パンダのデータフレームの列見出しの文字列の部分を切り取る

-1

約18の列がある.csvファイルからインポートされたpandasデータフレームで作業しています。各列には、列ヘッダーとしてHTML形式の項目名とイメージの説明があります。これは次のようなものです。パンダのデータフレームの列見出しの文字列の部分を切り取る

A <img width="300" alt="A" height="300".jpg">` ` B <img width="400" alt="B" height="600".jpg"`......

などです。

私が達成しようとしているのは、自分の列見出しの項目名だけを取得し、画像部分をトリミングすることです。

df.rename(columns=lambda x: x.replace('<img width="300" alt="A" height="300".jpg">', ''), inplace=True)

しかし、そこにこのような30と同様のファイルがあると、すべての画像は、異なる記述があるとして、すべての列名を与えることはできない。私は、これは機能を交換しようとしました。私はここでより洗練されたソリューションを探しています。私の出力は次のようになります：

A B C D ......so on

ご協力いただけると助かります。

私はあなたが正規表現に慣れていない場合は、正規表現

df.columns = df.columns.str.replace('\s*<.*>\s*$', '')

2017-07-08 00:19:21 piRSquared

を使用すると思い、あなたも試みることができる：

df.rename(columns=lambda x: x.split(' ')[0], inplace=True)

常にあなたの希望する出力の間にスペースがあることを考えますあなたは望ましくないものです。

2017-07-09 20:12:38

答えて