私はちょうどパンダを使い始めています。データフレームのようなデータフレームを扱うのは難しいです。何度も何度も行を反復せずに何かをする方法を考え出すことができません。パンダを正しく実行する...ループを使用するのではなく
たとえば、予算情報を持つデータフレームがあります。 ベンダー名でベンダー名
- 何とか何とか何とか:私は3つの潜在的な形式のいずれかの文字列である「簡単な説明」から「ベンダー」を、抽出したいです
- ベンダー名
私は、次のコードを使用して、これを行うことができますが、私は助けるが、それは適切にパンダを使用していないことを感じることができません。それを改善する上でのあらゆる考え方?
for i, row in dataframe.iterrows():
current = dataframe['short description'][i]
if 'to' in current:
point_of_break = current.index('to') + 3
dataframe['vendor'][i] = current[point_of_break:]
elif 'at' in current:
point_of_break = current.index('at') + 3
dataframe['vendor'][i] = current[point_of_break:]
else:
dataframe['vendor'][i] = current
をあなたは正規表現を使用して試みることができる - その方法のためhttp://pandas.pydata.org/pandas-docs/stable/text.htmlを見てみましょう正規表現をサポートする –
すべての行にベンダー名が引用符で囲まれているか、ベンダー名が各文字列のどこに含まれているかを示すために使用していますか? – DSM
それは私が意味するものではありません!私のせい。元の質問を更新して明確にします。 – user4896331