2
私はテキストデータを扱っているので、既存の列に基づいて新しい列を作成したいだけです。Pandasデータフレームで分割を使用して列を取り込む
例:列sourceEncodedID
はa.b.c
のような値を有することができると私は、利用可能な2番目の部分はありますならば、文字列の唯一の第二部、b
を抽出したいと思います。ここではいくつかの例の値は次のとおりです。
for i in range(0,20350):
if len(str(artifacts.sourceEncodedID[i]).split('.')) > 1:
artifacts['branch'][i] = str(artifacts.sourceEncodedID[i]).split('.')[1]
else:
artifacts['branch'][i] = str(artifacts.sourceEncodedID[i])
に分を取る:
sourceEncodedID Branch
a.b.c b
c.r.d r
a a
p p
はこれを実現するために、私は次のコードが出ていますブラウザを終了してレンダリングを応答しないようにする前に実行してください(私はipython notebook
を使用しています)。私はこれが数秒で実行されると思ったでしょう。
このコードにはわかりづらいものがありますか?どうすれば修正できますか?
おかげでそんなに、それは仕事をしてくれました。私のコードでわからない愚かさを指摘できますか? – Patthebug
@Patthebug、私は私の答えを更新しました - チェックしてください – MaxU
説明を追加していただきありがとう、私はそれを感謝します! パンダのベクトル化された機能を知り、基本に戻って時間を費やすのはちょっとイライラしていると思います。私は、ベクトル化されたソリューションはもっときちんとしているが、あなたはそれらを知っている必要があります。一度に1つの機能! – Patthebug