2017-11-14 4 views
1

私は新聞記事への10.000以上のリンクからなるパンダのデータフレームに取り組んでいます。/media/or/sport /などの記事の主題/編集を別の列に表示するリンクの文字列の部分を使用したいと思います。python/pandasのあるdf列から別のdf列に文字列を追加するにはどうすればよいですか?

例: コル1は、これらのリンクが含まれています www.theguardian.com/us-news/wikileaks-during-final-stages-of-election www.theguardian.com/politics/parliament-to-have-最終 -

e私はCol 1の文字列を反復するdefを作成したい。文字列に "/ us-news /"が含まれていれば "Politics"が文字列に含まれているかのように "US News"にCol 2が追加される。誰もがこれを行う方法を知っていますか? str.containsによって条件付き

答えて

0

使用numpy.select

m1 = df['col1'].str.contains('/us-news/') 
m2 = df['col1'].str.contains('/politics/') 

df['col2'] = np.select([m1,m2], ['US News','Politics'], default='no match') 
+0

が速い答えのためにどうもありがとうございます - 完全に働きました! –

+0

あなたは大歓迎です!私の答えが役に立ったら、[accept](http://meta.stackexchange.com/a/5235/295067)を忘れないでください。答えの横にあるチェックマーク( '✓')をクリックしてグレー表示にします記入してください。ありがとう。 – jezrael

関連する問題