Pythonを正しく使用する方法を完全に理解していないので、ここで私の愚かさに耐えてください。python 2つの不等なサイズの列の間で部分文字列を一致させる方法
のは、我々はこのようなデータフレームがあるとしましょう:
samp_data = pd.DataFrame([[1,'hello there',3],
[4,'im just saying hello',6],
[7,'but sometimes i say bye',9],
[2,'random words here',5]],
columns=["a", "b", "c"])
print(samp_data)
a b c
0 1 hello there 3
1 4 im just saying hello 6
2 7 but sometimes i say bye 9
3 2 random words here 5
を、私たちは私たちが望むいけない単語のリストを設定します。
unwanted_words = ['hello', 'random']
私はは、すべての行を除外する関数を書きたいですここで、列bには「unwanted_words」リストの単語が含まれています。だから、出力は次のようになります。
print(samp_data)
a b c
2 7 but sometimes i say bye 9
は私がこれまで試したものの中に組み込まれて「ISIN()」関数で使用して、次のとおりです
data = samp_data.ix[samp_data['b'].isin(unwanted_words),:]
を私は期待通り、この行を排除するものではありません。 と私はstr.containsを使用してみました()関数:
for i,row in samp_data.iterrows():
if unwanted_words.str.contains(row['b']).any():
print('found matching words')
、これは私にエラーをスローしていました。
私は物事を複雑にしていると思うし、私が気づいていない本当に簡単な方法があるはずです。 ご迷惑をおかけして申し訳ございません。 (私はすでに多くのウィンドウを閉じて、このリストに限定されない)私がこれまでに読み込ま
記事:
- regex to match partial strings and fragments of sentences
- Check if a value in one column is in a list in another column
- Check if column value is in other columns in pandas
あなたは「パンダ」との質問にタグを付ける必要があります。これは純粋なPythonではありません。 – glenfant