-3
"タイトル"と "説明"という2つの列を持つデータフレームがあります。タイトル欄には、臨床検査のテストに関するタイトルがたくさんあります。残念ながら、ほとんどのタイトルは同じテストが繰り返されますが、タイトルのマイナーチェンジによってタイトルは一意になります。文字列をPythonの新しい文字列や単語に完全に置き換える
values = [('Complete blood picture', 'AB'), ('Complete BLOOD test', 'AB'), ('blood glucose', 'AB'), ('COMplete blood Profile', 'AB')]
labels = ['title', 'description']
import pandas as pd
labtest = pd.DataFrame.from_records(values, columns = labels) # Create data frame
labtest = labtest.apply(lambda x: x.astype(str).str.lower()) # Convert columns to string and lower case
labtest['title'].str.contains("blood") # Search for blood
前:
Title Description
Complete blood test AB
COMPLETE Blood test\ AB
Blood glucose AB
Complete blood picture AB
後:
Title Description
Blood test AB
Blood test AB
Blood test AB
Blood test AB
私は言葉 "血" を検索したい[これは私が見えるように、データフレームをご希望の方法です]それが本当ならば、 "血液検査"でタイトル全体を変更してください。
P.S私はPythonに新しく、テキストデータを扱っているので、 "blood"という単語を検索することしかできませんでした。
@furas、typo - > str.replace() –
あなたの例では、「平均血糖(abg)」は常に文字列全体ですか?または、最初または最後に保管したいテキストが他にもありますか? –
'str.replace()'を使ってみましたか?そうでない場合はまずそれを試してください。 – furas