find()メソッドを使用して、.PDFからスクレイプされたテキストのリスト内の郵便番号を検索しようとしています。以下は、これまでのテキストと私のコードの例です。私はエラーなく実行することができますが、出力を生成しません。 'SOC'文字列を使用して都市、州、およびzipを含む行を検索し、replace()メソッドを使用して状態を ""に置き換え、zipを ""で置き換えたいと考えています。問題は、州が常にNYであり、変数や文字列で設定できるのに対し、zipはいくつかの異なる郵便番号になる可能性があるため、スクラップされたテキストに何が含まれるかはわかりません。したがって、私はリスト内でそれらをすべて入力して、コードを見つけたものに置き換えることができるので、テキストを調べてリストと比較できるようにfind()メソッドを使用したいと考えていました。Pythonリストを含むFind()メソッドを使用する
Smith, Joel
Soc Sec#: xxx-xx-1111
56 Monroe Drive
Smithville, NY 14221
27
Smith, Nicole M
Soc Sec#: xxx-xx-2222
56 Monroe Dr
Smithville, NY 14226
25
state = "NY"
zip = ["14206", "14215", "14218", "14221", "14226"]
# Searches for City
if line.find('Soc') != -1:
if line.find(str(zip)) in zip != -1:
print(lines[indx].strip().replace(state, "").replace(zip, ""))
あなたはあなたの状態を知っているし、あなたの郵便番号は、規則的なパターンに従っている場合は、使用することができます... 're'gexpressions。 –