PDFからコピーしたDavid Foster Wallaceを含む.txtファイルからインポートしています。いくつかの単語は、ページをオフに走ったので、私はのようなものを使用して、それをサニタイズするつもりだった条件に従って特定の文字列スニペットを.replace()する方法はありますか?
"interr- upted"
の形で来る:人も中にいくつかの奇妙な構造を使用しています...除き
with open(text, "r", 0) as bookFile:
bookString = bookFile.read().replace("- ", "")
彼の執筆。次のようなものがあります。
"R - - d©"
ブランド名バグスプレーRaid©私は明らかに "R d©"を残していますが、 " - "のインスタンスではなく " - "のインスタンス.replace()インスタンスを作成する方法はありますか?あるいは、すべてをリストに変換し、そのようにすべての操作を行う必要がありますか?ありがとう。
どのようにこの状態を定義しますか? 1つ以上の文字、ハイフン、スペース、1つ以上の文字がある場合のみですか? – jacoblaw
良い点。私はその事件をもっと一般的にして、将来の本に同じことをすると、 "a - b"のインスタンスはすべて破棄されないだろうが、 "ab - c" "abc"に変わります。 –