私はPythonを使ってテキストファイルに挿入される新しい単語を探したい。たとえば:テキストファイルに新しい挿入単語を見つける
Old: He is a new employee here.
New: He was a new, employee there.
私は、出力などの単語のリストをしたい:['was', ',' ,'there']
は私がdifflib
を使用しますが、それは私に'+', '-' and '?'
を使用して、悪いフォーマットされた方法で差分を与えます。私は新しい単語を見つけるために出力を解析する必要があります。これをPythonで簡単に行う方法はありますか?
しかし、古いテキストに「there」という単語が他の場所に含まれていた場合は、この単語を返しますか? – Hellboy
ああ、あなたは正しい。考え方は変わりませんが、その退行的な症例については簡単な修正があります。私は適応するように編集します。 –