2017-11-28 10 views
0

difflibを使って2つの文字列間の文字の違いを調べる方法はたくさんありますが、削除して2つの文字列の間に追加する方法やモジュールがあるかどうかを知りたいと思っています。例えばPythonの2つの文字列で追加または削除された単語を数えるには?

、我々は

foo = 'This is a sentence' 
bar = 'I am a sentence' 

を持っている場合、私は「この」と「ある」を含むリストを返します

deleted_words(foo, bar) 

の線に沿って機能がありますかどうかを知りたいと思います。

この機能を持つモジュールはありますか、それとも自分で行うアルゴリズムを作る必要はありますか?

+0

あなたは要件を説明する素晴らしい仕事をしていません...しかし、おそらく自分のソリューションを開発しなければならないように思えます –

答えて

1

記述したようなAPIが必要な場合は、記述したものがそのまま返されますので、自分で何かを書く必要があります。

ただし、2つのテキスト本文を区別するように設計されたモジュールがあります(例:diff-match-patch)。

一つの簡単な例は次のとおりです。

diff_main("Good dog", "Bad dog") => [(-1, "Goo"), (1, "Ba"), (0, "d dog")] 

とトピックにはGoogle Codeのウィキへの直接リンク: https://code.google.com/archive/p/google-diff-match-patch/wikis/API.wiki

あり、このSO自体にこのライブラリのより広範な説明:https://stackoverflow.com/a/16086633/3084820

関連する問題