私はテキストを入力していますが、これはあくまでブリークとワーストです。壊れた言葉の信頼性の高い修正
I have a text as an input, where there are occassionaly broken words.
として出力を返すことができNLTK
または類似の関数はありますか?
私はテキストを入力していますが、これはあくまでブリークとワーストです。壊れた言葉の信頼性の高い修正
I have a text as an input, where there are occassionaly broken words.
として出力を返すことができNLTK
または類似の関数はありますか?
あなたはすべての機能を1つの機能にまとめることはできませんが、Pyenchantライブラリの助けを借りて単語のスペルを確認できます。あなたが行うことができ、これらの手順:
はい、pyEnchantディクショナリには合法的ではない多くの単語が含まれていますが、効率的であるとは言いませんが、場合によっては機能します。上記の方法
は、レーベンシュタイン距離を使用している、あなたもまたNgrams、ジャカード係数を用いて補正を綴る行うことができます。
は、私はすでにあなたが私のGitHubのリンク上で確認することができ、このタスクを実装(https://github.com/rameshjesswani/Semantic-Textual-Similarity/blob/master/nlp_basics/nltk/string_similarity.ipynb)
あなたは[ 'pyechant']から辞書を使用した非常に近い得ることができます(https://pypi.python.org/pypi/pyenchant /)とループの少し。しかし、あなたは「時折」と「機会」と「同盟者」の両方を持つことができるので、あなたはまだ「仲間にいる時」の問題に遭遇します。 – Abdou