NLTKに特定の言語のテキストを扱うように指示するにはどうすればよいですか?NLTK/pyNLTKでは「言語ごとに」(英語以外の言語でも)作業できます
しばらくして、英語以外の(ただしヒンズー語のヨーロッパ語の)テキストドメインにPOSタギング、トークン化などを行う特殊なNLPルーチンを作成します。
この質問は、コード/設定変更、唯一異なるコーパスに対処するためではないようだ。 POS tagging in German
また、Python用の任意の特殊なヘブライ語/スペイン語/ポーランドNLPモジュールがあるのですか?
ありがとうございました。 punkt文トークナイザは正しい方向に見えます。 –
treetaggerはどのように機能するのですか? http://stackoverflow.com/questions/15503388/treetagger-installation-successful-but-cannot-open-par-file – alvas