2010-11-22 16 views
4

データセットのtruecasingのための良い機械学習分類器を提案してください。 また、そのような分類器では、トゥルーキャッシングのための独自のルール/機能を指定することは可能ですか?あなたの提案をありがとう。自然言語処理 - Truecaserクラシファイア

ありがとうございました

答えて

3

私は、Pythonでtruecaserのバージョンを実装しました。十分なデータを提供するとき(つまり、正確に囲まれた文章)には、どの言語でも訓練することができます。

英語の場合、Wikipediaのサンプル文章では98.38%の精度が得られます。あらかじめ訓練された英語モデルが用意されています。

あなたはここでそれを見つけることができます:実装が見つけることができる場所 https://github.com/nreimers/truecaser

+0

外部リソースへのリンクが推奨されていますが、リンクの周りにコンテキストを追加して、仲間のユーザーには何がわかり、その理由を知るようにしてください。ターゲットサイトに到達できない場合や、永続的にオフラインになる場合は、常に重要なリンクの最も関連性の高い部分を引用してください。 [How to Answer](http://stackoverflow.com/help/how-to-answer)から。 –

関連する問題