データセットのtruecasingのための良い機械学習分類器を提案してください。 また、そのような分類器では、トゥルーキャッシングのための独自のルール/機能を指定することは可能ですか?あなたの提案をありがとう。自然言語処理 - Truecaserクラシファイア
ありがとうございました
データセットのtruecasingのための良い機械学習分類器を提案してください。 また、そのような分類器では、トゥルーキャッシングのための独自のルール/機能を指定することは可能ですか?あなたの提案をありがとう。自然言語処理 - Truecaserクラシファイア
ありがとうございました
このホワイトペーパーをご覧ください。
http://www.cs.cmu.edu/~llita/papers/lita.truecasing-acl2003.pdf
彼らは、精度の98%を報告しています。
私は、Pythonでtruecaserのバージョンを実装しました。十分なデータを提供するとき(つまり、正確に囲まれた文章)には、どの言語でも訓練することができます。
英語の場合、Wikipediaのサンプル文章では98.38%の精度が得られます。あらかじめ訓練された英語モデルが用意されています。
あなたはここでそれを見つけることができます:実装が見つけることができる場所 https://github.com/nreimers/truecaser
外部リソースへのリンクが推奨されていますが、リンクの周りにコンテキストを追加して、仲間のユーザーには何がわかり、その理由を知るようにしてください。ターゲットサイトに到達できない場合や、永続的にオフラインになる場合は、常に重要なリンクの最も関連性の高い部分を引用してください。 [How to Answer](http://stackoverflow.com/help/how-to-answer)から。 –
あなたは知っていますか? –