私の要求は、クエリに応答して自然言語文(英語のみ)から数値データを認識して抽出することです。プラットフォームはJavaです。例えば、ユーザクエリは「エベレストの高さとは何か」であり、以下のように、私たちは、段落を持っている場合:数値データを認識するための自然言語処理
1856年は、英領インドの大三角測量は、エベレストの最初の公表の高さを確立し、その後として知られ、ピークXV、29,002フィート(8,840 m)。 1865年にエベレストは、当時の英国調査員アンドリュー・ウォー(Andrew Waugh)氏の推薦により、ロイヤル・ジオグラフィック・ソサエティ(Royal Geographical Society)の正式な英名を与えられました。 4] Chomolungmaは何世紀にもわたってチベット人に共通して使われていたが、Waughはネパールとチベットが外国人に閉鎖されていたため、地元名を提案することができなかった。
ユーザーのクエリ "Height of mount Everest"の段落からは、回答として29002 ftまたは8840 mを取得する必要があります。誰でもJavaでそれを行う可能な方法を提案できますか?同じオープンソースライブラリはありますか?
おそらくウィキの記事(http://en.wikipedia.org/wiki/List_of_natural_language_processing_toolkits)があなたを助けてくれるかもしれないし、おそらくそれをグーグル(http://www.google.com/search?sourceid=chrome&ie=UTF-8&q = java +自然+言語+解析)。スタンフォードのNLPキットは、かなりよく文書化されており、GPLされています。 – Tim
Timに感謝します。私はスタンフォードNLPを見ていました。しかし、私はそれが私のプロジェクトにとってはやや複雑すぎると思っていました。簡単な選択肢はありますか? –