2011-11-19 3 views
1

私は質問回答の学部プロジェクトのブレーンストーミングを行っています。 IRとNLPのコンポーネントを持つプロジェクト。IRとQA - 初心者のプロジェクトの範囲

ポップアップした最初のことは、もちろんファクトイド質問回答でしたが、それはすでに克服された問題のようでした。 #IBMワトソン!

QAが面白いと思われるので、私はそれを取り上げました。さて、私たちはプロジェクト記述のスコープ・アウト段階にあります。だから、野心的な目標 - ユーザーからの質問に答える - 私はプロジェクトの範囲を限定する必要があります。

は、だから私は、次のような決定をした:

  1. これは、ドメイン閉鎖される - C++ただ1つのウェブサイトから構成されます
  2. コーパスのプログラミング。
  3. QAアーキテクチャ全体のモジュールを1つだけ開発します(Passage RetrievalまたはAnswer Extraction)。

私たちのメンターは、まずは既存のソリューションを実装することを主張します。 私はこの時点で、既存の実装を検索することに固執しています。 Here is one。しかし、私が環境要件を読んだとき、それは驚異的でした。多くのライブラリとツールキットがありますが、少なくとも非常に小規模で知っていればいいと思います。

プロジェクトの有効範囲を提案してください。私はマスターでこのことを続けていきたいと思っています。それでいいスタートは何ですか?私たちは約4ヶ月のプロジェクトを持っており、研究プロジェクトを終わらせないことが重要です。それは明らかな出力を持つべきです。

答えて

0

IRの場合、Lucene/Solrがあります。

マシンラーニングとnlpの多くのライブラリは、主にPythonとJavaで、少なくともユーザーフレンドリーなものがあります。

Hoifungのシステムを実装することはかなり意欲的です。私はより簡単なものに行きます。あなたは彼のコードを見ましたか?

ここ数年、BioNLPの課題がたくさんありますが、それも比較的複雑な課題です。

twitterの映画レビューはどうですか?つまり、Xつぶやきに基づいて、この映画は吸うのですか?