2016-04-18 14 views
2

大学のプロジェクトについては、仮想建設現場に関するいくつかのコメントを受けて、実際の状態(just started,in constructionterminated)を検出するソフトウェアを作成する必要があります。私はフランスへの旅行を持っているために新しく建設された橋に行ってきました。昨日、」 単語分類アルゴリズムプロコン

  • 「我々はイギリス海峡の橋を歩くことができます聞いて幸せ」

    • :たとえば

      、コメントを与えられました友人 "

    • "彼らはすでにサイトを終え、すでに5マイル目に亀裂があります。

    "English Channel bridge"建設現場が終了したことを検出する必要があります。

    現時点では、このプロジェクトで使用する単語分類アルゴリズムを選択しようとしています。最高の分類アルゴリズムを使用するために、オンラインで を検索しました。私はSVCについて読んだことがありますが、私は実際にこの分野の専門家ではないので、 私は自分のシナリオでSVCのコンプライアンス/良さについて確信がありません。

    私が得ようとしているのは私の問題の解決ではなく、賛否両論のある利用可能なアルゴリズムのリストです。

  • 答えて

    1

    問題を誤って公式化しているため、人々が賛否両論のリストを提供することが難しくなります。

    あなたが記述している問題は、単語を分類していないので、実際には単語分類の問題ではありません。あなたがやろうとしていることである:建設のための固有名詞抽出

    1. 言及コンテキストに基づいて3つの異なったタイプにエンティティの名前付き各建設を分類
    2. を投影します。

    アルゴリズムは実際の問題ではありません。ほとんどの分類アルゴリズム(線形回帰、決定木、SVMなど)は機能します。

    実際に問題が生じているのは、トレーニングデータなしという名前の建設プロジェクトを見つけたり、それらのエンティティを3つのカテゴリに分類したりすることです。

    自由に利用できるNERツールキット/ライブラリの1つを使用して、建設プロジェクトに関連する辞書機能(橋、塔などの言葉...)を追加して、あなたの仕事の最初の部分で。

    もっと重要な考慮事項です:あなたは注釈付きのデータを取得する必要がありますどのくらいの時間/お金

    1. どのようなパフォーマンスが必要ですか?
    2. 何語/ライブラリは、あなたが(少なくとも重要な質問IMHO)toconsider喜んでいる

    私は申し訳ありませんが、私はこれはおそらくあなたが聞きたい答えではありません実現が、私はそれはあなたが必要な答えである疑いがあります。 ;)

    +0

    こんにちは、ご利用いただきありがとうございます。私はこの問題ではもはや仕事をする必要はありませんが、実際に解決策を実現する方法ではなく、単語分類アルゴリズムの賛否両論を知ることに興味がありました。あなたの考慮事項は、あなたが言ったように、私の質問に本当に不満足ではなく、有用である。 私はこの問題に取り組む必要はなく、何かをもっと知ることは面白いです。 [私の悪い英語のために申し訳ありません] – Ada