2016-10-06 3 views
0

私はフォーラムに取り掛かり、Quora.comのようなタグジェネレータを作ることを考えましたが、シンプルです。だから、最初に私は文字列を "浄化"しました。 "for"、 "in"のような無関係な単語を削除しました...文字列の名詞を除外できるPHPまたはJSアルゴリズムはありますか?

しかし、文字列中の名詞だけを取得する方法はわかりませんでした。例:このスレッドのタイトル"文字列の名詞を除外できるPHPまたはJSアルゴリズムはありますか?"は次のようになります。

PHP 
JS 
algorithm 
nouns 
string 

これは多かれ少なかれ正確です。しかし、私は年表の半分を無駄にしたくないので、名簿を使用したくない。あなたが良い名詞リストを知っていれば私も喜んでいます。ありがとうございました。

+1

ルックアップ自然言語処理 –

答えて

0

Princeton Wordnetのような「語彙辞書」(それらの間の単語や接続に関するメタデータを保持する辞書)が必要です。これは、名詞/動詞または同義語/上位語などのものを照会および比較するために使用できる英単語セマンティックデータベースです。

これは明らかにサーバーで実行されます。サーバー側で文字列を解析する必要があります(Ajaxをクライアント上で見たい場合はAjaxを使用できます)。英語の辞書全体をブラウザのメモリに保持し、それを検索し、良いものに似ているものは実現可能な方法はありません。

関連する問題