2011-02-04 1 views
1

私はテキストを解析し、その文法構造に応じて文章を分類したいが、私はNLPの非常に小さな理解しているので、私もどこから始めれば分かりません。は、どのように私は緊張した(現在、過去、未来、など)に応じて文章を分類するに行きますか?

私の知る限り読んでてきたように、私はテキストを解析し、見つける必要があり(またはタグ?)品詞すべての単語の。次に、私は、動詞句、または文章を分類するために使用したい他の定義的な特性を検索します。私にはわからない何

は、このより簡単か、私が個別にまたは何文法規則を定義する必要がある場合に行うには、いくつかの方法がすでに存在する場合です。

これを議論NLP上の任意のリソースは素晴らしいことです。プログラムの例も歓迎します。以前はNLTKを使用しましたが、広範囲には使用しませんでした。他のパーサーや言語もOKです!

答えて

2

のPython Natural Language Toolkitは、このような仕事をしているために適しているライブラリです。他のNLPライブラリと同様に、トレーニングのためにデータセットを個別にダウンロードし、トレーニング用のコーパス(データ)とスクリプトも使用できます。

example tutorialsもあります。これは、言葉のスピーチの一部を特定するのに役立ちます。是非、nltk.orgはあなたが探しているもののために行く場所であるべきだと思います。

特定の質問がここに再度掲載される可能性があります。

0

文法構造の種類ごとに「名詞動詞名詞」などのパターンを定義するだけで、部分的なタグ付け出力シーケンスでの検索が必要な場合があります。

関連する問題