2016-04-16 7 views
1

nltkライブラリを使って、Pythonでチャットボットに取り組んでいます。文章をカテゴリに分類するためにPOSタグを使用したいと思います。始めに、私はそれらを4つのカテゴリに分けたいと思っています"IMPERATIVE", "INTERROGATIVE", "EXCLAMATORY", "DECLARATIVE"。最終的にはQUESTIONSALUTATIONAPOLOGYなどのカテゴリを追加したいと思います。私は英語の文章パターンがどのように定義されているかについていくつかの参考文献を探しています。英語の文章のためのBNFのようなもの。このような場所はどこで見つけることができますか?文法の種類ごとに「名詞動詞名詞」などのパターンを見つけることができますので、私は文章を分類できますか?

答えて

0

あなたの仕事の説明はPOS taggingのように聞こえるのではなく、むしろ対話モデリングです:基本的には、dialogue actのタイプに従って注釈された英語のコーパスを見つける必要があります。私が以前に働いた良いアノテーションスキームの1つはAllen and Core's Dialog Act Markup in Several Layers (DAMSL)です。また、このデータの使用方法についてはtheir 1997 paperを参照してください。残念ながら、このデータを注釈付けした自由に入手可能な汎用コーパスはわかりません。

関連する問題