私は問題を抱えています。私が達成しようとしていることをまとめておきます。nltk pythonを使用してmovie_reviewと似たコーパスを作成する方法3.4
私はコーパスにmovie_reviewはわずか2つのカテゴリに持っていたが、どこ私の場合のように、私は複数のカテゴリとサブカテゴリを持つことになりますをmovie_reviewsに似何かを作成したいです。例えば
:
は私が は、 'A'、 'B'、 'C'、 'D' と 'E' のようなカテゴリを作成したかったmy_corpusとしてコーパスを有していると言います。この カテゴリには、 'A'のようなサブカテゴリが含まれています サブタイトルは 'a1'、 'a2'、 'a3'などです(B、C、DおよびE)。このサブカテゴリはそれぞれ に 'a1'のような独自のサブカテゴリが 'a1.1'、 'a1.2' などあり、最後に最下位(葉)はすべてテキスト ファイルが該当するカテゴリまたはサブカテゴリに関連しています。
私の質問>どのように私は、このようなコーパスを
1作成することができますされ、それを行うためにとにかくがある、あなたの応答は大きな助けになります、あなたはまた、どのリンクに私をマッピングすることができます私を導いてください私はこの
2を行うのを助けることができる>私は私がここにも私の場合は、naivebayesがALGO実行またはmovie_reviewsにNEGおよびPOSを見つけるために、1のように、この場合にはスイート他のアルゴことができます新しく尋ねられる質問がどのカテゴリとそのサブカテゴリに関連するのかを探る必要がありますか?
親切に私を助けてください。
同じように整理すると、コードを変更する可能性があります。あなたのデータはどのように見えますか? –
私のデータはテキストファイルです...カテゴリとサブカテゴリが必要な理由は、ノードのように使用したいので、仕事のためにリーフなどの構造を使用したいからです。 –
あなたのしかし、私はそれがコーパスリーダーを定義するという作業とは無関係であると確信しています。言い換えれば、別の質問です。 – alexis