mallet

    2

    1答えて

    私は、マレットシンプルタグャー(http://mallet.cs.umass.edu/sequences.php)を使用してPOSタグ付けのCRFモデルを学習しようとしています。 私のコンピュータがこの1つのモデルのために1週間以上学習しているので、今は心配し始めます。 ... Punkte NN->Puppenk�nig NN(Puppenk�nig NN) Punkte NN,Puppenk

    1

    1答えて

    マレットモデルのInputDirectoryに個別ファイルとして保存されたコーパスにポーターアルゴリズムを使用してステミングを適用したいと思います。誰かがそれがどのように実行できるかを助けることができますか?

    3

    2答えて

    9GBコーパスでLDAトピックモデリングを行いたいと思います。 100回のトピックで1000回の繰り返しをMALLETで行い、200回の反復バーンイン期間後に10回の反復ごとにハイパーパラメータを最適化するLDAモデルのトレーニングを計画しています。 私は64ビットWin8で作業しています。コンピュータには16GBのRAM、Intel®Core™i7-4720HQプロセッサが搭載されています。 こ

    2

    1答えて

    JavaのMalletでドキュメント分類子を実装しようとしています。私はすでに、本質的な特徴値を含むファイルを持っています。だから私はraw text処理パイプライン全体を実行したくありません。私の機能ファイル内の行は、現時点では、このようになります (2つの機能、IDとNrOfToken、文書のラベルが「A」である) ID=3 NrofTokens=279.0 A 私はこのファイルを読み込み、そ

    0

    1答えて

    Rletletには、マレットコマンドライン(--random-seed 1)で可能なランダムシードを使用するオプションがありますか?

    1

    2答えて

    私は、トピックモデルを作成し、そのモデルに基づいて推論を行うためにhLDAを使用しようとしています。しかし、私が見た限りでは、トピック推論ツールはLDAモデルでのみ機能しますが、そうですか? hLDAモデルからトピックを推論する方法はありますか?

    2

    1答えて

    Malletで見つかった各トピックの単語の分布をJavaで取得する必要があります(how to get a probability distribution for a topic in mallet?のCLIではなく)。 Introduction to Latent Dirichlet Allocation::私が何を意味するかの例については Topic A: 30% broccoli, 15%

    1

    1答えて

    --use-ngrams trueオプションを使用してmalletを実行したいが、動作させられないようだ。 bin\mallet import-file --input ovary.txt --output ovary2.mallet --keep-sequence-bigrams --remove-stopwords bin\mallet train-topics --input ovary

    0

    1答えて

    を構築するためにExpGainとGradientGain方法を使用するように、4つの特徴選択方法が利用可能である。(FeatureCounts、InfoGain、ExpGainとGradientGain )。 使い方を知りたいExpGainとGradientGainです。 例: FeatureSelector fselector = new FeatureSelector (new Feature