rweka

    0

    1答えて

    N-gramを実行しようとしています。しかし、突然このデータセットは機能しません。

    0

    1答えて

    を変換するには、私が使用してバイグラムのリストを作成しました: BigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2)) tdm_a.bigram = TermDocumentMatrix(docs_a, control = list(tokenize = Bigram

    0

    1答えて

    私はWEKA GUI Java hereを使ってデータの前処理を行っています。 Rで同じ前処理ステップを使用したいと考えています。 たとえば、WEKA GUIのMultiFilterの前処理をRにロードしたいのですが、RWekaではそれを見つけることができません。 RKAにWEKAプリプロセスステップをロードする方法は?

    0

    1答えて

    J48()の機能を使用してchurnデータセットのdecision treeを取得しました。RWekaパッケージの機能です。木は本当に大きいので、私は木全体を見ることができません。私はそれをテキストファイルで出力したいが、フォーマットは変更されている。ツリー形式を維持してどのように保存できますか? save(m2,file="thisexample.txt", ascii=TRUE) m2私はJ4

    0

    1答えて

    10倍交差検定を使用してテキスト分類した結果、予測結果を元のコメントに戻すことができますか? クラス非SARC及びSARCの2000人のコメントの結果から:WEKAは、クラス分割に私のコメントに再配置されているよう inst#,actual,predicted,error,prediction 1,2:non-sarc,2:non-sarc,,1 2,2:non-sarc,1:sarc,+,1

    0

    1答えて

    rWekaパッケージのNGramTokenizerを使用しています。私はすべてが正しくインストールされていると信じています。私は、次のコードを実行している:私は受信 Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2)) tdm <- TermDocumentMatrix(corpus,

    0

    1答えて

    私は以下のファイルを作成しました(悪名高いコースラコース以降)。何か変わったかどうかは分かりませんが、今は動作していないようで、何も変えていません。 最初に動作しないように見えるのは、特殊文字を削除するforループです。 次に、Plan Text Docとして扱うと、雲という言葉は働きたくないようです。 最後に、トークナイザ関数は同じチャートを作成しています。本質的によく使用される単一の単語対プロ

    1

    1答えて

    私はコーパスに対してunigramsとbigramsの2つの文書 - 項行列を作ろうとしています。しかし、バイグラム・マトリックスは現在、ユニグラム・マトリックスとまったく同じです。私はなぜその理由がわかりません。 コード: docs<-Corpus(DirSource("data", recursive=TRUE)) # Get the document term matrices Big