rweka

0熱

1答えて

.jcallのエラー（ "RWekaInterfaces"、 "[S"、 "tokenize"、.jcast（tokenizer、N-gramの場合はnull例外：

N-gramを実行しようとしています。しかし、突然このデータセットは機能しません。

0熱

1答えて

を変換するには、私が使用してバイグラムのリストを作成しました： BigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2)) tdm_a.bigram = TermDocumentMatrix(docs_a, control = list(tokenize = Bigram

0熱

1答えて

WEKAの前処理ステップをRにロードするには？

私はWEKA GUI Java hereを使ってデータの前処理を行っています。 Rで同じ前処理ステップを使用したいと考えています。たとえば、WEKA GUIのMultiFilterの前処理をRにロードしたいのですが、RWekaではそれを見つけることができません。 RKAにWEKAプリプロセスステップをロードする方法は？

0熱

1答えて

出力J48ツリーのテキストファイルR

J48()の機能を使用してchurnデータセットのdecision treeを取得しました。RWekaパッケージの機能です。木は本当に大きいので、私は木全体を見ることができません。私はそれをテキストファイルで出力したいが、フォーマットは変更されている。ツリー形式を維持してどのように保存できますか？ save(m2,file="thisexample.txt", ascii=TRUE) m2私はJ4

0熱

1答えて

10-fcv weka予測結果を元のコメントに戻します。

10倍交差検定を使用してテキスト分類した結果、予測結果を元のコメントに戻すことができますか？クラス非SARC及びSARCの2000人のコメントの結果から：WEKAは、クラス分割に私のコメントに再配置されているよう inst#,actual,predicted,error,prediction 1,2:non-sarc,2:non-sarc,,1 2,2:non-sarc,1:sarc,+,1

0熱

1答えて

NGramTokenize（lapply issue）の使用中にエラーが発生しました

rWekaパッケージのNGramTokenizerを使用しています。私はすべてが正しくインストールされていると信じています。私は、次のコードを実行している：私は受信 Bigram_Tokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 2)) tdm <- TermDocumentMatrix(corpus,

0熱

1答えて

テキスト解析プログラムが動作していましたが、今は動作しません

私は以下のファイルを作成しました（悪名高いコースラコース以降）。何か変わったかどうかは分かりませんが、今は動作していないようで、何も変えていません。最初に動作しないように見えるのは、特殊文字を削除するforループです。次に、Plan Text Docとして扱うと、雲という言葉は働きたくないようです。最後に、トークナイザ関数は同じチャートを作成しています。本質的によく使用される単一の単語対プロ

1熱

1答えて

R-bigramトークナイザの文書用語行列が動作しない

私はコーパスに対してunigramsとbigramsの2つの文書 - 項行列を作ろうとしています。しかし、バイグラム・マトリックスは現在、ユニグラム・マトリックスとまったく同じです。私はなぜその理由がわかりません。コード： docs<-Corpus(DirSource("data", recursive=TRUE)) # Get the document term matrices Big