tm - 優秀な図書館

tm

4熱

1答えて

私はテキストでトークンをランク付けしました。その基準に基づいて、それらはすべて価値があります。 library(tm) library(wordcloud) tokList = read.table("tokens.txt", header = TRUE, sep = ',') # Create corpus corp <- Corpus(DataframeSource(tokList

0熱

1答えて

文書用語集の単語を頻度で並べ替えます。R

新しい質問は申し訳ありませんが、テキストマイニングでは初心者です。profyのアドバイスが必要です。さて、content_transformerとの長い苦しみの後、私はきれいなコーパス次の質問 1. How select from `dtm` the words with small frequencies , so that the amount of frequencies was not

0熱

1答えて

"TM"、 "NLP" またはで "TM" のパッケージをインストールするR 3.3.2（MacOSのシエラ）

の "スラム" のパッケージをインストールすることはできません： install.packages("tm", dependencies = TRUE) は、次の出力で失敗： During startup - Warning messages: 1: Setting LC_TIME failed, using "C" 2: Setting LC_MESSAGES failed, using

0熱

1答えて

tmオブジェクトからkoRpusオブジェクトへの移動、またはその逆

tmオブジェクトからkoRpusオブジェクトへの移動に問題があります。コーパスをtmツールで正規化し、結果をkoRpusで体系化し、tmに戻って結果を分類する必要があります。これを行うには、tmオブジェクトをRデータフレームに変換してから、Excelファイルに変換してからtxtファイルに変換し、最後にkoRpusオブジェクトに変換する必要があります。これはコードです： #from VCORP

-1熱

1答えて

R：topicmodels、2つの似たような文書、1つのコードは、もう1つはdoesnt、もう1つは

私はtopicmodelコードを実行すると非常に奇妙なエラーが発生します。基本的に私はユーザーのコメントを持つ.csvファイルを持っています。私は各コメントが1つのドキュメントであるdtmを作成したいと思います。私は8kのコメントのサンプルを取って、その上に次のコードを使用： > #LOAD LIBRARYS > > library(tm) > library(SnowballC) >

0熱

1答えて

tm Corpus：tm_map関数がコーパスを変更しない

私はtm_map関数を使用してドキュメント用語行列を作成しようとしていますが、tm_map(Corpus, function, lazy=TRUE)に渡された関数は、コーパス。具体的には、文書は小文字に変換されません。 R Studioにエラーや警告は表示されません。私はここで何かを台無しにしましたか？これはいくつかの厄介な問題かもしれませんか？ library(tm) setwd("..."

1熱

1答えて

古いパッケージをRにインストールする際にエラーが発生しました

0.6-2バージョンのtmライブラリをインストールしようとしています。 archiveのtar.gzファイルをダウンロードし、RStudioでツール - >アーカイブ - >パッケージアーカイブファイルを選択してインストールしました。ただし、次のエラーが発生しています。誰かが私がこれをしてください修正するのに役立つことができます：あなたは、Microsoft WindowsでRでパッケージをビル

2熱

1答えて

古いtmパッケージをRにインストールする際のエラー

0.6-2バージョンのtmライブラリをインストールしようとしています。 archiveのtar.gzファイルをダウンロードし、RStudioでツール - >アーカイブ - >パッケージアーカイブファイルを選択してインストールしました。私は、JavaとRtoolsの最新バージョンもインストールしました。ただし、次のエラーが発生しています。誰かが私にこれを解決するのを手伝ってもらえますか？ ** l

-1熱

1答えて

R：テキスト分類のためのスペクトルクラスタリング

tmパッケージを使用して文書のコーパスを作成しています。テキスト分類にスペクトルクラスタリング（kernlabパッケージ）を使用します。だから、私はコーパス my_corpus = VCorpus(DirSource(directory="C:/Users/me/Desktop/Documents", pattern="txt") を持っていると私は、私のように置けばいいのどのような specc

1熱

1答えて

R-bigramトークナイザの文書用語行列が動作しない

私はコーパスに対してunigramsとbigramsの2つの文書 - 項行列を作ろうとしています。しかし、バイグラム・マトリックスは現在、ユニグラム・マトリックスとまったく同じです。私はなぜその理由がわかりません。コード： docs<-Corpus(DirSource("data", recursive=TRUE)) # Get the document term matrices Big