tm

    4

    1答えて

    私はテキストでトークンをランク付けしました。その基準に基づいて、それらはすべて価値があります。 library(tm) library(wordcloud) tokList = read.table("tokens.txt", header = TRUE, sep = ',') # Create corpus corp <- Corpus(DataframeSource(tokList

    0

    1答えて

    新しい質問は申し訳ありませんが、テキストマイニングでは初心者です。profyのアドバイスが必要です。 さて、content_transformerとの長い苦しみの後、私はきれいなコーパス 次の質問 1. How select from `dtm` the words with small frequencies , so that the amount of frequencies was not

    0

    1答えて

    の "スラム" のパッケージをインストールすることはできません: install.packages("tm", dependencies = TRUE) は、次の出力で失敗: During startup - Warning messages: 1: Setting LC_TIME failed, using "C" 2: Setting LC_MESSAGES failed, using

    0

    1答えて

    tmオブジェクトからkoRpusオブジェクトへの移動に問題があります。 コーパスをtmツールで正規化し、結果をkoRpusで体系化し、tmに戻って結果を分類する必要があります。 これを行うには、tmオブジェクトをRデータフレームに変換してから、Excelファイルに変換してからtxtファイルに変換し、最後にkoRpusオブジェクトに変換する必要があります。 これはコードです: #from VCORP

    -1

    1答えて

    私はtopicmodelコードを実行すると非常に奇妙なエラーが発生します。 基本的に私はユーザーのコメントを持つ.csvファイルを持っています。私は各コメントが1つのドキュメントであるdtmを作成したいと思います。私は8kのコメントのサンプルを取って、その上に次のコードを使用: > #LOAD LIBRARYS > > library(tm) > library(SnowballC) >

    0

    1答えて

    私はtm_map関数を使用してドキュメント用語行列を作成しようとしていますが、tm_map(Corpus, function, lazy=TRUE)に渡された関数は、コーパス。具体的には、文書は小文字に変換されません。 R Studioにエラーや警告は表示されません。 私はここで何かを台無しにしましたか?これはいくつかの厄介な問題かもしれませんか? library(tm) setwd("..."

    1

    1答えて

    0.6-2バージョンのtmライブラリをインストールしようとしています。 archiveのtar.gzファイルをダウンロードし、RStudioでツール - >アーカイブ - >パッケージアーカイブファイルを選択してインストールしました。 ただし、次のエラーが発生しています。誰かが私がこれをしてください修正するのに役立つことができます:あなたは、Microsoft WindowsでRでパッケージをビル

    2

    1答えて

    0.6-2バージョンのtmライブラリをインストールしようとしています。 archiveのtar.gzファイルをダウンロードし、RStudioでツール - >アーカイブ - >パッケージアーカイブファイルを選択してインストールしました。私は、JavaとRtoolsの最新バージョンもインストールしました。 ただし、次のエラーが発生しています。誰かが私にこれを解決するのを手伝ってもらえますか? ** l

    -1

    1答えて

    tmパッケージを使用して文書のコーパスを作成しています。テキスト分類にスペクトルクラスタリング(kernlabパッケージ)を使用します。 だから、私はコーパス my_corpus = VCorpus(DirSource(directory="C:/Users/me/Desktop/Documents", pattern="txt") を持っていると私は、私のように置けばいいのどのような specc

    1

    1答えて

    私はコーパスに対してunigramsとbigramsの2つの文書 - 項行列を作ろうとしています。しかし、バイグラム・マトリックスは現在、ユニグラム・マトリックスとまったく同じです。私はなぜその理由がわかりません。 コード: docs<-Corpus(DirSource("data", recursive=TRUE)) # Get the document term matrices Big