2017-11-02 16 views
1

私はtwitterから感情分析をしていますが、私のつぶやきはスペイン語ですので、単語を分類するためにtidytextを使用することはできません。スペイン語で似たようなパッケージがあるかどうかは誰にも分かりますか?tidytext Rスペイン語 - 任意の代替?

ありがとうございます!

+0

5月最高の選択肢ではありませんが、 'translateR'パッケージを使って英語に翻訳し、tidytextで分類することをお勧めします。しかし、あなたは少しの機械学習アルゴリズムを制御する場合。テキストクラスタリングにはいくつかのアルゴリズムがあります。 –

答えて

1

残念ながら、英語以外の言語でのセンチメント辞書には、多くの優れたオープンソースオプションはありません。あなたは他の言語でNRC lexiconを著者からリクエストできます。 Google翻訳で翻訳されています(もちろん、不確実性が増しますが、全体的にOKです)。著者は、研究目的では提供していますが、商用利用には料金を請求します。

0

英語以外のテキストミニングで同じ問題が発生します。 Bnosacによって開発されたrパッケージであるudpipeが見つかりました。生のテキストの言語に依存しない「トークン化」、「品詞タグ付け」、「字形化」、「形態学的特徴タグ付け」および「依存解析」を提供する自然言語処理ツールキットです。パッケージには感情タグがないことに注意してください。あなたは他の場所で見つける必要があるもの。

さまざまな種類の英語以外の言語もサポートしています。あなたはより多くの彼らのblog上、udpipeのウェブページ上またはgithub

P.S.に見つけることができ

私は彼らと提携していない。

関連する問題