2017-03-15 5 views
-3

私はテキスト文書を持っていて、テキストを消去しました。今、私は回帰を適用したい単語のリストを持っていますが、それをどうやって行うのか分かりません。誰でも助けてくれますか? また、単語のリストに他の機械学習アルゴリズムを使用できますか?単語の袋に回帰を適用する

答えて

0

どのような予測を行っているのか詳しく教えてください。

ステップ-1:使用雪玉ステマー言葉

ステップ-2を食い止める:(scikit学習を使用して)一般的なケースでは

これを使用するには、データの特徴やラベルのトレーニングとテスト・セットを作成し解析されました。

ステップ-3:tfidfvectorizer

ステップ-4を使用して数値のリストにテキストベクトルを変換します。それは機能の巨大なセットになりますように、我々はトップ10を選択する必要があります(またはあなたが好きな)パーセンタイルselectpercentileを使用して重み付けされていないフィーチャを削除します。

これで、目的の目的に合わせて機能セットを使用できるようになりました。

・ホープ、このことができます:)

PS:あなたが適切なパラメータと

0

Table description をチューニングするためのNLTKとベクトラ上のいくつかの研究を行う必要がありますが、私は例をアップロードした自分のリプレイ のためにどうもありがとうございます私がエクセルファイルに持っているもののうち 数値的に2つの列があり、数値が1つの列があります(0は非常に悪く、10は優れています)。

私がやりたいことは、ベース人々が最低/最高のスコアを与えている言葉/言葉には スコアはラベルになります しかし、それが可能かどうかわかりませんか?

先物/ラベルを抽出するためにテキストコメント(製品の改善)のみを使用しようとしましたが、それが賢明かどうかを確認するだけでしたが、その機能を抽出したときに、機能セットに基づいて

お待ちしています:-)

関連する問題