2016-10-26 5 views
0

私は研究をしています。回答者はアンケートを行い、次のような質問をします。 2)マーケティング情報(広告など)の重要性を評価する前に、マーケティング情報(広告など)の重要性を評価します。 0-10スケールで購入する 3)製品の特定の特性によってマーケティング情報がどのように評価されたか尋ねられます。 1)重要性の評価:目的に合わせて、どのテキストマイニング/ NLPメソッドを使用できますか?

サンプル応答は、このようなものです。それは、多くの製品の代替秒の違いを強調するので8

2)「マーケティングが重要である携帯電話は、複雑製品であり、携帯電話技術は常にであり、この問題を悪化させています。手動でこの単一の応答から抽出することができる

製品特性:製品の複雑さ、製品の代替の多くは、製品の技術的進歩のペース

同じ調査は13社の他の製品、また3つの他のソースに対して行われマーケティング情報以外の情報(合計4件) 200人の回答者。

ゴール:4つのソース情報のそれぞれの重要性を決定する製品特性のリストを作成する。

質問:私が持っている定性的な回答からこのリストを抽出するには、どのような定量的な方法をRやPythonで使用できますか?

これは私にとって重要な研究であり、私は非常に感謝しています。

答えて

3

広い意味で聞いてみたい(うまくいけば私の推測は正しい)という言葉を言い換えてください。たとえば、オンラインでのレビューがあり、さまざまな製品の側面をモデル化したいとします。これは研究者が取り組んでいる興味深い領域であり、正式名称はアスペクト・センチメント・モデリングです。時には、人々はこれを隠しトピックモデリングや意見鉱山と名付けることもあります。私は、階層的な感情モデルを提案する先行研究はほとんど見ていない。これを見てくださいpaper

unsupervised approachもご覧になれます。人々が話している特定の特性セットを学びたいので、それらを隠れたトピックとして考えることができます。より良い理解を得るには、paperをご覧ください。感情分析として問題をモデル化することもできます。先行研究はたくさんあり、依然として人々がそれに取り組んでいます。

PythonとRの実装:私はRの専門家ではないので、私はちょうどpythonについて話しています。 Pythonのトピックモデリングの場合は、thisに従ってください。感情分析のために、Pythonの中で最も良いことはNLTKです。このGitHubリポジトリは、非常に優れた一連の例を紹介します。オピニオンマイニング関連のものも表示されます。これは非常に優れた例であり、目的に合った良いモデルを構築するのに役立つはずです。最後に、この問題のドメインをより厳密に理解するのに役立ついくつかのGitHubリポジトリのリンクを提供しましょう。

例:(1)Yelp Summarization Miner(2)Joint aspect and sentiment modeling(3)Jointly modeling aspects, rating and sentiments(4)Opinion Phrase Extraction

1

各ソースの重要度評価は、すでに回答から入手可能であるならば、あなただけの製品特性を抽出する必要があります。次に、各製品特性について、評価スコアとの関連を判断することができます。

データのサイズが小さすぎて、トピックモデリングなどのメソッドで使用できないようです。したがって、類似した製品の大量のレビューでトピックモデルを鍛えることができます。そのようなコレクションがいくつかあります。例えば、this pageのリンクをご覧ください(Amazonのコーパスには、さまざまな電子商品のレビューが含まれています)。 Pythonのトピックモデリングでは、gensimtutorial)または scikit-learnexample)を使用できます。うまくいけば、ほとんどの話題は製品の特性に対応するでしょう。次に、大規模なコレクションで訓練されたトピックモデルを使用して、各レビューにトピックを割り当てることができます。

十分な数の関連レビューがない場合は、hereのライブラリの1つを使用して、レビューからキーフレーズを抽出できます。それらは「トピック」に配置されないため、分析で実際のキーフレーズを使用します。

トピックまたはキーフレーズを取得すると、それぞれのトピックに関連する平均重要度評価などが見つかります。

関連する問題