私は文法学校の満足度や一般的な問題を調査することを目的とした生徒のチームの「プログラマー」です。私たちは1-6の尺度に基づいて作成された質問を持っており、私はこれらの答えをPythonで書いたダイアグラムソフトウェアで解釈します。アンケート回答を調査するためにテキスト分析を使用するにはどうすればよいですか?
私たちの質問の最後に、好きなように使うことができる<textarea>
があります。 私は現在、このデータを使用可能にする方法を考えています(私たちは800以上の回答を読んでいません)。
Pythonでテキスト解析を使用して、生徒が何を書き込むかを調べるにはどうすればよいですか? 私はのように、「タグ」への道の下に書かれている任意の文を考えていた:
I don't like being in school. [wellbeing][negative]
I have way too much homework. [homework][much]
I think there should be more interesting projects. [projects][more]
はそれを得るために任意の使用可能なアプローチがありますか?既存のトークナイザを使用することは理にかなっていますか?
ありがとうございました!
800回答はNLPを行うのに十分ではありません。手動で回答を読む方が良いです。ナイーブなベイズ分類器を600でトレーニングし、それを200でチェックすることができますが、これは2次元を取得するだけです。さらに多くのタグでこれを行うことは可能ですが、さらに多くのエントリが必要になります。 – kreativitea
ボックスコメントが完全にフリーフォームであることを伝えたら、それとも役に立つトピックがあるのかを教えてください。 (またはそれに答えるためにクラスタリングを使う、あるいは普通の古いgrepを使うか、それとも自分自身で眼球を書く) – smci