sparkの音楽に関連するつぶやきについての感情分析に関するガイダンスが必要です。音楽に関するtwitterデータのセンチメント解析のための機能
私は、音楽に関連するつぶやきのツイッターデータについて感情分析を実行しようとしていました。ネット上でたくさんの検索をした後、私はtweepyのpython apiを使ってツイートを取得する方法を理解していますし、最終的にツイートを分類するために 'Naive Bayes classifier'を使うこともできることに気付きました。今私は、この分類のためのフィーチャを定義する方法について混乱しています。私は少なくとも500のフィーチャを定義することになっています。ここに私の質問があります。私はつぶやきの感情を見つけるために 'textblob'のような既に利用可能なAPIを使用したくありません。
1)誰かが音楽関連のつぶやきを分類するために使用できる機能の例を挙げることはできますか? [肯定的な訓練セットとして幸せな笑顔でつぶやきを使用することはできますか?もしそれらのツイートの言葉が私のクラシファイアの特徴ですか?]
2)この分類器のトレーニングセットはどのように生成するのですか?
3)ミュージック関連のつぶやきのつぶやきをフィルタリングしたい場合は、ブルームフィルタを使用してそれを達成できますか?
4)tweepy apiで得ることができるデータのサイズは?
私の理解に間違いがある場合は、私に修正してください。