-5
私は2人のユーザー間のチャットからテキストを分類するために分類器を訓練しようとしています。後で、2人のユーザーの誰がX文/単語をよく言うかを予測できます。そこに行くために、私はチャットログからテキストを採掘し、単語の2つの配列UserA_words
とUserB_words
で終わった。ユーザー分類に使用するチャットテキストデータの表現は何ですか?
この配列をnaiveBayesやSVMのような分類器に渡すためにはどのフォーマットで変換する必要がありますか?例:パスクラシファイアへの言葉の表現の袋?
特定の分類タスクに使用するML表現を質問するのは、姉妹サイト[DataScience.SE]でオントピックになっています((実際のタイプミスの可能性があります) http://datascience.stackexchange.com)。そこに移行してください。 – smci
これを保留にすることは建設的ではありません。DataScience.SEに移行するか、ここで開いてください。私の答えは、これは実際の答えがあることを示しています。 – smci
@smci申し訳ありませんが、私はここで新しく、Data Science SEで同様の質問を投稿しましたが、どのように移行しますか?事前にありがとう – whiteTea