SVMクラシファイアをsuccessfulyに実装しました。私はscikitのアプローチを使用していません。私は現在、さまざまなタイプのデータでそれを訓練しています。今、私は単一のテキスト入力のためにそれをテストしたいと思います。 私はパンダを使ってみましたが、私は自分のアプローチを変えなければならなかったので、私はそれを使わないことに決めました。 クラシファイアは、ポジティブ、ネガティブ、ニュートラルのラベルを使用した感情分析に使用されています。クラシファイアに送られるデータセットは、ツイッターからのツイートで構成されています。ここで は私の分級だ:https://pastebin.com/JZ5LVLW7クラシファイアのバイナリ機能ベクトルを作成するには
だから、私はが私の機能リストと比較し、バイナリーベクターを生成し、文字列の入力を取るのpythonで関数を設計する上で助けを必要としています。他の選択肢がある場合は、提案してください。 例:テキスト入力が「Footballはヨーロッパで人気のあるスポーツ」 したがって、提案された機能は(既にテストデータの助けによって生成された)機能リストをスキャンし、「football」、機能リストをスキャンすると、[...、1,0,1,1]のようになります。 、0,0,0、...]である。
分類子とは何か、対象とは何ですか? – aisensiy
いくつかの詳細を読み飛ばして申し訳ありません。クラシファイアは、ポジティブ、ネガティブ、ニュートラルのラベルによる感情分析用で、ツイートのデータセットから抽出された機能を含んでいます。 – Monty
これで、テキスト入力用にワンホット機能を生成することになりますか? scikitにはそのためのテキスト機能ツールがいくつかあります。 – aisensiy