テキストをカテゴリに分類しようとしています。私は9つのカテゴリを持っていますが、私が持っている与えられた文章は、より多くのカテゴリに分類することができます。私の目的は、文章を取り、各文章の業界を見つけることです。私の訓練セットには「ポルノ」カテゴリがなく、「財務」に分類されたポルノ資料を持つ文章がありません。マルチクラステキスト分類:入力がクラスと一致しない場合の新しいクラス
文章をクラスに分類できるかどうか、またそのテキストを分類できない印刷だけではない場合は、分類器に確認してもらいます。
私はTf-idfベクトル化ツールを使用して文章を変換してから、データをLinearSVCに送ります。
誰でもこの問題を解決できますか? 誰かが私に有用な資料を教えてもらえますか?