2016-09-30 9 views
0

フィーチャマトリックスディメンション(200,716)のモデルを訓練しました。ここで200はドキュメントの数、716はフィーチャの総数です。次にモデルをテストしたい私たちのモデルが訓練を受けているような正確な数の特徴にこのフィーチャをどのようにマップすることができますか?model.predict(test_data)の予測をチェックする機能新しいデータをモデル化する。入力テストデータをフィーチャマトリックスのディメンションに変更

+0

質問の詳細や、問題の理解に役立つ例を挙げてください。例:データを表現するための指標変数の行列を使用していますか?フィーチャーワードは文書内にありますか?など – raghu

答えて

0

答えはあなたにとってはあまり良いことではありませんが、最初に使用したのと同じ方法を使用する必要があります。それを達成するための一般的な「魔法の」方法はありません。訓練文書を生の形式で持っていて、何らかの変換によってそれをフィーチャにマップしました。には、変換自体が格納されています(関数、等。)。あなたがそれを取り除いた場合は、何もできません。通常は、モデル(分類子)と前処理パイプライン(f、データからフィーチャへの変換)の両方をピクルスファイルまたは任意の他のフォーマットで保存します。次に、予測時間の間に、両方のパーツをロードして新しいデータに再度適用します。

関連する問題