多くの欠損値とより多くのカテゴリ値を持つデータセットのジェンダー分類子に取り組んでいます。カテゴリ値を数値に変換する方法より正確な精度を得るには? https://github.com/lakshmipriya04/py-sample/テキストデータでデータセットを整理して分類するにはどうすればいいですか?
0
A
答えて
0
カテゴリ変数エンコーディングには、ダミー変数の作成とラベルエンコードによるエンコードの2種類があります。
ダミー変数の欠損値は、ダミー列の各束に対してヌルベクトルとして表示されます。ラベルエンコーディングの場合、それは特定のクラス(ラベル)であってもよい。
欠損値の問題を解決するには、平均(数値)またはモード(カテゴリ)を使用してそれらを代入できます。値がない場合は1、それ以外の場合は0を持つ追加の欠損値指示列を作成すると便利です。
転用によって、MLからの任意の分類子を使用することができる。 SVC(バイナリ分類があるため)を試し、単純なロジスティック回帰から始めましょう。
転用なしでのみ、XGBoostが役立ちます(データセットに欠損値があることが許されます)。
しかし、もう少し問題があります。テキストを前処理する必要があります。 NLPについてお読みください。
関連する問題
- 1. 時系列分類のためのデータセットを構築するにはどうすればいいですか?
- 2. keras RNNをデータセットのテキスト分類に使用するにはどうすればよいですか?
- 3. sklearnのアンサンブル分類器でカスタム分類子を使用するにはどうすればよいですか?
- 4. クラウドフォーメーションテンプレートを整理するにはどうすればいいですか?
- 5. 連続データを分類するにはどうすればよいですか?
- 6. Mavenで共有ライブラリを使用してプロジェクトを整理するにはどうすればいいですか?
- 7. ng-classを整理するにはどうすればよいですか?
- 8. 誤って分類された画像を表示するにはどうすればいいですか?
- 9. SharePoint 2010 EditModePanelで正しい分類法コントロールを表示するにはどうすればよいですか?
- 10. Doxygenでtypedefをどのように分類すればよいですか?
- 11. Eloquentを使用して大規模データセットを処理するにはどうすればよいですか?
- 12. PythonでMLアルゴリズムの機能としてテキストデータをエンコードするにはどうすればよいですか?
- 13. ランダム値に対して分類器の精度をテストするにはどうすればよいですか?
- 14. バイナリイメージ分類のためのデータセット編成はどれですか?
- 15. 次の分析でさらに分類を行うにはどうすればよいですか?
- 16. python3で整理したファイルを辞書にするにはどうすればいいですか?
- 17. annaulデータセットをパネルにマージするにはどうすればいいですか?
- 18. wekaでコストに敏感な分類器を実装するにはどうすればいいですか?
- 19. facebook/deepmaskで自分のデータセットをトレーニングするにはどうすればいいですか?
- 20. 私のビュー(MVC)をきれいに整理するにはどうすればいいですか?
- 21. Pythonを使用してデータを1行に整理するにはどうすればよいですか?
- 22. スライディングウィンドウのオブジェクト検出で真のネガを分類するにはどうすればいいですか?
- 23. カテゴリのない散布図を非分類データでプロットするにはどうすればよいですか?
- 24. Matlabの熟練した分類器を使用してC++でデータを分類するにはどうすればよいですか?
- 25. Scalaアプリケーションでimplicitsをどのように整理すればよいですか?
- 26. ファイルをXcodeでどのように整理すればよいですか?
- 27. IISでWebアプリケーションをどのように整理すればよいですか?
- 28. 深いネストされたオブジェクトを分類するにはどうすればよいですか?
- 29. Automapperでデータセットを使用するにはどうすればよいですか?
- 30. 分類のためのテキストデータの扱い
sub.hsub_category、description、titleの機能を削除することはできますか?product.httpsの特定のカテゴリの性別を分類する必要があるためです://github.com/lakshmipriya04/py-sample – LPR
できますか。しかし、それが間違って表示されている場合は、後でsub_sub_category、説明、タイトルを返すのは間違いではありません。 – avchauzov
説明を見てください。時には、「女性」、「男性」、「女性」、「男性」があることがあります。これらのトークンは、「ショートモデル」が完璧でない場合に非常に役立ちます。 – avchauzov