私はテキスト分類のフィーチャエンジニアリングに取り組んでいます。私は機能を選択する上でのポイントで立ち往生しています。大部分の文学は、テキストをトークン化し、それらを機能(ストップワード、句読点を削除)として使用しますが、その後、(肺がん)やフレーズのような複数ワードの単語を逃します。したがって、問題はどのようにngramの順序を決定し、それらを機能として扱うかです。フィーチャエンジニアリングのためのNgram注文の選択
0
A
答えて
0
関連2グラム(このケースでは肺がん)は頻度で表示されます。私は肺がんを持っている人を知っている
:肺癌は恐ろしい病気です
は、次のテキストを想像してみてください。
あなたは2グラムのリストを作成する場合は、最初に肺癌と終了します。と他の組み合わせ(「肺があります」、「憎しみ肺」)が続きます。
これは、単語の特定のグループが何かを表し、したがって繰り返し呼び出されるためで、他のものは2グラムの「環境」を形成するコネクタ(「has」または「hate」)のみであるためです。キーは周波数でフィルタリングすることです。
nグラムの生成に問題がある場合は、間違ったライブラリ/ツールセットを使用している可能性があります。
関連する問題
- 1. "row-subrows"注文選択のMYSQLクエリ
- 2. 注文リストで選択した注文のIDを取得する方法Prestashop?
- 3. 注文数でグループ化された顧客の数を選択
- 4. jpaで注文するケースを選択
- 5. ブール型のTensorflowフィーチャエンジニアリング
- 6. Django管理者の選択ボックスの注文
- 7. 日付文字列からの注入可能クエリの選択
- 8. フィールドの最高2を選択し、別のフィールドで注文
- 9. ローカルとリモートのデータを選択するための依存性注入
- 10. OpenMP並列のための注文
- 11. Pythonのtimeseriesデータセットのフィーチャエンジニアリング
- 12. MySQL |計算された選択値による注文
- 13. 注文された選択行を更新する
- 14. 数字で選択したSQL結果を注文
- 15. 与えられたボックスからセルを選択/注文するための公式
- 16. datepickerでyear-month-dayの選択を注文する
- 17. 管理セクションから注文する際の製品選択グリッド
- 18. 注文の選択に従ってリストを並べ替える
- 19. カスタマーのランダムな注文を選択してください
- 20. rails 2.1.1の選択クエリで注文を追加する方法
- 21. Foxpro各顧客の最新注文を選択
- 22. 選択によるmysqlの注文 - 可能ですか?ここ
- 23. 別のテーブルからデータを選択して注文する
- 24. 特定の選択のためのサーバーサイドレンダリング
- 25. IEのための選択のMouseoverオプション
- 26. ActiveRecordの選択のためのハッシュ
- 27. ノンパラメトリックテストのためのデータの選択R
- 28. MKMapView removeAnnotationは...選択した注釈
- 29. descテーブルのために注文
- 30. 無効な選択のための$ _POST