私は単語とテキストのデータセットを持っており、クラスタを(K平均で)作成するか、または他の教師なし/監督下の学習方法を使って単語を区別したいとします。例えば、単語「John」は名前として(そして他の人の名前と一緒に集まる)、場所としての「ブラジル」など。 問題を解決するために使用できるモデルはありますか? 私はNgramsの聞いたことがあるが、私はあなたがテキストマイニングと機械学習
-4
A
答えて
0
方法word2vecと埋め込みについての素晴らしいことだろう任意の例を持っている場合のx、yのプロットや、
P.SにNgrams確率をプロットする方法を知りませんか?
https://deeplearning4j.org/word2vec
+0
あらかじめ定義されたクラスがないと、word2vecは良い解決策です。ここでは、テンソルフローのソリューションですhttps://www.tensorflow.org/versions/r0.11/tutorials/word2vec/index.html単語をベクトルの形で表現し、次に余弦距離などを使って表すことができますクラスタリングを行う。あらかじめ定義されたクラスをお持ちの場合は、監視学習を使用する必要があります。 – Rob
関連する問題
- 1. 深い学習と機械学習
- 2. 機械学習、Python
- 3. 機械学習システム
- 4. 機械学習udacity
- 5. Python - 機械学習
- 6. 機械学習モデルテスト
- 7. 機械学習のヌルクラス
- 8. 機械学習 - 分類アルゴリズム
- 9. Coursera機械学習:グラデーションデサントベクトル化
- 10. ロボットでの機械学習
- 11. 機械学習のJavaライブラリ
- 12. 機械学習Webサービス
- 13. aws機械学習エンドポイント
- 14. 機械学習データのフォーマット
- 15. GATEの機械学習
- 16. 機械学習分類アンサンブル
- 17. 反復機械学習アルゴリズム
- 18. 機械学習の提案
- 19. 機械学習用レンタルサーバー
- 20. AWS機械学習エラーS3
- 21. R機械学習モデル - ブラインドテスト
- 22. C#の機械学習ライブラリ
- 23. Azureの機械学習 - データセット
- 24. 機械学習分類データセット
- 25. 機械学習で学習曲線とは何ですか?
- 26. 機械学習モデルのデータフィッティングと予測
- 27. 機械学習 - SVM機能融合テクニック
- 28. ガウスNB機械学習 - 機能解析
- 29. 簡単に学習機械プログラム
- 30. 機械学習の評価基準
「名前」と「場所」のみが気になる場合は、名前付きエンティティソリューションを探す必要があります。それ以外の場合は、ラベル付きデータの優れた情報源(気になるラベル)を見つけ出して開発し、それに基づいて分類子を学ぶことができます。 – greeness
あなたは*管理された*仕事、分類を記述しています。 –
私はデータをクラスター化して、意思決定の境界を作って、単語のタイプを近似できるようにしたい(クラスターは最終的にクラスに分類されます) – DavidOooO