私は何年もの間にニュースのデータを持っており、テストニュースを与えるたびにそのニュースが関係する業界を返します例えば「製造」または「金融」のようなものです。それは分類アルゴリズムを使って行うことができますが、あいにく私はデータを訓練するための分類子を持っていません。データは以下の形式であったであろう場合、私は産業分類するための分類アルゴリズムを適用することができトレーニングデータに分類子を含まない分類
ID | News
1 | News1
2 | News2
3 | News3
:
ID | News | Industry Related to
1 | News1 | Manufacturing
2 | News2 | Finance
3 | News3 | e-commerce
をしかし、あなたはニュースのAPIは、関連業界に提供しません知っている私のデータは、このようになりますニュースに。この場合、私のモデルを訓練するにはどうすればよいですか?
ありがとうございます。私は教師なし学習とLSHの文書間のコサイン距離の類似性の基礎を学んだが、私がここでそれを適用できると考えることができるまでには達していない。 – muazfaiz