私がしようとしているのは、Microsoftなどの会社名を入力して、コンピュータソフトウェア業界にあることを予測できるようにすることです。私はおよそ15万の名前と60以上の産業を持っています。名前の中には英語の会社名がないものもあります。企業名を業界に分類する機械学習
私は、会社名のみに基づいてGensimを使用してWord2Vecモデルをトレーニングし、SKlearnのロジスティック回帰にそれを与える前に単語ベクトルを平均化しましたが、ひどい結果をもたらしました。私の質問は次のとおりです。
誰もこの種のタスクを試しましたか?短い文章分類を検索すると、純粋な名前の代わりに短い文章を分類した結果が表示されます。誰もがこれを試したことがある場合は、このタスクに関するいくつかのキーワードや研究論文を共有することを心配ですか?
各社の名前を使用するのではなく、簡単な説明がある方が良いでしょうか?会社名だけを使用するのではなく、Word2Vecモデルのためにどれくらい助けてくれますか?
ニューラルネットワークで単語ベクトルをすでに取得しているので、 'softmax'出力レイヤーでニューラルネットワークを使用して分類を行うことができます。単語埋め込みレイヤーを分類レイヤーと同時にトレーニングすることもできます。 – Huang
分類レイヤと同時に単語埋め込みレイヤをトレーニングすることは何を意味しますか? @Huang –
)でネットワークを構築する。入力層(会社名または説明)。 b)埋め込み層のワードとc)。 'softmax'出力(分類)レイヤーです。次に、業界別にネットワークを訓練します(クラスラベルとして)。 – Huang