会社の説明から抽出された一連のキーワードが与えられ、会社の 'タイプ'を分類するモデルを作成したいと考えています。例を挙げて説明しましょう。小規模データセットのNLP分類/推論 - >単語埋め込みアプローチ
は「Snapchatはエバン・シュピーゲル、ボビー・マーフィー、とレジー・ブラウンによって作成された画像メッセージングおよびマルチメディアモバイルアプリケーションである、[3]スタンフォード大学の元学生、および、もともと株式会社Snapchatスナップ株式会社が開発した」
サンプル抽出キーワード:「画像メッセージング」。 「マルチメディアモバイルアプリケーション」
この情報を考えると
(Snapchat上のWikipediaのページから)、私のモデルは、「画像メッセージング」と「マルチメディア携帯から「IT」と「SNS」を推測する必要があります。応用"。
(抽出されたキーワードを使用しない理由を尋ねている場合は、すべての企業で可能な限りラベルに分類したいので、 'IT'と 'SNS'は 'imageメッセージングなど)
現在、私のデータセットはそれほど大きくありません。何百ものデータエントリについて、〜80%は私が望む方法で情報を含んでいます。この情報を元に、会社の説明から抽出したキーワードを処理し、正しいラベルを付けたいと考えています。
このプロジェクトで私を助けるための提案は素晴らしいでしょう。