は現在、私は60万レコードのデータベースを構成されている以下のように見える彼らのカテゴリ情報と商品を表します名前を付けてアイテムのカテゴリを予測する方法は?
{'title': 'Canon camera', 'category': 'Camera'},
{'title': 'Panasonic regrigerator', 'category': 'Refrigerator'},
{'title': 'Logo', 'category': 'Toys'},
....
しかし、カテゴリ情報なしmerchandisesがあります。
{'title': 'Iphone6', 'category': ''},
だから私は私がカテゴリが商品があるべきかを予測するのに役立つscikit-learnを使用して、私のアイテムの名前に基づいてテキスト分類器を訓練することが可能であるかどうかを考えています。私はマルチクラスのテキスト分類としてこの問題を形成していますが、多分deep learning/Kerasも使うことができるので、それぞれのアイテムに1〜複数の絵がありますか?
私はこの問題を解決する最良の方法がわからないので、提案や助言を歓迎します。これを読んでいただきありがとうございます。
P.S.実際のテキストは日本語です
iphone6のタイトルは何回表示されていますか?それが唯一のエントリーであれば、外部トレーニングソースに頼らざるを得ません。 –
@yosemite_k返事をありがとう。私はアイテムに2つの同一のタイトルが表示される可能性は低いと考えていますが、複数のアイテムのタイトルに再表示される用語があります。後ほど詳しい情報を提供します。 – LeeMeng