問題があり、どのアルゴリズムを適用する必要があるのかわからない。 私は2つのケースでクラスタリングを適用することを考えていますが、ケース1の場合は考えません。定義済みのカテゴリが利用できないときにテキストを分類する方法
私は500万のクレジットカードアクティビティ文書を持っています。各ドキュメントは明確に定義されており、1行に1トランザクションが含まれています。日付、金額、小売業者名、小売業者の短い5〜20ワードの説明。 サンプル: 2004-11-47、$ 500 Amazon、書籍、ハードウェア、音楽などを含む商品やサービスを提供するオンライン小売業者 質問: 1.事前定義されたカテゴリがない場合、各エントリをどのように分類するのか。 2.「レストラン」、「エンターテインメント」などの定義済みのカテゴリが指定されている場合、これはどのように行いますか?
このプロジェクトの目的は何ですか? –