多くのアルゴリズム(NaiveBayes、隠れマルコフモデル、条件付きランダムフィールドなど)を見つけましたが、ほぼすべてがエンティティを分類するために巨大なトレーニングデータを必要としているようです。トレーニングデータ用にテキスト全体を必要としないエンティティ認識器分類器アルゴリズムがありますか?
訓練データにテキストを含まずに認識できるアルゴリズムがあるかどうかを知りたいのですが、認識したいデータを表す単語だけ、あるいはいくつかの文字列パターンなどがあります。
私が避けたいのは、巨大なテキストをトレーニングデータとして使用する必要があることだけです。