私は約150,000のLARGE TEXTフィールドをmysqlデータベースの中に持っています。各TEXTフィールドは約1ページのテキストを表し、ここからページと呼ばれます。大きなテキストフィールドの比較グループ化 - FULLTEXT検索、SOLR、またはその他?
これらのページを関連性の低いページにグループ化したいと思います。これを行う方法に関する私の考えは、mysqlでFULLTEXT Indexを使用することです。私はテキストのブロックを入力し、FULLTEXTの検索ランクを他のページと関連付けるようにします。 FULLTEXT検索に入れることができるテキストブロックの大きさには限界がありますか?
PHP/mysqlを使用してこれを行う他の方法はありますか? SOLRのような検索エンジンを実装する必要がありますか?
関連性を判断することは難しい問題です。フィールドを分類したい、またはフィールドとの関連性を探そうとしているカテゴリー/用語のリストがありますか? – Sukumar