ブール検索モデルのクエリでは、異なる演算子を使用して結合された語句で構成されています。一見すると、共起は最も明白な選択ですが、クエリの長さが伸びると悪いことが起こりました。結合を使用しているときに結合と精度を使用したときには、リコールが大幅に低下しました(たとえば、stanford OR university)。 今のところ、私たちは検索システム(およびブール検索モデル)を使用しています。また
私はJavaとJsoupを使ってHTMLページを解析していますが、その中に別のdivが含まれていないすべてのdivを取得して、そこに含まれるテキストを印刷したいとします。 たとえば、divにテーブルが含まれていて、テーブルcostがdivの場合、私はそれを望んでいません。私はそれの中に他のdivはありません(別のタグは大丈夫です)、最下位レベルのdivだけが欲しいです。 どうすればよいですか? P
私はMongoDBに大規模な銀行データベースを構築しました。私はこの情報を簡単に取り、whooshでインデックスを作成することができます。たとえば、私は銀行名の「Eagle Bank & Trust Co of Missouri」と「Eagle Bank and Trust Company of Missouri」を照合することができます。次のコードは、簡単なファジーなと動作しますが、上記の試合を