fuzzy-search

    -2

    1答えて

    PowerShellスクリプト内でファジーストリングマッチングを実行するにはどうすればよいですか? 私は、さまざまなソースからスクレイプされた人々の名前のセットが異なり、それらを配列に格納しています。私は新しい名前を追加するときに、名前を既存の名前と比較したいと思います。もしそれらがあいまいに一致するならば、私はそれらを同じものとみなしたいと思います。例えば、データセットで: @("George

    1

    1答えて

    大きな配列(F)内で発生する小さなDNA配列(R)の数を検索してカウントしようとしていますが、Rには数文字変数。私が考えることができる最も簡単な方法は、Rの比率を設定し、Fの80%を超えるすべてのヒットをカウントすることですが、これを行うようなコマンド(difflibのSequenceMatcherやget_close_matchesなど)は動作するリストが必要です。私はそのようなリストにFを入れ

    0

    2答えて

    私は継承した汚れたデータベースを整理しており、人間の見直しのために名前を「曖昧にする」必要があります。私は動作する解決策を思いついたが、それはひどく遅い - 15k行で7分。私は本当にシンプルな解決策を見落としていると感じています。 例レコード: 1 John Smith 2 John Q Smith 3 Janway Smith 4 Jane Chen 5 David Jones 6

    0

    1答えて

    BK Trees (Burkhard-Keller Trees)はファジー文字列検索(スペルチェック、単語推奨など)に関連付けられています。そして、すべてのBK木探索アルゴリズムはexplained hereと同じです。目的は、たとえば"seek" and "peek" if I search for "aeek"のように戻ります。 は今、私の質問は、私はため与え辞書からすべて関連商品を検索するに

    0

    1答えて

    私は1つのfuziness距離を有する単純なテキストフィールドの検索を行い、単純な弾性クエリ持っている:上記のクエリは、やるように言われているまさにありませんが、私 GET /jobs/_search { "query": { "fuzzy": { "attributes.title": { "value": "C#" "fuzziness

    1

    1答えて

    '用語'を複数のフィールド(または_allフィールド)と一致させるために取り組んでいます cross_fieldsでファジーマッチを行いたいがサポートされていません。 それを行う方法やそれを行う他の方法はありますか? query: { multi_match: { query: term, type: "cross_fields", fields: ['_a

    1

    1答えて

    xqueryを使用して検索を実行するさまざまなxmlドキュメントを格納するためにexist-dbベースを使用します。これは、XML文書の例である: <person personID="some_id"> <name> <familyName>Doe</familyName> <firstName>John</firstName> </na

    0

    1答えて

    クライアントが提供するルックアップに基づいてフィールド値をクリーンアップしたいとします。残念ながら、Fieldにはさまざまな名前の組み合わせがあります。たとえば、一部のクライアント名には「限定」または「ltd」の組み合わせがあります。一部にスペースがありません。クライアントが提供するルックアップに基づいてこのフィールドをクレンジングするための最良の方法は何でしょうか。 SQL Extract

    0

    1答えて

    私は2つのcsvを持っていますが、1列の値で行を照合することができます(この列を微調整した後)。マッチングの後、私はそれらの両方からいくつかの値を取って新しい組み合わせの行を作りたいと思う。私はそれらの両方のためcsv.DictReaderを使用して簡単なスクリプトを考え、次にダブル for row1 in csv1: for row2 in csv2: if row1['someID