levenshtein-distance

    0

    4答えて

    まず、私は開発には新しく、少し手を持たせる必要があります。 私は単純な検索フィールド(提案付き)を構築し、配列一致の関連するランディングページにユーザーを送りました。検索が適切でない場合は、エラーメッセージを返します。しかし、私のコードは、ユーザーが提案をクリックしたり、検索フィールドに単語全体を入力することに依存しています。したがって、使い勝手が悪いです。 以下のコードは私の問題を際立たせます。

    0

    1答えて

    私はテキストをグループ化するのに助けが必要です。私はこのような加盟店のリストを持っています。最初のいくつかはSMART ATTの隣にあるCENTURYLINKに属しています。これらのテキストをグループ化/単一ラベルを持つか...彼らはに陥るプールごととして予め 001センチュリーIREP 003センチュリーMY ACCOUNT 003-ClearTalkワイヤレスで おかげでこれらのテキストを分類

    2

    3答えて

    私は、2つの単語の間に0または1の距離があるかどうかを確認し、そうであれば真を返すだけのゲームに取り組んでいます。 function levenshtein(s, t) { if (s === t) { return 0; } var n = s.length, m = t.length; if (n === 0 || m === 0) { return n + m;

    1

    1答えて

    Tensorflowにあるコードを書いて、1つの文字列と文字列の間の編集距離を計算しました。私はエラーを理解することはできません。 import tensorflow as tf sess = tf.Session() # Create input data test_string = ['foo'] ref_strings = ['food', 'bar'] def create_

    5

    1答えて

    私はテレビ番組やその他のメディア(ゲーム、映画など)用のスクレーパーを書いていますが、すべてのソースが特定のショーのために同じ方法でフォーマットされているわけではありません。たとえば、1つのソースはダッシュで字幕を表し、他のソースではセミコロンを表すことがあります。私は現在、Levenshtein距離を使用して、スクラップしたデータとTVショーファイル名から抽出したデータを比較していますが、アルゴ

    0

    1答えて

    多くのプロパティを持つ2つのオブジェクトが類似しているかどうかを確認する最良の方法はありますか? LOCATION1、LOCATION2、LOCATION3、location4、...、postalCodeの、所有者、住民.. 彼らはすべてのPostgresのデータに格納されています。アドレス、同様に、10個のフィールドを持っている - は、私は、オブジェクトを考えてみましょうjsonbタイプのベ

    2

    1答えて

    私たちはバージョン14で、Netezza/Postgre(Redshift)バックグラウンドから来ました。私は監査ログからログインデータを抽出して、同じIPが小さな変更を伴って同様の見た目のユーザー名を送信しているレコード/トランザクションを見つけ出すように求められました。 Samir - > Samr - > Amirなど フィッシング活動をキャプチャする。 POstgresには、 '%'のよう

    0

    1答えて

    ことが可能にいくつかの「カスタム条件」を使用して(複数のフィールド上の)2つの(Pair)RDD S(またはDataset S/DataFrame秒)に参加することです/ファジー・マッチングを一致/ファジーカスタム条件を使用して、例えば数字または日付のための範囲/間隔、および様々な「距離法」。 Levenshtein、ストリングス? PairRDDを取得するRDD内の「グループ化」のために 、一つ

    0

    1答えて

    私のアプリケーションでは、電話カメラをスキャンしてテキストを検出します。私のアプリケーションが関係する唯一の単語は有効な英語です。 私は〜354000の有効な英語の単語のリストを持っています。私はあなたのスキャンした単語を比較することができます。 私のアプリケーションではテキストが継続的に検出されるため、この機能は非常に高速である必要があります。私はLevenshtein距離法を適用しました。各単

    0

    1答えて

    レーベンシュタイン距離は、反復的に2行をこのように使用して計算することができます:私は転置を考慮に入れないOptimal String alignment distanceに出くわした https://en.wikipedia.org/wiki/Levenshtein_distance#Iterative_with_two_matrix_rows 。ウィキペディアは、通常のレーベンシュタインアルゴ