私はBase64の文字でいっぱいのさまざまな長さの文字列を持っています。実際には、音声認識データは曲ごとに異なります。数値に変換する文字列マッチング技術?
これらの文字列の一部を簡単に比較するために、それらを16文字のサブ文字列に分割します。 (曲の約1秒ですが)しかし、場合によっては、これらのものと頭を比較することはできません。私はそれらを測定する必要があります。
は「hellohellohelloo
」と「hallohellohelloo
」と例の比較のために、その後「hellohellohelloo
」と「herehellohelloo
」比較近い値を取得する必要があります。申し訳ありませんが、私はここに新しいです:)、私は自分自身を明確にすることができませんでした:
は、任意のアルゴリズムまたはtheorical
編集あります。ここに私を明確にし、アイデアを提案するいくつかのコメントがあります。
コメント1:
実際に私は、レーベンシュタイン距離について知っているが、問題は私が比較マトリックスを構築する必要が2つの文字列を比較すると、それは検索処理が遅くなり、すべての時間です。たとえばhelloを4444に変換し、halloを4443に変換できるのであれば、数値をインデックスに登録するだけでレコードがどれくらい近いかを判断できます。
コメント2:
多分私は、文字列のインデックス値としてそれらからベース一定長の文字列(S)及び店舗距離値を決定すべきです。それは単なるアイデアですか?
「音声認識データ」には実際に読み取り可能なテキストが含まれていますか? –
私が尋ねるのは、 "テキスト"への変換がとても良いので、単語やそれに類するものを選ぶことができれば、単純なlevenshtein-distanceの実装、または類似したものが動作するということです。異なるサンプルポイントを生成する、波形のように位相が少しずれているような変換の問題で文字列全体が異なる場合、levenshteinは役に立たないでしょう。オーディオから実際のデータを投稿できますか? –
いいえ、テキストではありません。これは、base64の文字だけで充分です。 –