1
任意の2つの配列間のLevenshtein距離を計算したいと思います。Levenshtein /任意の配列の距離を編集
a <- 1:100
b <- c(1, 1:100)
edit_distance(a, b) == 1
私はadist
機能とstringdist
パッケージの承知していますが、彼らは唯一の文字ベクトルに働きます。シーケンス内のシンボルの数が少ない場合、それらを文字としてエンコードし、上記の関数を使用することができます。
しかし、通常は1000個の異なるシンボルのオーダーになります。もう一つの選択肢は、Unicode文字(adist
がそれらに対応しています:adist("\U00001", "\U00001\U00002")
)としてそれらをエンコードすることですが、これを行う方法はわかりません。
たぶん 'jmotif'パッケージは一見の価値があるでしょう。それがあなたが探しているものであるかどうかは分かりませんが、重複しています。 – lmo