虹彩データセットの2つの単純な列を使用して編集距離を計算する

-1

以下のコードでは、2列のテキスト文字列間の類似度を計算します。これを達成するには、虹彩から "Petal.Length"それをa1に割り当て、虹彩の「Sepal.Length」列の最初の4行をa2に割り当てます。私の目的は、最後の行の数式を使って各a2値をすべてのa1値と比較して、40個の値を持つ最終ベクトルpercent_calcを得ることです。虹彩データセットの2つの単純な列を使用して編集距離を計算する

library(stringdist) 
library(RecordLinkage) 

a1 = iris$Petal.Length[1:10] * 1000 
a2 = iris$Sepal.Length[1:4] * 1000 
a1 = as.character(a1) 
a2 = as.character(a2) 

percent_calc = RecordLinkage::levenshteinSim(a2,a1)

出典

2017-12-07 Ashmin Kaul

'sapply（A2、機能（ⅰ）RecordLinkage :: levenshteinSim（I、A1））' – Sotos

@Sotos、私が行列を参照してください私はちょうど40の値でベクトルが欲しいです。 –

その行列をベクトルに変換してください!!!!それは難しいことではありません！ – Sotos

距離を取得、その後、すべての組み合わせを取得します、

は

a12 <- expand.grid(a1, a2, stringsAsFactors = FALSE) 

percent_calc <- levenshteinSim(a12$Var1, a12$Var2) 

percent_calc 
# [1] 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 
# [19] 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.75 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 
# [37] 0.50 0.50 0.50 0.50

出典

2017-12-07 09:36:19 zx8754

助けていただきありがとうございますが、私は解決策を得ていますが、上記の第2部では助けが必要です。私をここで助けてください。 –

虹彩データセットの2つの単純な列を使用して編集距離を計算する

答えて

関連する問題