2017-12-07 11 views
-1

以下のコードでは、2列のテキスト文字列間の類似度を計算します。これを達成するには、虹彩から "Petal.Length"それをa1に割り当て、虹彩の「Sepal.Length」列の最初の4行をa2に割り当てます。私の目的は、最後の行の数式を使って各a2値をすべてのa1値と比較して、40個の値を持つ最終ベクトルpercent_calcを得ることです。虹彩データセットの2つの単純な列を使用して編集距離を計算する

library(stringdist) 
library(RecordLinkage) 

a1 = iris$Petal.Length[1:10] * 1000 
a2 = iris$Sepal.Length[1:4] * 1000 
a1 = as.character(a1) 
a2 = as.character(a2) 

percent_calc = RecordLinkage::levenshteinSim(a2,a1) 
+1

'sapply(A2、機能(ⅰ)RecordLinkage :: levenshteinSim(I、A1))' – Sotos

+0

@Sotos、私が行列を参照してください私はちょうど40の値でベクトルが欲しいです。 –

+1

その行列をベクトルに変換してください!!!!それは難しいことではありません! – Sotos

答えて

0

距離を取得、その後、すべての組み合わせを取得します、

a12 <- expand.grid(a1, a2, stringsAsFactors = FALSE) 

percent_calc <- levenshteinSim(a12$Var1, a12$Var2) 

percent_calc 
# [1] 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 
# [19] 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.75 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 
# [37] 0.50 0.50 0.50 0.50 
+0

助けていただきありがとうございますが、私は解決策を得ていますが、上記の第2部では助けが必要です。私をここで助けてください。 –

関連する問題