2017-05-23 5 views
1

私はそれにダブレットがたくさんあるデータセットを持っています。私は正確に同じ名前を持っていないので、倍の変数間のおおよその一致を検索したいと思います。私はそれらを比較したいので、どれを削除しなければならないかを判断することができます。変数は、お互いに非常に似ていて、少数の文字でちょうどコンマかスペースで異なるプレとラストネームです。たとえば、「スミス」という名前のケースがあり、次のケースは「スミス」と呼ばれますが、ケースは同じです。どのようにそれらをマージできますか?変数間の近似

ありがとうございました!

答えて

1

あなたが探しているのは、確率論的なマッチングとも呼ばれる確率的なレコード結合です。 MATCH FILESコマンドによって提供される、確定的なレコード結合とは対照的です。確率的なレコード結合は、SPSSの標準的な機能ではありませんが、追加のソフトウェアが必要です。