2017-07-31 2 views
-5

異なるデータテーブルをアーティストデータとマージしたいと思います。しかし、アーティスト名は、私のデータセットの中には違う形で綴られています。これらのアーティスト名を照合するための簡単で便利な方法を探しています。これにより、各アーティストにデータセットのマージを容易にするIDを付けることができます。私はまだRにはまだ新しいので、あなたがこのトピックに関するいくつかの指針を与えることができるかどうか疑問に思っていました。アーティスト名は基本的に異なるデータテーブルの文字列です。R data.tableのテキスト名を一致させる

+1

再現例をマージするためにlibrary(plyr)から?revalueを使用できますか? – lmo

答えて

0

名前を修正して、彼らに

dt_age <- data.table(artist=c("Dali","Van Gogh"), 
       age=c(85,37)) 
dt_paintings <- data.table(artist=c("dali","van gogh"), 
        paintings=c("The peristence of Memory","The Starry Night")) 

merge(dt_age,dt_paintings,by="artist") # this is empty 

artist_correct <- c("dali"="Dali", 
         "van gogh"="Van Gogh" 
        ) 
dt_paintings$artist <- revalue(dt_paintings$artist,artist_correct) 

merge(dt_age,dt_paintings,by="artist") # this is correct after we correct the names 
関連する問題