例、私は数十億の短いフレーズを持っていて、それらのクラスターに似ています。Rで類似の文章やフレーズを見つける方法は?
> strings.to.cluster <- c("Best Toyota dealer in bay area. Drive out with a new car today",
"Largest Selection of Furniture. Stock updated everyday" ,
" Unique selection of Handcrafted Jewelry",
"Free Shipping for orders above $60. Offer Expires soon",
"XXXX is where smart men buy anniversary gifts",
"2012 Camrys on Sale. 0% APR for select customers",
"Closing Sale on office desks. All Items must go"
)
このベクトルが何十万行もあると仮定します。これらのフレーズを意味づけするためにRにパッケージがありますか? 、または誰かが、特定のフレーズに意味を付けて "類似した"フレーズをランク付けする方法を提案する可能性があります。
"意味"を定義する方法をどのように提案しますか?あなたの模範的なフレーズのどれを一緒に集めるべきですか? – tripleee