私はパンダには新しく、これらの2つのシリーズがあります。パンダのコラムのコサイン類似度を計算する
train['description_1']
およびtrain['description_2']
はシリーズです。それらはそれぞれ、各行のベクトルを含みます。
from scipy.spatial.distance import cosine
item3 = pd.concat([train['description_1'], train['description_2']], axis = 1)
cos_vec = item3.apply(cosine)
例外TypeError: ('cosine() takes exactly 2 arguments (1 given)', u'occurred at index description_1')
列車[ '記述']の各要素は、ベクターを含有するであろう。
私はあなたが必要とするこの
train_1 train_2
[1.0,2.0] [2.0,3.0]
[2.0,2.0] [3.0,2.0]
Output:
cos_sim
x
y
、' cosine'が繰り返し入力として、各列がかかりますがだからこそ、それはただ一つの引数を受け取るのです。 – IanS
どうすればこの問題を解決できますか? – aceminer