私はまだPythonとPandasの新機能を持ち、今後の進め方はわかりません。他の2つのデータフレームに基づいて新しいデータフレームを作成
基本的な概要:私は位置推薦システムを作成する必要があります。私は、venueID
とsub(!)categoryID
を持ついくつかの正方形のデータを与えられました。しかし私の推薦では、メインカテゴリーのすべてのデータを考慮する必要があります。ですから、どういうわけか私は主なカテゴリーを私の会場に割り当てる必要があります。
マイフォースクエアのデータフレームは、次のようになります。私はすでにメインカテゴリとそのサブカテゴリを持つデータフレームを作成している
UserID VenueID CategoryID CategoryName
470 49bbd6c0f964a520f4531fe3 4bf58dd8d48988d127951735 Arts & Crafts Store
979 4a43c0aef964a520c6a61fe3 4bf58dd8d48988d1df941735 Bridge
69 4c5cc7b485a1e21e00d35711 4bf58dd8d48988d103941735 Home (private)
:
Main Category Name Main Category ID Sub Categories Name Sub Categories ID
0 Arts & Entertainment 4d4b7104d754a06370d81259 Amphitheater 56aa371be4b08b9a8d5734db
1 Arts & Entertainment 4d4b7104d754a06370d81259 Aquarium 4fceea171983d5d06c3e9823
2 Arts & Entertainment 4d4b7104d754a06370d81259 Arcade 4bf58dd8d48988d1e1931735
だから、基本的に私がしたい:VenueID's Category ID
場合(フォースクエアからdf)がcategories_df
にある場合、venueID
を対応するメインcategory ID
と新しいデータフレームで書き込みます。私はあなたが私が意味することを理解できないことを願っています。
私はちょうど私の推薦のために主要なカテゴリを使用したいと思うし、サブカテゴリを考慮しません。
ありがとうございます!
どうもありがとうございました。これはまさに私が欲しかったものです。私はすでにSQLのすべての時間を考える必要があり、どのようにSQLでそれをやるのだろう... ^^ – Paprikamann