私は、データフレームをrealRatingMatrixに変換しようとしていました。しかし、そのためには、まずデータフレームを行列と行列に変換してからrealRatingMatrixにします。 データフレームdfには、475984 rows
と3 columns
が含まれています。
Column1
column2
はcustomer names
とcolumn3
ステップが続くそれぞれのユーザによって与えられたrating of the product
含んでいる、productID
ある:
1欠損値の除去
2行列にデータフレームのデータ
3変換の重複排除を4.テスト行列RのデータフレームからRへの変換
library(recommenderlab)
sapply(df, function(x) sum(is.na(x)))
# 100 missing values in column2
df <- df[-which(is.na(df$col2) == TRUE), ]
sum(duplicated(df))
# 580 duplicates
df <- df[-which(duplicated(df) == TRUE), ]
# Converting the dataframe into realratingMatrix
df_matrix <- data.matrix(df)
# Testing matrix
str(df_matrix)
df1 <- as.data.frame(df_matrix)
マトリックスにデータフレームを変換し、私は次の警告メッセージが出ていますが:
警告メッセージ: in data.matrix(beer_data):強制で導入されたNAs 作成した行列をデータフレームに変換すると、顧客名列(column2)には38エントリだけ残り、すべてがNAになります。
誰かが自分のコードを修正して希望の出力を得る方法を提案できますか?
はあなたには、いくつかのシミュレートされたかのサンプルデータを提供することはできますか? –