私はCSVで大規模なデータセットを持っている:Rのarulesの(...、 "transactions")がトランザクションを失うように見えるのはなぜですか?
- は50,000行あり、各行が1つのトランザクションです。
- 各トランザクションには最大5個のアイテムと最小1個のアイテムがあります。
- 可能なアイテムの値は5000種類あります。
- トランザクションに重複する項目はありません。
CSVをRStudioにロードしてunclass()
を適用した後、私はas(...,"transactions")
を適用します。
結果はこのようなものです:
# transactions in sparse format with
# 5 transactions (rows) and
# 1455 items (columns)
代わり50,000取引の、唯一の今そこにあります。
すべての取引はどこにありますか?マトリックスは何とか転置されました(結果の行数はCSVの列数と同じです)。
これはデータ前処理の問題かもしれませんが、thisによると、入力データは適切な形式にする必要があります。
[私はここに初めて投稿してR/RStudioにかなり新しいですよ。]