0
SKUとトランザクションIDを持つトランザクションファイル(データ)を分割しています。私はarulesライブラリを使って市場バスケット分析にこのファイルを使用したいと思います。SKUとトランザクションIDを持つトランザクションファイル(データ)を分割しています。スプリットを実行中に文字列または文字が数値に変わります。
次のような問題がある: データ
sku transactionId
GSB 1000019214173610000
HF 1000035644171470000
MT 1000035644171470000
WP 1000035644171470000
ED 1000043731010500000
DT 1000044672723070000
DT 1000118604897040000
CF 1000118604897040000
VS 1000165528585840000
私が実行します。私は、TRNの出力を検査する場合
isplit <- split(data$sku, data$transactionId)
trn <- as(isplit, "transactions")
、すべてのSKU値は、整数の代わりに、自分の名前に変換され、
{54} 1000019214173610000
{23,35,108} 1000035644171470000
{66} 1000043731010500000
{23} 1000044672723070000
{23} 1000118604897040000
{27} 1000044672723070000
なぜ私はSKU値を失っているのですか?リチャードスクリヴン、
によって示唆されるように
ワイルド推測では、: 'データ$ sku'が要因です。 'split()'に 'as.character()'をラップしてみてください。 –