2016-06-13 5 views
0

SKUとトランザクションIDを持つトランザクションファイル(データ)を分割しています。私はarulesライブラリを使って市場バスケット分析にこのファイルを使用したいと思います。SKUとトランザクションIDを持つトランザクションファイル(データ)を分割しています。スプリットを実行中に文字列または文字が数値に変わります。

次のような問題がある: データ

sku transactionId 
GSB 1000019214173610000 
HF 1000035644171470000 
MT 1000035644171470000 
WP 1000035644171470000 
ED 1000043731010500000 
DT 1000044672723070000 
DT 1000118604897040000 
CF 1000118604897040000 
VS 1000165528585840000 

私が実行します。私は、TRNの出力を検査する場合

isplit <- split(data$sku, data$transactionId) 
trn <- as(isplit, "transactions") 

、すべてのSKU値は、整数の代わりに、自分の名前に変換され、

{54} 1000019214173610000 
{23,35,108} 1000035644171470000 
{66} 1000043731010500000 
{23} 1000044672723070000 
{23} 1000118604897040000 
{27} 1000044672723070000 

なぜ私はSKU値を失っているのですか?リチャードスクリヴン、

によって示唆されるように

+4

ワイルド推測では、: 'データ$ sku'が要因です。 'split()'に 'as.character()'をラップしてみてください。 –

答えて

0

私はスプリットでas.character()でデータ$ SKUを包みました。

更新されたコード:

isplit <- split(as.character(data$sku), data$transactionId) 
関連する問題