2017-03-22 38 views
1

私は、アイテムのグループ化/マーケットバスケットを作成するためにaprioriアルゴリズムを使用しています。以下は、このデータセットをトランザクションクラスタイプに変換した後の要約です。AprioriのエラーR

私のエラーは、apriori関数で選択されているパラメータと関係があると思います。どんな洞察も素晴らしいだろう。

summary(groceries) 

transactions as itemMatrix in sparse format with 
57 rows (elements/itemsets/transactions) and 
817 columns (items) and a density of 0.03135133 

most frequent items: 
        A     B     C     D    (Other) 
       13     13     13     12     12    1397 

element (itemset/transaction) length distribution: 
sizes 
    3 4 5 6 7 8 9 10 13 14 16 17 18 22 29 30 32 33 34 40 43 45 55 77 86 111 118 353 
    7 4 4 4 3 4 4 3 1 3 2 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 

    Min. 1st Qu. Median Mean 3rd Qu. Max. 
    3.00 5.00 9.00 25.61 29.00 353.00 

includes extended item information - examples: 
    labels 
1  E 
2  F 
3  G 


groceryrules<-apriori(groceries, 
         parameter = list(support = 0.15, 
         confidence = 0.05, 
         minlen = 2)) 

これを実行している場合、それは素晴らしい作品が、私はあまりにも多くの勧告が現れているわけではないのでサポートを低下しようとすると、それは動作しません。

私が試した:

groceryrules<-apriori(groceries, 
         parameter = list(support = 0.14, 
         confidence = 0.05, 
         minlen = 2)) 

Apriori 

Parameter specification: 
confidence minval smax arem aval originalSupport maxtime support minlen maxlen target ext 
     0.05 0.1 1 none FALSE   TRUE  5 0.14  2  10 rules FALSE 

Algorithmic control: 
filter tree heap memopt load sort verbose 
    0.1 TRUE TRUE FALSE TRUE 2 TRUE 

Absolute minimum support count: 7 

set item appearances ...[0 item(s)] done [0.00s]. 
set transactions ...[817 item(s), 57 transaction(s)] done [0.00s]. 
sorting and recoding items ... [14 item(s)] done [0.00s]. 
creating transaction tree ... done [0.00s]. 
checking subsets of size 1 2 3 4 5 done [0.00s]. 
writing ... [90 rule(s)] done [0.00s]. 
creating S4 object ... done [0.00s]. 
Warning message: 
In apriori(groceries, parameter = list(support = 0.14, confidence = 0.05, : 
    Mining stopped (maxlen reached). Only patterns up to a length of 5 returned! 

はなぜ支援を変えるだろうが、量のこの小さな、エラーが発生?

+0

'メモリが不足しています。最小限のサポートを増やしてください。 – Drey

+0

エラーは何ですか?それはどこにある? –

+0

それは鉱業が停止したので、私はそれが関数の完全な完了をしていないと仮定していると思います –

答えて

2
Mining stopped (maxlen reached). Only patterns up to a length of 5 returned! 

minlenとmaxlenが責任を負います。あなたのパラメータリストにminlen =2と記入しました。あなたはmaxlenを指定していないので、algoはデフォルト値の10をとりました(algo出力でチェックアウト) maxtime(どちらも指定しておらず、デフォルト値の5秒で使用されました)は、長さnのルールでは、計算には5秒以上かかります - そして、algoはあなたが持っているように警告を出して停止します - maxtimeルールが破られる前にmaxlen=5になっただけです。

サイズ6のサブセットがチェック
checking subsets of size 1 2 3 4 5 done [0.00s]. 

- のいずれか(MINLENと同じパラメータリストに追加する:maxtime=10またはmaxtime=20など)MAXTIMEを変更する - そう......長すぎるので、スキップされた

がかかりますほとんどの場合と同様に、警告を無視します。これはエラーではありません。 5項目以上のルールを見つけることは本当に重要ですか?私はそうは思わない。あなたはこれを指定していませんでした。デフォルト値である

+0

説明のためのおかげで@ Zahiro Mor –