私は分析をしたい:どの商品が市場バスケット分析でうまくいっていないのか。基本的にどの項目が一緒にキューから出ていないのかを調べる。私は、属性(属性/列が13個含まれています)が属性のさまざまな組合せのために不完全である状況があります。 例:a1、a2 .... a13。 上記の属性はすべて値を持っていてもいなくてもかまいません。しかし、値が設定されていない属性では、レコードが不完全になる場合があります。市場バスケット分析の逆数R
この状況では、不完全なレコードの組み合わせが主にレコードセットに含まれています。このパターンを知ることは、私のチームが最も注意を必要とするレコードの優先順位付けに役立つでしょう。 Aprioriアルゴリズムは利用可能な値だけを取ることがわかりますが、発生していない組み合わせを分析する必要があります。私はこの問題が過去に解決されているはずだと確信していますが、フォーラムでは何のヒントも見ません。 誰もそのような種類の経験はありますか?あるいは、私が使うべき他のアルゴリズムを提案していますか?私はこの分析にRを使用しています。そして、合計レコード:218k
データに適切な統計分析方法を選択する際には、[stats.se]または[datascience.se]に質問を投稿する必要があります。これは具体的なプログラミングに関する質問ではありません。 Rを使用したいという事実は、データを分析するための適切な方法を選択することとは無関係です。 – MrFlick