これは非常に基本的な例です。しかし、私はいくつかのデータ分析をしており、確率テーブルを生成するように非常に似たSQLカウントクエリを書いています。分類/決定木と分割の選択
テーブルは、値0はイベントが発生しなかったことを意味し、値1はイベントが発生したことを意味します。上記の例では
> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 0 and C_O_Below_prevLow = 0")
count(distinct Date)
1 1081
> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 0 and C_O_Below_prevLow = 0 and E_halfGap = 1")
count(distinct Date)
1 956
> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 1 OR C_O_Below_prevLow = 1 and E_halfGap = 1")
count(distinct Date)
1 504
、私の予測変数はC_O_Above_prevHigh
あるとC_O_Below_prevLow
私の結果変数はE_halfGap
です。例えば、より多くの予測変数が存在する場合がいくつかある。私の予測因子に
1)出力電位確率パスをもと:Time
むしろ上記と手動で行う異なるpermuationsですべての私のクエリを入力するよりも、Rで利用可能なものかだろういくつかの他のアプリケーションはありますか? 2)パスを分割する方法を選択できるようにします
ご迷惑をおかけして申し訳ありません。あなたはすべての合計と小計をしたい場合は、決定木を構築したい場合は
キューブに私を回してくれてありがとう。 – Dave