0

これは非常に基本的な例です。しかし、私はいくつかのデータ分析をしており、確率テーブルを生成するように非常に似たSQLカウントクエリを書いています。分類/決定木と分割の選択

テーブルは、値0はイベントが発生しなかったことを意味し、値1はイベントが発生したことを意味します。上記の例では

> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 0 and C_O_Below_prevLow = 0") 
    count(distinct Date) 
1     1081 

> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 0 and C_O_Below_prevLow = 0 and E_halfGap = 1") 
    count(distinct Date) 
1     956 

> sqldf("select count(distinct Date) from joinedData where C_O_Above_prevHigh = 1 OR C_O_Below_prevLow = 1 and E_halfGap = 1") 
    count(distinct Date) 
1     504 

、私の予測変数はC_O_Above_prevHighあるとC_O_Below_prevLow私の結果変数はE_halfGapです。例えば、より多くの予測変数が存在する場合がいくつかある。私の予測因子に

1)出力電位確率パスをもと:Time

むしろ上記と手動で行う異なるpermuationsですべての私のクエリを入力するよりも、Rで利用可能なものかだろういくつかの他のアプリケーションはありますか? 2)パスを分割する方法を選択できるようにします

ご迷惑をおかけして申し訳ありません。あなたはすべての合計と小計をしたい場合は、決定木を構築したい場合は

答えて

2

、 R.

addmargins(Titanic) 
# More readable: 
ftable(addmargins(Titanic)) 

に またはaddmarginsをあなたはSQLでCUBE BYを使用することができます(それはSQLiteのではありません)、 あなたはrpartパッケージ を使用するか、 machine learning または graphical models タスク・ビューを確認することができます

+0

キューブに私を回してくれてありがとう。 – Dave

関連する問題