次のように私はSPSSに大きなデータセットを持っている:SPSSで大きなデータセットを集計すると、パーセンテージ列はどのように得られますか?
Col_1 Col_2 Qty
a x 5
a x 5
a y 2
b x 1
b y 6
b y 7
c y 4
c z 10
c z 11
d x 2
私はデータセットを集約し、次の構文を使用:で
Col_1 Col_2 Qty_sum
a x 10
a y 2
b x 1
b y 13
c y 4
c z 21
d x 2
:これは私が得る結果である
AGGREGATE
/OUTFILE='agg'
/PRESORTED
/BREAK=Col_1 Col_2
/Qty_sum=SUM(Qty).
をこれに加えて、次のような結果が得られます:
Col_1 Col_2 Qty_sum Percent
a x 10 83%
a y 2 17%
b x 1 7%
b y 13 93%
c y 4 16%
c z 21 84%
d x 2 100%
の列には、の値を超えてQty_sum
がどのように拡散しているかを示すパーセンテージがあります。
Col_1
とCol_2
のデータが一貫しているわけではないため、データセット全体では一般的な公式を使用できません。
Excel
ではデータセットが大きすぎるため、Sumifs
関数を使用すると、私はExcel
で作業できません。
Crosstabs
関数でRow Percentages
オプションを使用しようとしましたが、これはカテゴリ変数の2つの行にまたがるカウントを取得するためだけに機能します。
SPSS
の代わりに、これがR
でも実行できるかどうかお知らせください。
構文でデータを処理する方法について簡単に説明してください。 –