私はSASからの頻度を取得しようとしているデータセットを持っています。本質的には、エピソードの束と、誰かがイベントを持っているかどうかです。エピソードは技術的に複数のイベントを持つことができます。各レコードには組織識別子もあります。SASはユニークで独特ですが、追加の変数も必要です
proc sql;
create table out as select unique
episode_id, sum(event) as total_event
from table1
group by episode_id;
quit;
proc freq data=out;
tables total_event;
run;
このコードは素晴らしいしばらく私に迅速に与える:正しく(2、1、例えばので、エピソードごとに3件のイベント)エピソードあたりのイベントの頻度を識別するコードを(下)Iを開発しましたエピソードごとのイベント数の頻度には、必要な情報、つまりorganization_idが欠けています。コードにorganization_idを追加すると、その頻度は間違っていきます。私はtable1にoutテーブルをマージして、organization_idも取得しようとしましたが、それも頻度に加算されます。どのように私は最終的には、以下の周波数で実行できるように、私は追加の変数を追加します:私はあなたの目標を誤解しない限り、私はあなたがデータ自体に追加のマージが必要だと思うし、次に取得するORGANIZATION_ID
で重複排除
proc freq data=out;
tables organization_id*total_event;
run;
organization_idを追加するコードを表示します。理想的には、いくつかのサンプルデータを示します。 – Joe
ちょっと考えましたが、 'ORGANIZATION_ID'がエピソード内のすべてのイベント(同じ意味)で同じなら、なぜ' SELECT'リストに 'episode_id、organization_id、sum(event)as total_event'を使用できないのですか? 'group by episode_id、organization_id'を' GROUP BY'節として使用しますか? – vknowles
組織IDは、エピソード内のすべてのイベントで必ずしも同じではありません。この方法を試してみると、頻度が増えます – Questioner