0
私は、頻度、平均、および中央値を計算しているデータがあります。もちろん、一部のデータが失われています。統計分析に欠損値を含めるか含めないか?
私は欠損値を含めていませんが、周波数とカイ二乗検定の計算結果が私の上司の計算結果と大きく異なる場合があります。彼は欠けている値を保持し、私はしませんでした。私の上司は、統計家ではありません。
私の質問は、私は欠損値を保持する必要がありますか?そして、なぜ私はそれらを私の計算に残したいと思っているのでしょうか?ここで
は私がやっているのサンプルです:
保険の有無にかかわらず患者の割合を評価 保険ステータスによってグループ化された患者の割合を評価し、彼らがグループ化された患者のER陽性の 評価割合をテストしたかどうか保険の状態によって、レース
例により細分化:
Insurance Status Yes No
ERstatus
yes 50 112
no 23 87
任意の助けいただければ幸いです。ありがとう!
「欠落」とは、値が含まれていないことを意味しますか?たとえば、保険状態をno = 0、yes = 1としてコーディングしていて、保険状態が分からない場合は、それが整数変数のデフォルト値であるため、0にしますか?それは間違いです。一方、データが欠落している人々があなたが測定しようとしているものと相関している場合、分析からそれらの人々を削除することは、結果を偏らせることもできます。あなたはあなたの質問への良い答えを得るためにあなたのデータと手続きについてはっきりしている必要があります。 –