2016-12-21 8 views
0

調査パッケージを使用して貧困層の割合を計算しようとしています。 したがって、人口(1)とn(私はそれが正しい方法であるかどうかはわかりません)の合計の変数でサブセットを作成します。 だから、私は持っている:貧困層の割合

str(base2015$q) 
num [1:117939] 0 0 0 0 0 0 0 0 0 0 ... 
str(base2015$one) 
int [1:117939] 1 1 1 1 1 1 1 1 1 1 ... 

とカテゴリ変数領域。 (yは私のsvydesignです) 私はそのようなsvyratio関数を使用しようとしましたが、彼は私にすべてのデータセットの結果を返し、私はサブグループ(region)で欲しいです。

n <- subset(y , one == 1) 
View(n) 
svyby(~ q , ~ region , n , vartype=c("se","ci","cv"), svytotal) 
svyby(~ q , ~ region , n , vartype=c("se","ci","cv"), svymean) 
    region q se ci_l ci_u cv 
1  1 NA NaN NaN NaN NaN 
2  2 NA NaN NaN NaN NaN 
3  3 NA NaN NaN NaN NaN 
4  4 NA NaN NaN NaN NaN 
5  5 NA NaN NaN NaN NaN 

彼は私にこれを与える:行為で私は各地域のためにこれをしたい(画像を参照) proportion of poor

svyratio(numerator=~q, 
     ~one, 
     design = y, separate=FALSE, na.rm=TRUE, 
     formula, covmat=FALSE, deff=FALSE) 

私はまた、集団を用いてサブセットを作成し、svybyを使用してみました。私は何が間違っているのか分からない。 誰かがこれを手伝ってくれますか?

+0

「NA/NaN」の値は、データの値が欠落している可能性があります。これを確認するには、 'nonMissDF = na.omit(DF)'を使って欠けているデータを除外し、関数を再試行してください。データが欠落していることが確認された場合は、アンケート分析で欠損データの補完方法を探ることをお勧めします。 – OdeToMyFiddle

+0

ありがとう@オササン。 新しいnonMissDFがうまく機能します。そして、ブラジルの地理学研究所と統計学(ibge)が既にそれを行っているため、欠落しているデータの帰属を行うことはできません。だから私はできないと思う。 とにかくありがとう –

答えて

0
data(scd) 

scddes<-svydesign(data=scd, prob=~1, id=~ambulance, strata=~ESA,nest=TRUE, fpc=rep(5,6)) 

svyby(~ alive , denominator = ~ arrests , by = ~ ambulance , scddes , svyratio) 

# which missings do you want to remove? read `?svyby` 
svyby(~ alive , denominator = ~ arrests , by = ~ ambulance , scddes , svyratio , na.rm = TRUE , na.rm.by = TRUE , na.rm.all = TRUE) 
+0

ありがとう@Anthony Damico 私をたくさん助けてください –