2017-08-13 18 views
0

私はグーグルでスタックオーバーフローしましたが、私はこの問題を解決するために何かを見つけることはできません。この質問が一部の人にとって基本的なものであると思われる場合は、事前に謝罪してください。R:csvから作成されたdata.frameのグループ統計を計算する - 要因の問題

私はCSV(私は頭を含むよ)から以下のデータをインポート:私は単純にやろうとしていますすべてがcurrency_pchgカラムにグループ統計量(中央値)を実行している

head of data.frame

price.date列は、tapply式を使用するグループとして機能します。しかし、私は次のスクリーンショットに従って苦情を受け取ります。

error message from tapply

私は修正のすべての方法を試してみました - (再び、これは動作しませんCSVインポート時にstringAsFactors = FALSEを適用し、(動作しない)data.frameからの要素をドロップ - があるため私が理解しているところから、インポートファイルにいくつかのNAエントリがあります)、そして関数を使ってみました(tapplyの代替)。

しかし、何も動作していない、私はここで行き詰まった。ですから、どんな指導も大変ありがとうございます。

おかげで、

+0

'aggregate'または' dplyr' 'group_by' – Wen

+0

をしようとしないのはなぜ私はstringAsFactorsは= false'をがあるため' NAで失敗する 'とは思いません'。コードとデータを共有してください。 'dput(test)'を使い、ここに出力を投稿してください。 – www

+0

出力を画像としてではなくテキストとして貼り付けてください。 –

答えて

0

列currency_pchgが最も可能性が高い要因として読み込まれています。集約を行い、その後、このように数値にcurrency_pchgを変換してみて:

#na.rm = TRUE to ignore NAs 
data %>% group_by(price_date) %>% summarise(median(as.numeric(as.character(currency_pchg)), na.rm = TRUE)) 
+0

ありがとう、sparkh2o ...これは治療法です。私は実際にas.numeric(as.character(currency_pchg)))を試していましたが、これはうまくいきませんでした。しかし、na.rm = TRUE引数はこのトリックを実行しました。再度、感謝します – GoingMush