私のデータはtestdata
が2つのPWGTP
という名前の変数とAGEP
変数名が変更されていますが、どうすればこれを防ぐか修復できますか?
データが.csv
ファイルである持って設定してください。
は私が行うと:
> head(testdata)
変数だから、何らかの理由で、Rはï..PWGTP
としてPWGTP
を読んでいる
ï..PWGTP AGEP
23 55
26 56
24 45
22 51
25 54
23 35
として表示されます。いいえ。私は、変数PWGTP
を参照するために、いくつかの機能を使用する場合、私はメッセージを取得し、同様に
Error: id variables not found in data: ï..PWGTP
::私は、変数ï..PWGTP
を参照するために、いくつかの機能を使用するしかし
、私はメッセージを取得する
Error: id variables not found in data: PWGTP
2質問:
変数名のマングリングを防ぐために、ソースファイルに何かすべきことはありますか?
ï..PWGTP
の名前を他の名前に変更するのは簡単ですが、R
はそのような名前の変数を見つけることができません。どのように変数名を修復しようとしていますか?
あなたが読んでいるカラムの数と名前の順番を知っていれば 'names(testdata)< - c(" PWGTP "、" AGEP "、...)' –
のように見えますあなたの入力ファイルはBOMのUTF-8でしょうか? –
@DominicComtoisおそらく '.csv'エンコードの問題です。私はより大きいデータセットを持ち、変数名がうまく表示されます。大きなデータセットの最初の数百行(およびヘッダー行)をコピーして貼り付けて、「テストデータ」を作成しました。そのプロセス中に何か問題が発生しました。テキストエディタや「Excel」で 'testdata'を調べると、正常に見えます。だから私は、これが将来重大な状況で起こった場合に修正案を見つけることに興味がありました。 –