2017-09-19 22 views
1

Rを使用して、Excelでうまくいかないアナリティクスを使用しようとしています。しかし、私がExcelから保存したCSVファイルはどれもRで読み取ることができません。私は同じ結果でOpenOfficeでもCSVを作成しようとしました。テストとして、私は教育のウェブサイトからCSVをダウンロード:試験としてExcelで作成/変換された単純なCSVファイルでもRが読み込まれない

http://taddylab.com/teaching.html

、私はこのサイトから「pickup.csv」を開いてみました、それは罰金で読み取りました。しかし、Excelでファイルを開いて新しいCSVファイルとして保存してもう一度読み込もうとすると、もう動作しません。これは、私のソフトウェアが出力しているcsvファイルに何らかの形で問題が関連していることを示しています。それはExcelに限定された問題ではないが、明らかにOpenOfficeで作成されたCSVに同じ問題がある。

Error in read.table(file = file, header = header, sep = sep, quote = quote, : 
    more columns than column names 
In addition: Warning messages: 
1: In read.table(file = file, header = header, sep = sep, quote = quote, : 
    line 1 appears to contain embedded nulls 
2: In read.table(file = file, header = header, sep = sep, quote = quote, : 
    line 2 appears to contain embedded nulls 
3: In read.table(file = file, header = header, sep = sep, quote = quote, : 
    line 5 appears to contain embedded nulls 
4: In read.table(file = file, header = header, sep = sep, quote = quote, : 
    incomplete final line found by readTableHeader on 'simplest.csv' 

は、これは、データが、両方のファイルのようにちょうどスーパーシンプルに見えるものです::

year miles price make 
    2008 17638 14995 GMC 
    2003 174000 8500 Dodge 
    2001 1500 9998 Dodge 
    2007 22422 23950 GMC 
    2007 34815 19980 GMC 
    1997 167000 5000 GMC 
    1999 142000 2800 Dodge 
    2003 86000 7900 Dodge 
    2002 115000 6700 Dodge 

何であるか任意のアイデアを失敗したために

は、私は1つのエラーと複数の警告を取得し、読み込み、ここの問題?私は韓国の仕事環境で働いていますが、あなたが見ることができるように、ファイルには奇妙なマーカーはありません。ただし、アイコンが私のダウンロードしたファイル間で異なって見えるんし、それはいくつかのエンコーディングの問題である場合ので、私は疑問に思う:

https://imgur.com/gallery/lFKUL

編集:ここで失敗したラインです。例えば、私は、Excelでpickup.csvを開いたcsvファイルとして保存ヒットし、その後TestPickupそれを命名 - それは非常に

> > a<-read.csv("pickup.csv") 
> > a1<-read.csv("testpickup.csv") Error in make.names(col.names, unique = TRUE) : invalid multibyte string 1 In addition: Warning messages: 1: In read.table(file = file, header = header, sep = sep, quote = 
> quote, : line 1 appears to contain embedded nulls 2: In 
> read.table(file = file, header = header, sep = sep, quote = quote, : 
> incomplete final line found by readTableHeader on 'testpickup.csv' 

Pickup.csv元のファイルとtestpickup.csvは私がエクセルを駆け抜けたバージョンですが照明ではありません。これらのファイルの内容は同じです。明確にするために、私はtadylabのページからファイルを読み込めます.CSVファイルは何らかの理由で 'read.csv'で読み取れないことがあります。

解決済み:明らかに暗号化されています。これがすべてのファイルまたはすべての設定で機能するかどうかはわかりませんが、Excelのデータをコピーしてテキストファイルに貼り付けて、タブ区切りのテーブルにしました。でそれを読む:

df2<-read.table("samplefile.txt", sep="\t", header=TRUE) 

そして今、私はそれが可能性が高いとの問題があり、ヘッダーとセパレータのための正しい設定を使用して、代わりに関数read.csvを使用してデータを

+0

で遊ぶことができますが、私たちに失敗した行を与える...しかし、どのような場合には、 ''データからfread'をしようとしませんでした。それはより速く、たくさんのものを推測します。 –

+1

あなたが見せるスニペットは私のために働きます。エラーを再現するには、ファイルを十分に共有してください。 –

+0

私はread.txtではなくread.csvを使用しています。私はそれが失敗しているコードだとは思っていませんが、Excelからのファイル出力については、私が会計処理していないか、または破損しているだけです。 – Prem

答えて

0

を遊ぶことができますより一般的なread.table関数私はちょうどページから1 csvファイルでそれを試して、それは正常に動作します。

+0

私はread.txtではなくread.csvを使用しています。ページのcsvsはうまく動作します。それはちょうど私がCSVをExcelから生成するときです - 元の作業ファイルから作成されたCSVであっても、それを読むことはできませんR – Prem

+0

csvファイルをエクスポートするときの詳細を見てください。言語設定によっては、追加の ""またはセミコロンでエクスポートされることがあります。コンマの代わりにエクスポートされたファイルをExcelで取得できないため、確認できません。 – alex2006

+0

実際、出力されたcsvファイルは暗号化されていると思います。メモ帳の出力にはパスワードを入力する必要があります。私はRでそれを回避する方法はわかりませんが、これは私たちのITに相談しなければならないものだと思います。 – Prem

0

明らかに、暗号化が途中で行われています。学ぶにはあまり役に立たない、申し訳ありませんが、あなたが企業環境にいるかどうかを見極めるだけです。

EDIT:これはすべてのファイルまたはすべての設定で機能するのかどうかはわかりませんが、Excelのデータをコピーしてタブ区切りのテーブルになったテキストファイルに貼り付けました。でそれを読む:

df2<-read.table("samplefile.txt", sep="\t", header=TRUE) 

そして今、私はデータ

関連する問題