2017-04-10 8 views
0

CSVをRに2つの列でインポートしました。日付とリンク数が検出されました。ウェブサイト日付の書式化係数はすべての日付をN/Aに変換します

 Date| No.of.Links.Found| 
1| 2011-09-12|     2| 
2| 2011-10-03|     1| 
3| 2011-10-10|     1| 
4| 2011-10-12|     2| 
5| 2011-10-14|     2| 
6| 2011-10-15|     3| 

(これらの奇妙な文字がありますが、彼らはまた、R.に表示されるかわからない)

しかしCSVをインポートするには、日付列が要因としてフォーマットされています。私のCSVは、このようになります。試してみる

Links_Over_Time$Date<-as.Date(Links_Over_Time$Date,format = "%y/%m/%d") 

すべての日付の値は「該当なし」に置き換えられます。

Date No.of.Links.Found 
1 <NA>     2 
2 <NA>     1 
3 <NA>     1 
4 <NA>     2 
5 <NA>     2 
6 <NA>     3 

私も試してみた:

Links_Over_Time$Date<-as.POSIXct(as.character(Links_Over_Time$Date), format = "%y/%m/%d") 

と同じことが起こります。私はまた、

library(lubridate) 
Links_Over_Time$Date<-ymd(Links_Over_Time$Date) 

を試してみましたが、私が得る「すべてのフォーマットは解析に失敗しました。何のフォーマットが見つかりませんでした。」警告メッセージ。

このCSVは、Microsoft SQL Server Management Studioからのエクスポートです。 「 - 」あなたが使用する必要があります

+3

変換しながらあなたの日付形式は、 '%Y-%M-%D ' – akrun

+0

' stringsAsFactors = false'を – jwells

+0

のように見えますプログラムの中には、ファイルの先頭に ''»を追加しているものがあります。それらをRにインポートする直前にソースファイルで手動で削除することができます。 –

答えて

0

代わりにスラッシュ(「/」)の:

options(stringsAsFactors=F) 

Links_Over_Time$Date<-as.Date(Links_Over_Time$Date,format = "%Y-%m-%d") 

私はRコンソールにデータをインポートし、上記のコマンドを試してみましたが、私は離れてから正しい結果を得ました最初のレコードであるので、最初の行から次のコマンドを使用してデータからガベージを削除します。 Encoding(df$column_name)を使用し、以下のように「UTF-8」に設定します。ここでcolumn_nameはガーベッジデータの問題を持つ列です。以下は

library(stringr) 
Encoding(df$bcol) <- "UTF-8" 
df$bcol1 <- str_replace(df$bcol,"(.*)(?=\\d{4}-\\d{2}-\\d{1,2})","") 
df$dt <- as.Date(df$bcol1,format="%Y-%m-%d") 

(私は簡単にするためにacol、bcolとCCOLとして列を命名した)が出力され、dtはあなたの日付のデータをクリーンアップ最後の列である居住されています

> df$dt <- as.Date(df$bcol1,format="%Y-%m-%d") 
> df 
    acol     bcol ccol   dt 
1 1 <U+0095><c8><c0>2011-09-12 2 2011-09-12 
2 2     2011-10-03 1 2011-10-03 
3 3     2011-10-10 1 2011-10-10 
4 4     2011-10-12 2 2011-10-12 
5 5     2011-10-14 2 2011-10-14 
6 6     2011-10-15 3 2011-10-15 
    bcol1 
1 2011-09-12 
2 2011-10-03 
3 2011-10-10 
4 2011-10-12 
5 2011-10-14 
6 2011-10-15 

+1

ありがとうこれはトリックでした!私はそれらの奇妙な文字が混乱していると思う。 – jceg316

0
Links_Over_Time <- read.csv('filepath/filename', stringsAsFactors = FALSE) 
+0

申し訳ありませんが、そのコメントは自動的に追加されました。あなたはそのコード行が質問者の質問に答えるのを助ける理由を説明するのを助けるためにあなたの答えに説明を加えるべきです – r0m4n

関連する問題