2016-12-04 10 views
1

私は最近、CSVエクスポートを提供するシカゴの犯罪データウェブサイトを発見しました。 readrで6.2M +レコードをインポートすると、12:00:00 PMから12:59:59 PMまでの時間を持つすべてのDateレコードを読み取ることができないことに気付きました。Readr:read_csvに特定の日付の問題があります

私はインポートするには、次を使用:

 
chicagocrime = read_csv("~/R/chicago_Crime/Crimes_-_2001_to_present 20161203.csv", 
         col_types = cols(
           Date = col_datetime(format = "%m/%d/%Y %H:%M:%S %p"), 
           Location = col_skip(), 
           `Updated On` = col_skip(), 
           `X Coordinate` = col_skip(), 
           `Y Coordinate` = col_skip() 
             ) 
         ) 

は問題は()以下を示した:

 
problems(chicagocrime) 
# A tibble: 156 × 4 
    row col expected     actual 
          
1  12 Date valid date 06/13/2005 12:40:00 PM 
2  20 Date valid date 04/06/2005 12:30:00 PM 
3  24 Date valid date 06/13/2005 12:45:00 PM 
4  32 Date valid date 06/12/2005 12:00:00 PM 
5  43 Date valid date 06/03/2005 12:00:00 PM 
6  53 Date valid date 03/20/2005 12:00:00 PM 
7  61 Date valid date 06/15/2005 12:33:00 PM 
8  80 Date valid date 06/13/2005 12:30:00 PM 
9 104 Date valid date 06/13/2005 12:46:17 PM 
10 143 Date valid date 06/12/2005 12:12:30 PM 

他のすべての時間は問題なくインポートします。

入力ファイルのフィールドの日付は、「04/06/2005 12:30:00 PM」の形式です。どんな助けやコメント? (Windows 10のR 3.3.2、最新パッケージ)

答えて

0

の代わりに%Iを使用する必要があります(this bug reportに記載されています)。これは文書化されていないので、私はpull requestを提出しました。

関連する問題