1
私は最近、CSVエクスポートを提供するシカゴの犯罪データウェブサイトを発見しました。 readrで6.2M +レコードをインポートすると、12:00:00 PMから12:59:59 PMまでの時間を持つすべてのDateレコードを読み取ることができないことに気付きました。Readr:read_csvに特定の日付の問題があります
私はインポートするには、次を使用:
chicagocrime = read_csv("~/R/chicago_Crime/Crimes_-_2001_to_present 20161203.csv", col_types = cols( Date = col_datetime(format = "%m/%d/%Y %H:%M:%S %p"), Location = col_skip(), `Updated On` = col_skip(), `X Coordinate` = col_skip(), `Y Coordinate` = col_skip() ) )
は問題は()以下を示した:
problems(chicagocrime) # A tibble: 156 × 4 row col expected actual 1 12 Date valid date 06/13/2005 12:40:00 PM 2 20 Date valid date 04/06/2005 12:30:00 PM 3 24 Date valid date 06/13/2005 12:45:00 PM 4 32 Date valid date 06/12/2005 12:00:00 PM 5 43 Date valid date 06/03/2005 12:00:00 PM 6 53 Date valid date 03/20/2005 12:00:00 PM 7 61 Date valid date 06/15/2005 12:33:00 PM 8 80 Date valid date 06/13/2005 12:30:00 PM 9 104 Date valid date 06/13/2005 12:46:17 PM 10 143 Date valid date 06/12/2005 12:12:30 PM
他のすべての時間は問題なくインポートします。
入力ファイルのフィールドの日付は、「04/06/2005 12:30:00 PM」の形式です。どんな助けやコメント? (Windows 10のR 3.3.2、最新パッケージ)