2016-12-23 13 views
-3

Googleを使用して検索しても困っていませんでした。CsvファイルとJava

"、"区切り文字を使用して、多くの情報行を持つcsvファイル[dataset.csv]があります。

この情報は、事業[事業名、種類など]に関する情報です。

[都市、REVIEW_COUNT、評価、名前、full_address、タイプ、カテゴリ/ 0、カテゴリ/ 1、 working_days、労働時間、max_reservations]の = 11:非常に最初の行のカテゴリが存在しますそれら。

ただし、これらの情報はすべて1行には含まれていません。

2行の

例:

ファウンテンヒルズ、AZ 85268" 、ビジネス、バー、アメリカ(新)、2,9:00-17:00,15

ギルバート、8,2、Salon Lola、 "3479 E Baseline Rd

一部の情報は欠落していますが、各行には同じではありません。これらの情報のすべてが与えられているものがいくつかあります。

私はこのcsvファイルを読んで、可能であれば、情報が空の場合は、nullや何かを入れる方法を理解したいと思います。

ご迷惑をおかけいたします。あらかじめご了承ください。

+2

これが真の場合、無効なファイルです。 –

+2

@StephanBijzitterいいえ、投稿されたデータOPを見ると、二重引用符がありますが、二重引用符はありません。OPのデータにカンマが含まれていることを意味するテキスト修飾子があると思いますデリミタとしては意味がありません。 'Gilbert、8,2、Salon Lola、" 3479 E Baseline Rd'ここに "Rd"の後ろにカンマがあり、これはOPの行を破っている。 – SnakeDoc

+1

先に進む前に、二重引用符が入っているはずです。 –

答えて

0

2行は次の

Fountain Hills, AZ 85268",business,Bars,American (New),2,9:00-17:00,15 

Gilbert,8,2,Salon Lola,"3479 E Baseline Rd 

を取ると、一番上の行に下の行を追加する場合は、次の

Gilbert,8,2,Salon Lola,"3479 E Baseline Rd Fountain Hills, AZ 85268",business,Bars,American (New),2,9:00-17:00,15 

[city, review_count, rating, name, full_address, type, categories/0, categories/1, working_days, working hours, max_reservations] 

を取得し、実際には単一の行の2枚であることを見てこれは、ファイルの先頭にある列記述子を11行目に11行並べます。2行目が最初の行の先頭になるのは異常ですが、これは列の値が欠落しているように見える理由です。

不完全な行が最初に見つかった場合は、最初の行が開始であり、2番目の行が残りの半分であると思います。この例の代わりに、実際には前の行の後半と次の行の前半になるかもしれません。