ヘッダーがすべてそうです。このファイルには、およそ数ヶ月分のデータが含まれています。私はすべてのものを読んで記憶に記憶するのが賢明ではないと思ったので、バッチでこれをはるかに速くすると聞いた。しかし、私は以前に試したことがないし、始める方法がわからない。Javaを使用してバッチで非常に大きなcsvファイル(30GB以上)を読む方法
ファイルには数か月分のデータが含まれており、UNIXの日付が含まれています。私の仕事は、その行を数えて別々の月に分けることです。その後、レコードの数が最も多い月には狭くなり、その月からさらに狭くなってレコードの数が最も多く、さらに時間がさらに狭くなります。
どのようにすればいいですか?
ようこそStackOverflow。 [help]にアクセスして[ask]を読んでください。問題を解決するために努力することが期待されています。理解できないものに遭遇した場合は、特定の質問をします。 StackOverflowは、チュートリアル、ディスカッション、または他の人があなたのためにコードを書いているのではありません。あなたが取るべきアプローチは、一度に1行ずつファイルを処理し、必要な情報だけを抽出/集約することです。あなたがする必要があるのは、ほとんどのレコードがある月/日/時であることが分かっていれば、これは地図データ構造で行うことができます。 –
何回か質問する必要がある場合は、JimGarrisonまたはgeorge-polioveiの方法を試してみてください。何度もクエリを行う必要がある場合は、まずソートしてみてください(https://en.wikipedia.org/wiki/External_sorting) – waltersu