Luigi
フレームワークを使用してPython
スクリプトを使用して大量のデータ(それぞれ1,500万行の100個のcsvファイルを取り込みます)を取り込みしようとしました。Postgresで大量のデータを処理する速度が遅くなりクラッシュする
2016-08-18 13:14:31.714 UTC,,,8508,,57b5b2ec.213c,1,,2016-08-18 13:06:52 UTC,13/109,0,PANIC,53100,"could not write to file ""pg_xlog/xlogtemp.8508"": No space left on device",,,,,"writing block 49526 of relation base/16384/22811",,,, ""
摂取が(WAL)メカニズムをログ控え書くによるPOSTGRESによってブロックされているように思え:私は最も重要な部分があり、そのうちの(Postgresのログから)次のエラーに達するまで細かいです。 10日分のファイルを摂取してデータベースをリセットした後、私はより多くの日を摂取しようとしました。 2回目の試みでは、1日のデータが摂取されるのはわずか1日です。 3回目の試みは完全に失敗します。
pg_xlogがクリーニングされていない場合はありますか?私は彼らがどのように管理され、正確な目的が分からないので、私の直感は、WALはPOSTGRESがデータベースに挿入される行を書き込むメカニズムだと言います。
私は欠けているデータベースの設定はありますか?私のテーブルのインデックスには問題がありますか?ほかに何か?これらの.csvファイルのGBでの全体的なサイズ、である何
2016-08-18 12:57:45.255 UTC,,,8342,,57b5a460.2096,96,,2016-08-18 12:04:48 UTC,,0,LOG,00000,"checkpoints are occurring too frequently (25 seconds apart)",,"Consider increasing the configuration parameter ""max_wal_size"".",,,,,,,"" 2016-08-18 12:57:45.255 UTC,,,8342,,57b5a460.2096,97,,2016-08-18 12:04:48 UTC,,0,LOG,00000,"checkpoint starting: xlog",,,,,,,,,"" 2016-08-18 12:58:13.609 UTC,,,8342,,57b5a460.2096,98,,2016-08-18 12:04:48 UTC,,0,LOG,00000,"checkpoint complete: wrote 349100 buffers (16.6%); 0 transaction log file(s) added, 143 removed, 0 recycled; write=15.550 s, sync=12.677 s, t otal=28.354 s; sync files=51, longest=2.304 s, average=0.248 s; distance=2641771 kB, estimate=2641771 kB",,,,,,,,,"" 1038 2016-08-18 12:58:13.610 UTC,,,8342,,57b5a460.2096,99,,2016-08-18 12:04:48 UTC,,0,LOG,00000,"checkpoints are occurring too frequently (28 seconds apart)",,"Consider increasing the configuration parameter ""max_wal_size"".",,,,,,,"" 1039 2016-08-18 12:58:13.610 UTC,,,8342,,57b5a460.2096,100,,2016-08-18 12:04:48 UTC,,0,LOG,00000,"checkpoint starting: xlog",,,,,,,,,""
おかげ
@ roger-dieirtonすべての貴重な情報をお寄せいただきありがとうございます。 '' postgres''データベースへの大量の '' csv'' ingestionsを送ります。あなたが指摘したように、摂取の主な問題は、デバイスにスペースがないことでした。私は2つのパーティションを持つLinuxオペレーティング・システムを持っていました.1つはユーザーのスペース用、もう1つはデータ用でした。私はユーザのスペースにデータベースを保存しようとしていましたが、実際にはそれを実現することなくスペースを使い果たしました。一度それをデータパーティションに移動すると、私は摂取に問題はありませんでした。 – gzagatti