ファイルを分割するためにPythonで問題を解決するには、いくつかのアイディアが必要です。Pythonデータをルールで複数のファイルに分割する
"accountid"と "property"という2つの列を持つファイルでは、1.000.000を超える行が表示されます。 1つの「accountid」は複数のプロパティを持つことができますが、各プロパティは1つの行です。 Example
このデータをファイルごとに50.000行に分割する必要があります(これは問題ではありません)。しかし、私は1つのファイルは "accountid"あたり50の "プロパティ"も許可しています。そして多くは50以上の特性を持っています。
アイデア技術的にこのベストを解決する方法はありますか?私は、任意のコードを必要としませんが、ここでは)
おかげ
Floの
たaccountId = 1との項目が13万性質(すなわち13万行に表示)を持っているのであれば、あなたは3つの別々のファイルにそれをしたい(最初の2つのファイルは、第三のファイル意志ながら、アカウントID = 1で50,000行が含まれています残りの行は30,000、他のアイテムは20,000行あります)。 – shahins
はい、分割自体は問題ではありません。各ファイルは1つのIDごとに50個のプロパティしか持たないため、複雑になります。 私はすでにこれを解決する複雑なIDを持っています。最初は40.000バッチに分割し、50個以上のプロパティを持つIDを他のファイルに移動する2番目のスクリプトを実行するように分割します。 –