大量のデータセットを扱っており、多数のCSVファイルに分散しているとします。あなたはIPythonノートブックを開いて物を探索し、いくつかの変換を行い、データの並べ替えやクリーンアップを行います。IPythonノートブックの使用中に複雑さを管理するにはどうすればいいですか?
次に、データでいくつかの実験を開始し、さらにノートブックをいくつか作成し、最終的にはデータ変換パイプラインが埋め込まれたさまざまなノートブックを手に入れます。このようにデータ探索/変換/学習から、それのプロセスを整理する方法
、その:
- 複雑さが徐々に引き上げ、爆破されません。
- あなたのコードベースを管理し、ナビゲートすることができます。
- データ変換パイプラインを再現し調整することができますか?