私は、パンダのデータフレームにExcelスプレッドシートを読み込む方法に精通しています。ただし、スプレッドシート自体には明確な列と行があると想定しています。私は1つのExcelのシートを複数のテーブルが含まれており、各テーブルの行数と列の数が異なります。この同じシートには、いくつかのテキストと表があります。これをパンダにロードする方法に関する提案はありますか?ありがとう。非構造化スプレッドシートをパンダにロードするには?
答えて
多くのデータ形式をサポートします。
使用
pd.read_excel
は、それは、CSVにExcelスプレッドシートファイル(.xlsxの)輸出スプレッドシートを読み、
pd.read_csv
を使用しています。私はこの方法を楽しんでいます。ロードする使用
pd.ExcelFile
、それはだが、似方法1.見えますが、それはより速くother answer
ありがとうございます、はい、私はすでにpd.read_excelを試しました。しかし、それを使用して、一貫性のない構造を持つ複数のテーブルを持つExcelシートを解析する方法はありますか? https://ufile.io/5novd –
で提供されているサンプルデータをご覧ください。いくつかのスプレッドシートに分割することをお勧めします。パンダの様々な構造を扱うことは困難です。あなたのファイルでは、行[2:7]は1つのpandas DataFrameになることができます。複数の構造をロードした後、データを連結または処理します。 – Maybe
- 1. 構造化PAASと非構造化PAAS
- 2. 構造化非構造化データ
- 3. 非構造化エクセルファイルをデータベースにインポート
- 4. スパークプロセス非構造化ファイル
- 5. 構造体のベクトルにcsvストリームを非直列化する
- 6. マップ構造にプロパティファイルをロード
- 7. Pythonのパンダのオブジェクトは、私はパンダのデータフレームが構造化してい
- 8. 構造化プログラミングと開発に対する構造化アプローチの違いは?
- 9. ユーザーリサーチの非構造化データ集約ツール
- 10. Firebaseデータベース構造 - 非正規化データ?
- 11. TypeScriptとオプションの非構造化引数
- 12. 棒グラフと非構造化データ
- 13. mgo付き非構造化MongoDBコレクション
- 14. 構造化グリッドと任意の点(非構造化グリッド)間のMatlab補間
- 15. TypeError例外:非ハッシュタイプ:私は、このように作成パンダのデータ構造、持っているパンダ
- 16. 非構造化CSVデータをハイブに読み込む
- 17. 構造化パラメータの構造化に戸惑う
- 18. C++構造体のポインタを持つ構造体を初期化するには、
- 19. TensoFlowは非構造化データを学習できますか?
- 20. Apache Sparkは非構造化マルチラインデータを処理しますか?
- 21. csvは構造化データか半構造化データですか?
- 22. 非構造化コンテンツのフラッシュを削除する(FOUC)
- 23. テキストコーパスから非構造化文を分離する
- 24. Hadoop + MapReduceで非構造化データを処理する
- 25. Firebase - 非正規化されたデータ構造を理解する
- 26. 構造サイズが非常に大きく、最適化が必要
- 27. 非構造小道具は
- 28. 非構造状態は
- 29. パンダ:フリーテキストの列を構造化データに分割するカスタム関数を適用する方法は?
- 30. テキストを構造体に非整列化するときの問題
は、データフレームにそれを投げ、その後、別のサードパーティのライブラリでそれを解析も参照のだ、我々はいくつかのサンプルデータか何かを得ることができます? –
可能であれば、他のサードパーティのライブラリを使用することなく、理想的にはプログラム的にやりたいと思っています。ここでサンプルデータを見つけてください:https://ufile.io/5novd –