非構造化スプレッドシートをパンダにロードするには？

私は、パンダのデータフレームにExcelスプレッドシートを読み込む方法に精通しています。ただし、スプレッドシート自体には明確な列と行があると想定しています。私は1つのExcelのシートを複数のテーブルが含まれており、各テーブルの行数と列の数が異なります。この同じシートには、いくつかのテキストと表があります。これをパンダにロードする方法に関する提案はありますか？ありがとう。非構造化スプレッドシートをパンダにロードするには？

出典

2017-06-10 D.prd

は、データフレームにそれを投げ、その後、別のサードパーティのライブラリでそれを解析も参照のだ、我々はいくつかのサンプルデータか何かを得ることができます？ –

可能であれば、他のサードパーティのライブラリを使用することなく、理想的にはプログラム的にやりたいと思っています。ここでサンプルデータを見つけてください：https://ufile.io/5novd –

多くのデータ形式をサポートします。

使用pd.read_excelは、それは、CSVにExcelスプレッドシートファイル（.xlsxの）
輸出スプレッドシートを読み、pd.read_csvを使用しています。私はこの方法を楽しんでいます。ロードする
使用pd.ExcelFile、それはだが、似方法1.見えますが、それはより速くother answer

出典

2017-06-10 20:46:02 Maybe

ありがとうございます、はい、私はすでにpd.read_excelを試しました。しかし、それを使用して、一貫性のない構造を持つ複数のテーブルを持つExcelシートを解析する方法はありますか？ https://ufile.io/5novd –

で提供されているサンプルデータをご覧ください。いくつかのスプレッドシートに分割することをお勧めします。パンダの様々な構造を扱うことは困難です。あなたのファイルでは、行[2：7]は1つのpandas DataFrameになることができます。複数の構造をロードした後、データを連結または処理します。 – Maybe

非構造化スプレッドシートをパンダにロードするには？

答えて

関連する問題