2017-06-10 1 views
0

私は、パンダのデータフレームにExcelスプレッドシートを読み込む方法に精通しています。ただし、スプレッドシート自体には明確な列と行があると想定しています。私は1つのExcelのシートを複数のテーブルが含まれており、各テーブルの行数と列の数が異なります。この同じシートには、いくつかのテキストと表があります。これをパンダにロードする方法に関する提案はありますか?ありがとう。非構造化スプレッドシートをパンダにロードするには?

+0

は、データフレームにそれを投げ、その後、別のサードパーティのライブラリでそれを解析も参照のだ、我々はいくつかのサンプルデータか何かを得ることができます? –

+0

可能であれば、他のサードパーティのライブラリを使用することなく、理想的にはプログラム的にやりたいと思っています。ここでサンプルデータを見つけてください:https://ufile.io/5novd –

答えて

0

多くのデータ形式をサポートします。

  1. 使用pd.read_excelは、それは、CSVにExcelスプレッドシートファイル(.xlsxの)

  2. 輸出スプレッドシートを読み、pd.read_csvを使用しています。私はこの方法を楽しんでいます。ロードする

  3. 使用pd.ExcelFile、それはだが、似方法1.見えますが、それはより速くother answer

+0

ありがとうございます、はい、私はすでにpd.read_excelを試しました。しかし、それを使用して、一貫性のない構造を持つ複数のテーブルを持つExcelシートを解析する方法はありますか? https://ufile.io/5novd –

+0

で提供されているサンプルデータをご覧ください。いくつかのスプレッドシートに分割することをお勧めします。パンダの様々な構造を扱うことは困難です。あなたのファイルでは、行[2:7]は1つのpandas DataFrameになることができます。複数の構造をロードした後、データを連結または処理します。 – Maybe

関連する問題