さて、物事のカップルを願っています。私はそれらの専門家ではないことに注意してください。
まず、データがExcelファイルの場合、そのデータは構造化されています。テーブルの性質は、データを構造化することです。非構造化データは、テキストファイルやテキストファイルのディレクトリのようなものです。
第二に、これを読んで、質問を処方する場合、それに従ってください。https://stackoverflow.com/help/mcve
第三に、SOあなたのためのすべてのコードを書くためにここではありません。あなたの質問によれば、あなたはまだ何かを試していません。あなたの質問が落ちた理由です。
これはあくまでも、Pythonのpandasライブラリを使用してExcelファイルをインポートし、操作し、SQLデータベースにアップロードすることができます。
import pandas as pd
df = pd.read_excel('tmp.xlsx')
df2 = pd.melt(df, id_vars = ['Country', 'Commodity'], var_name = 'Year', value_name = 'Value')
df2
入力:
Country Commodity 2009 2010 2011 2012 2013
0 Austria Com. 1 1 1 1 1 1
1 Austria Com. 2 2 2 2 2 2
2 Belgium Com. 1 3 3 3 3 3
3 France Com. 1 4 4 4 4 4
出力:
Country Commodity Year Value
0 Austria Com. 1 2009 1
1 Austria Com. 2 2009 2
2 Belgium Com. 1 2009 3
3 France Com. 1 2009 4
4 Austria Com. 1 2010 1
あなたは多くのExcelファイルを持っている場合は、あなたを介して反復する/ディレクトリ上glob
またはos.walk
を使用し、一部またはをインポートすることができますすべてのExcelファイル
パンダDataFrame.to_sql
を使用して、データベース接続(サーバアドレス、ログイン/ pwなど)の定義が必要なSQLデータベースにデータをアップロードできます。
「データベース」とは何ですか?ファイルをデータベースにアップロードするだけですか、何らかの分析を行う必要がありますか?これまでに何を試しましたか? – Evan
@エヴァン私は、ファイルからデータベースにデータを取得したいだけで、分析は必要ありません。しかし、上記のように、データセットは毎年分離されていないため、構造を手動で変更する必要があります。基本的に私はいくつかのライブラリがデータ構造(配列またはdict)にExcelデータを読み込み、次にこの配列を編集/適合させてからdbに入力することをお勧めします。残念ながら、私は上記のライブラリのいずれかからこれに関する情報を見つけられませんでした。 – thimma
あなたが言ったことから、私はpandasライブラリとそのread_excel()関数の使用をお勧めします。データフレームを作成し、操作し、それをCSVやデータベース(SQLなど)に出力できますが、データベースの内容を教えないと助けになることはありません。 – Evan