2016-07-07 6 views
0

私はPythonにはかなり新しくて、まあ...コーディングに関しては、専門家ではないと言えましょう。とても素人な質問のために前もって申し訳ありません。私は私の研究に使用するいくつかのgoogletrends report.csvファイルをマージしようとしています。PythonでGoogleTrendsデータレポートをマージする

2つの問題は、私が遭遇した:

  1. レポートファイルだけでスプレッドシートではなく、無関係である、他の多くの情報が含まれています。私。私はちょうど各ファイルの特定の配列をマージする(実際には、毎月の日付と対応するSVIを含む毎日のデータが必要です)。

  2. データは毎月のレポートファイルから抽出され、月には一定の日数がありません。固定列番号を使用して読み込むことはできませんが、特定の月がある日数に合わせる必要があります。

多くのご協力ありがとうございます!

編集:私が使用

コード:

import pandas as pd 
report = pd.read_csv('C:/Users/paul/Downloads/report.csv', skiprows=4, skipfooter=17) 
print(report) 

The output it produces

私は最初の数行を遮断するために管理が、私はボトムビットを切断する方法がわかりません31行目以降。だからスキップフットラーは動作していないようだ。しかし、月が同じ日数を持たないため、看板を使うことはできないので、事前に行数を知ることはできません。

+0

あなたが持っているものとあなたが望むものの例が必要 –

+0

フレンドリーなポインタ - ここの人々は間違いなく助けてくれるが、これは「私のためのコード」サービスではない。彼らは、あなたが最初に行ったことを知りたい。 – dodell

+0

申し訳ありませんが、むしろ混沌とした質問でした。上記のコードと出力を参照してください。 – PaulWohlfarth

答えて

0

これは時々、pythonが与える警告を読むのに役立つことが判明しました。

ParserWarning: 'c'エンジンがskip_footerをサポートしていないため、 'python'エンジンにフォールバックします。この警告は、engine = 'python'を指定することで回避できます。

skip_footerオプションが機能しなかったという問題は、明らかに使用されているcエンジンに関連していました。同じ問題に実行している人のため

は、ここで私はそれを解決したコードは次のとおりです。

import pandas as pd 
report = pd.read_csv('C:/Users/paul/Downloads/report.csv', skiprows=4, skip_footer=27, engine='python') 

print(report) 

ただ、Cエンジンの問題を取り除くためにエンジン=「のpython」を追加します。私が最後に27行をスキップしなければならなかった理由を聞かないでください(私は17を数えたと確信していました)。

関連する問題