2017-01-22 20 views
0

私はPythonを学びたいと思っています。このタスクでは、特定のフォルダ内の特定のcsvファイルをPythonデータ型にインポートし、さらにデータを処理しようとしています。 私は、データをPythonにインポートする必要がある部分に苦労しています。私はこれが効率的であることが必要です。私はいくつかのことを試し、フォーラムや他のWebページで提案されている提案に基づいていくつかのアプローチを試しました。いずれかがこれを解決することができれば、助けは非常に高く評価されるでしょう。効率的にカスタムCSVファイルをPythonに読み込む

注:私はすでにPDとしてパンダをインポートした

アプローチ1

Error tokenizing data. C error: Expected 1 fields in line 13, saw 2

アプローチ2:

DF = pd.read_csv(FilePath) 

これは、次のエラーを生成します

DF = pd.read_csv(FilPath, skiprows=3) 

これも同じエラーが得られます。

Error tokenizing data. C error: Expected 1 fields in line 13, saw 2

アプローチ3:

data = pd.read_csv(FilePath, error_bad_lines=False) 

これは、すべての行をスキップして、1行に1つの文字を読み取ります。これにより、データの処理がさらに困難になります。

https://dl.dropboxusercontent.com/u/32778128/Test.csv

いずれかがこの問題を解決するための提案を持っている場合、私は大いに助けをいただければ幸いです。

ベスト U

+0

「パンダ」は行く道です。データの配置方法に適しています。行をスキップします。 'csv'のもう一つのオプションは、ヘッダーをスキップまたは割り当てるためにリーダーを2回進めることです。メモ:ファイルを安全に開いたり閉じたりするには 'with'ブロックを使います。変数は小文字であるという規則があります。 – pylang

答えて

1

あなたは「データフレーム」は何を使用してしなければならないことはパンダライブラリであると言います。 Pandasでは、インポートcsvファイルを簡単に操作してデータの操作を開始できるPandas DataFrameを提供しています。具体的にはpandas.read_csvの機能を調べる必要があります。それは、あなたが求めているものとそれ以上を行います。行単位でフィルタリングする必要がある場合は、「skiprows」引数を調べます。

あなたは次の操作を実行して、データフレームオブジェクトを取得することができます:あなたはそれ以上を必要とする場合、あなたは上記のリンク先のドキュメントを参照してくださいすることができます

import pandas 

df = pandas.read_csv('boing.csv') # Creates dataframe from specified CSV file 

を、pandas.read_csvはここに一覧表示するにはあまりにも多くの引数を取ります。私はこれが役立つことを願っていますskiprows

例:

df = pandas.read_csv('boing.csv', skiprows=2) 

これは、あなたのCSVファイルの最初の2行を飛ばしてデータフレームを与えます。 2つのヘッダーをいくつでも変更できます。 skiprowsを使用する場合は、ファイル内の実際のデータを表す行をスキップしていないことを確認してください。

+0

私の質問で詳しく説明してくれないことに対する謝罪。私はこの方法も試みました。 エラートークン化データ - PD DF = pd.read_csv(ファイルパス、のskipRows = 3) として 輸入パンダを次のように私の場合には実装されている上記の方法が見えますこれは、次のエラーを生成します。 Cエラー:13行2列目に1フィールドが必要です さらにこのエラーを修正するために検索すると、ここで終わりました。それは私がskiprows' 'については、別の詳細と私の答えの最後に文を追加行 – UGuntupalli

+0

につき1つの文字を読み込みしかし データ= pd.read_csv(「file1.csv」、error_bad_lines = False)が これは、データを正しく読み込みます。私はそれが助けて欲しい –

+0

skiprowsを使用することは残念なことに役立たない。 @large_medium_pizza。 – UGuntupalli

関連する問題