2017-04-17 11 views
1

CSVファイルをPythonで使い始めたので、正しく操作する方法を学びたいと思っています。このCSVファイルのように大量のデータを管理する方法を知りたいのですが、Sacramento Crime January 2006には7,548件の犯罪記録があります。CSVファイルから「クリーンな」データテーブルを作成するには

基本的に、ヘッダー(名前、ID、緯度など)とその下のすべての値として最初の行を含む表に変換します。この質問のコードはwhich is similar to mine but does not work entirelyです。

はその質問によると、私はその内容に続いて、ヘッダーの名前を持つ必要がありますが、私は得る:

{'address': [], 'etc': []} [] 

私は{{'adress':[]]} ['addresses in CSV file(7k etc)']

を取得する必要があります。また、それはすべて1行であるとき、I

:それはすべて私のCSVファイルながら

Name ID Latitude etc 
John 55 -4.56777 etc 

ようになりたいのは、このようなものです

cdatetime,address,district,beat,grid,crimedescr,ucr_ncic_code,latitude,longitude 
1/1/06 0:00,3108 OCCIDENTAL DR,3,3C  

現在のところ、私はリンクされた質問の答えにあるものに取り組んできましたが、私は方法を見つけるためにしばらくの間苦労してきました。ところで、私はPythonにはまったく新しいです。私はちょうどファイルを開く、読む、書く方法を学びました。 import pandasまたはimport csvも使用しなければなりません。どちらが良いですか?

+1

私はいくつかのパンダを学ぶことをお勧めします。あなたがどこかで見つけるのに苦労しているなら、基礎を学ぶためにdatacampまたは他の教育サイトのようなものに行ってください。しかし、あなたはread_csvメソッドを使ってパンダでcsvファイルをインポートすることができます。 – Aklys

+0

'{['address':[]]} []'は有効なPython式ではありません。 –

+0

@TamasHegedusは投稿を編集しました。私の間違いは、申し訳ありません。 – Maiels

答えて

1

私の質問に対する解決策が見つかりました。私は思ったよりもずっとシンプルで、パンダを使っています。私はそれがCSVファイルを操作するのに非常に有用であるとは考えていませんでした。あなたが必要な場合があります

import pandas as pd 

path=("path to csv file") 
table= pd.read_csv(path, header='infer', sep=',') 
print(table) 

は、あなたの区切り文字を変更すると、ファイルに応じて、あなたは(0inferがデフォルトです)ヘッダの値を変更する必要があります。これは次の結果でした

cdatetime   adress  district beat etc. 
1/1/06 0:00 3108 OCCIDENTAL DR  3  3C etc. 
関連する問題