2017-05-17 2 views
0

私はいくつかの非構造化データを持っており、その上でいくつかの処理を行う必要があります。
university_towns.txt:パンダの列名をスキップしてデータを読み取る

Alabama[edit] 
Auburn (Auburn University)[1] 
Florence (University of North Alabama) 
Jacksonville (Jacksonville State University)[2] 
Livingston (University of West Alabama)[2] 
Montevallo (University of Montevallo)[2] 
Troy (Troy University)[2] 

私はpd.read_tableを使用してこのファイルを読んだとき、私はパンダは私が最初の行(「アラバマ州[編集]」)で必要な列に名前を付けました。私の両方の列がカスタム・命名されているので、

def get_list_of_university_towns(): 
    df = pd.read_table('university_towns.txt') 
    df = df.reset_index() 
    return list(df) 
> ['index', 'Alabama[edit]'] 

は、どのように私はこの「自動命名」をリセットすることができ、私は、最初の文字列(「アラバマ州[編集]」)を失うことはありませんか?

read_tableに特定の引数が渡されている可能性がありますが、どちらが正しいかわかりません。

+1

あなたは' pd_tread_table( 'university_towns.txt'、header = None) ' –

+0

を使うことができます。私は0と1の両方を試しましたが、「なし」がトリックでした! – feedthemachine

答えて

1

これはいくつかの方法で実行できます。例えば

あなたはpd.read_table使用するときは、列名を定義することができます。

COL = [ "都市"]

DF = pd.read_table( "D: \ datos \ university_towns.txt.txt "、名前= col

+0

これもうまくいくが、 'header = None'がうまく機能する。ありがとう – feedthemachine

+0

確かに!私はデータ列に名前を付けると仮定しましたが、間違っていました – FdMon

関連する問題