私はいくつかの非構造化データを持っており、その上でいくつかの処理を行う必要があります。
university_towns.txt:パンダの列名をスキップしてデータを読み取る
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
私はpd.read_tableを使用してこのファイルを読んだとき、私はパンダは私が最初の行(「アラバマ州[編集]」)で必要な列に名前を付けました。私の両方の列がカスタム・命名されているので、
def get_list_of_university_towns():
df = pd.read_table('university_towns.txt')
df = df.reset_index()
return list(df)
> ['index', 'Alabama[edit]']
は、どのように私はこの「自動命名」をリセットすることができ、私は、最初の文字列(「アラバマ州[編集]」)を失うことはありませんか?
read_tableに特定の引数が渡されている可能性がありますが、どちらが正しいかわかりません。
あなたは' pd_tread_table( 'university_towns.txt'、header = None) ' –
を使うことができます。私は0と1の両方を試しましたが、「なし」がトリックでした! – feedthemachine