2017-05-30 6 views
1

質問ファイル:私はデータフレームにファイルを読み込む方法についてのいくつかのウェブサイトを見ているだけにSOHを使用したファイルを読み取る方法を教えてものを見つけることができません

を分割データ。読み取り(データを分割するSOHを使用して)パンダのデータフレームに

私が入手したファイルには拡張子はありませんが、.txtファイルのようです。

今のところ、ファイルを行単位で読み込んでデータフレームを作成するため、時間がかかります。それを速くする方法はありますか?

コード:あなたのデータはヘッダを持っていない場合

from pandas import DataFrame 
openfile = open('filename','r') 
column1 = [] 
column2 = [] 
for line in openfile: 
    line = line.strip().split('\x01') #soh equals to '\x01' 
    column1.append(line[0]) 
    column2.append(line[1]) 
data = {'column1':column1, 'column2':column2} 
table = DataFrame(data,columns = ['column1','column2']) 

答えて

0

が、これはそれを行う必要があります。

import pandas as pd 
table = pd.read_table('filename', sep='\x01', header=None, names=['column1','column2']) 

あなたのファイルhereを読み込むについてリア多くをすることができます。

関連する問題