2017-04-04 9 views
0

私はgoogleのdatalabでGoogleストレージからファイルを読み込んでいます。次に、データに変数がありますが、これをpandas Dataframeに変換する必要があります。Googleストレージオブジェクトからpandasデータフレーム

私は読んでいます:

1/1/2016 08:35:56,1,4756798,"7501073831988",1.00,15.00,0.16,"S0394",4388,2,10.43\r\n1,1/1/2016 08:35:56,1,4756798,"850697002395",1.00,13.50,0.00,"S0394",4388,2,10.36\r\n1,1/1/2016 08:35:56,1,4756798,"850697002425",1.00,10.00,0.00,"S0394",4388,2,7.29\r\n1,1/1/2016 08:38:55,2,1013642,"8469760102003",1.00,200.00,0.16,"C0278",2595,1,161.20\r\n 

すべてのヘルプしてください:

%%gcs read --object $objeto1 --variable prueba 

変数pruebaは次のようになりますか?

+0

は:DF = bq.Query(「タブラから選択*」)to_dataframe( )、私のオブジェクトをpandas Dataframeに変換すれば十分ですが、ストレージの変数にそのようなことをすると、AttributeError: 'str'オブジェクトに 'to_dataframe'属性がありません –

+0

変数をStringIOに以下のようにラップします:https: //stackoverflow.com/questions/37990467/how-can-i-load-my-csv-from-google-datalab-to-a-pandas-data-frame – Tautvydas

答えて

0

私はあなたがdatalabsのマシンにGCSからファイルを読むことをお勧めします:私は、例えばBigQueryのからクエリを読み

def (gcs_path, csv_file_name): 
    get_ipython().system(u'gsutil cp ' + path + csv_file_name+' .') 
    df = pd.read_csv(csv_file_name) 
    return df 
関連する問題