2017-11-24 20 views
0

クラス割り当てでは、Jupyterノートブックを使用してPythonでデータフレームにcsvファイルをロードしようとしています。.csvファイルの内容をPythonデータフレームに正しく読み込むことができません

以下は私の試みです。私は、次のような列を定義している:

gnacs_y = "id|postedTime|body|None1|['twitter_entiteis:urls:url']|None2|['actor:languages_list-items']|gnip:language:value|twitter_lang|[u'geo:coordinates_list-items']|geo:type|None3|None4|None5|None6|actor:utcOffset|None7|None8|None9|None10|None11|None12|None13|None14|None15|actor:displayName|actor:preferredUsername|actor:id|gnip:klout_score|actor:followersCount|actor:friendsCount|actor:listedCount|actor:statusesCount|Tweet|None16|None17|None18" 
colnames = gnacs_y.split('|') 

その後、私は、次のしている:データがロードされるとき

df_3 = pd.read_csv('../data/twitter_sample.csv', sep='|', names=colnames) 

df_3.tail(10) 

は、しかし私は、HTMLコードのテキストおよび他のすべてのように思えるものを持つ唯一のID列を参照してください列はNaNで、.CSVファイルにデータがあるとします。ジュピターノートに表示されるスクリーンショットとCSVファイルの内容を添付しました。私がgancs_yの列名の最初の宣言を乱したかどうかはわかりません。割り当てのためのCSVファイルへ

リンク:すべてのヘルプは result of load csv file content

答えて

0

あなたのファイル素晴らしいいただければ幸いです https://github.com/terratenney/yorkBigData/blob/master/assignments/data/twitter_sample.csv

csvファイルではありません、それはそれでテーブルを持っているhtmlファイルです。割り当てファイルにcsvファイルがあるとすれば、適切なファイルをダウンロードしたことを確認しましたか?

EDIT:あなたのファイルを保存台無しのように見えます - あなたはGitHubの上でRAWボタンをクリックしていることをダウンロードした場合、それは、html

+0

こんにちはルイーズせずに、あなたの返事に感謝を正しいcsvファイルが得られます。私はファイルを3回チェックしており、拡張子は.CSVです。私はおそらくあなたが一見を持つことができるようにファイルで最初の質問を更新します。その間、私はメモ帳に内容をコピーしてコピーし、.HTMLファイルとしても試してみます。あなたの入力をありがとう – vbala2014

+0

元のファイルは有用であるか、ファイルの単純なテキストサンプル(Excelではなく)です。 'html'が何をしているのか、実際には' read_csv'で読むことができるように救済できるファイルなのかどうかは分かりません。 –

+0

こんにちはLouise、質問の元のファイルへのリンクを追加しました。あなたがそれを開くことができれば教えてください。ありがとうございます。 – vbala2014

関連する問題