.csvファイルの内容をPythonデータフレームに正しく読み込むことができません

クラス割り当てでは、Jupyterノートブックを使用してPythonでデータフレームにcsvファイルをロードしようとしています。.csvファイルの内容をPythonデータフレームに正しく読み込むことができません

以下は私の試みです。私は、次のような列を定義している：

gnacs_y = "id|postedTime|body|None1|['twitter_entiteis:urls:url']|None2|['actor:languages_list-items']|gnip:language:value|twitter_lang|[u'geo:coordinates_list-items']|geo:type|None3|None4|None5|None6|actor:utcOffset|None7|None8|None9|None10|None11|None12|None13|None14|None15|actor:displayName|actor:preferredUsername|actor:id|gnip:klout_score|actor:followersCount|actor:friendsCount|actor:listedCount|actor:statusesCount|Tweet|None16|None17|None18" 
colnames = gnacs_y.split('|')

その後、私は、次のしている：データがロードされるとき

df_3 = pd.read_csv('../data/twitter_sample.csv', sep='|', names=colnames) 

df_3.tail(10)

は、しかし私は、HTMLコードのテキストおよび他のすべてのように思えるものを持つ唯一のID列を参照してください列はNaNで、.CSVファイルにデータがあるとします。ジュピターノートに表示されるスクリーンショットとCSVファイルの内容を添付しました。私がgancs_yの列名の最初の宣言を乱したかどうかはわかりません。割り当てのためのCSVファイルへ

リンク：すべてのヘルプは

出典

2017-11-24 vbala2014

あなたのファイル素晴らしいいただければ幸いです https://github.com/terratenney/yorkBigData/blob/master/assignments/data/twitter_sample.csv

がcsvファイルではありません、それはそれでテーブルを持っているhtmlファイルです。割り当てファイルにcsvファイルがあるとすれば、適切なファイルをダウンロードしたことを確認しましたか？

EDIT：あなたのファイルを保存台無しのように見えます - あなたはGitHubの上でRAWボタンをクリックしていることをダウンロードした場合、それは、html

出典

2017-11-24 13:18:52

こんにちはルイーズせずに、あなたの返事に感謝を正しいcsvファイルが得られます。私はファイルを3回チェックしており、拡張子は.CSVです。私はおそらくあなたが一見を持つことができるようにファイルで最初の質問を更新します。その間、私はメモ帳に内容をコピーしてコピーし、.HTMLファイルとしても試してみます。あなたの入力をありがとう – vbala2014

元のファイルは有用であるか、ファイルの単純なテキストサンプル（Excelではなく）です。 'html'が何をしているのか、実際には' read_csv'で読むことができるように救済できるファイルなのかどうかは分かりません。 –

こんにちはLouise、質問の元のファイルへのリンクを追加しました。あなたがそれを開くことができれば教えてください。ありがとうございます。 – vbala2014

.csvファイルの内容をPythonデータフレームに正しく読み込むことができません

答えて

関連する問題