クラス割り当てでは、Jupyterノートブックを使用してPythonでデータフレームにcsvファイルをロードしようとしています。.csvファイルの内容をPythonデータフレームに正しく読み込むことができません
以下は私の試みです。私は、次のような列を定義している:
gnacs_y = "id|postedTime|body|None1|['twitter_entiteis:urls:url']|None2|['actor:languages_list-items']|gnip:language:value|twitter_lang|[u'geo:coordinates_list-items']|geo:type|None3|None4|None5|None6|actor:utcOffset|None7|None8|None9|None10|None11|None12|None13|None14|None15|actor:displayName|actor:preferredUsername|actor:id|gnip:klout_score|actor:followersCount|actor:friendsCount|actor:listedCount|actor:statusesCount|Tweet|None16|None17|None18"
colnames = gnacs_y.split('|')
その後、私は、次のしている:データがロードされるとき
df_3 = pd.read_csv('../data/twitter_sample.csv', sep='|', names=colnames)
df_3.tail(10)
は、しかし私は、HTMLコードのテキストおよび他のすべてのように思えるものを持つ唯一のID列を参照してください列はNaNで、.CSVファイルにデータがあるとします。ジュピターノートに表示されるスクリーンショットとCSVファイルの内容を添付しました。私がgancs_yの列名の最初の宣言を乱したかどうかはわかりません。割り当てのためのCSVファイルへ
こんにちはルイーズせずに、あなたの返事に感謝を正しい
csv
ファイルが得られます。私はファイルを3回チェックしており、拡張子は.CSVです。私はおそらくあなたが一見を持つことができるようにファイルで最初の質問を更新します。その間、私はメモ帳に内容をコピーしてコピーし、.HTMLファイルとしても試してみます。あなたの入力をありがとう – vbala2014元のファイルは有用であるか、ファイルの単純なテキストサンプル(Excelではなく)です。 'html'が何をしているのか、実際には' read_csv'で読むことができるように救済できるファイルなのかどうかは分かりません。 –
こんにちはLouise、質問の元のファイルへのリンクを追加しました。あなたがそれを開くことができれば教えてください。ありがとうございます。 – vbala2014