私は区切り文字で読み込むためにパンダを使用しようとしています。セパレータは小文字のrho(þ)というギリシャ語の文字です。rhoで区切られたファイルを読む
正しいread_tableパラメータを定義して、結果として得られるデータフレームが正しくフォーマットされるように苦労しています。
誰でもこれに関する経験や提案はありますか?
ファイルの例は
TimeþUser-IDþAdvertiser-IDþOrder-IDþAd-IDþCreative-IDþCreative-VersionþCreativeサイズ-IDþSite-IDþPage-IDþCountry-IDþState/ProvinceþBrowser-IDþBrowser-VersionþOS-IDþDMA-IDþCity-IDþZip未満であります-CodeþSite-DataþTime-UTC-SEC 03-28-2016-00:50:03þ0þ3893600þ7786669þ298662779þ67802437þ1þ300x250þ1722397þ125754620þ68þþ30þ0.0þ501012þ0þ3711þþþ1459122603 03-28-2016-00:24:29þ0þ3893600þ7352234þ290743769þ55727503þ1þ1x1þ1602646þ117915815þ68þþ31þ0.0þ501012þ0þ3711þþþ1459121069 03-28-2016-00:13:42þ0þ3893600þ7352234þ290743769þ55727503þ1þ1x1þ1602646þ117915815þ68þþ31þ0.0þ501012þ0þ37 11þþþ1459120422 03-28-2016-00:21:09þ0þ3893600þ7352234þ290743769þ55727503þ1þ1x1þ1602646þ117915815þ68þþ31þ0.0þ501012þ0þ3711þþþ1459120869
あなたは 'read_table(file、sep =r'ρ ')'は動作しないと言っていますか?追加のパラメータ 'encoding = 'utf-8''または' encoding =' utf-16''を使用していますか? – EdChum
ええ、そうです。 –
私はWindowsマシン上で助けにはならないかもしれませんが、私の構文が最初であることを確認したいと思います。次のことを試してみてください。 'import pandas as pd data = pd.read_table( 'C:\ Users \ robin.sheridan \ Documents \ RCode \ NetworkImpression_5684_03-28-2016'、sep =r'ρ '、nrows = 10、encoding =' utf-16 ') print(data) ' –