numpyのgenfromtxtを使ってtxtファイルを読みたいと思います。次のようにファイルt.txtに見える:Numpy genfromtxtは追加の不要な文字列を読み込みます
###############
PSZ1 G096.89+24.17
PSZ1 G108.18−11.53
RXC J0225.1−2928
RXC J1053.7+5452
RXC J1234.2+0947
RXC J1314.4−2515
S 1081
ZwCl 0008.8+5215
ZwCl 2341+0000
1E 0657−558
1RXS J0603.3+4214
24P 73
私はnumpyのをインポートすると、次のようにgenfromtxt実行します。
import numpy as np
a =np.genfromtxt("t.txt", comments="#", dtype=None,autostrip=True,delimiter = " ")
をし、それが発行するときに、次の印刷返します
array([['PSZ1', 'G096.89+24.17'],
['PSZ1', 'G108.18\xe2\x88\x9211.53'],
['RXC', 'J0225.1\xe2\x88\x922928'],
['RXC', 'J1053.7+5452'],
['RXC', 'J1234.2+0947'],
['RXC', 'J1314.4\xe2\x88\x922515'],
['S', '1081'],
['ZwCl', '0008.8+5215'],
['ZwCl', '2341+0000'],
['1E', '0657\xe2\x88\x92558'],
['1RXS', 'J0603.3+4214'],
['24P', '73']],
dtype='|S15')
Iをgenfromtxtを使用している間に\ xを含む追加の刺し傷の原因とその乗り方を知りたいとします。
さらに、このポスト(t.txt)の例を直接txtまたはcsvファイルに直接コピーしても、文字列を読み取る他の多くの方法でも同じ問題(追加の\ x文字列)が返されます。
私は下のUTF8で言われるアトムエディタでファイルt.txtを作成しました。また、ファイルをUTF8として保存しました。
偽のコード化された+と - をPythonで手で個別に変更することなく正しく読むことができますか?
おかげPY3 Ipythonセッションで
[numpy.genfromtxtを使用してPython 3でUTF-8ファイルを読み込む](http://stackoverflow.com/questions/33001373/loading-utf-8-file-in-python-3-using -numpy-genfromtxt) – Yugi
私はPython 2.7を使用していますが、エラーメッセージは表示されません。また、私のtxtファイルには派手な文字はありません(私が知る限り)。 – user3063903
エンコーディングのように見えますが、マイナス記号は翻訳されておらず、その代わりに "\ xe2 \ x88 \ x92"というUTF-8コードに置き換えられています。 UTF-8の読み込みに関連している必要があります。エラーはありませんが、@ yugiが提供するリンクの解決策が役立ちます。 – oxtay