2017-09-10 26 views
0

私はいくつかのHTMLページをpythonで削っています。一部のスペースのテキストに半角スペース(\ u200c)があります。変数にテキストを使用すると、すべてのことがOKです。問題は、リストにテキストを追加すると、実際のハーフスペースの代わりに '\ u200c'が表示されることです。何が問題ですか?実際の半角スペースの代わりに u200c

+0

「半空間」は何であるかは分かりませんが、「\ u200c」は通常のユニコード文字(別の表現)です。たとえば、「0x1」は「1」の別の表現です。だから私はあなたの問題はおそらく全く問題ではないと思うが、コードを見ずに言うのは難しい。 –

+0

ここをクリックしてください:http://www.fileformat.info/info/unicode/char/200c/index.htm – keramat

+0

なぜそれを「半空間」と呼んでいますか? '\ u200c'文字はZERO WIDTH NON-JOINERです。ペルシア語Wikipediaに基づく – mzjn

答えて

1

__repr__メソッドが提供するので、'\u200c'と表示されます。しかし、print()を使用して印刷してみてください。print()__str__という魔法の方法を使用しています。

+0

ありがとう、しかし、それは動作しません。 – keramat

+0

@keramat値がi番目のインデックスに格納されている場合、print(your_list [i])は何を与えますか? –

+0

それは本当に印刷されます! – keramat

0

私はあなたがpython 2.7を使用していると思います。代わりにpython 3を使い始めると、これらの問題はなくなります。 Python 2.7では、Unicode文字であることを知るためにUnicode文字を表現する必要があります。 Python 3はすべての文字列をUnicode文字として扱うのに対し、実際にはそれほど心配する必要はありません。

+0

ここでPython3にアドバイスをしても構いませんが、おそらくOPでの問題ではありません。 –

+0

ありがとう、しかし、私はPython 3.4を使用しています。 – keramat

関連する問題