2011-07-06 6 views
-2

私の仕事は、特定の名前のウェブサイトをデータマイニングすることです。私のPythonの経験はあまり高くありません。Python/Scrapyの質問:よりクリーンな結果を得るには?

[u'Bobジョー ']
[u'Timトム']
[u'Anneフランク ']
[u'superman':私はすべての名前をこすり落としたとき、彼らはこの形式で出てきます]

これらの値をクリーンアップするにはどうすればよいですか? 「u」は何を意味していますか?私のxpathは間違っていますか?私は治療パイプラインでそれをきれいにしなければならないでしょうか(これを避けたいですか?)私はちょうど名前がほしいと思う、そしてそれの周りの余分の迷惑ではない。

答えて

1

Python 2では、 'u'接頭辞はUnicode文字列であることを示します。 [u'Bob Joe']は、Unicode文字列を含むリストです。

+0

接頭辞を削除する方法を教えてください。だから私が入力した場合 印刷item.name それは名前だけを印刷するだろうか?この質問が本当に初歩的なのであれば申し訳ありませんが、私は新しいPythonです。時間の制約があるため、言語の学習に時間を十分に費やすことができません。 – Tom

+0

これはリストです。リストの0番目の要素、つまり文字列 'print item.name [0]'を印刷してみてください。 – MRAB

+0

あなたは私を救った!ありがとうございました! – Tom

関連する問題