私はlxml
を使用して、Webページから文字列を取得しています。以下のエラーが出ることなく抽出するデータの文字列を取得するにはどうすればよいですか?私はちょうどstr()
を使って問題を解決できないと思う。 PythonでPython、lxmlおよび<type 'exceptions.UnicodeEncodeError'>
:
mystring = MySQLdb.escape_string(i.text_content())
(<type 'exceptions.UnicodeEncodeError'>, UnicodeEncodeError('ascii', u"\n\nEve Pownall\n\n \n \n \n \n Eve Pownall\n\t (Author)\n\t\n \u203a Visit Amazon's Eve Pownall Page\n Find all the books, read about the author, and more.\n\n See search results for this author \n Are you an author?\n Learn about Author Central\n \n \n \n \n\n \n amznJQ.onReady('bylinePopover', function() {});\n \n\n\n (Author)\n\n\n\n\n\n\n\n\n\n\n", 75, 76, 'ordinal not in range(128)'), <traceback object at 0x7f225c99f050>)
この質問の可能性のある重複http://stackoverflow.com/questions/808275/decoding-problems-in-django-and-lxml –