1
文字列を取得するためのPythonプログラムを作成しました。たとえば、文字列に画像があります。たとえば、 "Siempre endíade la Madre lapasábamosas 'todos en familiaあなたと他の人との間には、あなたが他の人と共有し合うことができます。Pythonの文字列の画像を削除する文字と数字のみを取得する
文字列からこれらの画像を削除し、数字と文字のみを取得したいと考えています。
注意:これらの文字列は英語で書かれているだけでなく、すべての種類の言語(アラビア語、日本語など)で書かれている可能性があります。
私のプログラム:
for post_item in group_member_posts_list:
if post_item['post_content']:
post_item_content_str = post_item['post_content']
print("post_item_content_str:" + post_item_content_str)
post_item_content_str = filter(str.isalnum,post_item_content_str)
print("after filter post_item_content_str:" + post_item_content_str)
b = TextBlob(post_item_content_str)
post_item_content_type = b.detect_language()
私はフィルタ機能を使用しようとしましたが、それはエラーが発生します。そして、isalnum関数は英語の文字しか見つけることができません。
この問題の解決方法を教えてください。