2013-03-04 6 views
5

私のプロジェクトは、私はアラビア語でつぶやきを入力するときにエラーがPythonコードにアラビア語のテキストを入力するにはどうすればよいですか?

>>> pos_tweets = [(' أساند كل عون أمن شريف', 'positive'), 
       ('ما أحلى الثورة التونسية', 'positive'), 
       ('أجمل طفل في العالم', 'positive'), 
       ('الشعب يحرس', 'positive'), 
       ('ثورة شعبنا هي ثورة الكـــرامة وثـــورة الأحــــرار', 'positive')] 
Unsupported characters in input 

どのようにすることができますが発生し、私はNLTKとPythonを使用し、この作業を行うには、アラビア語で正または負の感情(感情分析)を特定することですこの問題を解決します?

+0

は、あなたのシステムの詳細を与えることができます:それは動作しますが、それは、私はこれらの行を追加した後、Unicode文字列を受け入れ、スムーズにスクリプトを実行する理由がわからないのですか? – pram

+0

私のプロジェクトは、アラビア語のセンチメント分析ツールキットを構築することです。ネットを閲覧したときに、このタスクは英語よりも難しいことがわかりました。NLTKとPythonを使って感情を分析する例が見つかりました。 [例](http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-and-nltk/)、私はアラビア語で同じことをすることができるかどうか疑問に思っています –

+0

申し訳ありません、私は対話的なシェルやスクリプトから実行していますか?どのPythonシェルを使ったのですか、あなたのOSなどは何ですか? – pram

答えて

3

問題はIDLEシェルから発生しました。 AFAIK IDLEはインタラクティブモードでUTF-8入力を受け付けません。

DreamPiePythonWinなどの代替シェルを使用することをお勧めします。

+0

アラビア語でセンチメントを分析できるこれらのツールはありますか? –

+1

彼らは単なるシェルです。 Pythonインタプリタに入力した文を渡します。好きなシェルを使っても何の問題もありません。もちろん、必要なライブラリ(この場合はnltk)をインストールする必要があります。 – pram

+0

ありがとうございます、それはDreamPieシェルで動作します:) –

3

私は通常、私のPythonコードにUTF-8を入力するための簡単なハックがあります。

#! /usr/local/bin/python -*- coding: UTF-8 -*- 

pos_tweets = [(u' أساند كل عون أمن شريف', 'positive'), 
(u'ما أحلى الثورة التونسية', 'positive'), 
(u'أجمل طفل في العالم', 'positive'), 
(u'الشعب يحرس', 'positive'), 
(u'ثورة شعبنا هي ثورة الكـــرامة وثـــورة الأحــــرار', 'positive')] 

for i in pos_tweets: 
    print i[0], i[1] 
+1

これは今、おかげで動作します:) –

+3

......(=ألعفو – alvas

関連する問題