2012-02-18 18 views
0

私はPythonを使用して、2つのシステムを統合するスクリプトを作成しています。システムは、メールボックスをスキャンし、特定の件名を検索し、電子メールから情報を解析します。私が探している要素の1つは、HTMLコードをテキスト形式のテキストファイルに書き込むためにCurlを使用するHTMLリンクです。Pythonを使用して日本語を英語に翻訳する

私の質問は、電子メールのテキストが日本語であれば、自動的にそのテキストを英語に変換するモジュールがPythonにありますか?または、文字列をUnicodeに変換してからデコードする必要がありますか?

ここに私が見ているものの例があります。私は、文字列を取得し、これを取得するファイルにそれを書くための簡単なre.match行うと

USB Host Stack 処理において解放されたメモリを不正に使用している 

:私はURLからテキストをつかむためにカールを使用する場合

USB Host Stack æQtk0J0D0f0ã‰>eU0Œ0_0á0â0ê0’0Nckk0O(uW0f0D0‹0 

をI私はそう

>>> emailMessage.get_payload() 
USB Host Stack =E5=87=A6=E7=90=86=E3=81=AB=E3=81=8A=E3=81=84=E3=81=A6=E8=A7= 
=A3=E6=94=BE=E3=81=95=E3=82=8C=E3=81=9F=E3=83=A1=E3=83=A2=E3=83=AA=E3=82=92= 
=E4=B8=8D=E6=AD=A3=E3=81=AB=E4=BD=BF=E7=94=A8=E3=81=97=E3=81=A6=E3=81=84=E3= 
=82=8B 

をメールモジュールを使用して電子メールをつかむときも、私は私の本当の問題は、私は、これはENGLに変換するために取得するために取る必要がありますどのような手順で以下のように推測します正しいですか?私は本当に最初のものを日本語の文字にして、それを英語に変換したいと思っています。

+0

Python 2.xまたはPython 3.xを使用していますか? Python 2.xを使用している場合は、['unicode'](http://docs.python.org/library/functions.html#unicode)について何かお読みください。 – juliomalegria

+0

どのように英語に変換しますか?スペルや翻訳は? –

+1

文字列はすでにUnicodeです。日本語を直接処理することができます。 「変換」は必要ありません。日本語を英語に翻訳したいのであれば、非常に洗練されたソフトウェアが必要です。あなたはNLTKについて尋ねていますか?または、Google翻訳について質問していますか? –

答えて

0

自然言語の翻訳は、他の人が書いたように、非常に困難な問題です。そのため、翻訳する文字列をサービスに翻訳する(たとえばgoogle translateなど)。翻訳は翻訳されます(翻訳は不十分ですが、翻訳よりも優れています)。あなたはそれを破壊することなく、テキストを読んで、書いているように、仕事に、あなたはあなたのエンコーディングの問題(ユニコード、uuencodingなど)を整理する必要があることを取得する前translate url with google translate from python script

次SOのリンクは、1つの方法を示してい。

+0

ありがとうございました。これのもう1つの部分は、システムが完全に自動化されているため、Googleの部分を自動化するのが難しいことです。 –

+1

Google翻訳api v1は最近廃止され、v2は有料サービスなので、Web上の多くの例はもう機能しません。 「疑わしい利用規約の濫用」のエラーが多数発生することが予想されます。 – DSM

+0

別の注記では...我々は主題の上にあるので簡単な質問です。 readline()は、私が読んでいるtxtファイルに存在するものを正確に返さないのはなぜですか?あなたが私の最初の控訴から見ることができるように、私はそうします。 –

関連する問題