2017-01-27 4 views
0

私はAzure Machine Learningに自分のコードを配備し、UnixやW10などの異なるオペレーティングシステムでRでバッチリクエストを実行しました。なんらかの理由で、ホスト出力はW10のRでのみ正しくフォーマットされていますが、Unixシステムでは正しくフォーマットされた出力を得ることができません。すべてのシステムで適切にフォーマットされた出力を得るには、Azure GUIを使用し、手動でファイルをダウンロードしてください。 W10では、私はRscript/Rstudioで適切にフォーマットされたファイルを直接取得するという贅沢を持っています。 Rでは、system("defaults write org.R-project.R force.LANG en_US.UTF-8")をヒントhereとして明示的に指定していますが、Microsoftが実行するAzureサーバーで実行されるバッチリクエストRスクリプトには何の影響もありません。Azure Machine Unixでフォーマットされたウムラウトを返すバッチリクエスト

何が起こっていることは、たとえば、そのUTF-8 characters bytes are returned as Latin-1 characters bytesある

  1. öとしてÃ ¶

  2. äà ¤として

  3. ÄÃ ¥

  4. として3210

これは、このツールで実証され、テストされています。hereについては、Latin-1文字についてです。だから、このエンコーディングの問題に対処する最善の方法は何ですか、Azure MLの中でどうにか対処できますか?バグレポートはどこで行えますか? Rの中でLatin-1からUTF-8に変換するためのツールがありますか?

Azure ML(ラテン文字1ではなく)でRバッチリクエストを使用してウムラウトを使用して正しくフォーマットされたUTF-8ファイルを取得するにはどうすればよいですか?

+1

Windoze固有の文字セットがあります:https://msdn.microsoft.com/en-us/library/windows/desktop/dd317756(v=vs.85).aspx。 1つ以上のプログラムがどのように文書化されているように動作しないかを示すことができない限り、これをバグとみなすのは難しいと思われます。ユーザーのエラーや混乱は「バグ」ではありません。投稿したシステムコールは、OSXのシステムコマンドのように見えますか? –

答えて

0

バッチリクエストRコマンドには、saveBlobToFile機能があります。問題はgetUrlで間違ったエンコーディングを使用するsaveBlobToFile関数にあります。 getUrl関数は、エンコードを明示的に指定する必要があります。次のように変更

blobContent = getURL(blobUrl, .encoding="UTF-8") 

.encodingせず、出力がISO8859-1('latin1')するか、システムから継承されたものです

を行います。

関連する問題