私はラテン語やロシア語混合エンコーディングで書かれ<STDIN>
から文字列を取得し、いくつかのURLに変換する必要があります質問:Perlのエンコーディングが
$search_url = "http://searchengine.com/search?text=" . uri_escape($query);
しかし、これproccessが悪くなり、Mojibakeを提供します(A奇妙な文字の混合物)。それを解決するためにPerlで何ができるでしょうか?
私はラテン語やロシア語混合エンコーディングで書かれ<STDIN>
から文字列を取得し、いくつかのURLに変換する必要があります質問:Perlのエンコーディングが
$search_url = "http://searchengine.com/search?text=" . uri_escape($query);
しかし、これproccessが悪くなり、Mojibakeを提供します(A奇妙な文字の混合物)。それを解決するためにPerlで何ができるでしょうか?
開始する前に知っておくべきことがいくつかあります。
入力のエンコーディングを知る必要があります。 「ラテン」と「ロシア語」は(文字)エンコードではありません。
複数のエンコーディングを扱う場合は、エンコードされているエンコーディングを知る必要があります。 "それはミックスです"とは言えません。
サイトでは、クエリで使用する予定のエンコードを知る必要があります。これは、検索フォームを含むページと同じエンコードでなければなりません。
次に、正しいエンコードを使用して入力をデコードし、正しいエンコードを使用してクエリをエンコードすることだけです。それは簡単な部分です。 Encodeは、これを行うにはdecode
とencode
の機能を提供します。
各文字列のエンコーディングを知っていますか?文字列内に存在するすべてのエンコーディングを知っていますか? –
なぜ文字列が混在しているのですか?どのようにこの文字列を取得していますか?完全なサンプルプログラムとサンプル入力は、あなたを助けます。 :) –