私は竜巻でWebサーバーを構築しています。キーワードを検索し、サーバーから返信することができます。
python tornado:URLのエンコードとデコード
ユーザーは中国語や日本語などの任意の単語を入力できるため、UTF-8を使用する必要があります。ここで
は私のコアコードです:
class SearchHandler(tornado.web.RequestHandler):
def get(self, path):
try:
print(self.get_argument('key'))
print(urllib.parse.unquote(self.get_argument('key'))
val = urllib.parse.unquote(self.get_argument('key'))
...
...
今度は、ユーザーが中国語の単語を検索するとしましょう:泰国
は、以下のように私に結果が得られます:
%E6%B3%B0%E5%9B%BD
泰国
を
バックエンド部分では、泰国
を使用します。
これですべては問題ありません。
今日、私は私のログにいくつかの奇妙な言葉を見つける:しかし、私は送っ
: country-cn.html?æ³°å½content
は、その後、私はそれがどのように見えるとして、それは示して、私のブラウザにコピーログファイルをWindowsにコピーしてtxt
という名前で開くと、泰国という中国語の単語が表示されます。
今は完全に混乱しています。私は自分のPC(Mac OS)を使用して泰国
と入力して、私のWebサーバーにアクセスしてください。しかし、それは私がそれを解読することができないように私が知らない特別なエンコーディング方法で同じ中国語の単語を検索しようとしていた人がいるようです。