2012-03-31 9 views
0

私はcommons.wikimedia.orgでURLを見つけるための簡単なクエリを書いていますが、ここで使用されている正確な名前ファイルを取得するためにどの特定の消毒ルールを使用するべきかわかりません。ウィキメディアのURLには、どの特定のサニタイズ機能が使用されていますか?

例:象牙海岸の旗はフランス語でDrapeau_de_la_Côte_d%27Ivoireと表示されていますので、アポストロフィは消毒されていますが、通常のôはそうではありません。特別な文字が保存されている他の多くのファイル名を見てきました。

すべての特殊文字が保存され、すべての句読点および/または非文字が墨塗りされていると想定するのは安全でしょうか?

+0

ブラウザは、ということではないwikepediaんでした。ブラウザはASCII形式の安全なシンボルでURLを送信しますが、ユーザにとって特にフレンドリーな方法でそれらを表示します – zerkms

+0

そのため、その側では何も起こりません。 – moraleida

+0

私はどのような墨塗りを意味するのかよく分かりませんが、その部分では%nn(http://en.wikipedia.org/wiki/Flag_of_C%C3%B4te_d'Ivoire)とブラウザでエンコードされたデータを送信しますそれをデコードします – zerkms

答えて

2

ウィキペディアはすべてのURLを%nnnn形式(すべてのURLのRFCに準拠)でエスケープして使用しています。ブラウザは最終的な作業を行います。

だから私のクロムがhttp://en.wikipedia.org/wiki/Flag_of_Côte_d'Ivoire URLを示していても、もともとはhttp://en.wikipedia.org/wiki/Flag_of_C%C3%B4te_d'Ivoire

+0

素晴らしい、ありがとう! – moraleida

関連する問題