これは他の韓国語のエンコーディングの質問と異なる場合があります。C# - 韓国語のエンコーディング
このサイトがあります。スクレイプしなければならないのは韓国語です。
サイト内の例文は です。「個人情報保護を行うためには、ボタンのみをクリックして結果画面上部と下部のボタンを使用してください。」
私はHttpWebRequestとHttpWebResponseを使用してサイトをスクラップしています。
これは、私は、HTML
盗んどのようにされた - 部分コード -
using (Stream data = resp.GetResponseStream())
{
response.Append(new StreamReader(data, Encoding.GetEncoding(code), true).ReadToEnd());
}
を今私の問題は、正しい韓国語の文字を取得しておりませんされています。私の "コード"変数では、MSDN http://msdn.microsoft.com/en-us/library/system.text.encoding.aspxのコードページを基にしています(絞り込んでください)。ここ
は、韓国語のコードページです: 51949、50225、20949、20833、10003、949
が、それでも正しい韓国語の文字を取得していないのですか?あなたは何が問題だと思いますか?
ページはどのようなエンコードですか?メタタグはありますか? httpヘッダーはどうですか? – Oded
それはただEUC-KRに向いていますが、私はすでにその名前Encoding.GetEncoding( "EUC-KR")を使用していて、間違った韓国語の文字を持っています。 ?踰?寃?寃? ?ㅼ|寃? ⑸??えええええええええええええええええええええええええええええと> ㅻㅻ湲踰踰寃寃곌???硫硫硫??????????? –
スクレイピングを実行しているコンピュータにそのコードページがインストールされていますか? – Oded