私はJsoupを使ってウェブページをスクラップしています。それはテキストを取り込み、それをデータベースに直接入力します。mysqlデータベースの特定の文字を照合utf-8で置き換える疑問符はなぜですか?
対象のWebページのテキストは完全にうまく見えますが、データベースに入力すると、特定の文字を置き換える疑問符が表示されます。例えば
単一の右引用符(U + 2019)次の文で:
私は、ええと 想像力の影響を受けていない人間の努力のドメインを想像することはできません。
は、データベースに次のように表示されますと、私はそれを出力してるウェブページ:??
私はtはトン の影響を受け、ええとにISN人間の努力のドメインを想像することができます想像力。当初、私は現在で働いているSQLデータベースがである
...私は、これはデータベースの文字セット/照合を持つだけの問題でだと思ったが、さまざまな種類を試した後、問題が解決しない
UTF-8:
mysql> SHOW VARIABLES LIKE 'character\_set\_%';
+--------------------------+--------+
| Variable_name | Value |
+--------------------------+--------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
+--------------------------+--------+
とメタが設定されている:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
私は特にJavaでそれを設定しようとしましたそのように:これはあるかもしれない理由を任意のアイデア..私は新しいデータベースと何も動作するようです作成しようとしました
を
SET NAMES 'utf8'
SET CHARACTER SET utf8
:
url = "jdbc:mysql://localhost:3306/somedb?useUnicode=true&characterEncoding=utf-8";
私のようなSQLクエリを試してみましたハプニング?
で見る "疑問符" あなたはUTF-8にJsoupエンコーディングを設定しようとしたことがありますか? –
はい、ちょうどそれを今試みました、残念ながら同じ問題をまだ得ています。しかし良い提案 –