10

Scannerを使用して、Javaで.txtドキュメントをスキャンしています。私は、Eclipseでの.txt文書を開いたときしかし、私はいくつかの文字が認識されていない気づき、そして彼らはこのようなものに置き換えられます:Eclipse文字エンコーディング

これらの文字も私がスキャンさせません

while(scan.hasNext) 

は、自動的にfalseを返します(これらの文字が存在しない場合は、ドキュメントを正常にスキャンできます)。

私はスキャンできるようにEclipseにこれらの文字を認識させる方法を教えてください。文書がかなり大きいので、手動で削除することはできません。おかげさまで

+0

それはファイルがそれでない文字を持っている、またはあなたが(おそらくデフォルト)を使用している文字セットは、そのファイルが何であるかではありません。意味 –

答えて

15

あなたが読んでいるファイルは、UTF-8または他のいくつかのエンコーディングの文字を含む必要があり、あなたがコンソール上でそれらを印刷しようとすると、あなたは「として一部の文字を取得します。これは、Eclipseのデフォルトのコンソール・エンコーディングがUTF-8ではないためです。ドロップダウンからRun Configuration - > Common - > Encoding - > UTF-8を選択して設定する必要があります。スクリーンショットの下にチェック:

enter image description here

13

あなたがウィンドウに行き、あなたの全体のEclipseワークスペースの文字コードを変更する必要がある場合 - >設定。 次に、「一般」 - >「ワークスペース」で、「テキストファイルのエンコーディング」を適切な文字エンコーディング(この場合はUTF-8)に変更します。

Eclipse Preferences - Changing Character Encoding

関連する問題