テキストファイルからの読み込みの最初の文字：ï»¿

私はこのコードを記述する場合、私は出力としてこれを取得 - >この最初：ï»¿ し、他のラインはどのようテキストファイルからの読み込みの最初の文字：ï»¿

try { 
    BufferedReader br = new BufferedReader(new FileReader(
      "myFile.txt")); 

    String line; 
    while (line = br.readLine() != null) { 
     System.out.println(line); 
    } 
    br.close(); 

} catch (FileNotFoundException e) { 
    e.printStackTrace(); 
} catch (IOException e) { 
    e.printStackTrace(); 
}

それを避けることはできますか？

出典

2013-07-01 Milton90

エンコードされていると思います。 –

おそらくBOMですか？ https://en.wikipedia.org/wiki/Byte_order_mark –

これは[UTF-8 BOM]（https://en.wikipedia.org/wiki/Byte_order_mark）です。 –

問題はエンコードされている可能性があります。これを試してみてください。

BufferedReader in = new BufferedReader(new InputStreamReader(
     new FileInputStream("yourfile"), "UTF-8"));

出典

2013-07-01 13:07:05 Tala

私はそれを言うでしょう*確かに*エンコーディングです;） – Joey

私はすでに試してみました。 ï»¿の代わりに '？' – Milton90

これはIDEを使用している可能性があります。時にはネイティブオペレーティングシステムのデフォルトエンコードを設定することもあります – Tala

をこのシーケンスはUTF-8 byte order mark (BOM)あるので、あなたが最初の行に文字ï»¿を取得しています。テキストファイルがBOMで始まる場合は、メモ帳などのWindowsプログラムによって生成された可能性があります。

はあなたの問題を解決するために、我々はUTF-8として明示的にファイルを読み込むことを選択するのではなく、どのようなデフォルトのシステムの文字エンコーディング（US-ASCIIなど）：

UTF-8で次に

BufferedReader in = new BufferedReader(
    new InputStreamReader(
     new FileInputStream("myFile.txt"), 
     "UTF-8"));

、バイトシーケンスは、1文字（U + FEFF）にデコードされます。この文字はオプションです。合法的なUTF-8ファイルは、それで始まるかもしれません。

in.mark(1); 
if (in.read() != 0xFEFF) 
    in.reset();

そして今、あなたはあなたのコードの残りの部分を続行することができます。だから我々はそれがU + FEFFだ場合にのみ、最初の文字をスキップします。

出典

2013-07-01 13:38:02 Nayuki

テキストファイルからの読み込みの最初の文字：ï»¿

答えて

関連する問題