ÐÏの前にcontainsヘッダーを含む.docファイルがあるので、ÐÏの前に存在するすべての文字を削除する必要があります。Javaを使用してファイル内の特殊文字を特定する方法
例:asdfasdfasdfasfasdfasfÐÏ9asjdfkj
Iは、以下のコードを使用しています。
InputStream is = new FileInputStream("D:\\Users\\Vinoth\\workspace\\Testing\\Testing_2.doc");
DataInputStream dis = new DataInputStream(is);
OutputStream os = new FileOutputStream("D:\\Users\\Vinoth\\workspace\\Testing\\Testing_3.doc");
DataOutputStream dos = new DataOutputStream(os);
byte[] buff = new byte[dis.available()];
dis.readFully(buff);
char temp = 0;
boolean start = false;
try{
for(byte b:buff){
char c = (char)b;
if(temp == 'Ð' && c == 'Ï'){
start = true;
}
if(start){
dos.write(c);
}
temp = c;
}
ただし、最初のif条件が満たされていないため、ファイルには何も書き込まれません。どうすればいいのかアドバイスしてください。
"ÐÏ"の前に文字を削除するだけで、ドキュメントの内容は変わりません。私はちょうど変更をせずに読んで、書き込むだけでこの方法を試しました.DOCファイルは完璧です。 – Vinoth