アクセント文字を維持しながらファイル上の句読点を削除する必要があります。 このコードを試しましたが、どうしたらうまくいかないでしょうか。 Eclipse
とfiletext.txt
がUTF-8
に設定されていますJavaで文字列の句読点を削除する(アクセント文字も含む)。
Expectation: input=> ’'qwe..,rty ‘èeéò’“ ”o" "à output=> qwertyèeéòoà
Effective result: input=> ’'qwe..,rty ‘èeéò’“ ”o" "à output=>’qwerty ‘èeéò’“ ”o" "à
私は’“”
シンボルとこれら
ノートの他を削除することはできません。
には、Unicode文字クラスを有効にしない限りimport java.io.*;
import java.util.Scanner;
public class DataCounterMain {
public static void main (String[] args) throws FileNotFoundException {
File file = new File("filetext.txt");
try {
Scanner filescanner = new Scanner(file);
while (filescanner.hasNextLine()) {
String line = filescanner.nextLine();
line=line.replaceAll ("\\p{Punct}", "");
System.out.println(line);
}
}
catch(FileNotFoundException e) {
System.err.println(file +" FileNotFound");
}
}
}
あなたがすべてのUnicode句読点や記号を削除したいようです。 'line = line.replaceAll("(?U)[\\ p {S} \\ p {P}] + "、" ");' –