私はjavaでStringTokeniserを使用してテキストファイルをトークン化しようとしています。しかし、問題はそれが行の最後の言葉だけを取ることです。少しの助けが必要です。このサンプルコードはmap-reduce関数の一部です。StringTokenizerは、行の最後の単語を取ります。
String profile;
StringTokenizer inputKey=new StringTokenizer(value.toString());
while(inputKey.hasMoreTokens()){
String input=inputKey.nextToken();
if(!input.endsWith("</id>")){
textInput.set(input);
} else {
profile=input.substring(4,15);
profileId.set(profile);
}
}
予想される出力は何ですか? –
... 'textInput'とは何ですか? –
トークン化しようとしている文字列の区切り文字は何ですか?特定のものを渡さなければ、StringTokenizerはデフォルトで区切り文字として '' 'を使います。 –