のHTMLファイルのコードサンプルをExcelファイルにその内容を保存します。のJava読むhtmlファイルと
<HTML>
<HEAD>
<TITLE>REPORT</TITLE></HEAD>
<BODY>
<TITLE>REPORT</TITLE><PRE><H2>################ REPORT ###################</H2><H3>Setup</H3> Item1 1120 <br> Item2 Copy free <br> Item3 8/3/2017 5:44:51 AM <br> Item4 <Press OK> <br>
以下
のようなExcelファイルにこれらの情報を保存することです私は現在、htmlファイルを読むためにBufferedReaderのを使用しますが、私は、フィールドと値を含む行を分離する方法を知りません。フィールド名と値を保存するためにhashmapを使用しようとしていましたが、正しい方法で値を取得できません。私はまた、HTMLタグを取り除くためにJsoupを試してみましたが、それは私に
private final String[] modStrings = new String[]{"Item1", "Item2", "Item3", "Item4", "Item5"};
public void readHtmlFile() throws IOException {
FileReader reader = new FileReader("C:\\Users\\file.html");
// StringBuilder sb = new StringBuilder();
BufferedReader br = new BufferedReader(reader);
String line;
String[] tempContent = {};
ArrayList content = new ArrayList();
HashMap modMap = new HashMap<>();
while ((line=br.readLine()) != null) {
tempContent = line.split("<br>");
for(int i = 0; i < tempContent.length; i++){
for (String sub:modStrings){
if(tempContent[i].contains(sub)){
String value = "TODO HERE"; // TODO
content.add(sub);
modMap.put(sub, value);
}
}
}
}
// String textOnly = Jsoup.parse(sb.toString()).text();
for(int i = 0; i < content.size(); i++){
System.out.println(content.get(i));
System.out.println(modMap);
}
}
任意の提案やアイデアは多くの助けになるhtmlファイルので、ラインを読むために、より複雑になります。
:こちらをたとえば、私はあなたのために簡単なトリックに
サンプルコードを実行するために...
or
subString'トリムsplit(String regex)
、[split(String regex, int limit)](https://docs.oracle.com/javase/7/docs/api/java/lang/String.html#split(java.lang.String,%20int)),
を使用していますbr ")'はあなたが望むものをあなたに与えません。 'Item'と値を得るには' space'と 'split'を使うべきです。 –String [] keyVal = s.trim()。split(" + ");を使うことができます。値= keyVal [1]; key = keyVal [0]; – CodeIsLife
@TuyenNguyen、私はsplit( "")を使うことはできません。いつか値にもスペースが含まれているので、スペースで区切っても私が望む値に分割されます。 (たとえば、無料でコピーして、2011年8月3日5:44:51 AM) –