2016-04-09 22 views
1

HTMLファイルの解析に問題があります。私が見たすべての例は、初心者のためにとても複雑で、私はそれらを全く理解していません。私はGetNestedTagマニュアルを読んだことがありますが、より良い方法があるようです:HTML Domを使用する。 「3272」最初のケースと「中:私はテキストを取得するにはどうすればよいAutoHotKeyでHTMLを解析するには?

</span> 3272</p>

<h1 class="articleTitle">Title of text</h1>

は、私のような(これは正しい単語があるかどうかわからない)多くのタグを持っています2番目のケースでは「テキストのタイトル」ですか?

htmlCode = <h1 class="articleTitle">Title of text</h1> 

html := ComObjCreate("HTMLFile") 
html.write(htmlCode) 

MsgBox % html.getElementsByClassName("articleTitle")[0].innerText\ 

そして私も試してみました:

私がこれまで試してみましたが、いずれの場合MsgBox

IE := ComObjCreate("InternetExplorer.Application") 
IE.Visible := true 

IE.Navigate("http://archiwum.rp.pl/artykul/473989-Miller-rezygnuje-z-kierowania-SLD.html#.VwkZz_mLTcs" PostCode) 

    while IE.readyState!=4 || IE.document.readyState != "complete" || IE.busy 
     continue 

    Sleep 1000 

Title_element := Name_Elements[A_Index-1].parentElement.getElementsByClassName("articleTitle")[0] 
Title_text  := Title_element.innertext 

msgbox, % title_text 


ExitApp 

は正しい値を表示するために失敗しました。

答えて

0

COMを使用してウェブサイトを適切にナビゲートして解析するには、Domをブラッシュアップする必要があります。

私はここでこのスレッドをお勧めしたい:Basic Webpage Controls with JavaScript/COM - Tutorial

IE := ComObjCreate("InternetExplorer.Application") 
IE.Visible := true 

IE.Navigate("http://archiwum.rp.pl/artykul/473989-Miller-rezygnuje-z-kierowania-SLD.html#.VwkZz_mLTcs" PostCode) 

    while IE.readyState!=4 || IE.document.readyState != "complete" || IE.busy 
     continue 

    Sleep 1000 

Title_text := IE.document.getElementsByClassName("articleTitle")[0].innertext 

MsgBox % Title_text