私はこのWebページでは、いくつかのパラメータを取得したいのSave htmlファイル:たとえばhttps://pubchem.ncbi.nlm.nih.gov/compound/16678118#section=2D-Structure、完全にソースコード
私は「トポロジカル極の表面積」の値を検索する場合
もし私が手動でInternet Explorerでは、ページを保存し、その後、私はしかし、これらのコマンド
cat file.html | grep -c "Topological Polar Surface Area" ,
で値を見つけることができ、私はコマンドwget
またはcurl
で保存したいならば、私は値を見つけることができません。
サーバーが送信するものを取得します。後でJS/AJAXを介して追加のコンテンツが読み込まれた場合は、もちろん取得できません。この場合、状況はより複雑になります。 「ヘッドレスブラウザ」は検索キーワードです。 – CBroe