私はscholar.google.com で特定のクエリに一致する論文の数をダウンロードするためにwgetを使用し、ページのすべてのコンテンツを表示するファイルを取得します。wgetのgrep htmlファイル
ファイルの次の部分の最後の番号を取得します。 "結果1 - 10の約8,890。"
cat /dir/file | tr -d "," | grep -o -E -- 'about ([^"]+) \w+'
をそれが出力されます:
は、私が試した
about <b>8890</b>. (<b>0.12</b> sec) </font></td></tr></table></form> <div class
私はちょうど8890(TR -dで世話をされていないカンマ "" で
をしたいのに対し、それを改善する方法についてのご意見はありますか? ありがとうございます。
これも動作します! 1本のパイプが少なくなっています。ありがとう – user1249747