BeautifulSoupを使用してHTMLソースコードからJavaScriptのvar値を取得しようとしています。例えばBeautifulSoupを使用してPythonを使用してHTMLソースでJS var値を取得
私が持っている:
<script>
[other code]
var my = 'hello';
var name = 'hi';
var is = 'halo';
[other code]
</script>
私はvarの値を返すために何かをしたい "私の" Pythonので
どのように私はそれを達成することができますか?
import re
from bs4 import BeautifulSoup
data = """
<script>
[other code]
var my = 'hello';
var name = 'hi';
var is = 'halo';
[other code]
</script>
"""
soup = BeautifulSoup(data, "html.parser")
pattern = re.compile(r"var my = '(.*?)';$", re.MULTILINE | re.DOTALL)
script = soup.find("script", text=pattern)
print(pattern.search(script.text).group(1))
プリントhello
: