私はこれを行う方法の例を見てきましたが、それを理解できません。私はbeautifulsoupを使っていくつかのデータをスクラップしています - 私はそれを使って私が望むデータを見つけることができますが、それは以下のコードブロックに含まれています。私はそれからタイムスタンプ情報を抽出しようとしています。私は正規表現がここで働いているような気がしますが、私はそれを理解することができません - どのような提案?Pythonを使用してJavascriptからテキストを抽出する
<script class="code" type="text/javascript">
$(document).ready(function(){
line1 = [['2009-02-23 10 AM', 5203], ['2009-02-08 10 AM', 3898], ['2009-02-09 10 AM', 4923], ['2009-02-22 10 AM', 3682], ['2009-02-21 10 AM', 3238], ['2009-02-20 10 AM', 4648]];
options1 = {
etc other text
}
});
</script>
うんを、唯一のBS4は、ターゲットがこのタイプのデータであるあなたが行うのに役立ちますそれは正規表現で - 正規表現+ ast.literal_evalを使うのがうまくいく場合があります。 – n1c9
コードは間違いなく動作します - ありがとうございます。私の具体的な例では、最初にデータをターゲットにするためにbs4を使用しているため、結果のデータは正規表現では機能しないbs4要素です。だから結果を文字列に変換しますが、タイムスタンプの後のコードの一部が表示されます。どのように私はそれを 'line1'と 'options1'の間にあるものに限定することができますか?私がしようとしていることはすべて空を生み出しています。 x = 'line1'、y = 'options1' – karty
が存在する場合は、 '\'(?> = y) '"、text) 'n'なら' text.split( '\ n')[2] .strip() 'を実行し、' line1 = [...]; 'を得ることができます。これで最後に 'line1 ='と ';'を削除するために '[8:-1]'スライスを使うことができます。最後に 'text.split( '\ n')[2] .strip()[8:-1 ] ' – furas