2017-06-26 9 views
-3

私はスクレイピング(BeautifulSoup)なしタグが

のソースコード(find_all、見つける、取得などの機能を...)、こすると非常に新しいです私が掻き集めているウェブサイトでは、同じタグの中にさまざまなアイテムが表示されています

これはソースコード内に「アイテム」が表示されているためです(これらのアイテムはカンマ(、)で区切られています)

{ 
        "id1" : "121130815", 
        "id2" : "113840", 

       } 

このアイテムはどのように入手できますか?

ありがとうございました

+4

bs4ではなくjsonを使用する必要があります。 –

+0

[Pythonを使用したJSONファイルからの値の解析?](https://stackoverflow.com/questions/2835559/parsing-values-from-a-json-file-using-python) –

+0

Btwは明白ですあなたはまだBeautifulSoupを使って

1

これはHTMLではなく、JSONです。 BeautifulSoupは、単にウェブページではなく、HTMLコードを解析するためのライブラリです。 Webページは、ページの定義に応じて、さまざまな形式にすることができます。

この場合、JSONを返すサイトがあるため、適切なツールを選択する必要があります。 PythonのJSONライブラリに組み込まれているjsonを使用する必要があります。 jsonモジュールhereの詳細を読むことができます。

あなたはそれに精通していないので、JSONについて少しお読みください。 hereは、このフォーマットの素晴らしい紹介です。

関連する問題