私はこのウェブサイトスクラップしようとしている:それはイスラエルのウェブサイトがは私がウェブサイトをスクラップしよう、と私は入れません404エラー
https://www.nadlan.gov.il
で、歴史的な不動産取引上のデータを示しています。
検索ボックスには、無料のテキストを検索して、どのような都市/近所に歴史的な取引を表示することができます。
それだけでヘブライ語をサポートしていますので、私は入力します。שכונתגבעתמרדכי、ירושליםGivatモルデハイ周辺に位置し、エルサレムを意味
。
クロムのネットワークタブをトラッキングすると、実際のデータ(グリッド)を返す関数がGetAssetsAndDeals
であり、必要なすべてのデータを含むJSONを返します。
だから私はCURLをコピーし、私はhttps://curl.trillworks.com/
を使用して、Pythonコードに変換 - そしてそれは私には、このコードを返します。
import requests
cookies = {
'_ga': 'GA1.3.584052889.1509031917',
'_gid': 'GA1.3.66244842.1510507506',
'keshet-client-token': 'dvVFgVcuJrTgXPx+w9KtJktxk2wVZXGU1EfZ+3uBhMUYr9ZNWFKIBogGUbb8GjCRqetT2Vf0RRap26mkrYNDp8Nf0ZntyB3fYPNn65i9lrzVYU7bZpI79aqu/D9pYlm4aJj76C5fGsU+ncV5IsysqlqCa0ihRtWhncW6xMxr0l7H4L2OqPk2A5rSCHyAbzdn',
}
headers = {
'Origin': 'https://www.nadlan.gov.il',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'en-US,en;q=0.8',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36',
'Content-Type': 'application/json;charset=UTF-8',
'Accept': 'application/json, text/plain, */*',
'Referer': 'https://www.nadlan.gov.il/',
'Connection': 'keep-alive',
}
data = '^{^\\^MoreAssestsType^\\^:0,^\\^FillterRoomNum^\\^:0,^\\^GridDisplayType^\\^:0,^\\^ResultLable^\\^:^\\^^\u05E9^\u05DB^\u05D5^\u05E0^\u05EA'
requests.post('https://www.nadlan.gov.il/KeshetAnnan.REST/Main/GetAssestAndDeals', headers=headers, cookies=cookies, data=data)
をしかし、私は、Pythonでこのコードを実行すると - 私は404エラーを取得します!
任意のヘルプは理解されるであろう
...私はそれがエンコーディングとは何かを持っていると思いますが、私は変更すべきかわかりません!
位置や他のフィールドを調整する
json_data
仲介結果を変更したいだろうと思いますありがとうございました!!!!それは完全に動作します!何かの理由で –、それは私のために今働いていない。 それはあなたのために働くのですか? 変更されましたか?それはとても奇妙です... –
私はちょうど今試しました、そして、残りのAPIのベースURLが 'KeshetAnnan.REST'の代わりに' Nadlan.REST'に変更されたようです。これがアップデートかどうかわからない、またはこれが意図されている場合 –