2017-02-26 6 views
0

私は顧客用のWebアプリケーションを構築しようとしています。私がする必要があるのは、Company or keywordsラベルされた入力フィールドに何らかの値を挿入し、検索を実行し、HTTPレスポンスを取得することですこのタイプのサイトアーキテクチャのスクラップは可能ですか?

https://www.handelsregister.de/rp_web/mask.do?Typ=n

:それはこのサイト上の簡単なリモート検索を実装しています。

問題は私がこの種のアーキテクチャに精通していないことです。私は常にURLなどを持つAPIで作業してきました。上記の操作はプログラミングで自動的に実行できますか?

答えて

1

おそらく。 POST要求を送信して応答を解析することができます。ここではモジュールrequestsとPythonでの基本的な例です。

import requests 

query = "test" 

post_fields = {'suchTyp':'n', 
     'registerArt':'', 
     'registerNummer':'', 
     'registergericht':'', 
     'schlagwoerter':query, 
     'schlagwortOptionen':2, 
     'ergebnisseProSeite':100, 
     'btnSuche':'Rechercher'} 

response = requests.post("https://www.handelsregister.de/rp_web/search.do", data=post_fields) 
print(response.status_code) 
print(response.text) 
+0

うわー、これまでありがとうございました。これは実際に動作し、html応答を出しますか?あなたはそれを試しましたか? –

+0

@AlexanderDeBeurもちろん、私はそれをテストせずにスクリプトを投稿しません。しかし、これはほんの始まりに過ぎません。結果の最初のページのHTMLコードを返します。このHTMLを解析して、フォーマットされた表を取得する必要があります。 –

+1

確かに、多くのありがとう。私は、他の(厄介な)プロジェクトのためにHTMLを解析する経験があるので、今は少なくともその可能性を知っています。 –

関連する問題