この質問は技術者以外からのものです。私はチームに一種のRSSリーダーを構築するよう依頼しました。本質的には、そのニュースアグリゲータです。私たちが最初に気にしていたことは、ft.com、reuters.com、およびbloomberg.comの特定のソースから直接ニュースを入手することでした。RSSリーダーのCaptchas?
開発チームは、これを実行する方法を提案しました。これは、news.google.comを使用して結果を返すことです。今私はこれが疑わしい合法性を持っていることを知っています、そして、私たちはその事実を本当に心地よく感じることはできませんが、法務部がそれを確認している間、私たちは原型で作業しました。
技術的な問題が発生しました。このメソッドは、実際には、captchaを返した後、news.google.comでの検索を実際にシミュレートしていたためです。私はその方法がだったことが疑わしいのですが、RSS RSSとは対照的に、RSSとして結果を表示しています...しかし、開発チームはRSSがまったく同じものだと言っています。よく
私は疑問があります。それが事実なら、他のニュースアグリゲーターサイトはどのようにしてさまざまなソースからのフィードを編集していますか?あなたの参考のために
は、ここので、彼らはボットを防ぐために、彼らはできる限りのことをやる、最終的には非常にリソースを集中されているため、キャプチャの後ろに通常ある「検索」CAPTCHA にhttps://news.google.com/news/feeds?hl=en&gl=sg&as_qdr=a&authuser=0&q=dbs+bank+singapore&bav=on.2,or.r_gc.r_pw.r_cp.,cf.osb&biw=1280&bih=963&um=1&ie=UTF-8&output=rss