私はRubyに、検索クエリを使って検索エンジンを検索するスクリプトを書いています。私は、このスクリプトをユーザーが使用するときは匿名のままにしておきたい。これまでのところ、スクリプトはユーザーエージェントを変更し、ランダムなヘッダーを使用します。匿名のままにしておくべき特定の方法や特定の検索エンジンはありますか?検索エンジンをクロールするための最も匿名の方法
私はDuckDuckGoが良いスタートであることを見てきました。これは明らかにデータを記録していないTorを使用しているため、APIを持っていますが、複数の検索エンジンを使用したいのですが?たとえば、複数のスレッドを使用して複数の検索エンジンをクロールし、すべてのエンジンで匿名のままにします。
どうすればこの問題を解決できますか?
私はRubyのプロキシ機能について知っていますが、私はそれを使用する方法が完全にはわかりません。別の問題です。
私は 'tor --SOCKS'部分について混乱しています、それは何ですか?申し訳ありませんが、私はプロキシとその仕組みについてほとんど知りません – 13aal
ポート9050でリッスンするように指示します。Net :: HTTP.SOCKSProxyでこのポートに接続します。あなたのHTTPリクエストはプロキシ経由で発行されます – ThomasSevestre
基本的にTorは私のローカルIPをポート9050経由で接続していますか? – 13aal