ウェブ全体から製品のデータ(価格、タイトルなど)を掻き集める掻き取りツールを開発する必要があります。今、私は掻爬の経験がありますが、それは単一のウェブサイトのためです。私はどのように私は全体のウェブをこすり分けるか分からない。 1つの可能な解決策は、Googleに問い合わせて、Googleに現れるリンクから各ウェブサイトを掻き集めることです。これは良いアプローチですか?ウェブ全体からのデータの掻き取り
私は、各サイトが独自のデータ表現方法を持っている可能性があるため、この問題をどのように解決するかという一般的なアプローチが必要です。どのようにこれらのすべてのバリエーションを組み込むのですか?あらゆるガイドライン/ヒント?