コンテンツページの連絡先情報をウェブサイト(数千件)から取得しようとしています。私はあなたのような専門家に頭を傷つける前に尋ねたがっていました。私が必要とするのは、アドレス、電子メールID、電話番号、連絡先情報(利用可能な場合)だけです。検索文字列アルゴリズム
あなたはすでに問題を理解していると思います。はい、それはフォーマットです...ウェブサイトが従う標準フォーマットがないので、私が必要とする正確な情報をピンポイントするのは本当に難しいです。いくつかのウェブサイトはフラッシュコンタクトのページで設計されており、他のいくつかのウェブサイトでは連絡先情報をカスタムフォントのイメージタイプとして設計しています。
とヒント/アイデア/提案はほとんどが歓迎されている...
ありがとうございました....
あなたはこの情報で何をするつもりなのか分かりますか?スパマーを助けていると思わない人は、あなたを助ける可能性が高くなります。 –
私はスパマーではありません:-)私は本当にあなたの関心を賞賛しています...私はビジネスと顧客の両方を助ける多くのフィルタリングオプションを備えたビジネスウィキのようなウェブサイトを開発する予定です – Krishna
IRをやりたいLuceneを見て、それは本当に強力です – JohnJohnGa