2016-05-12 6 views
0

私はウェブサイトからデータを抽出する必要があるプロジェクトに取り組んでいます。そのHTMLを解析し、タイトルタグとメタdescriptionからコンテンツを取得します。私は通常のウェブサイトからそのデータを解析できますこの問題はウェブサイトだけがURLとしてIPアドレスを使用してアクセスすることができます。それは抽出することが可能であり、どのようなソリューションを使用することができますか?URLなしのウェブサイトからデータを取得する

+1

'url'は、' ip address'を人間が覚えやすいものに変換する単なる方法です。だから、直接IPを使用するだけで正常に動作する必要があります – DarkBee

答えて

1

URLにはドメイン名は必要ありません。http://127.0.0.1/test.phpのようなものが有効なURLであり、すべてのスクレーパーが正しく動作するはずです。

これは、ウェブサイトに、ipベースのURLへのリクエストに応じる必要があります。プライベートサーバーや非常に大きなサイトでは、通常の共有ホストからのサイトでは通常、同じIPを持つ複数のサイトをホストするため、サイトはそうではありません。

+0

私がアクセスしたいWebサイトは内部からのアクセスになることができる私的なWebサイトです。まだ私はそれに擦り傷をつけることができますか? – AJ93

+0

スクレーパーにアクセスできる必要があります。スクレーパーがインターネット上にあり、内部のウェブサイトにアクセスできない場合は、不可能です。しかし、それはプログラミングの問題ではなく、ネットワーキングの問題です。 – clemens321

関連する問題