URLの#文字がwgetの動作が私の期待とは異なることがわかりました。基本的に#までのURL文字列は保持され、#の部分文字列は破棄されます。 #これは#ページ内のナビゲーションリンクだからですしかし明らかに特定のサイトはそれを "?" (URLパラメータの先頭)。これをwgetで処理するにはどんなソリューションですか?私はカールを試みましたが運がありません。wget:ショップ(#)の文字でURLをクロールする方法
0
A
答えて
2
関連する問題
- 1. URLをクロールするurl \ node.jsで動的リンクを取得する方法
- 2. storeify store URLでショップ名を取得する方法はありますか?
- 3. URLクエリ文字列にnode.jsのURLクエリ文字列を使用する方法
- 4. シェルスクリプトを使用してURLをクロールする方法は?
- 5. SoapUIですべてのURLを小文字にする方法
- 6. フィードをクロールする方法
- 7. wgetでpdfファイルをダウンロードする。 (ファイル拡張後の文字)
- 8. python3でURLのUnicode文字列を処理する方法は?
- 9. dango urlをurls.pyでクエリ文字列を無視する方法
- 10. Pythonでウェブサイトコンテンツをクロールする方法
- 11. アンドロイドアプリで電子ショップをデザインする方法のアドバイス
- 12. 重複のない大文字と小文字を区別しないURLのクロール
- 13. クロール時にURLを管理する一般的な方法は何ですか?
- 14. scrapyのLxmlLinkExtractor相対URLをクロールする
- 15. nutch 1.3のURLを再クロールする
- 16. PDFBOXで文字列をURLで置き換える方法は?
- 17. PHPのURLの間に文字列を追加する方法
- 18. Pythonでurlパスの部分文字列を返す方法は?
- 19. 同じ頭のURLからすべてのページをクロールする方法は?
- 20. URL /クエリ文字列にRNGCryptoServiceProvider生成文字列を使用する方法
- 21. Nutchで深くクロールする方法
- 22. URL文字列からjavaのパスパラメーターを取得する方法
- 23. AngularJSのURLにクエリ文字列を追加する方法は?
- 24. コードレセプトのURLにクエリ文字列を追加する方法
- 25. URLのエスケープ文字をエンコードする方法は?
- 26. 「?」を使用する方法URl内の文字列として
- 27. groovyの文字列からURLを取得する方法
- 28. コントローラクラスのURL文字列を決定する方法
- 29. WebブラウザコントロールのURLプロパティを文字列に設定する方法
- 30. AngularJiルータのURLにクエリ文字列を追加する方法
はあなたが#はアンカー/ブックマークとして使用されていない例のリンクを供給することはできますか?より明示的。毎日のブラウザの代わりにwgetを使用すると、どこが違うのでしょうか? – ath88
ブラウザは文字列を切り捨てずにそのまま渡すので、問題ありません。私は例を指定するのが少し嫌ですが、私は他の例を見つけることができるかどうか見てみましょう。 – kee
正確に。 #は、表示されたhtmlのアンカーを定義するための予約文字です。これはブラウザにスクロールバーの配置場所を指示します。 wgetはそれほど気にすることができないということは意味をなさない。 – ath88