httrack

    0

    1答えて

    は、私は、次のコマンドを使用してHTTrackでウェブサイトをダウンロードしたファイルが見つかりません:ウェブサイトフォルダ内のindex.htmlファイルを設置し、それを実行するIよりも /usr/local/bin/httrack https://www.website.com -O /Users/mainuser/Desktop/website -n -j 。 Chromeはメッセージ「

    0

    1答えて

    私は、URLに特殊文字があると、HTTrackがファイルをダウンロードできないことに気付きました。例えば、ドイツのß - 404応答を返します。 エラーはスクリーンショットのようになります。 は、このような文字に対処することができるようにするHTTrackのいずれかの設定がありますか? PS:私はしかし、答えのない、同様のスレッドが見つかりました: Httrack faulty when enco

    0

    2答えて

    HTTrackまたはWgetを使用しようとしています。ウェブサイトからいくつかの.docxファイルをダウンロードしています。私はこれをフォルダのためだけにしたい、そしてそれはサブフォルダです。例:www.examplewebsite.com/doc(これはさらに5レベル下がります) これを行うにはどうすればよいでしょうか?

    0

    1答えて

    HTTrackによって完全なウェブサイトをダウンロードしました。しかし、サイトをダウンロードした後、すべてのURLは、このURLを削除する方法はありますか?index.htmlの代わりにwww.example.com/index.htmlのようなサイトのドメイン名のURLが含まれていますか?

    0

    1答えて

    ytsのウェブサイトからすべてのトレントファイルをダウンロードできますか? HHTRACKではミラーエラーが発生します。おそらく、サイトにアクセスする前に入力しなければならないcaptchaが原因です。これを回避する方法や別の方法を使用する方法はありますか?

    1

    1答えて

    :私はこすりする必要がhttp://httrack.kauler.com/help/User-defined_structure サイトでは、この構造内のURLを持っています https://www.example.com/index.php?HelpTopics https://www.example.com/index.php?MoreHelp など HTTrackを使用して、ダウンロードした

    0

    1答えて

    を完了するまで、私はここに HTTrackでURLで検索要求の結果をダウンロードしようとして待つ残念ながらダウンロードがすぐに開始され、ページがまだあるとして(検索結果を得ることはありません。車輪を示す)。 質問:最初のページリクエストの後に強制的にポーズを実行することも、起動する前にチェックを定義することも可能ですか? 最悪の場合:これを行うことができる他のウェブサイトのコピー機はありますか?

    0

    1答えて

    私のウェブサイト上のすべてのボット(HTTrackのような)をブロックしたい。通常、私はRewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR]経由でボットをブロックするために.htaccessファイルを使用します。 ただし、私のサーバーでNode.js Expressが実行されています。 Node.jsでHTTP_USER_AGENTを取得し、ブロックまたは再

    0

    1答えて

    Wordpressテンプレートのスタイリングに基づいて静的なウェブサイトを構築したいと考えています。Inovado私は、次のコマンドを使用して、(Linuxでは)HTTrackを使用してウェブサイトをダウンロード: httrack http://inovado.hellominti.com 結果index.htmlは、次のようないくつかのスタイルシートが含まれています <link rel='sty