私はこのウェブサイトにサインアップして、私は何日間も何時間も検索していて何も見つけられていないので、この質問にお答えします。 私は10秒以内に、5つのウェブサイトから2〜3文字を掻き集め、それらを組み合わせてボックスに貼り付けようとしています。 私は、私が必要とするものを大まかに考えていますが、これについてどうやって行くのかは考えていません。 私は、特定のウェブサイトからスクラップされたコンテンツを変数に割り当て、コピー&ペーストするためにこれらの変数の組み合わせを印刷するようにしたいと考えています。 私はPythonのどの方法でもエキスパートではありませんので、可能であれば、コピー/ペースト可能なスクリプトは素晴らしいでしょう。 ウェブサイトは以下のとおりです。 私はそれを取ることができないという理由だけで、今これを維持https://assess.joincyberdiscovery.com/challenge-files/clock-pt1?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt2?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt3?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt4?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt5?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D 。助けてくれてありがとう、私はこれが他の誰かを助けることを願っています。 ダブになって申し訳ありません。ウェブでPythonの複数のサイトを掻き集める
答えて
私はコードを実行して試しました。それは動作しますが、それは質問に対する答えではありません。リンクから文字を取得してそれらをまとめることは機能しません。私は多くのことを試してきましたが、私はまだそれを自分で取り組んでいます。私のアドバイスは、あなた自身でそれを働かせてください。はるかに多くの報酬があり、将来の競争の一部に役立つでしょう。また、コードから 'a'のすべてを削除することを考えるなら、それはどちらもうまくいかない。私は試した。
ここのコード(あなたが最初の要求 "のpython modeuleをインストールする必要がある)である、あなたのスタックオーバーフローの質問に答えるために:
import requests
page1 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt1?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page1_content = requests.get(page1)
page1text = page1_content.text
page2 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt2?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page2_content = requests.get(page2)
page2text = page2_content.text
page3 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt3?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page3_content = requests.get(page3)
page3text = page3_content.text
page4 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt4?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page4_content = requests.get(page4)
page4text = page4_content.text
page5 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt5?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page5_content = requests.get(page5)
page5text = page5_content.text
print(page1text + page2text + page3text + page4text + page5text)
は、しかし、この方法は14
チャレンジに応答しません私は最後に貧しい結果と同様に何か非常に似たようなことをしました。私は、しかし、これをしばらく実行して、時計がパターンに従うことに気づいた。いくつかの時間前に、時計はすべて "aaaaaaaaaaaaaaa"、次に "aBaa1aafaa2aa3a"と "aDaafaaHaajaala"と読みました。私は完全なリストを待って、最終的なURLの次のクロックシーケンスを提案しようとします。これがうまくいくなら、私はあなたに戻ってきます。ヘルプインポートmodualsためまた
私はお勧め: https://programminghistorian.org/lessons/installing-python-modules-pip & https://docs.python.org/3/installing/index.html
import requests
abc = ""
while 1 == 1 :
page1 = requests.get('your first link')
page2 = requests.get('your second link')
page3 = requests.get('your thrid link')
page4 = requests.get('your fourth link')
page5 = requests.get('your fith link')
text = page1.text+page2.text+page3.text+page4.text+page5.text
# abc1 = "the verify link except clock pts is replaced with "+"text>" so the end looks like this :string=<"+text+">"
abc1 = text
if abc1 != abc:
print (abc1)
abc = abc1
編集 クロックは90のコード全くイムわからないと15分のサイクルで実行されます、これはまだのようにどのように役立ちますかアイデアを投稿するだけです。私はきれいに出力するコードを取得するためにいくつかの変更をしなければならなかったし、ここで私の改良版(これは申し訳ありませんが非常に厄介である)である:
import requests
abc = ""
page1 = requests.get('your first link')
page2 = requests.get('your second link')
page3 = requests.get('your thrid link')
page4 = requests.get('your fourth link')
page5 = requests.get('your fith link')
while 1 == 1 :
page12 = requests.get('your first link')
page22 = requests.get('your second link')
page32 = requests.get('your thrid link')
page42 = requests.get('your fourth link')
page52 = requests.get('your fith link')
if page1.text != page12.text and page2.text != page22.text and page3.text != page32.text and page4.text != page42.text and page5.text != page52.text:
text = page12.text+page22.text+page32.text+page42.text+page52.text
abc1 = text
# abc1 = * your url for verification with * string=<"+text+">"
if abc1 != abc:
print (abc1)
abc = abc1
page1 = page12
page2 = page22
page3 = page32
page4 = page42
page5 = page52
最終編集 私はsepnt限り把握の道を下って行くましたどのようにタックを作って、あまりにも多くの仕事をやっているのか。最終的にURLを送信する場合ので、あなたは私が「、質問への答えを知っているが、代わりにコードを与えるのそれを完了するためにhttps://assess.joincyberdiscovery.com/challenge-files/get-flag?verify=*this is an identifiere*&string=*The string you get*
あなたの質問をさらに説明できますか?あなたが何を求めているのかははっきりしていません... – Luis
が好きでなければならない>セクションのためとNOT <内部repalcementとしてあなたsolutinをincluedeいけません私は自分自身でその質問を完了したので、あなたがそれを見つける方法の一つを教えてくれるでしょう。他のすべてのリンクのようなものを持っていたのに対し、それはクロックPTS」を語るそのハイパーリンクの末尾にhttps://assess.joincyberdiscovery.com/challenge-files/get-flag?verify=j7fPvtmWLDY5qeYFuJtmKw%3D%3D&string=%3Cclock%20pts%3E
お知らせ:あなたがこの質問をしたとき
は、あなたが完全に第6リンクがあったことを言及するのを忘れてしまいましたclock-pt1またはclock-pt4。あなたが与えられたすべての前のリンクの中から文字列を作成しなければならないなど、クロックptsが一度に異なるリンクをすべて参照している場合、ハイパーリンクの文字列セクションの 'clock pts'あなたはレベルを完成させるコードを与える別のリンクから作ったのですか?
以下は、回答に使用したコードです。あなたがそれを使いたい場合は、リクエストモジュールが必要です。 (また、私は100%確実ではありませんが、チャレンジはタイマーに基づいているため、プログラムはクロック変更前にすべての文字列を取得できない可能性がありますので、タイマーは、私は挑戦を完了)
import requests
page1 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt1?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page1_content = requests.get(page1)
page1text = page1_content.text
page2 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt2?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page2_content = requests.get(page2)
page2text = page2_content.text
page3 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt3?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page3_content = requests.get(page3)
page3text = page3_content.text
page4 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt4?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page4_content = requests.get(page4)
page4text = page4_content.text
page5 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt5?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D"
page5_content = requests.get(page5)
page5text = page5_content.text
code=(page1text + page2text + page3text + page4text + page5text)
page6= "https://assess.joincyberdiscovery.com/challenge-files/get-flag?verify=j7fPvtmWLDY5qeYFuJtmKw%3D%3D&string="+code
page6_content = requests.get(page6)
print(page6_content.text)
をリセットしている、私はすべてのクロックサイクルからすべての小さなコードのものを取得し、1つのコードごとに10秒を作るためにそれらを一緒に入れて機能をExcelのスプレッドシートを使用。申し訳ありませんが、それが意味をなさない場合、私はそれを説明する方法がわかりません。次に、URLの末尾にある<クロックptsを置き換えるために、これを「検証リンク」の最後に貼り付けました。私はクロックをリセットする前にこれを非常に速く実行しなければなりませんでした。非常にストレスハハ。それで結局私はこれを時間内に行い、それが私にコードを与えました。私はこれが役立つことを願っています しかし、自分で10秒以内にすべてのコードを一緒に取得する方法を見つけなければならないでしょう。さもなければ、これは基本的に不正なものですよね?
- 1. ウェブで複数のリンクを掻き集めるr
- 2. beautifulsoupでウェブを掻き集める
- 3. ウェブでPythonを使ったGoogleのニュースを掻き集める
- 4. C#を使用して複数のサイトを掻き集める
- 5. ウェブを掻き集めるワードリスト
- 6. ウェブを掻き集めるaspxウェブページR
- 7. Phantomjsでサイトを掻き集める
- 8. 複数のページに亘って徹底的にウェブを掻き集める
- 9. Pythonを掻き集める
- 10. 香港のe-法律をウェブで掻き集める
- 11. vbaを使用して複数のサイトからデータを掻き集める
- 12. Pythonでテーブルを掻き集めるWeb
- 13. jsonをPythonリクエストで掻き集める
- 14. WebをPython 3で掻き集める
- 15. 複数のURLでWebを掻き集める
- 16. Pythonを掻き集めるhref iinks
- 17. 複数のウェブページ上のRテーブルを掻き集めるR
- 18. 複数のページとリンクからデータを掻き集める
- 19. GoogleのPuppeteerでArtoo jsを使用してウェブを掻き集める
- 20. jsoup問題でサイトを掻き集める
- 21. ノードを掻き集める
- 22. VIEWSTATEを掻き集める
- 23. Netflixを掻き集める
- 24. パンダスWeb複数ページを掻き集める
- 25. VBAを使用してサイトからinnerHTMLを掻き集める
- 26. Web Pythonで特定のページを掻き集める
- 27. 多くのURLをPythonで掻き集める
- 28. 条件を満たしている間にウェブを掻き集める
- 29. ウェブサイトの特定の部分を掻き集める[Python]
- 30. jsonのウェブページを掻き集める
これまでに何を試しましたか?質問にコード例を追加できますか? – Al0x
私はPythonであまり良くしていないので、私はほとんど試してみました。私はいくつかの市販のウェブサイトを試しましたが、必要なものを手に入れることはできません。自分自身をコーディングする場合、最初のハードルで立ち往生しました:私はコードを動作させるために使用する必要があると思われるbeautifulsoup/lxnlをダウンロードして実行することはできません –
誰もがどこかで起動しなければなりません基礎を学ぶための簡単な例から始める方が良いでしょうか?ここの誰もあなたのための完全な実例をコーディングするつもりはないと思う。 – Al0x