ウェブでPythonの複数のサイトを掻き集める

私はこのウェブサイトにサインアップして、私は何日間も何時間も検索していて何も見つけられていないので、この質問にお答えします。私は10秒以内に、5つのウェブサイトから2〜3文字を掻き集め、それらを組み合わせてボックスに貼り付けようとしています。私は、私が必要とするものを大まかに考えていますが、これについてどうやって行くのかは考えていません。私は、特定のウェブサイトからスクラップされたコンテンツを変数に割り当て、コピー＆ペーストするためにこれらの変数の組み合わせを印刷するようにしたいと考えています。私はPythonのどの方法でもエキスパートではありませんので、可能であれば、コピー/ペースト可能なスクリプトは素晴らしいでしょう。ウェブサイトは以下のとおりです。私はそれを取ることができないという理由だけで、今これを維持https://assess.joincyberdiscovery.com/challenge-files/clock-pt1?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt2?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt3?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt4?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D https://assess.joincyberdiscovery.com/challenge-files/clock-pt5?verify=BY%2F8lhw%2BtbBgvOMDiHeB5A%3D%3D 。助けてくれてありがとう、私はこれが他の誰かを助けることを願っています。ダブになって申し訳ありません。ウェブでPythonの複数のサイトを掻き集める

出典

2017-12-01 Anonymous

これまでに何を試しましたか？質問にコード例を追加できますか？ – Al0x

私はPythonであまり良くしていないので、私はほとんど試してみました。私はいくつかの市販のウェブサイトを試しましたが、必要なものを手に入れることはできません。自分自身をコーディングする場合、最初のハードルで立ち往生しました：私はコードを動作させるために使用する必要があると思われるbeautifulsoup/lxnlをダウンロードして実行することはできません –

誰もがどこかで起動しなければなりません基礎を学ぶための簡単な例から始める方が良いでしょうか？ここの誰もあなたのための完全な実例をコーディングするつもりはないと思う。 – Al0x

私はコードを実行して試しました。それは動作しますが、それは質問に対する答えではありません。リンクから文字を取得してそれらをまとめることは機能しません。私は多くのことを試してきましたが、私はまだそれを自分で取り組んでいます。私のアドバイスは、あなた自身でそれを働かせてください。はるかに多くの報酬があり、将来の競争の一部に役立つでしょう。また、コードから 'a'のすべてを削除することを考えるなら、それはどちらもうまくいかない。私は試した。

ここのコード（あなたが最初の要求 "のpython modeuleをインストールする必要がある）である、あなたのスタックオーバーフローの質問に答えるために：

import requests 
page1 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt1?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
page1_content = requests.get(page1) 
page1text = page1_content.text 

page2 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt2?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
page2_content = requests.get(page2) 
page2text = page2_content.text 

page3 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt3?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
page3_content = requests.get(page3) 
page3text = page3_content.text 

page4 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt4?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
page4_content = requests.get(page4) 
page4text = page4_content.text 

page5 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt5?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
page5_content = requests.get(page5) 
page5text = page5_content.text 

print(page1text + page2text + page3text + page4text + page5text)

は、しかし、この方法は14

出典

2017-12-02 17:37:38

チャレンジに応答しません私は最後に貧しい結果と同様に何か非常に似たようなことをしました。私は、しかし、これをしばらく実行して、時計がパターンに従うことに気づいた。いくつかの時間前に、時計はすべて "aaaaaaaaaaaaaaa"、次に "aBaa1aafaa2aa3a"と "aDaafaaHaajaala"と読みました。私は完全なリストを待って、最終的なURLの次のクロックシーケンスを提案しようとします。これがうまくいくなら、私はあなたに戻ってきます。ヘルプインポートmodualsためまた

私はお勧め： https://programminghistorian.org/lessons/installing-python-modules-pip & https://docs.python.org/3/installing/index.html

import requests 
abc = "" 
while 1 == 1 : 
    page1 = requests.get('your first link') 
    page2 = requests.get('your second link') 
    page3 = requests.get('your thrid link') 
    page4 = requests.get('your fourth link') 
    page5 = requests.get('your fith link') 
    text = page1.text+page2.text+page3.text+page4.text+page5.text 

    # abc1 = "the verify link except clock pts is replaced with "+"text>" so the end looks like this :string=<"+text+">" 
    abc1 = text 
    if abc1 != abc: 
     print (abc1) 
     abc = abc1

編集クロックは90のコード全くイムわからないと15分のサイクルで実行されます、これはまだのようにどのように役立ちますかアイデアを投稿するだけです。私はきれいに出力するコードを取得するためにいくつかの変更をしなければならなかったし、ここで私の改良版（これは申し訳ありませんが非常に厄介である）である：

import requests 
abc = "" 
page1 = requests.get('your first link') 
page2 = requests.get('your second link') 
page3 = requests.get('your thrid link') 
page4 = requests.get('your fourth link') 
page5 = requests.get('your fith link') 
while 1 == 1 : 
    page12 = requests.get('your first link') 
    page22 = requests.get('your second link') 
    page32 = requests.get('your thrid link') 
    page42 = requests.get('your fourth link') 
    page52 = requests.get('your fith link') 
    if page1.text != page12.text and page2.text != page22.text and page3.text != page32.text and page4.text != page42.text and page5.text != page52.text: 


     text = page12.text+page22.text+page32.text+page42.text+page52.text 
     abc1 = text 
     # abc1 = * your url for verification with * string=<"+text+">" 
     if abc1 != abc: 
      print (abc1) 
      abc = abc1 
      page1 = page12 
      page2 = page22 
      page3 = page32 
      page4 = page42 
      page5 = page52

最終編集 私はsepnt限り把握の道を下って行くましたどのようにタックを作って、あまりにも多くの仕事をやっているのか。最終的にURLを送信する場合ので、あなたは私が「、質問への答えを知っているが、代わりにコードを与えるのそれを完了するためにhttps://assess.joincyberdiscovery.com/challenge-files/get-flag?verify=*this is an identifiere*&string=*The string you get*

出典

2017-12-04 13:43:56 D010s

あなたの質問をさらに説明できますか？あなたが何を求めているのかははっきりしていません... – Luis

が好きでなければならない>セクションのためとNOT <内部repalcementとしてあなたsolutinをincluedeいけません私は自分自身でその質問を完了したので、あなたがそれを見つける方法の一つを教えてくれるでしょう。他のすべてのリンクのようなものを持っていたのに対し、それはクロックPTS」を語るそのハイパーリンクの末尾にhttps://assess.joincyberdiscovery.com/challenge-files/get-flag?verify=j7fPvtmWLDY5qeYFuJtmKw%3D%3D&string=%3Cclock%20pts%3E

お知らせ：あなたがこの質問をしたとき

は、あなたが完全に第6リンクがあったことを言及するのを忘れてしまいましたclock-pt1またはclock-pt4。あなたが与えられたすべての前のリンクの中から文字列を作成しなければならないなど、クロックptsが一度に異なるリンクをすべて参照している場合、ハイパーリンクの文字列セクションの 'clock pts'あなたはレベルを完成させるコードを与える別のリンクから作ったのですか？

以下は、回答に使用したコードです。あなたがそれを使いたい場合は、リクエストモジュールが必要です。（また、私は100％確実ではありませんが、チャレンジはタイマーに基づいているため、プログラムはクロック変更前にすべての文字列を取得できない可能性がありますので、タイマーは、私は挑戦を完了）

import requests 
    page1 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt1?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
    page1_content = requests.get(page1) 
    page1text = page1_content.text 

    page2 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt2?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
    page2_content = requests.get(page2) 
    page2text = page2_content.text 

    page3 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt3?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
    page3_content = requests.get(page3) 
    page3text = page3_content.text 

    page4 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt4?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
    page4_content = requests.get(page4) 
    page4text = page4_content.text 

    page5 = "https://assess.joincyberdiscovery.com/challenge-files/clock-pt5?verify=4VjvSgWQQ8yhhiYD9cePtg%3D%3D" 
    page5_content = requests.get(page5) 
    page5text = page5_content.text 

    code=(page1text + page2text + page3text + page4text + page5text) 

    page6= "https://assess.joincyberdiscovery.com/challenge-files/get-flag?verify=j7fPvtmWLDY5qeYFuJtmKw%3D%3D&string="+code 
    page6_content = requests.get(page6) 
    print(page6_content.text)

出典

2017-12-04 16:35:12

をリセットしている、私はすべてのクロックサイクルからすべての小さなコードのものを取得し、1つのコードごとに10秒を作るためにそれらを一緒に入れて機能をExcelのスプレッドシートを使用。申し訳ありませんが、それが意味をなさない場合、私はそれを説明する方法がわかりません。次に、URLの末尾にある<クロックptsを置き換えるために、これを「検証リンク」の最後に貼り付けました。私はクロックをリセットする前にこれを非常に速く実行しなければなりませんでした。非常にストレスハハ。それで結局私はこれを時間内に行い、それが私にコードを与えました。私はこれが役立つことを願っていますしかし、自分で10秒以内にすべてのコードを一緒に取得する方法を見つけなければならないでしょう。さもなければ、これは基本的に不正なものですよね？

出典

2017-12-07 11:39:22 Buttons

ウェブでPythonの複数のサイトを掻き集める

答えて

関連する問題