python
  • web
  • web-scraping
  • 2017-01-20 37 views 0 likes 
    0

    私は株式市場からデータを削り取ろうとしていますが、データを印刷するときに何も得られません。私はリンゴの価格が欲しい。Python 2を使用してウェブサイトからデータを掻き集める

    import urllib 
    import re 
    
    
    
    htmlfile = urllib.urlopen("http://finance.yahoo.com/q?s=AAPL&q1=1") 
    
    htmltext = htmlfile.read() 
    
    regex = '<span class="Fw(b) Fz(36px) Mb(-4px)" data-reactid="270">(.+?)</span>' 
    
    pattern = re.compile(regex) 
    
    price = re.findall(pattern,htmltext) 
    
    print price 
    

    答えて

    0

    正確にページから引き出しようとしているものについて詳しく説明できますか?私は以下のコードであなたのタグを引っ張ることができました(注:Python 3、BeautifulSoupとリクエストを使用していますが、これはすべて私がWebスクレイピングに推奨しています;ヘッダー変数に何を入れる必要があるかを知るには、http://www.whatsmyua.com/

    import requests 
    from bs4 import BeautifulSoup 
    
    url = 'http://finance.yahoo.com/q?s=AAPL&q1=1' 
    
    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; InfoPath.3; .NET4.0C; .NET4.0E; rv:11.0) like Gecko'} 
    
    r = requests.get(url, headers=headers) 
    
    soup = BeautifulSoup(r.text, "html.parser") 
    
    for item in soup.find_all('span', {"class":"Fw(500) Pstart(10px) Fz(24px) C($dataRed)"}): 
        print(item) 
    
    +0

    私はリンゴの価格を得るために探していると私はそれを返すコード空のリスト –

    +0

    を実行するたびに、私はあなたがここにこれらの答えを見てみましょうお勧め:http://stackoverflow.com/questions/20045955 /正規表現パターンで-のpython-のための構文解析-HTMLタイトルタグ K仲の良い友達の答えは正規表現は、あなたがを望むあなたの場合タグ を取り込み方法を説明します210タグを使用すると、すべてのスパンタグのリストが表示され、必要な情報を見つけるためにさらに検索することができます。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/6705190/">Jcloud</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">関連する問題</div> <ul class="relative_list"> <li> 1. <a href="http://ja.uwenku.com/question/p-mrmhnuqn-mc.html" target="_blank" title="PythonでウェブサイトからHTMLデータを掻き集める"> PythonでウェブサイトからHTMLデータを掻き集める </a> </li> <li> 2. <a href="http://ja.uwenku.com/question/p-kgwffsmz-v.html" target="_blank" title="Rを使用してaspxウェブサイトから掻き集める"> Rを使用してaspxウェブサイトから掻き集める </a> </li> <li> 3. <a href="http://ja.uwenku.com/question/p-pmnonjvj-gy.html" target="_blank" title="テキストファイルから変数を使用してPythonウェブサイトを掻き集める"> テキストファイルから変数を使用してPythonウェブサイトを掻き集める </a> </li> <li> 4. <a href="http://ja.uwenku.com/question/p-pcuzurvv-kr.html" target="_blank" title="Pythonを使用してソースコードからテキストを掻き集める"> Pythonを使用してソースコードからテキストを掻き集める </a> </li> <li> 5. <a href="http://ja.uwenku.com/question/p-gckvtrqh-gy.html" target="_blank" title="PythonでBeautifulSoupを使用してyahooファイナンスからデータを掻き集める"> PythonでBeautifulSoupを使用してyahooファイナンスからデータを掻き集める </a> </li> <li> 6. <a href="http://ja.uwenku.com/question/p-gllurtex-co.html" target="_blank" title="ポストリクエストを使用してRubyを掻き集めるウェブサイト"> ポストリクエストを使用してRubyを掻き集めるウェブサイト </a> </li> <li> 7. <a href="http://ja.uwenku.com/question/p-fdldvsbu-gg.html" target="_blank" title="Beaufifulsoupとリクエストを使用してウェブサイトからコンテンツを掻き集める"> Beaufifulsoupとリクエストを使用してウェブサイトからコンテンツを掻き集める </a> </li> <li> 8. <a href="http://ja.uwenku.com/question/p-doesfcwy-kc.html" target="_blank" title="VBAを使用してサイトからinnerHTMLを掻き集める"> VBAを使用してサイトからinnerHTMLを掻き集める </a> </li> <li> 9. <a href="http://ja.uwenku.com/question/p-ajamrmxt-od.html" target="_blank" title="TripadvisorのWebをPythonを使用して掻き集める"> TripadvisorのWebをPythonを使用して掻き集める </a> </li> <li> 10. <a href="http://ja.uwenku.com/question/p-srpasudo-py.html" target="_blank" title="Pythonを掻き集める"> Pythonを掻き集める </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://ja.uwenku.com/question/p-vkqtugpb-gt.html" target="_blank" title="vbaを使用して複数のサイトからデータを掻き集める"> vbaを使用して複数のサイトからデータを掻き集める </a> </li> <li> 12. <a href="http://ja.uwenku.com/question/p-mgjmnxub-ow.html" target="_blank" title="シングルページのウェブサイトを掻き集める"> シングルページのウェブサイトを掻き集める </a> </li> <li> 13. <a href="http://ja.uwenku.com/question/p-gpnlhdoc-en.html" target="_blank" title="python3&beautifulsoup 4で掻き集めるウェブサイト"> python3&beautifulsoup 4で掻き集めるウェブサイト </a> </li> <li> 14. <a href="http://ja.uwenku.com/question/p-slwjurwy-gv.html" target="_blank" title="電子メールでウェブサイトからhtmlタグを掻き集める"> 電子メールでウェブサイトからhtmlタグを掻き集める </a> </li> <li> 15. <a href="http://ja.uwenku.com/question/p-fzhubgcn-ma.html" target="_blank" title="twebbrowserでdelphiのウェブサイトから画像を掻き集める"> twebbrowserでdelphiのウェブサイトから画像を掻き集める </a> </li> <li> 16. <a href="http://ja.uwenku.com/question/p-hzthuydy-br.html" target="_blank" title="VBAを使用してウェブサイトから掻き集めても動作しません。何をすべきか?"> VBAを使用してウェブサイトから掻き集めても動作しません。何をすべきか? </a> </li> <li> 17. <a href="http://ja.uwenku.com/question/p-mkrtotpz-dm.html" target="_blank" title="ウェブサイトの特定の部分を掻き集める[Python]"> ウェブサイトの特定の部分を掻き集める[Python] </a> </li> <li> 18. <a href="http://ja.uwenku.com/question/p-tvkndrcu-oo.html" target="_blank" title="ビデオリンク用の購読済みのウェブサイトを掻き集める"> ビデオリンク用の購読済みのウェブサイトを掻き集める </a> </li> <li> 19. <a href="http://ja.uwenku.com/question/p-pcomalob-ko.html" target="_blank" title="PythonウェブページからURLを掻き集める美しいスープ"> PythonウェブページからURLを掻き集める美しいスープ </a> </li> <li> 20. <a href="http://ja.uwenku.com/question/p-zagbybal-hr.html" target="_blank" title="BeautifulSoupを使用してWebページからプロキシIPを掻き集める"> BeautifulSoupを使用してWebページからプロキシIPを掻き集める </a> </li> <li> 21. <a href="http://ja.uwenku.com/question/p-uuhccjlo-me.html" target="_blank" title="python 2.7とbeautifulsoup 4で掻き集めるウェブサイト"> python 2.7とbeautifulsoup 4で掻き集めるウェブサイト </a> </li> <li> 22. <a href="http://ja.uwenku.com/question/p-gktmaozj-kc.html" target="_blank" title="Pythonを掻き集めるhref iinks"> Pythonを掻き集めるhref iinks </a> </li> <li> 23. <a href="http://ja.uwenku.com/question/p-sgvirgit-ox.html" target="_blank" title="Pythonでテーブルを掻き集めるWeb"> Pythonでテーブルを掻き集めるWeb </a> </li> <li> 24. <a href="http://ja.uwenku.com/question/p-fkjidyta-pk.html" target="_blank" title="jsonをPythonリクエストで掻き集める"> jsonをPythonリクエストで掻き集める </a> </li> <li> 25. <a href="http://ja.uwenku.com/question/p-hagggsnr-qb.html" target="_blank" title="WebをPython 3で掻き集める"> WebをPython 3で掻き集める </a> </li> <li> 26. <a href="http://ja.uwenku.com/question/p-hnineakv-ke.html" target="_blank" title="パンダを使ってwundergoundの気象データを掻き集める"> パンダを使ってwundergoundの気象データを掻き集める </a> </li> <li> 27. <a href="http://ja.uwenku.com/question/p-uzsujqtm-nb.html" target="_blank" title="xpathを使用してウェブページから特定のテキストを掻き集める"> xpathを使用してウェブページから特定のテキストを掻き集める </a> </li> <li> 28. <a href="http://ja.uwenku.com/question/p-hzquyrya-kr.html" target="_blank" title="JavaScriptを使用してウェブページからのリンクを掻き集めるR"> JavaScriptを使用してウェブページからのリンクを掻き集めるR </a> </li> <li> 29. <a href="http://ja.uwenku.com/question/p-kasdfxhd-nk.html" target="_blank" title="C#を使用して複数のサイトを掻き集める"> C#を使用して複数のサイトを掻き集める </a> </li> <li> 30. <a href="http://ja.uwenku.com/question/p-ghinjlbc-ky.html" target="_blank" title="excelとVBAを使用してWebを掻き集める"> excelとVBAを使用してWebを掻き集める </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048742"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新の質問 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-dvufvkyr-op.html" target="_blank" title="4桁目の後に数字を複製する少なくとも3桁の行を出力するようにsedしました"> 4桁目の後に数字を複製する少なくとも3桁の行を出力するようにsedしました </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-khruwphf-ot.html" target="_blank" title="[admin-on-rest] [aor-graqhql]を使用したカスタムテーマ"> [admin-on-rest] [aor-graqhql]を使用したカスタムテーマ </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-vrvexuhb-ox.html" target="_blank" title="JS:予期しないスクリプトの終了"> JS:予期しないスクリプトの終了 </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-kubrvwbh-ow.html" target="_blank" title="fontawesomeアイコンの近くにテキストを配置する方法は?"> fontawesomeアイコンの近くにテキストを配置する方法は? </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-dkchosqz-pw.html" target="_blank" title="Jenkinsfileに設定されている環境を取得する方法"> Jenkinsfileに設定されている環境を取得する方法 </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-bmjppyrn-pv.html" target="_blank" title="Railsカスタム金額のストライプチェックアウト"> Railsカスタム金額のストライプチェックアウト </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-xoxalznw-pt.html" target="_blank" title="Semantic UI Reactでドロップダウンアイテムをクリックしたときにモーダルをトリガする方法は?"> Semantic UI Reactでドロップダウンアイテムをクリックしたときにモーダルをトリガする方法は? </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-eevmffnw-qd.html" target="_blank" title="Scalaの"> Scalaの </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-dqhrhzsw-qb.html" target="_blank" title="Xcode 9.2(9C40b)iOSプロジェクトのViewControllerに参照オブジェクトをドラッグする"> Xcode 9.2(9C40b)iOSプロジェクトのViewControllerに参照オブジェクトをドラッグする </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-edvmaqvx-pz.html" target="_blank" title="AEMでのダイナミックメディアとシーン7の統合"> AEMでのダイナミックメディアとシーン7の統合 </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 関連する問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-mrmhnuqn-mc.html" target="_blank" title="PythonでウェブサイトからHTMLデータを掻き集める"> PythonでウェブサイトからHTMLデータを掻き集める </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-kgwffsmz-v.html" target="_blank" title="Rを使用してaspxウェブサイトから掻き集める"> Rを使用してaspxウェブサイトから掻き集める </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-pmnonjvj-gy.html" target="_blank" title="テキストファイルから変数を使用してPythonウェブサイトを掻き集める"> テキストファイルから変数を使用してPythonウェブサイトを掻き集める </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-pcuzurvv-kr.html" target="_blank" title="Pythonを使用してソースコードからテキストを掻き集める"> Pythonを使用してソースコードからテキストを掻き集める </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-gckvtrqh-gy.html" target="_blank" title="PythonでBeautifulSoupを使用してyahooファイナンスからデータを掻き集める"> PythonでBeautifulSoupを使用してyahooファイナンスからデータを掻き集める </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-gllurtex-co.html" target="_blank" title="ポストリクエストを使用してRubyを掻き集めるウェブサイト"> ポストリクエストを使用してRubyを掻き集めるウェブサイト </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-fdldvsbu-gg.html" target="_blank" title="Beaufifulsoupとリクエストを使用してウェブサイトからコンテンツを掻き集める"> Beaufifulsoupとリクエストを使用してウェブサイトからコンテンツを掻き集める </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-doesfcwy-kc.html" target="_blank" title="VBAを使用してサイトからinnerHTMLを掻き集める"> VBAを使用してサイトからinnerHTMLを掻き集める </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-ajamrmxt-od.html" target="_blank" title="TripadvisorのWebをPythonを使用して掻き集める"> TripadvisorのWebをPythonを使用して掻き集める </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-srpasudo-py.html" target="_blank" title="Pythonを掻き集める"> Pythonを掻き集める </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div><!-- wrap end--> <!-- footer --> <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ja.uwenku.com/contact">お問い合わせ</a></li> <li>© 2020 JA.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer> <!-- / footer --> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>