Pythonの正規表現がhtmlファイルで一致する

htmlファイル内で一致させようとしています。これはhtmlです：Pythonの正規表現がhtmlファイルで一致する

<td> 
<b>BBcode</b><br /> 
<textarea onclick='this.select();' style='width:300px;  height:200px;' /> 
[URL=http://someimage.com/LwraZS1]   [IMG]http://t1.someimage.com/LwraZS1.jpg[/IMG][ [/URL] [URL=http://someimage.com/CDnuiST] [IMG]http://t1.someimage.com/CDnuiST.jpg[/IMG] [/URL] [URL=http://someimage.com/Y0oZKPb][IMG]http://t1.someimage.com/Y0oZKPb.jpg[/IMG][/URL] [URL=http://someimage.com/W2RMAOR][IMG]http://t1.someimage.com/W2RMAOR.jpg[/IMG][/URL] [URL=http://someimage.com/5e5AYUz][IMG]http://t1.someimage.com/5e5AYUz.jpg[/IMG][/URL] [URL=http://someimage.com/EWDQErN][IMG]http://t1.someimage.com/EWDQErN.jpg[/IMG][/URL] 
</textarea> 
</td>

[to]からすべてのBBコードを抽出します。

そして、これは私のコードです：

import re 
x = open('/xxx/xxx/file.html', 'r').read 
y = re.compile(r"""<td> <b>BBcode</b><br /><textarea onclick='this.select();' style='width:300px; height:200px;' />. (. *) </textarea> </td>""") 
z = y.search(str(x()) 
print z

しかし、私はこれを実行したときに、私は間違いありなしオブジェクトを取得...？

出典

2016-04-16 Andrew Stef

は ''）（読み括弧忘れました。 –

何もない、まだ何も取得..正規表現が間違っているかもしれません.. –

ええと、answer.checkを投稿しました。 –

私はこのためにパーサを使用します。

from html import HTMLParser 

class MyHtmlParser(HTMLParser): 
    def __init__(self): 
     self.reset() 
     self.convert_charrefs = True 
     self.dat = [] 
    def handle_data(self, d): 
     self.dat.append(d.strip()) 
    def return_data(self): 
     return self.dat 
>>> with open('sample.html') as htmltext: 
     htmldata = htmltext.read() 
>>> parser = MyHtmlParser() 
>>> parser.feed(htmldata) 
>>> res = parser.return_data() 
>>> res = [item for item in filter(None, res)] 
>>> res[0] 
'BBcode' 
>>>

出典

2016-04-16 14:59:14

あなたの答えをありがとう！実際にこのスクリプトを実行してres [0]を印刷しようとすると、html：box-shadow { -moz-box-shadow：3px 3px 5px＃000000; -webkit-box-shadow：3px 3px 5px＃000000; ボックスシャドウ：3px 3px 5px＃000000; } –

ああ、私は第4引数を印刷しなければなりませんでした。まさに私が必要なもの。どうもありがとう！最後に、出力をファイルに書き込む方法は？ –

単純なテキストファイルとして： 'open（ 'filename.txt'、 'w'）をnewfile：newfile.write（res [0]）' –

私はregexオブジェクトを引き出すために、z.group（）のようなものを追加する必要があると思いますよね？だから、それを行う可能性があります）（

印刷z.groupに

をあなたの最後の行を変更します。

出典

2016-04-16 07:44:33 coralvanda

import re 
x = open('/xxx/xxx/file.html', 'rt').read() 
r1 = r'<textarea.*?>(.*?)</textarea>' 
s1 = re.findall(r1, s, re.DOTALL)[1] # just by inspection 
r2 = r'\[(.*?)\]' 
s2 = re.findall(r2, s1) 
for u in s2: 
    print(u)

出典

2016-04-16 07:51:00

ありがとう、それは動作しますが、それはhtmlの別の部分を取得するので、すべての内部。すべてのhtmlテキストファイルで質問を更新しました。助けてくれてありがとうbtw !! – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+1</span></div> <div class="col-lg-11"> <p class="commenttext">@AndrewStef予想される出力を表示できますか？正規表現の問題では、いつでも参考になります。 – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">期待される出力は[URL = http：//someimage.com/LwraZS1] [IMG] http://t1.someimage.com/LwraZS1.jpg [/ IMG] [URL = http：// someimage.com/CDnuiST] [IMG] http://t1.someimage.com/CDnuiST.jpg [/ IMG] [/ URL] ...これは正確です。このページは、someimage.comがアップロードしたファイルの出力です。私は[と] Textの間のBBCODEをキャッチしようとしています。 – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">関連する問題</div> <ul class="relative_list"> <li> 1. <a href="http://ja.uwenku.com/question/p-guwvtusj-ht.html" target="_blank" title="htmlの正規表現の不一致"> htmlの正規表現の不一致 </a> </li> <li> 2. <a href="http://ja.uwenku.com/question/p-mumvdcik-gw.html" target="_blank" title="一致する複数のPythonの正規表現は、tarファイル"> 一致する複数のPythonの正規表現は、tarファイル </a> </li> <li> 3. <a href="http://ja.uwenku.com/question/p-uwnlrbgm-ph.html" target="_blank" title="Javascriptの正規表現がjsonとhtmlで一致する"> Javascriptの正規表現がjsonとhtmlで一致する </a> </li> <li> 4. <a href="http://ja.uwenku.com/question/p-sznnlwzz-bb.html" target="_blank" title="ファイル名の一致の正規表現"> ファイル名の一致の正規表現 </a> </li> <li> 5. <a href="http://ja.uwenku.com/question/p-alebfxtr-hh.html" target="_blank" title="正規表現のディレクトリパスに一致する正規表現"> 正規表現のディレクトリパスに一致する正規表現 </a> </li> <li> 6. <a href="http://ja.uwenku.com/question/p-kzlqnhxe-dq.html" target="_blank" title="正規表現での正規表現の一致値"> 正規表現での正規表現の一致値 </a> </li> <li> 7. <a href="http://ja.uwenku.com/question/p-gckmdwiz-hr.html" target="_blank" title="正規表現に一致する正規表現（CTLDループ）"> 正規表現に一致する正規表現（CTLDループ） </a> </li> <li> 8. <a href="http://ja.uwenku.com/question/p-xvnjpufd-kh.html" target="_blank" title="正規表現と一致する正規表現2.3"> 正規表現と一致する正規表現2.3 </a> </li> <li> 9. <a href="http://ja.uwenku.com/question/p-yvaffctn-g.html" target="_blank" title="正規表現に一致する正規表現"> 正規表現に一致する正規表現 </a> </li> <li> 10. <a href="http://ja.uwenku.com/question/p-mkancyxd-ox.html" target="_blank" title="正規表現と一致する正規表現"> 正規表現と一致する正規表現 </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://ja.uwenku.com/question/p-mxulmvyf-er.html" target="_blank" title="正規表現に一致する正規表現"> 正規表現に一致する正規表現 </a> </li> <li> 12. <a href="http://ja.uwenku.com/question/p-nqbreumh-nq.html" target="_blank" title="正規表現のURLを一致させる正規表現"> 正規表現のURLを一致させる正規表現 </a> </li> <li> 13. <a href="http://ja.uwenku.com/question/p-sdvfrvpd-ev.html" target="_blank" title="正規表現一致"> 正規表現一致 </a> </li> <li> 14. <a href="http://ja.uwenku.com/question/p-edwmznhi-od.html" target="_blank" title="正規表現一致％\％"> 正規表現一致％\％ </a> </li> <li> 15. <a href="http://ja.uwenku.com/question/p-zpzcazov-kh.html" target="_blank" title="Pythonの正規表現がTwitterのハンドルと一致する"> Pythonの正規表現がTwitterのハンドルと一致する </a> </li> <li> 16. <a href="http://ja.uwenku.com/question/p-awlwtcas-gw.html" target="_blank" title="正規表現でHTMLの部分と一致する"> 正規表現でHTMLの部分と一致する </a> </li> <li> 17. <a href="http://ja.uwenku.com/question/p-rjxoomcn-ge.html" target="_blank" title="Python：正規表現の要素がリストと一致する"> Python：正規表現の要素がリストと一致する </a> </li> <li> 18. <a href="http://ja.uwenku.com/question/p-krgfcetl-pw.html" target="_blank" title="正規表現を一致させる正規表現"> 正規表現を一致させる正規表現 </a> </li> <li> 19. <a href="http://ja.uwenku.com/question/p-ptqisxeq-gs.html" target="_blank" title="正規表現の一致が"> 正規表現の一致が </a> </li> <li> 20. <a href="http://ja.uwenku.com/question/p-vpbnikvy-w.html" target="_blank" title="正規表現で特定のhtmlタグを一致させる"> 正規表現で特定のhtmlタグを一致させる </a> </li> <li> 21. <a href="http://ja.uwenku.com/question/p-bduuukbf-hg.html" target="_blank" title="Python正規表現がタプルペアに一致する"> Python正規表現がタプルペアに一致する </a> </li> <li> 22. <a href="http://ja.uwenku.com/question/p-wobvsdbx-es.html" target="_blank" title="最初に一致する正規表現で一致した正規表現を最初に一致する正規表現"> 最初に一致する正規表現で一致した正規表現を最初に一致する正規表現 </a> </li> <li> 23. <a href="http://ja.uwenku.com/question/p-wohmvttt-cu.html" target="_blank" title="正規表現の一致HTMLを包み込んだHTML"> 正規表現の一致HTMLを包み込んだHTML </a> </li> <li> 24. <a href="http://ja.uwenku.com/question/p-ooqhbtnh-cy.html" target="_blank" title="JavaScriptでの正規表現の一致"> JavaScriptでの正規表現の一致 </a> </li> <li> 25. <a href="http://ja.uwenku.com/question/p-emhvpilp-pq.html" target="_blank" title="アサートスローでの正規表現の一致"> アサートスローでの正規表現の一致 </a> </li> <li> 26. <a href="http://ja.uwenku.com/question/p-xpqomaan-gn.html" target="_blank" title="vimでの正規表現（正規表現）の一致をコピーする"> vimでの正規表現（正規表現）の一致をコピーする </a> </li> <li> 27. <a href="http://ja.uwenku.com/question/p-srpxwqff-hx.html" target="_blank" title="正規表現での代替一致"> 正規表現での代替一致 </a> </li> <li> 28. <a href="http://ja.uwenku.com/question/p-gocplbco-ev.html" target="_blank" title="正規表現文字列が一致？"> 正規表現文字列が一致？ </a> </li> <li> 29. <a href="http://ja.uwenku.com/question/p-mbsvynqp-mm.html" target="_blank" title="正規表現で文字列をHTMLに一致させる"> 正規表現で文字列をHTMLに一致させる </a> </li> <li> 30. <a href="http://ja.uwenku.com/question/p-dfyforik-nq.html" target="_blank" title="オプションパラメータと一致する正規表現"> オプションパラメータと一致する正規表現 </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048742"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新の質問 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-qvgsmuwz-oo.html" target="_blank" title="は、私は「uidは」ユーザーテーブルと他の二つのテーブルの外部キーの主キーである3つのテーブルのユーザー、専門職と教育を持って、私は3つのテーブルを結合したい値"> は、私は「uidは」ユーザーテーブルと他の二つのテーブルの外部キーの主キーである3つのテーブルのユーザー、専門職と教育を持って、私は3つのテーブルを結合したい値 </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-tujknlpl-om.html" target="_blank" title="SFMLはWindows上のCLionで動作しません"> SFMLはWindows上のCLionで動作しません </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-dikzyzni-or.html" target="_blank" title="big.Intスライスをappend（）に書き直しています"> big.Intスライスをappend（）に書き直しています </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-nuovnjom-ou.html" target="_blank" title="nuspecファイルをリポジトリに公開する必要がありますか？"> nuspecファイルをリポジトリに公開する必要がありますか？ </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-mnhvksnm-ox.html" target="_blank" title="GUIを使用したPythonistaプロジェクトを実行可能ファイルにしてiPhoneで実行できますか？"> GUIを使用したPythonistaプロジェクトを実行可能ファイルにしてiPhoneで実行できますか？ </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-wjgsmfeh-pz.html" target="_blank" title="テーブルビューのセルにApp Delegateから配列データを表示できません"> テーブルビューのセルにApp Delegateから配列データを表示できません </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-dkjtorha-py.html" target="_blank" title="反復処理は/ pythonの"> 反復処理は/ pythonの </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-hneksjuy-ok.html" target="_blank" title="listviewのtextviewをPHPに戻す方法"> listviewのtextviewをPHPに戻す方法 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-zspecplq-pb.html" target="_blank" title="私のWordPressテーマのfunctions.phpにフィルタを追加する場所は？"> 私のWordPressテーマのfunctions.phpにフィルタを追加する場所は？ </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-rucjrnal-pc.html" target="_blank" title="OpenGL/LWJGLでglReadPixelsはどのように機能しますか？"> OpenGL/LWJGLでglReadPixelsはどのように機能しますか？ </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 関連する問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-guwvtusj-ht.html" target="_blank" title="htmlの正規表現の不一致"> htmlの正規表現の不一致 </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-mumvdcik-gw.html" target="_blank" title="一致する複数のPythonの正規表現は、tarファイル"> 一致する複数のPythonの正規表現は、tarファイル </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-uwnlrbgm-ph.html" target="_blank" title="Javascriptの正規表現がjsonとhtmlで一致する"> Javascriptの正規表現がjsonとhtmlで一致する </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-sznnlwzz-bb.html" target="_blank" title="ファイル名の一致の正規表現"> ファイル名の一致の正規表現 </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-alebfxtr-hh.html" target="_blank" title="正規表現のディレクトリパスに一致する正規表現"> 正規表現のディレクトリパスに一致する正規表現 </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-kzlqnhxe-dq.html" target="_blank" title="正規表現での正規表現の一致値"> 正規表現での正規表現の一致値 </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-gckmdwiz-hr.html" target="_blank" title="正規表現に一致する正規表現（CTLDループ）"> 正規表現に一致する正規表現（CTLDループ） </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-xvnjpufd-kh.html" target="_blank" title="正規表現と一致する正規表現2.3"> 正規表現と一致する正規表現2.3 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-yvaffctn-g.html" target="_blank" title="正規表現に一致する正規表現"> 正規表現に一致する正規表現 </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-mkancyxd-ox.html" target="_blank" title="正規表現と一致する正規表現"> 正規表現と一致する正規表現 </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ja.uwenku.com/contact">お問い合わせ</a></li> <li>© 2020 JA.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>

Pythonの正規表現がhtmlファイルで一致する

答えて