を使用して特定のURLへのリンクを検索して表示するので、特定のサイトへのリンクのみを抽出しようとしています。私はこのサイトを何時間も篩い分けして次のように書きましたが、それは私のためにはうまくいきません。正規表現
match = re.compile('<a href="(http:\/\/www\.|https:\/\/www\.|http:\/\/|https:\/\/)(youtu|www.youtube|youtube|vimeo|dailymotion|)\.(.+?)"',re.DOTALL).findall(html)
for title in match:
print '<a href="'+title+'>'+title+'</a>'
上記の方法は、このエラーを与える:
print '<a href="'+title+'>'+title+'</a>'
TypeError: cannot concatenate 'str' and 'tuple' objects
と私は単純に「印刷=タイトル」私は掻き取っすべてのリンクは次のようになります以下の醜い結果に
('https://www.', 'youtube', 'com/watch?v=gm2SGfjvgjM')
を取得置く場合:
<a href="https://www.youtube.com/watch?v=gm2SGfjvgjM"
Im希望
<a href="https://www.youtube.com/watch?v=gm2SGfjvgjM">youtube</a>
<a href="http://www.dailymotion.com/video/x5zuvuu">dailymotion</a>
私はしばらくの間、pythonで遊んでいましたが、私は苦労しました。そしてFYI Iveは、美しいスープを見つけようと無限の時間を費やしましたが、それを手に入れませんでした。可能であれば、メソッドを完全に変更することなく、これに関する助けを感謝します。何か助けてくれてありがとう。
ここでコードを実行してみてください:http://pythontutor.com –
私はダニを試します。ありがとうございました前にそのサイトを見ていない。アイドル状態で走っていると同時にそこでテストすることのメリットは何ですか? –
エラーが発生するのは、タプルと文字列をまとめようとしているからです。 'title'が文字列になっているかどうか分からないのであれば(あなた自身でそれを理解することはできますが)、Pythonの先生がプログラムに要する手順を1つずつ視覚的に示してくれます。 –