可能性の重複:
私のようなものに見える文字列を持っている場合は
RegEx match open tags except XHTML self-contained tagsPythonの正規表現 - すべてのテーブルセルの内容を抽出
...
"<tr><td>123</td><td>234</td>...<td>697</td></tr>"
基本的にはn個のセルを持つ表の行。
各セルの値を取得する最も簡単な方法は、Pythonです。つまり、リストまたは配列に格納されている値「123」、「234」、「697」、またはこれまでに最も簡単な値がほしいのです。
私は
re.match
を使用する場合、私はそれが何かを見つけるために取得することはできませんよ、正規表現を使用しようとしました。試してみると
re.search
私は最初のセルしか入手できません。しかし、私はすべての細胞を取得したい。 n個の細胞でこれを行うことができない場合、固定数の細胞でどのようにしますか?
BeautifulSoupの良いチュートリアルをお勧めしますので、すべてのセルを行ごとに取得できますか?おかげで –
ドキュメントは素晴らしいですし、いくつかの例が含まれています:http://www.crummy.com/software/BeautifulSoup/bs4/doc/ – bernie