-3
私はPython(そしてSQL、SAS、そして少しのRの外で多くのコーディングがあります)が新しく、これを使ってさまざまな数のデータからデータセットを構築しようとしていますウェブページ。あなたの助けを前にありがとう。Python Site Scrape Help Needed
私はPython 3.4.4を使用しており、サイトのコードを正常に取得しましたが、必要な特定のデータ要素/メトリックを分離する正規表現コードの作成に問題があります。以下はウェブページのコードのサンプルであり、tdclassステートメント間で整数だけを分離したいと考えています。
<tr class="Company"><td class="Company"> <ahref="http://www.theacsi.org/index.php?option=com_content&view=article&id=149&catid=&Itemid=214&c=Liz+Claiborne&i=Apparel" id="L">Liz Claiborne</a> </td><td class="Baseline"> 84 </td><td class="Y1995"> 81 </td><td class="Y1996"> 81 </td><td class="Y1997"> 77 </td><td class="Y1998"> 78 </td><td class="Y1999"> 76 </td><td class="Y2000"> 79 </td><td class="Y2001"> 79 </td><td class="Y2002"> 80 </td><td class="Y2003"> 78 </td><td class="Y2004"> 79 </td><td class="Y2005"> 78 </td><td class="Y2006"> 81 </td><td class="Y2007"> 79 </td><td class="Y2008"> 79 </td><td class="Y2009"> 82 </td><td class="Y2010"> 79 </td><td class="Y2011"> 79 </td><td clas
私はこのページを見て、regexを作るために華麗です:https://txt2re.com/ –