正規表現を使っていないようです。美しいスープを使った正規表現 ':'の後ろにあるすべての文字を抽出
私はこのコードを実行すると、私は
for paragraph in soup.find_all('p'):
print(paragraph.find_all(text =re.compile(":*\w*")))
私が取得テキストの下にテキストだけで理想的な出力があるので、株価情報を抽出したいのは
Continuing our series of surfacing 2016 stinkers, here are the 25 Russell 2000 stocks that imploded in 2016. Further down, you'll find the 25 worst stocks excluding pharma. Ophthotech (NASDAQ:OPHT) -94% Galena Biopharma (NASDAQ:GALE) -93% Cempra (NASDAQ:CEMP) -91% Toaki Pharma (NASDAQ:TKAI) -89% Anthera Pharma (NASDAQ:ANTH) -86% Adeptus Health (NYSE:ADPT) -86% CytRx (NASDAQ:CYTR) -86% Novavax (NASDAQ:NVAX) -85%
あり得ます。
OPHT
GALE
CEMP
TKAI
など。
私はこれらのコードのバリエーションを試してみました:
for paragraph in soup.find_all('p'):
print(paragraph.find_all(text =re.compile('(:\w+)')))
for paragraph in soup.find_all('p'):
print(paragraph.find_all(text =re.compile("(:*\w*)")))
for paragraph in soup.find_all('p'):
print(paragraph.find_all(text =re.compile('(:)?\w+')))
が、私は
`['Continuing our ', 'series', " of surfacing 2016 stinkers, here are the 25 Russell 2000 stocks that imploded in 2016. Further down, you'll find the 25 worst stocks excluding pharma."]
['Ophthotech (NASDAQ:', 'OPHT', ') -94%']
['Galena Biopharma (NASDAQ:', 'GALE', ') -93%']
['Cempra (NASDAQ:', 'CEMP', ') -91%']
['Toaki Pharma (NASDAQ:', 'TKAI', ') -89%']
['Anthera Pharma (NASDAQ:', 'ANTH', ') -86%']
['Adeptus Health (NYSE:', 'ADPT', ') -86%']
['CytRx (NASDAQ:', 'CYTR', ') -86%']
['Novavax (NASDAQ:', 'NVAX', ') -85%']`
ない私が間違ってやっていることを確認の出力で終わるよ、ほとんどの時間。
ありがとうございます。
好き? – serk