2017-09-19 17 views
0

クイズレットからフラッシュカードセット/デッキのリストを一括してエクスポートしたい。メニューを手動でクリックしたり、エクスポートしたり、ピクチャを挿入したり、コピーしたり、新しい空白のテキストファイルにペーストしたりするのではなく、これを行うためのスクリプトを書く方が簡単です。バッチWebページを解析するには?

どうすればいいですか?誰かが私の頭のスタートを与えるのを助けることができる(と私は残りのことなどができる)。

Javascript? JQuery? Python?

URL(各デッキへの直接リンク)のテキストファイルを解析する必要があります。例えば、 。 https://quizlet.com/215441327/f1-u1a-making-friends-flash-cards/ https://quizlet.com/218503855/f1-u1b-making-friends-flash-cards/ とエクスポート。

更新: "MORE"ボタン(省略記号)のonclickを起動し、 "EXPORT"を起動する方法はありますか? それから火をつけて "INCLUDE PICTURES"チェックボックスをクリックしてください。次にテキストエリアをつかむ?

答えて

1

私の好みはpythonです。出発点は以下のコードを参照してください。私はBeautifulSoupパッケージを使用しています。以下の例を出発点として参照してください。

:他の言語

for ch in soup.select(".TermText.notranslate.lang-zh-TW"): 
    print(ch.text.strip()) 

出力用

enjoy 
cheerful 
everyone 
sporty 
sometimes 
practise 
practice 
friend 
favourite 
help 

from bs4 import BeautifulSoup 
import requests 
url = "https://quizlet.com/215441327/f1-u1a-making-friends-flash-cards/" 
headers = {'User-Agent':'Mozilla/5.0'} 
page = requests.get(url) 
soup = BeautifulSoup(page.text, "html5lib") 

は、英語の単語

for en in soup.select(".TermText.notranslate.lang-en"): 
    print(en.text.strip()) 

出力を取得するには

請享用 
高興的 
每個人 
運動型的 
有時 
練習 
練習 
朋友 
最喜歡的 
幫助 
+0

おかげで、よさそうです。その "MORE"ボタン(省略記号)でonclickを起動し、 "EXPORT"をクリックして火をつける方法はありますか? それから火をつけて "INCLUDE PICTURES"チェックボックスをクリックしてください。次にテキストエリアをつかむ? –

+0

@AndWanこのリンクを参照してくださいhttps://stackoverflow.com/questions/9271365/how-to-pull-out-css-attributes-from-inline-styles-with-beautifulsoup画像を直接抽出することができます – sgetachew

0

また、Webページと対話するためにセレンのpythonライブラリを使用することができます。

from selenium import webdriver 
import os 
chromedriver = "C:\Users\pappuj\Downloads\chromedriver" 
os.environ["webdriver.chrome.driver"] = chromedriver 
driver = webdriver.Chrome(chromedriver) 
url='http://www.zoover.nl/cyprus' 
driver.get(url) 
driver.find_element_by_class_name('next').click() 
関連する問題