を使用する: https://pakstockexchange.com/stock2/index_new.php?section=research&page=show_price_table_new&symbol=KELデータ抽出は、私は、このリンクから歴史的な価格を抽出することに興味を持っていますPythonの
をので、私は
import requests
import pandas as pd
import time as t
t0=t.time()
symbols =[
'HMIM',
'CWSM','DSIL','RAVT','PIBTL','PICT','PNSC','ASL',
'DSL','ISL','CSAP','MUGHAL','DKL','ASTL','INIL']
for symbol in symbols:
header = {
"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36",
"X-Requested-With": "XMLHttpRequest"
}
r = requests.get('https://pakstockexchange.com/stock2/index_new.php?section=research&page=show_price_table_new&symbol={}'.format(str(symbol)), headers=header)
dfs = pd.read_html(r.text)
df=dfs[6]
df=df.ix[2: , ]
df.columns=['Date','Open','High','Low','Close','Volume']
df.set_index('Date', inplace=True)
df.to_csv('/home/furqan/Desktop/python_data/{}.csv'.format(str(symbol)),columns=['Open','High','Low','Close','Volume'],
index_label=['Date'])
print(symbol)
t1=t.time()
print('exec time is ', t1-t0, 'seconds')
リンクからコードを抽出するデータの上に次のコードを使用しています行うためにに変換しますパンダのデータフレームを保存して保存します。
問題は、多くの時間がかかり、より多くのシンボルで効率的ではないという問題です。誰でも上記の結果を効率的に達成するために他の方法を提案することはできますか?
さらに、同じ仕事をするが、より短い時間で行う他のプログラミング言語がありますか?
私は時間のまともな部分がブロッキングGET要求であることを_guess_う。リクエストを非同期的に実行しようとするとどうなりますか? ['要求 - 先物](https://github.com/ross/requests-futures)で? – roganjosh
私の普通のPCには、テストするためのいくつかの前提条件をダウンロードしていません:) – roganjosh
私はプログラミングに慣れていないので、要求を非同期的に実行しようとする時間がかかります。ドキュメントを参照してください。 –