2016-05-04 13 views
2

私はwgetを使って複数のPubmed論文からテキストを取得しようとしていますが、NCBIのウェブサイトはこれを許可していないようです。他の選択肢はありますか?このようなwgetの代わりに 'ERROR 403:Forbidden'

Bernardos-MacBook-Pro:pangenome_papers_pubmed_result bernardo$ wget -i ./url.txt 
--2016-05-04 10:49:34-- http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4560400/ 
Resolving www.ncbi.nlm.nih.gov... 130.14.29.110, 2607:f220:41e:4290::110 
Connecting to www.ncbi.nlm.nih.gov|130.14.29.110|:80... connected. 
HTTP request sent, awaiting response... 403 Forbidden 
2016-05-04 10:49:34 ERROR 403: Forbidden. 

--2016-05-04 10:49:34-- http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4547177/ 
Reusing existing connection to www.ncbi.nlm.nih.gov:80. 
HTTP request sent, awaiting response... 403 Forbidden 
2016-05-04 10:49:34 ERROR 403: Forbidden. 

答えて

3

設定カスタムユーザーエージェント:

wget --user-agent="Mozilla" http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4560400/ 
+0

これは働いていたが、なぜ? – sherrellbc