ノード：URLに奇妙なクエリ文字列があるURLから画像を取得

#1917Liveの一部として、100年前のニューヨークタイムズのロシアに関する記事をつぶやくTwitterボットを作った。ノード：URLに奇妙なクエリ文字列があるURLから画像を取得

これは、記事を取得するために、ニューヨーク・タイムズのArticle Search APIを使用し、それらをつぶやきtwitを使用しています。

実際の新聞紙のように、つぶやきをもっと魅力的にしてみてください。そこで、見出しを読みやすくして、#1917Liveの一部であるユーザーにタグを付け、ハッシュタグを追加します。

ここに私が立ち往生している部分があります。各記事には、印刷時の見た目を示すpdfファイルのURLが付属しています。 Here's an example。私はそのpdfをダウンロードし、最初のページをイメージに変換し、そのイメージをツイートに添付したいと思います。これは、PDFを取得するために使用しようとした単純化されたコードです。

var http = require('http'); 
var fs = require('fs'); 

var url = "http://query.nytimes.com/mem/archive-free/pdf?res=9500E4DC153AE433A25756C1A9629C946696D6CF"; 

var file = fs.createWriteStream("file.pdf"); 
var request = http.get(url, function(response) { 
    response.pipe(file); 
});

これは機能しません。 .pdfというファイル拡張子を持つ通常のpdfファイルをダウンロードしようとしていたのであれば、問題はないと思う。しかし、これは異なっています。どんな助けも非常に高く評価されるでしょう。

出典

2017-04-16 Harry Stevens

'アクセス制御の許可の原点 'ヘッダーが要求されたリソースに存在しません。 – guest271314

エラーを印刷してみてください。 http://stackoverflow.com/a/22907134 – gaganshera

あなたはdata URI

let url = "https://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20data.uri%20where%20url%3D%22http%3A%2F%2Fquery.nytimes.com%2Fmem%2Farchive-free%2Fpdf%3Fres%3D9500E4DC153AE433A25756C1A9629C946696D6CF%22&format=json&callback="; 
 

 
fetch(url).then(response => response.json()) 
 
.then(({query:{results:{url}}}) => console.log(url)) 
 
.catch(err => console.log(err));

として成功した場合、 .pdfファイルになります、 JSON応答の "query"財産の "result"財産の "url"プロパティを取得、クエリの JSON結果を得るためにYQLを使用することができます

注：リソースはhtmldocumentで、.pdfではありません。。 .pdfのURLをhtmldocumentに取得するには、htmlを.innerHTMLに設定して<template>と入力し、次に .srcというクエリを設定します。

のURLにも期限切れのヘッダーがあります。まだ未知の期間として403 (Forbidden)が応答として返されます。

let url = "https://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20data.uri%20where%20url%3D%22http%3A%2F%2Fquery.nytimes.com%2Fmem%2Farchive-free%2Fpdf%3Fres%3D9500E4DC153AE433A25756C1A9629C946696D6CF%22&format=json&callback="; 
 
let template = document.createElement("template"); 
 
fetch(url).then(response => response.json()) 
 
.then(({query:{results:{url}}}) => 
 
    fetch(url).then(res => res.text()) 
 
    .then(html => { 
 
    template.innerHTML = html;  
 
    let iframe = document.createElement("iframe"); 
 
    let src = template.content.querySelector("iframe").src; 
 
    console.log(src); 
 
    iframe.src = src.slice(0, src.indexOf("?")); 
 
    document.body.appendChild(iframe); 
 
    }) 
 
) 
 
.catch(err => console.log(err));

出典

2017-04-16 04:17:41 guest271314

'url'のリソースからの応答は、' .pdf' 'ドキュメント'を描画するように見える ''要素を含む '' text/html "'です。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2801559/">guest271314</a></span> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">これは 'data：text/html; charset = UTF-8; base64'をロギングしてから実際に長い文字列を返します。それで私は何をしますか？また、ここでそのURLを試してみると（https://developer.yahoo。com/yql /）、エラーを返します。 – <span class="text-secondary"> <small> <span></span> </small> </span> </p> </div> </div> </div> <div itemprop="comment" class="post-comment"> <div class="row"> <div class="col-lg-1"><span class="text-secondary">+0</span></div> <div class="col-lg-11"> <p class="commenttext">リソースからの応答は、 '.pdf'ではなく' 'text/html" 'である' data URI'です。 'html'の中に' <iframe> '要素があり、' <iframe> 'の' src'は '.pdf'に設定されています。 'html'は' <iframe> '' src'のために解析する必要がありますが、おそらく削除することはできますが、URLには '' Expires ''クエリ文字列があります。 – <span class="text-secondary"> <small> <a rel="noopener" target="_blank" href="https://stackoverflow.com/users/2801559/">guest271314</a></span> <span></span> </small> </span> </p> </div> </div> </div> </div> </div> </article> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1038284119" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <article class="board-top-1 padding-top-10"> <div class="post-col vote-info"> <span class="count">0<i class="fa fa-thumbs-up"></i></span> </div> <div class="post-offset"> <div class="answer fmt"> <p>それは、はるかに簡単に、そしてより多くの明白な方法があったが判明しました。私はちょうど私が最初からやっていたはずのように、要求とcheerioを使用しました。</p> <pre><code class="prettyprint-override">var request = require("request"), cheerio = require("cheerio"); var url = "http://query.nytimes.com/mem/archive-free/pdf?res=9500E4DC153AE433A25756C1A9629C946696D6CF"; request(url, function(error, response, body){ if (!error && response.statusCode == 200){ var $ = cheerio.load(body); var pdf = $("iframe").attr("src"); console.log(pdf); } }); </code></pre> </div> <div class="post-info"> <div class="post-meta row"> <p class="text-secondary col-lg-6"> <span class="source"> <a rel="noopener" target="_blank" href="https://stackoverflow.com/q/43555617">出典</a> </span> </p> <p class="text-secondary col-lg-6"> <span class="float-right date"> <span>2017-04-22 05:29:44</span> </p> <p class="col-12"></p> <p class="col-12"></p></div> </div> </div> </article> </div> <div class="clearfix"> </div> <div class="relative-box"> <div class="relative">関連する問題</div> <ul class="relative_list"> <li> 1. <a href="http://ja.uwenku.com/question/p-afbhyjbb-ek.html" target="_blank" title="htaccessリダイレクト後に画像から奇妙な文字を取得する"> htaccessリダイレクト後に画像から奇妙な文字を取得する </a> </li> <li> 2. <a href="http://ja.uwenku.com/question/p-qkxwmdia-bx.html" target="_blank" title="Google画像：サムネイルURLから大きな画像URLを取得"> Google画像：サムネイルURLから大きな画像URLを取得 </a> </li> <li> 3. <a href="http://ja.uwenku.com/question/p-tzdtkmvz-he.html" target="_blank" title="URLが存在する場合、抽出URLからクエリ文字列を取得"> URLが存在する場合、抽出URLからクエリ文字列を取得 </a> </li> <li> 4. <a href="http://ja.uwenku.com/question/p-zebhswbu-nq.html" target="_blank" title="ColdFusionのURLからクエリ文字列を取得する方法"> ColdFusionのURLからクエリ文字列を取得する方法 </a> </li> <li> 5. <a href="http://ja.uwenku.com/question/p-wwodhooc-bm.html" target="_blank" title="URLが無効なルートからURLクエリ文字列を読み取る"> URLが無効なルートからURLクエリ文字列を読み取る </a> </li> <li> 6. <a href="http://ja.uwenku.com/question/p-dkjkxyec-qb.html" target="_blank" title="URL文字列からIDを取得"> URL文字列からIDを取得 </a> </li> <li> 7. <a href="http://ja.uwenku.com/question/p-gltygoii-ev.html" target="_blank" title="Androidの奇妙なURL取得"> Androidの奇妙なURL取得 </a> </li> <li> 8. <a href="http://ja.uwenku.com/question/p-aoxehlck-nz.html" target="_blank" title="Regexがクエリ文字列で画像URLを検証する"> Regexがクエリ文字列で画像URLを検証する </a> </li> <li> 9. <a href="http://ja.uwenku.com/question/p-zlmdzgzr-x.html" target="_blank" title="奇妙なURL文字列を.htaccessで書き換える"> 奇妙なURL文字列を.htaccessで書き換える </a> </li> <li> 10. <a href="http://ja.uwenku.com/question/p-nvtrqdft-dn.html" target="_blank" title="URLクエリ文字列から特殊文字を読み取る"> URLクエリ文字列から特殊文字を読み取る </a> </li> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block; text-align:center;" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-6208739752673518" data-ad-slot="4606349252"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <li> 11. <a href="http://ja.uwenku.com/question/p-bvlnztlq-by.html" target="_blank" title="文字列URL画像をビットマップに"> 文字列URL画像をビットマップに </a> </li> <li> 12. <a href="http://ja.uwenku.com/question/p-axdehoml-ed.html" target="_blank" title="BasePage.vbを設定してセッションを作成した後、URLに奇妙なクエリ文字列があります"> BasePage.vbを設定してセッションを作成した後、URLに奇妙なクエリ文字列があります </a> </li> <li> 13. <a href="http://ja.uwenku.com/question/p-fhvwbgat-b.html" target="_blank" title="クエリ文字列の奇妙な問題"> クエリ文字列の奇妙な問題 </a> </li> <li> 14. <a href="http://ja.uwenku.com/question/p-fiurbdko-mo.html" target="_blank" title="jquery ajaxから画像URLを取得"> jquery ajaxから画像URLを取得 </a> </li> <li> 15. <a href="http://ja.uwenku.com/question/p-hvtrrpzm-kz.html" target="_blank" title="URLクエリ文字列に文字列のカンマがあります"> URLクエリ文字列に文字列のカンマがあります </a> </li> <li> 16. <a href="http://ja.uwenku.com/question/p-svzxnjwl-pd.html" target="_blank" title="クエリ文字列からURLを抽出"> クエリ文字列からURLを抽出 </a> </li> <li> 17. <a href="http://ja.uwenku.com/question/p-afgtrdkx-pa.html" target="_blank" title="奇妙なURLリクエスト"> 奇妙なURLリクエスト </a> </li> <li> 18. <a href="http://ja.uwenku.com/question/p-bmryrjor-ck.html" target="_blank" title="jqueryのGETクエリ文字列URLから"> jqueryのGETクエリ文字列URLから </a> </li> <li> 19. <a href="http://ja.uwenku.com/question/p-vxjpijhm-mc.html" target="_blank" title="画像ライブラリから画像URLを取得する方法"> 画像ライブラリから画像URLを取得する方法 </a> </li> <li> 20. <a href="http://ja.uwenku.com/question/p-crbaawkf-mz.html" target="_blank" title="画像URLから画像データを取得する方法"> 画像URLから画像データを取得する方法 </a> </li> <li> 21. <a href="http://ja.uwenku.com/question/p-wtsuobol-oc.html" target="_blank" title="URLクエリ文字列にnode.jsのURLクエリ文字列を使用する方法"> URLクエリ文字列にnode.jsのURLクエリ文字列を使用する方法 </a> </li> <li> 22. <a href="http://ja.uwenku.com/question/p-yyvnilli-gk.html" target="_blank" title="文字列として取得された画像URLから文字を削除しますか？"> 文字列として取得された画像URLから文字を削除しますか？ </a> </li> <li> 23. <a href="http://ja.uwenku.com/question/p-hlwmffpz-dn.html" target="_blank" title="URLから文字列を取得するには"> URLから文字列を取得するには </a> </li> <li> 24. <a href="http://ja.uwenku.com/question/p-qssqsmhu-da.html" target="_blank" title="レール、URL文字列からparamsを取得するには？"> レール、URL文字列からparamsを取得するには？ </a> </li> <li> 25. <a href="http://ja.uwenku.com/question/p-uoqfvoxf-eg.html" target="_blank" title="ASP.NET webformsのURLから文字列を取得するには？"> ASP.NET webformsのURLから文字列を取得するには？ </a> </li> <li> 26. <a href="http://ja.uwenku.com/question/p-aqncmajy-ns.html" target="_blank" title="スラッシュのないURLから文字列を取得"> スラッシュのないURLから文字列を取得 </a> </li> <li> 27. <a href="http://ja.uwenku.com/question/p-zrjdabxx-nr.html" target="_blank" title="CSS背景画像のURLがURLを取得しない"> CSS背景画像のURLがURLを取得しない </a> </li> <li> 28. <a href="http://ja.uwenku.com/question/p-hzayrfhv-bt.html" target="_blank" title="Djangoのurlパターンでクエリ文字列パラメータを取得する"> Djangoのurlパターンでクエリ文字列パラメータを取得する </a> </li> <li> 29. <a href="http://ja.uwenku.com/question/p-sdfqxlpd-kc.html" target="_blank" title="JavaScriptのクエリ文字列URLからパラメータを取得する方法"> JavaScriptのクエリ文字列URLからパラメータを取得する方法 </a> </li> <li> 30. <a href="http://ja.uwenku.com/question/p-zlwvdbaz-nn.html" target="_blank" title="スウィフト奇妙な文字列"> スウィフト奇妙な文字列 </a> </li> </ul> </div> <div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-format="autorelaxed" data-ad-client="ca-pub-6208739752673518" data-ad-slot="1575177025"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="padding-top-10"></div> </div> </div> <script type="text/javascript" src="http://img.uwenku.com/uwenku/script/side.js?t=1644592048742"></script> <script type="text/javascript" src="http://img.uwenku.com/uwenku/plugin/highlight/highlight.pack.js"></script> <link href="http://img.uwenku.com/uwenku/plugin/highlight/styles/docco.css" media="screen" rel="stylesheet" type="text/css" /> <script type="text/javascript"> $('pre').each(function(i, e) { hljs.highlightBlock(e, "<span class='indent'> </span>", false) }); </script> <div class="col-lg-3 col-md-4 col-sm-5"> <div id="rightTop"> <div class="row"> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-6208739752673518" data-ad-slot="5415218910" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> </div> <div class="row sidebar panel panel-default"> <div class="panel-heading font-bold"> 最新の質問 </div> <div class="m-b-sm m-t-sm clearfix"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-amlyfusf-nb.html" target="_blank" title="JavaのJTextField内のクリアテキスト"> JavaのJTextField内のクリアテキスト </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-nqrfnpqj-mx.html" target="_blank" title="Acumatica処理画面ARTranカスタムフィールドを更新するカスタムテーブルフィールドも更新する必要があります"> Acumatica処理画面ARTranカスタムフィールドを更新するカスタムテーブルフィールドも更新する必要があります </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-fymmufsj-mv.html" target="_blank" title="アクティブなサイドバーでコンテンツを中央に配置するにはどうすればいいですか？"> アクティブなサイドバーでコンテンツを中央に配置するにはどうすればいいですか？ </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-drkfxzpt-na.html" target="_blank" title="なぜデバッグモードで構造体の大きなベクトルの要素にアクセスするのが、より小さなものにアクセスするよりも遅いのですか？"> なぜデバッグモードで構造体の大きなベクトルの要素にアクセスするのが、より小さなものにアクセスするよりも遅いのですか？ </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-rpmueyef-my.html" target="_blank" title="「状態」のオブジェクトをreact reduxで更新するにはどうすればよいですか？私の減速で"> 「状態」のオブジェクトをreact reduxで更新するにはどうすればよいですか？私の減速で </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-wpqjyvor-mp.html" target="_blank" title="WebElementには属性がありませんw3c"> WebElementには属性がありませんw3c </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-nudbqkap-ma.html" target="_blank" title="iOS App Store提出時に住所が必要"> iOS App Store提出時に住所が必要 </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-hweuamaj-mb.html" target="_blank" title="AlertDialogの助けを借りてカスタムアレイアダプタに新しいオブジェクトを追加"> AlertDialogの助けを借りてカスタムアレイアダプタに新しいオブジェクトを追加 </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-glrxgqwd-me.html" target="_blank" title="私はRのカーネルで使用jupyterノートブックでJupyterノート"> 私はRのカーネルで使用jupyterノートブックでJupyterノート </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-nnnzvmuj-md.html" target="_blank" title="プロップ名として反応コンポーネントに渡される画像を要求する方法はありますか？"> プロップ名として反応コンポーネントに渡される画像を要求する方法はありますか？ </a> </li> </ul> </div> </div> </div> <p class="article-nav-bar"></p> <div class="row sidebar article-nav"> <div class="row box_white visible-sm visible-md visible-lg margin-zero"> <div class="top"> <h3 class="title"><i class="glyphicon glyphicon-th-list"></i> 関連する問題</h3> </div> <div class="article-relative-content"> <ul class="side_article_list"> <li class="side_article_list_item"> 1. <a href="http://ja.uwenku.com/question/p-afbhyjbb-ek.html" target="_blank" title="htaccessリダイレクト後に画像から奇妙な文字を取得する"> htaccessリダイレクト後に画像から奇妙な文字を取得する </a> </li> <li class="side_article_list_item"> 2. <a href="http://ja.uwenku.com/question/p-qkxwmdia-bx.html" target="_blank" title="Google画像：サムネイルURLから大きな画像URLを取得"> Google画像：サムネイルURLから大きな画像URLを取得 </a> </li> <li class="side_article_list_item"> 3. <a href="http://ja.uwenku.com/question/p-tzdtkmvz-he.html" target="_blank" title="URLが存在する場合、抽出URLからクエリ文字列を取得"> URLが存在する場合、抽出URLからクエリ文字列を取得 </a> </li> <li class="side_article_list_item"> 4. <a href="http://ja.uwenku.com/question/p-zebhswbu-nq.html" target="_blank" title="ColdFusionのURLからクエリ文字列を取得する方法"> ColdFusionのURLからクエリ文字列を取得する方法 </a> </li> <li class="side_article_list_item"> 5. <a href="http://ja.uwenku.com/question/p-wwodhooc-bm.html" target="_blank" title="URLが無効なルートからURLクエリ文字列を読み取る"> URLが無効なルートからURLクエリ文字列を読み取る </a> </li> <li class="side_article_list_item"> 6. <a href="http://ja.uwenku.com/question/p-dkjkxyec-qb.html" target="_blank" title="URL文字列からIDを取得"> URL文字列からIDを取得 </a> </li> <li class="side_article_list_item"> 7. <a href="http://ja.uwenku.com/question/p-gltygoii-ev.html" target="_blank" title="Androidの奇妙なURL取得"> Androidの奇妙なURL取得 </a> </li> <li class="side_article_list_item"> 8. <a href="http://ja.uwenku.com/question/p-aoxehlck-nz.html" target="_blank" title="Regexがクエリ文字列で画像URLを検証する"> Regexがクエリ文字列で画像URLを検証する </a> </li> <li class="side_article_list_item"> 9. <a href="http://ja.uwenku.com/question/p-zlmdzgzr-x.html" target="_blank" title="奇妙なURL文字列を.htaccessで書き換える"> 奇妙なURL文字列を.htaccessで書き換える </a> </li> <li class="side_article_list_item"> 10. <a href="http://ja.uwenku.com/question/p-nvtrqdft-dn.html" target="_blank" title="URLクエリ文字列から特殊文字を読み取る"> URLクエリ文字列から特殊文字を読み取る </a> </li> </ul> </div> </div> </div> </div> </div> </div> </div>  <footer id="footer"> <div class="bg-simple lt"> <div class="container"> <div class="row padder-v m-t"> <div class="col-xs-8"> <ul class="list-inline"> <li><a href="http://ja.uwenku.com/contact">お問い合わせ</a></li> <li>© 2020 JA.UWENKU.COM</li> <li><a target="_blank" href="https://beian.miit.gov.cn/">沪ICP备13005482号-4</a></li> <li><script type="text/javascript" src="https://v1.cnzz.com/z_stat.php?id=1280101193&web_id=1280101193"></script></li> <li><a href="http://www.uwenku.com/" target="_blank" title="优文库">简体中文</a></li> <li><a href="http://hk.uwenku.com/" target="_blank" title="優文庫">繁體中文</a></li> <li><a href="http://ru.uwenku.com/" target="_blank" title="поле вопросов и ответов">Русский</a></li> <li><a href="http://de.uwenku.com/" target="_blank" title="Frage - und - antwort - Park">Deutsch</a></li> <li><a href="http://es.uwenku.com/" target="_blank" title="Preguntas y respuestas">Español</a></li> <li><a href="http://hi.uwenku.com/" target="_blank" title="कार्यक्रम प्रश्न और उत्तर पार्क">हिन्दी</a></li> <li><a href="http://it.uwenku.com/" target="_blank" title="IL Programma di chiedere Park">Italiano</a></li> <li><a href="http://ja.uwenku.com/" target="_blank" title="プログラム問答園区">日本語</a></li> <li><a href="http://ko.uwenku.com/" target="_blank" title="프로그램 문답 단지">한국어</a></li> <li><a href="http://pl.uwenku.com/" target="_blank" title="program o park">Polski</a></li> <li><a href="http://tr.uwenku.com/" target="_blank" title="Program soru ve cevap parkı">Türkçe</a></li> <li><a href="http://vi.uwenku.com/" target="_blank" title="Đáp ứng viên">Tiếng Việt</a></li> <li><a href="http://fr.uwenku.com/" target="_blank" title="Programme interrogation Park">Française</a></li> </ul> </div> </div> </div> </div> </div> </footer>  <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?f78a970f17b19a79fc477a3378096f29"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </body> </html>

ノード：URLに奇妙なクエリ文字列があるURLから画像を取得

答えて