答えて
HTMLからPDFへの変換を行い、REST APIを持つWebサービスがいくつかありますので、RCurl
でそれらを呼び出すことができます。簡単なインターネット検索ではpdfcrowd.comとなります。彼らは、URLを変換するだけでなく、ドキュメントをアップロードさせることもできますが、有料のサービスです。
次のヒットはjoliprintです。これは無料です。試してみてください:
library(RCurl)
url_to_convert <- curlEscape("http://lifehacker.com/5706937/dont-make-important-decisions-until-your-decision-time") #or wherever
the_pdf <- getForm(
"http://eu.joliprint.com/api/rest/url/print",
url = url_to_convert
)
私は厄介なファイアウォールの問題を抱えているようです。企業ネットワークに支配されていない人が自分のコードを試してください。 –
警告を出します。出力ファイルが機能していないようです。あなたの方向は興味深いようですが! #警告メッセージ:testCurlOptionsInFormParametersで #(.params):フォームパラメータで #見つかり可能カールオプション:URL 猫(the_pdf、ファイル= "D:\\ temp.pdf") –
は、彼らのいずれかの方法であり、 Rを使用してpdfをhtmlに変換する –
wkhtmltopdfは、このための素晴らしいクロスプラットフォームツールです。お使いのオペレーティングシステムに応じてインストールし、次にRから呼び出します。 HTMLファイルは、Rマークダウンによって生成 -
system("wkhtmltopdf --javascript-delay 1 in.html out.pdf")
IはローディングMathJaxの結果としてPDFファイルに含まれる「/a11y/accessibility-menu.js [Contribの】ロード」メッセージを回避するために必要なJavaScriptの遅延を発見しましたしましょう。
本当にRの質問ではありません.Rがこれを行う方法はないからです。あなたはRからこれを行う簡単なステップである外部ユーティリティを呼び出さなければならないでしょう。難しいステップは、HTMLからPDFへの変換です - それは_rendered_バージョンか普通のHTMLテキストを意味するのですか? HTMLをレンダリングするには、画像、スタイルシート、javascriptを処理するためのWebブラウザが必要です。 – Spacedman
Hi spacedman - 普通のHTMLテキストを意味します。 私はあなたを正しく理解していれば、ブラウザから印刷コマンドを「実行」する必要があります。それも可能ですか? –
あなたはHTMLのきれいなプリンタが欲しいですか?ハイライトタグ、テキストの色付け、そのようなもの? – Spacedman