2011-09-20 23 views
5

Rを使用してHTMLファイルをPDFファイルに変換したい場合Rを使用してファイルをPDFに変換(印刷)しますか?

この変換を実行できるコマンド、またはツール/コマンドの組み合わせはありますか?

+0

本当にRの質問ではありません.Rがこれを行う方法はないからです。あなたはRからこれを行う簡単なステップである外部ユーティリティを呼び出さなければならないでしょう。難しいステップは、HTMLからPDFへの変換です - それは_rendered_バージョンか普通のHTMLテキストを意味するのですか? HTMLをレンダリングするには、画像、スタイルシート、javascriptを処理するためのWebブラウザが必要です。 – Spacedman

+0

Hi spacedman - 普通のHTMLテキストを意味します。 私はあなたを正しく理解していれば、ブラウザから印刷コマンドを「実行」する必要があります。それも可能ですか? –

+1

あなたはHTMLのきれいなプリンタが欲しいですか?ハイライトタグ、テキストの色付け、そのようなもの? – Spacedman

答えて

3

HTMLからPDFへの変換を行い、REST APIを持つWebサービスがいくつかありますので、RCurlでそれらを呼び出すことができます。簡単なインターネット検索ではpdfcrowd.comとなります。彼らは、URLを変換するだけでなく、ドキュメントをアップロードさせることもできますが、有料のサービスです。

次のヒットはjoliprintです。これは無料です。試してみてください:

library(RCurl) 
url_to_convert <- curlEscape("http://lifehacker.com/5706937/dont-make-important-decisions-until-your-decision-time") #or wherever 

the_pdf <- getForm(
    "http://eu.joliprint.com/api/rest/url/print", 
    url = url_to_convert 
) 
+0

私は厄介なファイアウォールの問題を抱えているようです。企業ネットワークに支配されていない人が自分のコードを試してください。 –

+0

警告を出します。出力ファイルが機能していないようです。あなたの方向は興味深いようですが! #警告メッセージ:testCurlOptionsInFormParametersで #(.params):フォームパラメータで #見つかり可能カールオプション:URL 猫(the_pdf、ファイル= "D:\\ temp.pdf") –

+0

は、彼らのいずれかの方法であり、 Rを使用してpdfをhtmlに変換する –

1

wkhtmltopdfは、このための素晴らしいクロスプラットフォームツールです。お使いのオペレーティングシステムに応じてインストールし、次にRから呼び出します。 HTMLファイルは、Rマークダウンによって生成 -

system("wkhtmltopdf --javascript-delay 1 in.html out.pdf") 

IはローディングMathJaxの結果としてPDFファイルに含まれる「/a11y/accessibility-menu.js [Contribの】ロード」メッセージを回避するために必要なJavaScriptの遅延を発見しましたしましょう。