Rのpdftoolsパッケージが、Windows 7マシンでローカルに実行されている場合とssh経由で共有Ubuntuサーバーで実行されている場合の動作が異なるようです。Rのpdftoolsが異なるマシン間で実行する場合
マイコード:Ubuntuのサーバー上で、それはとして表示に対し、私のローカルのWindows 7マシンで
download.file("http://www.nber.org/lbid/docs/LinkCO95Guide.pdf",
"1995codebook.pdf",
mode = "wb",
method = "libcurl")
codebook <- pdf_text("1995codebook.pdf")
、オブジェクトコードブックは、 "大文字(258個の要素、710.2 KB)" として表示されます"大きな文字(258要素、701.9 Kb)"。
これは私のローカルマシンで動作するコードがUbuntuサーバーで同じ結果を生成していない下流の私には問題を引き起こしています。 コードブックに含まれるテキストを見ると、私がすぐに気づくのは、Windowsで作成されたバージョンが "\ r \ n"の場合、Ubuntuで生成されたバージョンは "\ n"のみである( "\ r" \ n ")。
なぜ文字シリーズが異なるのですか?それはエンコーディングと何か関係がありますか?これを引き起こしていることと、両方のマシンでどのように同じ結果を得ることができるのかについての助けとなりました。
言及する最後の事は:た後
apt-get source poppler
cd poppler-0.24.5
./configure --prefix=$HOME/myapps
make
make install
export PKG_CONFIG_PATH=$HOME/myapps/lib/pkgconfig
:私はインストールするpdftoolsを得るためにUbuntuのサーバー上の自分のホームディレクトリ(sudoのアクセスを持っていない)へのpopplerライブラリをインストールする必要がありましたinstall.packages( "pdftools")が正しく動作しているようです。 pdftoolsは問題なくロードされます。だから、それが悪いインストールの場合、私は何が間違っているか分からない。
いずれの不一致も、使用中のエンコード問題やエンコード問題のポップラーライブラリのb/cとなる可能性があります。あなたは何をした。ドキュメントは何ですか?あなたがqを提出したときに提供するように指示された再現可能なコードはどこですか? – hrbrmstr
お返事ありがとうございます。ドキュメントは上記のRコードにあります。それは、install.packages( "pdftools")とlibrary(pdftools)以外のRでの複製に必要なすべてのコードです。 popplerライブラリを取得するために使用したコードは次のとおりです。 apt-get source poppler; cd poppler-0.24.5; ./configure --prefix = $ HOME/myapps; make; make install; エクスポートPKG_CONFIG_PATH = $ HOME/myapps/lib/pkgconfig; – lost