0
私はLinkedinからダウンロードしたCVのPDFを解析するツールを構築しています。しかし、文書を解析すると、は目に何も存在しない空白の行を見つけます。Ruby pdf-readerは空白の行を追加しますが、PDFの解析時には空白の行はありません
これがPDFまたはPDFリーダーに問題があるのでしょうか?
スクリプト
require 'pdf-reader'
reader = PDF::Reader.new("CV.pdf")
reader.pages.each_with_index do |page, page_num|
bits = page.text.split("\n")
bits.each_with_index do |bit, index|
puts bit
end
end
CVのスナップショット
解析された出力
Senior Analyst
September 2013 - August 2015 (1 year 11 months)
- Managed a team of analysts to drive operational improvement across all departments of a subsidiary
company, including a 33% increase in conversions on their e-commerce platform and a 8% decrease in
logistics costs within my first year
出力されたテキストには、文の途中に空白行が追加されています。
PDFのスクリーンショットを見ると、pdfリーダーが見つけた空白行が表示されないため、奇妙に思えます。
これを引き起こす可能性のある人はいますか?