2016-03-22 2 views
3

私はここで検索して答えを見つけることができませんでした。 import.io APIの一部の列はデータを返しません。これらのデータはJavaScriptの背後にありますが、トレーニング中はデータが返されますが、一括抽出またはクロール中は列は空です。私はimport.ioのサポートを郵送し、彼らはここに私の質問を掲示するように私に頼んだ。誰でも助けてくれますか?JavaScriptが有効になっているため、Import.ioから空の列が返される

+0

詳細を入力してください。あなたが抽出しているURLは何ですか?あなたの抽出器のガイドは何ですか? – Bam4d

+0

URLは ですhttps://www.kickstarter.com/projects/1410842311/the-future-is-now-volume-two 私は「行く日」の値と「この後に提供される終了日」を抽出しようとしていましたプロジェクトは資金を提供される "。 GUIDはa7e3f2b7-6a52-4310-bf3a-15721e14ae53 – neenkart

答えて

4

ページのHTMLを見ると、JSがなくても、 "days to go"の近くのhtmlの部分の属性が表示されます。

例えば:

data-hours-remaining="532.6704760581918"

と:

data-end_time="2016-04-13T16:00:00-04:00"

私は、これはテキストを "行くために日" に該当すると考えています。

たとえば、.//*[@id='project_duration_data']/@data-hours-remainingなどのカスタムxpathを使用して、これらの属性から必要なデータを取得します。次に、必要なフォーマットにそれらを後処理することができます。日、週など。

+1

ありがとうBam4dです。私は/ span> @did = 'project_duration_data']/@ data-hours-remainingと[@ id = 'project_duration_data']/@ data-end_timeを試してみました。私はいくつかの正規表現を使ってデータをトリミングしました。ありがとうございました。 – neenkart

関連する問題