2017-08-31 11 views
1

から元のURLがこのリンクを検討しなさい: https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=linkのredditのURL

元などは、私が使用しなくても最初のリンクから元のリンクを取得することができますどのようにJavascriptを使用して、

http://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids

ましたReddit API?

+0

はい、ページを擦ってリンクを取得してください –

+0

あなたに別の見通しや質問を修正するにはあなたが提供したリンクは、どのようにしてbbc.comリンクを参照しています。元のリンクが指し示すページにそのリンクが含まれているだけです。だから唯一の方法は、そのリンクのページをこすりすることです。 – Paul

+0

@Paul:この形式は、(共有ボタンをクリックして)Redditで投稿を共有しようとすると(元のリンクの代わりに)得るものです。 – Ari

答えて

2

ウェブページで実行されているJavaScriptについて言えば、できません。 Reddit APIを使用するか、RedditのWebページをスクラップする必要があります。ただし、クロスオリジンのセキュリティルールのためにJavaScriptを使用してWebページをスクラップすることはできないため、APIを使用する必要があります。

EDIT:ああ、ポールは、Node.jsにタグを付けたと指摘しました。あなたがサーバーからこれをやっているなら、掻き取りが可能です。 "node.jsで掻き集める"を参照してください。 Googleで大まかに見てみると、RedditのWebページのHTMLをダウンロードしてCheerioというライブラリで解析することが、ほとんどのソリューションのように見えます。また、有望に見えるこの事はscrape-itです。

+1

彼はtag node.jsをタグ付けしました。おそらく、クライアント側ではなくサーバー側であると想定できます。 – Paul

+0

これは質問に対する答えを提供しません。批評をしたり、著者の説明を求めるには、投稿の下にコメントを残してください。 - [レビューの投稿](/レビュー/低品質の投稿/ 17202436) – GrumpyCrouton

関連する問題