2016-04-26 19 views
-2

私はthe pageに出くわしました。それに基づいて私は以下のコードを書いた。コードが実行されます。私はいくつかの追加の結果が欲しい。あなたが提案できる提案や代替パッケージはありますか?私は「エリックブレッドソー」/バイグラム及びません(「エリック」、「ブレッドソー」)を検索したいので、私は、どのように私は、タイムスタンプ(6時間バック、4月25日を取得することができますpython web scraping gnp package

  1. import gnp 
    word= 'eric bledsoe' 
    word1='"' + word + '"' 
    c = gnp.get_google_news_query(word1) 
    #c = gnp.get_google_news_query("What's happening on earth") 
    print (c) 
    
    を単語1を作成しています2016など)は、各ニュースに関連付けられている ですか?
  2. 私は最近365日間に公表されたニュースに限定することができますか?
  3. どのようにしてトップxエントリだけを取ることができますか?たとえば、私はトップを見たい 1000結果のみ? 2,3,4 .... google news ページをナビゲートするにはどうすればよいですか?
+0

投稿ごとに1つの質問に自分自身を制限してください。 – MattDMo

+0

非常によく似ている(同じ問題に関連していても)1つ以上の質問を投稿できないというルールを私に見せてください。 – user2543622

+1

厳密にはルールではありませんが、ここでは(強調しています): "**広すぎる**、不明瞭、不完全な意見、彼らが改善されるまで、コミュニティによって保持されるかもしれません "。猫1匹につき複数の質問をすることは、あなたの質問をあまりにも広すぎるものとして閉じてしまう。 –

答えて

1

できません。使用しているパッケージはこれらのものをサポートしていません。

一般的に言えば、私はそのパッケージの使用を避けることをお勧めします。どんな種類の公式(あるいは非公式)APIを使用するのではなく、Google NewsのHTML出力を掻き集めることに基づいているので、本質的に脆弱であり、GoogleがNewsインターフェースを再設計すると壊れる可能性があります。

+0

あなたは正しい@duskwuffです。解析目的のために 'gnp'パッケージが作成されました。これは、Googleがニュースレイアウトを変更した場合には、これを修正する必要があります。その機能を追加するためのパッケージをユーザーが作成できるようにします。 – Manuel