私はスケジューラやcronjobを使って時々実行させるために、クラウドに展開したいPythonスクレイパー(スクリプト)をいくつか持っています。問題は、スクレーパーとその出力をホストできるプラットフォームがわからないことです。
P.S:私のスクリプトは、BeautifulSoupモジュールを使用してPythonベースです。どのようにクラウドにpythonスクレーパーを導入するのですか?
2
A
答えて
2
ただBeautifulSoupをクラウドで廃棄して展開するだけでは効率的ではなく、コードを維持することも難しくなります。
Scrapyモジュールを試すことをお勧めします。どのように作業するのかわからない場合は、その文書から学習してください。あなたがScrapyで掻き分ける方法が十分に快適なときは、それを展開することができます。
最近、私は1つのプロジェクトに関連して10百万以上のデータを処理していましたが、その当時、私は実際に自分のコードをクラウドに展開したかったのです。多くの研究の後、私はScrapingHubを見つけた。
1つのアカウントを作成し、次に1つのプロジェクトをScrapy設定で作成する必要があります。無料のアカウントには1名の無料ワーカーがいて、24時間のみ稼働します。 その上にScrapyスパイダーを配置し、スパイダーを起動してください。完了後、データは7日間保存され、jsonのような任意の形式でデータをダウンロードできます。
関連する問題
- 1. Java ESBをクラウドに導入する
- 2. googleクラウドでdjangoアプリを導入するにはどうすればよいですか?
- 3. Symfony2を共有ホスティングにどのように導入するのですか?
- 4. initilizationコンストラクタはどのように導入しますか? C#CS0236
- 5. サイファークエリでパラメータを導入するにはどうすればよいですか?
- 6. python webスクレーパー - どうしたのですか?
- 7. どのようにしてBluemixにMobileFirst Application Centerを導入できますか?
- 8. Firebaseのクラウド機能を導入するためにノードが必要です
- 9. GAEランチャーからOAuth2をどのように導入しますか?
- 10. Pythonスクレーパーのアドバイス
- 11. どのようにクラウドでフォールトトレランスを達成するには?
- 12. 個々のバージョンのドッカーコンテナを安全なスクリプトに導入するにはどうすればよいですか?
- 13. FTPベースのファイルプロセスにデータベースのファイル名要求を導入するにはどうすればよいですか?
- 14. C#でWebリクエストとサイトの間に遅延を導入するにはどうすればよいですか?
- 15. Firebase用のクラウド機能を適切に導入する方法は?
- 16. 内部のMobileFirstハイブリッドアプリケーションを専用Bluemix環境に導入するにはどうすればよいですか?
- 17. Google AdMobsのバナー広告を迅速に導入するにはどうすればよいですか?
- 18. アンドロイドアプリを開発してプレイストアに導入するには、どのような技術が必要ですか?
- 19. Xcode BotからTestFlightに自動ビルドを導入するにはどうすればよいですか?
- 20. stdinで導入された行の数を表示するにはどうすればよいですか?
- 21. 次のJavaプログラムでカプセル化を導入するにはどうすればよいですか?
- 22. ヘロクにGoogle上でアクションを導入するにはどうすればよいですか?
- 23. index.htmlをindex.phpに誘導するにはどうすればよいですか?
- 24. Emacsの:どのように自動的にCCモード誘導体でコロンの後にスペースを挿入する
- 25. Java Google App Engineの導入をスピードアップするにはどうすればよいですか?
- 26. Azureの機能を社内のデータセンターにどのように導入できますか?
- 27. 複雑な機械学習予測プログラムをどのように導入すればよいですか?
- 28. 生産環境にDukescript Jersey Based Serverを導入するにはどうすればよいですか?
- 29. メトロアプリをWindows 8デバイス/タブレットに導入するにはどうすればよいですか?
- 30. Safari用にxcode Webpluginを導入するにはどうすればよいですか?
あなたはどの技術を使用しているか知らずにその難しい – VMRuiz