2017-02-04 9 views
0

私は以前に大学でJavaを学んでいた3ヶ月の短期コース(唯一のプロジェクトは数独ゲームをコーディングしていました)でした。スクラップ価格>表>アラートメール

一般的な自動化タスクで最も一般的なプログラミング言語を学びたいと思います。これまでのところ、私はAHKを手に入れました。そして、それは多くのテキスト拡張/アプリのショートカットなどで私を助けました。

はさらに進めて、以下を達成、例えばしたいと思います:

1 [このサイトへ:https://carousell.com/search/products/?query=12-35mm

2スクレイプ「パナソニック」、「12〜35ミリメートル」 が含まれている全てのデータを(ウィルこれらの結果のすべてのページをかき集めるのは難しいですか?)

3価格欄に価格を設定します。価格は、商品説明内の価格の値の検索(「$)、(たとえば、$ 1、$ X 4値以下)誤解されている場合。エクセル

4 Tabluate結果

5は、平均価格に、最新の結果を比較してください。

6最新価格が平均価格より低い場合>電子メールで私に警告してください。

私のオートメーションプロジェクトのほとんどは、次のようなものです:最高のプログラミング言語とは何ですか?まさにその通りですか?

私はそれをImport.IOとPythonに絞りました。しかし私は間違っているかもしれません。

このコースは役に立つと思われますが、この個人的なプロジェクトを完了するために必要なすべてを教えてくれるかどうかはわかりません。

https://www.udemy.com/automate/

教えてください、ありがとう!

+0

検索結果の項目は、同じhtml構造です。これは掻き取り工程を単純化する。私はRやPythonを使用して、スクラップ、価格比較、自動メールを達成できると確信しています。このコースでは、最も重要な部分が削られているようです。 –

+0

利用規約の下で許可されているかどうかわかりません。彼らは自動掻き取りの一形態を禁止しており、それはすべての掻き取りを禁止することを意図している可能性が高い。 LinkedInが昨年、掻き集めて人々を訴えて以来、慎重に踏み込んでいます。 ToS/T&Cを読むことは、何かを掻き集めることを決めるときに最初に行うことです。 – hrbrmstr

+0

@hrbrmstrこれはあなたがどこに住んでいるかによって異なります。一部の国では、LinkedInのToS/T&Cに代わる法律があります。しかし実際のプログラミングでは、サイト上のあらゆる変更に適応することは困難です。 –

答えて

1

Pythonは、これらの種類のWebスクレイピングと処理に最適です。

ページを取得する:必要な情報を出力するためにJavascriptを使用しないので、requestsで十分です。

HTMLを解析して情報を抽出します。私の個人的なお気に入りはBeautifulSoupです。もっと深く掘り下げたい場合は、question about thisがあります。

結果をExcelに保存します。2つのモジュールが再びジョブを実行します。私のお気に入りはopenpyxlです。非常に大きなファイルを保存する必要がない場合は、これで十分です。

価格比較:価格はあなたのスクリプト、「データベース」として機能するExcelシートと単に比較することができます。

メール送信:Python standard libraryでメールを送信できます。これは何試しスクリプトを書いて、あなたが任意の特定のフェーズにヒントを必要とする場合、その特定の部分のために働いていない特定のコード、と戻ってきてくださいする..それを行う方法を


fine tutorialではありませんそれから私たちはあなたを助けることができます。

+0

地上ゼロからPythonを教えることができる1つの特別なチュートリアルがありますか?私はおそらく最初から勉強する必要があり、リンクされたチュートリアルも私の現在のレベルではやや複雑です。 Udemyチュートリアルはこの目的には十分ですか? – curiousnotepad

関連する問題