昔懐かしのWebサイトの自動巡回をしています。
仕組みとしてはUbuntuで動かしているファイルサーバーにcronでWebサイトを巡回する自作スクリプトを定期的に実行しています。
スクリプトはpythonを使っており、まず、BeautifulSoupで目的のサイトのページのHTMLをパースし更新情報を抜き出します。その情報をテキストファイルとして保存した前回の更新内容と文字列比較し、更新されていれば自分宛にメールを送信します。
RSSのあるページであればfeedparserで最新のタイトルを更新時報として同様に比較しメールすることにしています。
仕組みとしてはUbuntuで動かしているファイルサーバーにcronでWebサイトを巡回する自作スクリプトを定期的に実行しています。
ubuntuで定期的にスクリプトを実行【cron】
パソコンをサーバとして運用していると定期的に自動実行してほしい仕事が出てきます。 cronは設定ファイルに実行したいコマンドと時刻を記述することで自動実行する機能です。 ubuntuに限らず多くのunix系osで採用されている機能です。 w...
スクリプトはpythonを使っており、まず、BeautifulSoupで目的のサイトのページのHTMLをパースし更新情報を抜き出します。その情報をテキストファイルとして保存した前回の更新内容と文字列比較し、更新されていれば自分宛にメールを送信します。
PythonでWebからHTMLファイルをダウンロードして解析してみる。
WinPythonをインストールしましたが、Pyhoneの学習が大分ほったらかしになっていましたので、久々にPythonを触ってみたいと思います。今回はWebサイトからHTMLをダウンロードして、ダウンロードしたHTMLファイルを解析するサ...
RSSのあるページであればfeedparserで最新のタイトルを更新時報として同様に比較しメールすることにしています。
PythonでRSSの更新をメールで知らせるスクリプトを作る。
PythonでRSSをパースするライブラリ「feedparser」を使って、RSSの更新がある場合メールで知らせるスクリプトを作ってみます。 #!/usr/bin/env python3 # coding: utf-8 # rss更新確認ス...
同じことを目的としたサービスは無数にあるとは思いますが、自前で用意する場合自分向けにカスタマイズにこだわることが出来ます。
コメント