Оригинальная статья: Lucas Nussbaum
Перевод: Соломин Евгений
Множество web-сайтов предоставляют возможности чтения заголовков RSS.
Когда Вы хотите следить за изменениями на каком-либо сайте, Вы можете только
посещать его время от времени, или использовать общедоступные сервисы такие
как FEED43 или RSSPECT. Websec (Web Secretary)
автоматизирует процесс регулярного посещения web-сайтов: он обычно
запускается в cron job и сравнивает
содержимое web страницы с тем что было скачано при последнем запуске. Если
содержимое изменилось, программа посылает Вам e-mail с новыми данными,
выделяя их от старых подсвечиванием.
Программа работает вполне прилично, но имеет некоторые ограничения:
Вы не можете следить за целым web-сайтом, а можете только за одной страницей;
Вы можете исключить некоторый текст из сравнения (обычно "Сгенерировано за
0,2с", текущую дату и время и т.д.), но мне не следует делать этого, за
исключением составных строк (т.к. это делает невозможным отслеживать
результаты например Google) Смотри баг #402113.
Мне не удалось найти пакет который делал бы тоже самое что и websec, но
генерировал бы RSS вместо того, что бы посылать e-mail с изменениями. Если
кто-нибудь хочет написать его, должна быть возможность переделать некоторую
часть кода websec'a.
Вы можете посетить домашнюю страницу http://baruch.ev-en.org/proj/websec/
Websec доступен в репозитариях Debian и Ubuntu в нескольких стабильных
релизах, не имея серьезных ошибок.