Инструкция к программе “Web-наблюдатель”

Что это за программа?

Программа “Web-наблюдатель” предназначена для отслеживания изменений на страницах сайтов. Обычно для этих целей используется технология RSS, но в последнее время некоторые вебмастера отказываются от неё, чтобы заставить пользователя лишний раз зайти на сайт и заодно посмотреть рекламу.

“Web-наблюдатель” скачивает каждую добавленную в список страницу, находит в ней интересующий пользователя фрагмент, сравнивает его с предыдущей версией, и если обнаруживает изменения — оповещает об этом пользователя. Программа может сравнивать как “сырой” HTML-код, так и очищенный от кода текст. Также распознаются случаи, когда блоки на странице просто поменялись местами.

Программа производит проверку только по указанию пользователя, автоматическая проверка по расписанию не предусмотрена.

Как добавить сайт?

Для добавления сайта нужно нажать левую кнопку на верхней панели. Появится окно добавления сайта:

Затем нужно заполнить требуемые поля:

  • Название сайта: это имя будет отображаться в списке сайтов в главном окне программы.
  • Ссылка: адрес страницы сайта в интернете, которую нужно проверять на изменения.
  • Начальный ограничитель фрагмента и Конечный ограничитель фрагмента: текст, по которому программа определяет фрагмент страницы, где будут искаться изменения. Зачастую страницы содержат динамически генерируемый контент, который может меняться при каждой загрузке: рекламные баннеры, блоки со случайно выбранными статьями и пр. Поэтому нужно ограничить сравнение только действительно необходмой частью страницы.

    Ограничители фрагмента ищутся в исходном коде страницы: часто для его просмотра используется комбинация клавиш Ctrl+U, но в каких-то браузерах это может быть другая команда. В исходном коде следует найти код, с которого начинается нужный фрагмент, причем это должно быть первое вхождение кода на странице. Рассмотрим пример:

    <div class="content">
        <div class="banner">
            ...
        </div>
        <div class="news">
            <ul>
                <li>Первая новость</li>
                <li>Вторая новость</li>
                <li>Третья новость</li>
            </ul>
        </div>
        <div class="main">
            ...
        </div>
    </div>

    В этом примере нужно оставить фрагмент, содержащий новости, и отбросить всё остальное. Видно, что непосредственно перед блоком новостей идёт код <div class="news">, поэтому именно его нужно брать в качестве начального ограничителя фрагмента. После блока новостей идёт код </div>. Этот код встречается несколько раз, но в качестве конца фрагмента будет выбран первый код после начального фрагмента. В результате для сравнения программа выберет следующий код:

    <div class="news">
        <ul>
            <li>Первая новость</li>
            <li>Вторая новость</li>
            <li>Третья новость</li>
        </ul>
    </div>

  • Удалять HTML-теги при сравнении: если выбрать эту опцию, то программа удалит теги и будет сравнивать только чистый текст. Это бывает полезно в тех случаях, когда HTML-код часто меняется (например, названия CSS-стилей генерируются заново при каждой загрузке страницы, чтобы усложнить работу блокировщиков рекламы).
  • Фрагменты-разделители для разбиения на строки: список фрагментов текста, перед которыми программа будет вставлять маркер новой строки. Это бывает полезно в тех случаях, когда весь фрагмент на сайте располагается в одной строке:

    <ul> <li>Первая новость</li> <li>Вторая новость</li> <li>Третья новость</li></ul>

    Если ввести в поле разбиения на строки код <li>, то получится более удобный для сравнения код:

    <ul>
    <li>Первая новость</li>
    <li>Вторая новость</li>
    <li>Третья новость</li>
    </ul>

Что такое User Agent?

User Agent — это строка, которая передаётся браузером на сайт в момент загрузки страницы. Она содержит информацию о браузере, его версии, операционной системе и загруженых плагинах. Сайт может анализировать эту информацию и в зависимости от версии браузера или операционной системы скорректировать код сайта. Поэтому во избежание неожиданностей лучше всего указывать User Agent, совпадающий с таковым для используемого браузера.

Чтобы изменить строку User Agent нужно открыть окно конфигурации в программе (кнопка с шестеренкой на верхней панели), и ввести соответствующую информацию в поле:

Можно нажать кнопку “Открыть сайт What's My User Agent?”, расположенную под полем ввода. В браузере откроется сайт whatsmyuseragent.com и отобразит информацию о строке User Agent используемого браузера. Можно скопировать эту информацию с сайта и вставить в программу.

Как авторизоваться на сайте?

Некоторые сайты могут отображать требуемую для отслеживания информацию только после авторизации. На других сайтах может стоять защита от программ-роботов, которые выполняют автоматизированные действия, и требуется сперва подтвердить, что пользователь является человеком. В таких случаях в браузере пользователя всё может работать корректно, но программа получает другую версию страницы от сервера и не находит требуемый фрагмент.

Чтобы решить эту проблему, нужно щёлкнуть правой кнопкой на проблемном сайте в главном окне и выбрать в меню пункт “Открыть в программе”. Страница откроется во встроенном браузере. Здесь нужно произвести требуемые действия (авторизоваться, подтвердить что пользователь не робот и т.д.). После этого проверка должна производиться нормально.