Мониторинг uptime: зачем и как настроить
Зачем мониторить uptime
Uptime (доступность) — время, в течение которого сайт или сервис доступен и функционирует корректно. Каждая минута простоя — это потерянные деньги, клиенты и репутация. По исследованиям, одна минута простоя обходится бизнесу в среднем в $5,600 для крупных компаний.
мониторинг сайтов uptime позволяет обнаружить проблему за минуты, а не узнать о ней от недовольных клиентов через часы.
Что мониторить
Основной сайт
Проверяйте главную страницу и ключевые разделы. Не ограничивайтесь проверкой HTTP-кода — проверяйте наличие ключевого контента в ответе.
API
Мониторьте критические эндпоинты API документацию. Проверяйте не только доступность, но и корректность ответа (JSON-структура, ожидаемые поля).
Базы данных
Падение БД — наиболее частая причина серьёзных инцидентов. Мониторьте подключение и время отклика.
Сторонние сервисы
Платёжные шлюзы, CRM, email-провайдеры, CDN — любой внешний сервис, от которого зависит ваш бизнес.
SSL-сертификаты
Просроченный сертификат = полная недоступность для пользователей. Мониторьте срок истечения с помощью SSL-чекера Enterno.io.
Типы проверок
HTTP/HTTPS проверка
Самый распространённый тип. Отправляет HTTP-запрос и проверяет код ответа, время отклика, содержимое.
- Код ответа (200, 301, 500...)
- Время отклика (должно быть менее порога)
- Наличие строки в ответе (keyword check)
- Валидность проверку SSL
Ping (ICMP)
Проверяет доступность сервера на сетевом уровне. Быстрый и лёгкий, но не проверяет работу веб-приложения. Используйте Ping-тест Enterno.io.
TCP/порт проверка
Проверяет доступность конкретного проверку портов: 3306 (MySQL), 6379 (Redis), 5432 (PostgreSQL). Полезно для мониторинга внутренних сервисов.
DNS проверка
Проверяет корректность DNS Lookup и время резолвинга. Используйте DNS Lookup Enterno.io.
Частота проверок
- Каждые 30 секунд — для критических сервисов (платёжные системы, основной API)
- Каждую минуту — для основного сайта и ключевых страниц
- Каждые 5 минут — для внутренних сервисов и менее критичных страниц
- Каждые 15-30 минут — для второстепенных сервисов
Учитывайте, что слишком частые проверки создают трафик и могут быть заблокированы WAF.
Настройка алертов
Ключевые принципы:
- Подтверждение из нескольких точек — единичная ошибка может быть сетевым глюком. Алерт должен сработать только если проверка провалилась из 2+ локаций.
- Задержка перед алертом — дождитесь 2-3 последовательных ошибок перед уведомлением.
- Правильные каналы — Telegram/SMS для critical, email для warning.
- Эскалация — если проблема не решена за 15 минут, уведомляйте следующего по цепочке.
Status Page
Публичная status page информирует пользователей о текущем состоянии сервисов и инцидентах. Это уменьшает нагрузку на поддержку и повышает доверие.
Status page должна содержать:
- Текущий статус каждого сервиса (Operational, Degraded, Down)
- Историю инцидентов с таймлайном
- Плановые работы
- Подписку на обновления (email, RSS, webhook)
- Uptime за последние 30/90 дней
SLA и расчёт uptime
SLA (Service Level Agreement) определяет гарантированный уровень доступности:
- 99% — до 7.3 часов простоя в месяц
- 99.9% — до 43.8 минут простоя в месяц
- 99.95% — до 21.9 минут простоя в месяц
- 99.99% — до 4.3 минут простоя в месяц
Формула: uptime% = (total_minutes - downtime_minutes) / total_minutes * 100
Начните мониторинг с Enterno.io
Настройте мониторинг uptime Enterno.io за несколько минут. Добавьте URL вашего сайта, выберите частоту проверок и каналы уведомлений. Система будет проверять доступность и уведомлять при проблемах. Используйте панель мониторов для просмотра статуса всех сервисов.
Итоги
Мониторинг uptime — обязательный минимум для любого веб-проекта. Мониторьте не только HTTP-доступность, но и API, БД, SSL и сторонние сервисы. Настройте алерты с подтверждением из нескольких точек. Публикуйте status page для прозрачности. Помните: без мониторинга вы узнаете о проблемах последними.
Проверьте ваш сайт прямо сейчас
Проверить →