100 рецептов мониторинга · uptime / SSL / cron / k8s · Enterno.io

Igor Verentsov

Кулинарная книга мониторинга

Готовые рецепты для типовых задач мониторинга. Каждый рецепт показывает минимальный DIY-скрипт и one-click монитор Enterno.io, который закрывает ту же задачу без лишней инфраструктуры.

100 рецептов · MIT · RU + EN

Uptime-проверка HTTP через bash + cron

bash

bash uptime curl

Нужно убедиться, что сайт возвращает 2xx каждую минуту, и получить алерт в Slack/Telegram при падении.

Открыть рецепт → HTTP monitor

SSL-certificate expiry watch в Python

python

python ssl tls

Самоподписанный скрипт проверяет SSL сертификат и шлёт алерт за 14 дней до expiry.

Открыть рецепт → SSL checker

PostgreSQL replication lag alert

sql

postgres sql replication

Нужно ловить момент, когда реплика начала отставать от мастера больше чем на 10 секунд.

Открыть рецепт → HTTP monitor

Python cron heartbeat (dead-man switch)

python

python cron heartbeat

Ваш cron стал молча не запускаться. Нужен алерт, если скрипт пропустил окно выполнения.

Открыть рецепт → Heartbeat monitor

Kubernetes deployment health externally

yaml

kubernetes kubectl readiness

Readiness-probe внутри пода есть, но никто не видит, что LB отказался роутить трафик на новый deploy.

Открыть рецепт → HTTP monitor

Алерт о задержке репликации Redis

bash

redis replication cli

Slave-Redis отстаёт от master — read-after-write возвращает старые данные. Стандартного алерта нет, нужен внешний.

Открыть рецепт → HTTP monitor

Алерт при всплеске 5xx в nginx

bash

nginx errors awk

Сервер начал отвечать 503/504 — но это пропускает обычный uptime-мониторинг (главная отдаёт 200, ошибки в API).

Открыть рецепт → HTTP monitor

Алерт при OOM-kill контейнера

bash

docker oom cron

Контейнер падает по OOM, restart-политика поднимает его обратно — наружу никаких сигналов, пока пользователи не пожаловались.

Открыть рецепт → Heartbeat monitor

Watch DMARC-record для домена рассылок

bash

email dmarc dns

Маркетолог-стажёр меняет DMARC с <code>p=quarantine</code> на <code>p=none</code> ради «исправить bounce» — через час Gmail помечает все рассылки как спам.

Открыть рецепт → DNS monitor

Резольвер не отвечает — алерт раньше пользователей

bash

dns resolver cli

Один из публичных DNS-резольверов (1.1.1.1, 8.8.8.8) deg для региона. Ваш сайт «работает», но половина пользователей видит «server not found» — uptime-monitor молчит.

Открыть рецепт → DNS monitor

Прокинуть alertmanager-алерты в Telegram

yaml

prometheus alertmanager telegram

Prometheus + Alertmanager шлют алерты только в email или PagerDuty. Команда живёт в Telegram — нужно мостовое звено без отдельного сервера.

Открыть рецепт → Webhook receiver

Алерт при всплеске медленных запросов MySQL

bash

mysql database performance

long_query_time = 1, slow_query_log включён. Нужно понимать, когда количество медленных запросов в минуту резко вырастает (deploy сломал индекс, ORM начал N+1).

Открыть рецепт → Performance monitor

Алерт при провале cache-hit ratio CDN

bash

cdn cache cloudflare

CDN cache_status (cf-cache-status или x-cache) внезапно даёт MISS на больше 30% запросов — вырос origin-load и счёт за бэкенд.

Открыть рецепт → HTTP monitor

Контроль квоты сторонних API

python

api rate-limit webhook

Stripe, GitHub, Twilio возвращают X-RateLimit-Remaining в заголовках. Если бэкенд не отслеживает порог — внезапно пойдёт 429, биллинг встанет.

Открыть рецепт → API monitor

Алерт о заканчивающемся месте на диске

bash

disk filesystem cron

Логи или backup-файлы съедают /var; через 24 часа сервер ляжет. Базовый df-чек один раз в 10 минут спасает от 2 АМ инцидента.

Открыть рецепт → Heartbeat monitor

Kafka consumer lag — алерт при отставании больше N

bash

kafka streaming lag

Consumer-группа отстаёт от продьюсера, и сообщения копятся. Нужен порог lag, после которого летит алерт.

Открыть рецепт → HTTP monitor

Elasticsearch — поймать переход cluster в yellow/red

bash

elasticsearch cluster health

Продакшен ES-кластер ушёл в yellow status. Хочется алерт сразу, не через 30 минут как от Kibana.

Открыть рецепт → HTTP monitor

RabbitMQ — алерт при росте очереди

bash

rabbitmq amqp queue

Consumer не успевает обрабатывать сообщения, очередь растёт, в итоге диск переполнится. Нужен alert по количеству messages-ready в очереди.

Открыть рецепт → HTTP monitor

HAProxy — алерт когда хотя бы один backend ушёл в DOWN

bash

haproxy load-balancer health

HAProxy балансит на 5 backend-серверов; один из них стал отвечать ошибками и ушёл в DOWN. Перед тем как пользователь это заметит — алерт.

Открыть рецепт → HTTP monitor

Алерт когда бэкап старше N часов

bash

backup cron storage

Cron бэкапа тихо упал, никто не заметил, через неделю обнаружится при инциденте. Нужен алерт, если последний backup-файл старше 30 часов.

Открыть рецепт → Heartbeat monitor

Не нашли нужный рецепт?

Напишите, какой стек добавить — письмо на support@enterno.io, добавим рецепт и поставим кредит на странице.

Начать мониторинг — бесплатно →

Не нашли нужный рецепт?

Начните мониторинг бесплатно