HAProxy — алерт когда хотя бы один backend ушёл в DOWN
HAProxy балансит на 5 backend-серверов; один из них стал отвечать ошибками и ушёл в DOWN. Перед тем как пользователь это заметит — алерт.
Рецепт
#!/usr/bin/env bash
# Reads HAProxy stats socket; prints "ok" if every backend is UP, "down N" otherwise.
SOCK="${SOCK:-/var/run/haproxy/admin.sock}"
DOWN=$(echo "show stat" | socat - "UNIX-CONNECT:$SOCK" \
| awk -F, 'NR>1 && $2 != "FRONTEND" && $2 != "BACKEND" && $18 == "DOWN" {print $2"/"$1}')
[ -z "$DOWN" ] && echo "ok" || echo "down $DOWN"
То же самое в Enterno.io
Поднимите endpoint и натравите HTTP-монитор Enterno на rule "body = ok". Multi-region check (Pro+) подтвердит, что DOWN видят все 3 региона, а не один edge-роутер.
Похожие рецепты
Продакшен ES-кластер ушёл в yellow status. Хочется алерт сразу, не через 30 минут как от Kibana.
Нужно убедиться, что сайт возвращает 2xx каждую минуту, и получить алерт в Slack/Telegram при падении.
Самоподписанный скрипт проверяет SSL сертификат и шлёт алерт за 14 дней до expiry.