systemd — алерт по любому failed unit на хосте · monitoring cookbook · Enterno.io

Igor Verentsov

systemd — алерт по любому failed unit на хосте

Один из нескольких systemd units (cron, redis, postfix) упал в 3 ночи и не поднялся. Узнал утром по жалобам. Хочется endpoint показывающий high когда любой unit failed.

Стек: systemd · bash · cron Теги: systemd, linux, services

Рецепт

bash

#!/usr/bin/env bash
# Wraps `systemctl --failed` for an HTTP-monitor probe.
FAILED=$(systemctl --failed --no-legend --plain --quiet 2>/dev/null | wc -l)
[ "$FAILED" -gt 0 ] && {
  NAMES=$(systemctl --failed --no-legend --plain | awk '{print $1}' | head -5 | tr '\n' ' ')
  echo "high $FAILED failed: $NAMES"
  exit 1
}
echo "ok"

То же самое в Enterno.io

Положите endpoint на хост (через nginx или mini-server) + Enterno HTTP-монитор с keyword "ok" — pager-уровень мониторинга всех systemd units одной строкой. Дешевле любого APM.

Настроить HTTP monitor → ← Все рецепты

systemd — алерт по любому failed unit на хосте

Рецепт

То же самое в Enterno.io

Похожие рецепты

Uptime-проверка HTTP через bash + cron

SSL-certificate expiry watch в Python

PostgreSQL replication lag alert

Начните мониторинг бесплатно