Docker daemon — алерт когда dockerd завис · monitoring cookbook · Enterno.io

Anatoly Oshmanovsky

Docker daemon — алерт когда dockerd завис

docker info висит >30 сек — daemon в split-brain состоянии. Контейнеры работают (kernel держит namespaces), но новых релизов deploy не сделать. systemctl status показывает active.

Стек: docker · systemd · cron Теги: docker, runtime, infra

Рецепт

bash

#!/usr/bin/env bash
# /etc/cron.d/docker-hang
# */2 * * * * root /opt/docker-hang.sh

TIMEOUT=${TIMEOUT:-15}

# Use timeout — `docker info` will hang forever if daemon is wedged
if timeout "$TIMEOUT" docker info >/dev/null 2>&1; then
  echo "OK"
  exit 0
fi

curl -fsS "$HEARTBEAT_URL" --data "docker_hang=true,timeout=${TIMEOUT}s"
exit 2

То же самое в Enterno.io

Поставьте Enterno heartbeat с интервалом 2 мин — узнаете о daemon-hang в первые 4 мин, а не «утром в первом deploy», когда CI красит pipeline.

Настроить Heartbeat monitor → ← Все рецепты

Docker daemon — алерт когда dockerd завис

Рецепт

То же самое в Enterno.io

Похожие рецепты

Алерт при OOM-kill контейнера

NTP — алерт когда системные часы дрейфуют

Docker Hub — алерт о приближении к pull-rate-limit

Начните мониторинг бесплатно