
Специалисты, которым необходимо внедрить надежную систему мониторинга и алертинга в Kubernetes для повышения отказоустойчивости и наблюдаемости приложений и инфраструктуры.
Системные администраторы, отвечающие за эксплуатацию кластеров Kubernetes и желающие освоить отраслевой стандарт для мониторинга их состояния, включая контрольные плоскости и рабочие узлы.
Инженеры, строящие внутренние платформы для разработчиков и нуждающиеся в глубоких знаниях KPS для предоставления готовых решений по мониторингу как сервиса.
Команда Rebrain изучает, какие из компетенций требуются на разных уровнях профессий.
Настроить Ingress-ресурсы для Prometheus, Grafana и Alertmanager. Добавить базовую аутентификацию (Basic Auth) и TLS, где это необходимо. Подготовить Bash-скрипт, который с помощью curl попытается получить доступ к интерфейсу Grafana, Prometheus, Alertmanager используя правильные и неправильные учётные данные.
Убедиться, что KPS собирает метрики с компонентов Control Plane (apiserver, scheduler, controller-manager). Найти и проанализировать ключевые метрики, связанные с apiserver_request_latencies и etcd_disk_wal_fsync_duration_seconds в Prometheus. Подготовить Bash-скрипт, который выполняет запрос к Prometheus API для получения текущих значений одной из этих метрик.
Сконфигурировать Alertmanager так, чтобы алерты из разных компонентов отправлялись в разные «каналы» (например, симулированные файлы логов). Проверить, что алерты маршрутизируются корректно. Подготовить Bash-скрипт, который проверяет конфигурацию маршрутизации Alertmanager.
При использовании данного сайта, вы подтверждаете свое согласие на использование файлов cookie и других похожих технологий в соответствии с настоящим Уведомлением.