
которым важно обеспечить надёжность и производительность систем, что невозможно без качественного мониторинга
которые хотят перейти от реактивного решения проблем («все упало») к проактивному — предотвращать сбои на основе метрик
которые заинтересованы в получении данных о производительности своих приложений в реальных условиях
Команда Rebrain изучает, какие из компетенций требуются на разных уровнях профессий.
В этом задании вам будет необходимо настроить алерт на персентиль времени выполнения compaction внутри самого prometheus. На подготовленной виртуальной машине уже установлен Prometheus.
Критерии оценки выполнения задания:
Prometheus собирает метрики с самого себя (настроено по умолчанию).
В Prometheus подключены правила алертинга из файла /opt/prometheus/alerts.yml
В файле /opt/prometheus/alerts.yml описан алерт:
Название алерта - CompactionTimeTooLong
Алерт должен проверять 95 персентиль для метрики prometheus_tsdb_compaction_duration_seconds_bucket и если он больше или равен 1 секунде - должен срабатывать
Алерт должен срабатывать если он активен более 5 минут
Алерт должен иметь лейблы: severity=warning и env=dev
Алерт должен иметь summary вида: Compaction time on $INSTANCE equals $DATA. Вы должны заменить $INSTANCE на имя инстанса, а $DATA на значение функции из пункта 3.2 с помощью go-template.
При использовании данного сайта, вы подтверждаете свое согласие на использование файлов cookie и других похожих технологий в соответствии с настоящим Уведомлением.