Яндекс.Мониторинг — сервис для мониторинга инфраструктуры и приложений. Сервис обрабатывает 1 млрд. точек на запись и 150 млн — на чтение ежесекундно, рассчитывает 4 млн алертов. Такие объёмы требуют решения сложных задач по масштабированию и отказоустойчивости.
Мониторинг активно развивается — им пользуется большинство команд Яндекса и внешние пользователи сервисов Yandex.Cloud (правда, в более ограниченной версии по сравнению с внутренним Мониторингом).
Новый проект Prometheus drop-in replacement посвящён разработке сервиса Managed Service for Prometheus, который будет работать поверх Яндекс.Мониторинга и поддерживать все возможности Prometheus. Похожие проекты — Amazon Managed Service for Prometheus, Google Cloud Managed Service for Prometheus, Grafana Cloud, VictoriaMetrics.
Будет плюсом:
Команда Yandex Infrastructure создаёт и предоставляет внутреннюю инфраструктуру Яндекса — фундамент из продуктов и технологий, на базе которого тысячи инженеров разрабатывают, деплоят и эксплуатируют основные сервисы Яндекса: Поиск, Такси, Маркет, Алису, Кинопоиск и многие другие.