Мы ищем инженера мониторинга, который станет ключевым звеном в обеспечении стабильности и надёжности наших сервисов. Если ты готов погружаться в детали, предлагать инновационные решения и внедрять передовые технологии, мы будем рады видеть тебя в нашей команде.
Наша цель — создать условия, при которых пользователи могут наслаждаться бесперебойной работой наших сервисов, а команды — эффективно решать задачи, опираясь на точные данные и надёжные системы мониторинга.
Технологии, с которыми будешь работать
- Мониторинг: Grafana + OnCall, Prometheus (HA, Thanos), Alertmanager + Karma, Blackbox + Uptime Kuma.
- Логи и трассировка: ELK Stack (Open Distro), Jaeger, Loki (преимущество).
- Оркестрация и управление: Airflow, N8N, Kafka.
- Базы данных: PostgreSQL.
- Документирование: Jira, Confluence.
Чем будешь заниматься у нас
- Разрабатывать и оптимизировать архитектуру систем мониторинга, совершенствуя подходы, инструменты и методологии.
- Обеспечивать стабильную работу систем мониторинга: устранять сбои, обновлять, настраивать и тестировать.
- Реализовывать и сопровождать метрики, алертинг и визуализацию: настраивать триггеры, создавать дашборды для команд разработки, тестирования и поддержки.
- Автоматизировать процессы управления мониторингом через скрипты, утилиты и кастомные экспортеры.
- Готовить техническую документацию, инструкции и описания метрик.
- Выполнять задачи в рамках Agile-подхода.
- Развивать экспертизу в смежных с OPS-областях, интегрируя новые решения.
Успех в этой роли обеспечат
- Опыт работы с системами мониторинга от 3 лет, понимание принципов построения As-a-Service.
- Экспертиза в Prometheus и TSDB: знание архитектуры, конфигурирования, интеграций (Thanos, VictoriaMetrics), написание кастомных экспортеров.
- Умение работать с системами сбора, анализа и визуализации логов (Elasticsearch, Logstash, Fluentd, Rsyslog, Graylog, InfluxDB, Grafana, Kibana), написание EQL/KQL-запросов.
- Навыки администрирования и автоматизации: использование профильных команд для ОС и приложений, написание SH-скриптов, базовые знания Git и CI/CD.
- Понимание ООП, функционального программирования, чтение и анализ кода на Python.
- Знание микросервисной инфраструктуры, устройства и кластеризации.
Мы делаем всё, чтобы работа была в кайф
Становимся лучшими версиями себя
- Отправляем на конференции и профессионально коучим спикеров.
- Организовываем обучение под ключ.
- Растим своих менторов.
- Развиваем внутренние комьюнити: от киберспорта до книжного клуба.
Создаём только комфортные вайбы
- Компенсируем коворкинги и всегда ждём в стильных московских офисах.
- Поддерживаем гибкий формат работы и начала рабочего дня.
- Предоставляем возможность полной удалёнки.
- Обеспечиваем преимущества работы в аккредитованной IT‑компании.
- Каждого нового сотрудника сопровождаем поддержкой бадди для быстрой и комфортной адаптации.
- Вручаем подарки на годовщины и одеваем в стилевый мерч.
- Устраиваем мощные тусовки и дарим проходки на концерты артистов.
Знаем, как оставаться в ресурсе и в потоке
- Оформляем фуллхаус ДМС с первого дня: с ежегодными чекапами, полисом путешественника и ведением беременности. И даже ДМС для питомцев!
- 100% компенсируем больничный до 15 календарных дней в год.
- Оплачиваем сессии с психологами сервиса «Ясно».
- Предоставляем 6 дополнительных days-off в год.
- Компенсируем личные затраты на спорт и устраиваем онлайн-тренировки с нашими личными тренерами.