Наша распределённая команда Dev насчитывает более 700 специалистов и разрабатывает собственные продукты с 2012 года — рекламные платформы, игровые сервисы и платформы, мобильные игровые и развлекательные приложения, финтех-продукты и решения.
У нас проектно-ориентированный подход, матричная структура с привязкой специалистов к одному проекту, но при этом мы работаем командой. В работе мы применяем Scrum, Agile.
Обязанности:
- Проектирование и настройка систем мониторинга.
- Разработка архитектуры системы мониторинга инфраструктуры и приложений.
- Внедрение систем мониторинга и сбора логов (Prometheus, ELK-Stack, Grafana, Grafana OnCall).
- Проектирование системы оповещений.
- Настройка триггеров и оповещений для своевременного уведомления о сбоях.
- Оптимизация пороговых значений для минимизации ложных срабатываний.
- Интеграция со смежными системами: мессенджеры, системы управления инцидентами.
- Анализ и отчётность.
- Создание дашбордов и отчётов для анализа ключевых метрик производительности и доступности.
- Проведение RCA после инцидентов.
- Оптимизация и автоматизация.
- Разработка автоматизированных решений для устранения инцидентов и сбора метрик.
- Интеграция мониторинга с CI/CD-процессами.
- Поддержка и развитие инфраструктуры мониторинга.
- Обновление и поддержка версий систем мониторинга.
- Масштабирование систем для поддержки роста компании.
Ожидания:
- Знание систем мониторинга.
- Экспертные знания современных инструментов мониторинга (Prometheus, Grafana, ELK Stack).
- Опыт настройки дашбордов, отчётов и оповещений.
- Опыт системного администрирования.
- Опыт работы с Linux/Windows на уровне системного администратора.
- Понимание работы основных сетевых протоколов (TCP/IP, SNMP, HTTP, ICMP).
- Опыт настройки мониторинга компонентов сетевой инфраструктуры.
- Знание скриптовых языков (Python, Bash, PowerShell) для автоматизации задач мониторинга.
- Умение быстро реагировать на инциденты и принимать решения.
- Аналитическое мышление, умение находить корневые причины проблем.
- Хорошие коммуникационные навыки.
- Умение работать в распределённой команде и взаимодействовать со смежными подразделениями технического департамента (разработка, служба поддержки).
Желательные знания и опыт:
- Опыт работы с контейнерами (Docker, Docker Compose, Kubernetes) и мониторинг их инфраструктуры.
- Сертификации CCNA, RHCE.
Условия:
- У нас удалёнка, но есть офис в Москве для желающих поработать в формате коворкинга или с закреплённым рабочим местом.
- Оформление в штат компании или заключение международного контракта.
- Гибкий график работы из дома или офиса — лояльное начало дня, 8-часовой рабочий день.
- Возможность выбрать привычное оборудование (Mac, Linux, Windows, мониторы и пр.) с доставкой на дом.
- Performance Review, на котором мы поможем тебе выстроить цели, а также ежегодную индексацию зарплаты.
- Непрерывное обучение: у нас есть внутренняя Академия, а также много партнёрских программ, которые поделятся знаниями не только в профессиональной сфере, но и поддержат твои хобби.
- Митапы, конференции, хакатоны, квесты, онлайн-игры — лишь небольшая часть наших активностей, в которых ты сможешь участвовать.
- Разнообразные корпоративные программы: английский, мастер-классы, развлечения и отдых.
- Классный офис на Тульской с видом на Москву-реку и летней верандой, зонами отдыха, гамаками и прочим.