📍 Москва (м. Молодёжная)Санкт-Петербург (м. Чернышевская)Полная удалёнка
Мы ищем опытных инженеров, готовых принять участие в захватывающем проекте по созданию совершенно новой платформы PaaS с нуля. Если вы готовы к вызову и желаете принести свой вклад в создание инновационных решений для мониторинга, то это место для вас!
Технологии/инструменты
PrometheusJaegerLokiOpsgeniePythonGo
О команде
Мы работаем над переносом старой системы мониторинга на совершенно новую платформу и развитием инфраструктуры для мониторинга, логирования и трейсинга. Наши задачи включают в себя такие важные аспекты, как обеспечение высокой доступности, разработка инструментов для отладки и мониторинга, а также создание клиентских библиотек для интеграции с системами мониторинга, трейсинга и логирования.
Вам предстоит
- Эксплуатировать и развивать систему мониторинга на базе Prometheus и long-term хранения данных.
- Развивать системы логирования на базе Loki.
- Обеспечивать разработчиков инструментами для отладки и мониторинга — дашбордами, логами, трейсами и алертами.
- Разрабатывать клиентские библиотеки, которые инструментируют сервисы для интеграции с системами мониторинга, трейсинга и логирования.
- Планировать инфраструктуру и обеспечивать отказоустойчивость высокой доступности указанных систем совместно с системными инженерами.
- Собирать метрики со всех подсистем — от браузера пользователя до дисковой подсистемы на сервере баз данных.
- Заниматься написанием экспортеров метрик для Prometheus.
- Поддерживать внутренних пользователей, формировать базу знаний.
- Обеспечивать круглосуточную и бесперебойную работу текущей инфраструктуры.
Требования
- Хорошо знакомы с эксплуатацией софта и работали с системами мониторинга (Prometheus), трейсинга (Jaeger), логирования (Loki) и алертинга (OpsGenie и аналоги).
- Имеете опыт разработки на Python, Go.
- Вам интересен анализ, проектирование и решение проблем в масштабных распределенных системах.
- Умеете дебажить и оптимизировать код, автоматизировать рутинные операции.
- Есть опыт описания инфраструктуры как код.
- Умеете искать узкие места в архитектуре приложений.
- Умеете определять критерии работоспособности приложений.
Условия
- Официальное трудоустройство и соблюдение норм ТК РФ.
- Комфортный график работы, возможны гибкие форматы в зависимости от команды и проектов.
- Возможен полностью удаленный или гибридный формат работы — при необходимости готовы организовать удаленное оформление.
- Расширенный пакет ДМС и страхование от несчастных случаев с первого месяца работы, льготное ДМС для близких родственников, страхование имущества и пр.
- Компенсация мобильной связи (корпоративная сим-карта) для тех, кому нужно всегда быть на связи.
- Рост и развитие в компании: регулярная обратная связь каждому сотруднику, обучающие мероприятия и широкий доступ к материалам, в том числе ведущих образовательных платформ.
- Скидки для сотрудников на недвижимость группы "Самолет", индивидуальные условия по рассрочке.
Ксения Небыкова IT Researcher