Ищем Lead Site Reliability Engineer в Точку. Мы — финтех-компания, создающая онлайн-банк и другие сервисы для предпринимателей и предприятий. Ими пользуются более 600 000 клиентов, а создают больше 4 000 сотрудников в России и за границей.
Технологии/инструменты
Java/Python/GoGitBitbucketDockerKubernetesCI/CDGitlab CITeamCityPrometheusGrafanaELK
- У нас микросервисная архитектура. Команды работают с последними технологиями, областями вроде машинного обучения и big data, а также свободны в принятии технических и продуктовых решений.
- Заботимся о качестве кода: проводим ревью, всё покрываем тестами и даём обратную связь.
- Используем гибкие методологии в разработке: Scrum или Kanban, в зависимости от типа продуктов. Пользуемся OKR для формирования целей, но не ограничиваемся ими.
- Каждая продуктовая команда может самостоятельно выбирать стек разработки. Мы делаем много проектов на Python (asyncio, aiohttp, FastAPI), Java (Spring, Spring Boot), Go.
- Работаем с Kubernetes, Consul, Vault.
- Много асинхронного взаимодействия на RabbitMQ, Kafka и работы с микросервисной архитектурой.
- Мониторинг на Prometheus, ELK, Grafana.
Что в Точке необычного
- Лидеры вместо начальников. Никто не будет контролировать твой рабочий день, следить за каждым действием и говорить, как конкретно идти к цели. Лидер всегда готов поддержать и помочь — только скажи.
- Не стоим на месте. Обмениваемся знаниями внутри команд и прокачиваем друг друга, ездим на конференции за счёт компании, раз в полгода обновляем индивидуальный план развития.
- Сами принимаем решения. Не нужно ждать согласований «сверху»: каждый принимает решения в рамках своей зоны ответственности. А ещё можно влиять на продукт: мы учитываем идеи друг друга.
- Работаем там, где удобно. Не ограничиваем передвижения сотрудников: можно работать из дома, в любом офисе или из другой страны. Но в первые три месяца лучше быть рядом с командой в офисе.
О команде
Ты будешь работать в команде, которая следит за бесперебойностью IT-систем Точки. Мы оперативно эскалируем сбои до команд-владельцев, даём удобную и полезную аналитику по сбоям каждой команды и Точке в целом. Помогаем формировать и проверять гипотезы для сокращения количества ошибок и времени их устранения. В команде: дежурные инженеры, IT-аналитики по разным направлениям, разработчики сервисов.
Точка растёт, поэтому увеличивается количество сбоев, их последствия становятся больше. Поэтому ищем человека, который выстроит работу в этом направлении и будет его лидировать.
Что делать
- Повышать надежность продуктов и сервисов Точки. Внедрять и развивать SRE практики в командах продуктовой разработки.
- Формировать и поддерживать в актуальном состоянии метрики надежности продуктов Точки.
- Разрабатывать и дорабатывать инструменты повышения надежности информационных систем.
- Развивать и оптимизировать процесс работы со сбоями.
- Повышать и поддерживать в актуальном состоянии observability приложений.
- Предлагать и проверять гипотезы, которые помогут повысить стабильность и надежность продуктов и сервисов Точки. Автоматизировать рутинную работу дежурных инженеров.
- Формировать ранбуки и иную документацию для повышения стабильности и надежности систем.
Ты подойдёшь, если
- Есть опыт внедрения и развития SRE-практик.
- Уверенно владеешь одним из языков программирования: Java, Python, Go.
- Знаешь, что такое стандартизация контрактов надёжности продуктов и сервисов, формирование SLO и SLI, SLA и OLA, развитие процесса работы с инцидентами.
- Работаешь с системами контроля версий Git, Bitbucket, системами контейнеризации и оркестрации Docker и K8S.
- Работаешь с CI/CD системами: Gitlab CI и TeamCity.
- Есть опыт работы с системами мониторинга Prometheus и Grafana, агрегаторами логов ELK.
- Есть опыт работы со сложными архитектурами распределенных систем.
- Можешь организовать свою работу и делаешь нужное без контроля и напоминаний.
- Легко находишь общий язык с людьми и умеешь понятно объяснять сложные вещи.
- Умеешь выстраивать процессы, смотреть на них со стороны и находить то, что можно улучшить или автоматизировать.
Что ждёт тебя в Точке
- Официальная зарплата от 400 000 ₽. Точная сумма зависит от твоих навыков и ожиданий — обсудим их на собеседовании.
- Пятидневная рабочая неделя с гибким началом и окончанием дня.
- Удалёнка или любой офис Точки в городах присутствия. Наши офисы — это продуманные опенспейсы, где есть индивидуальные места для работы, зоны отдыха и кухни с кофе и перекусами. Ты можешь самостоятельно выбрать, где работать — ходить в офис необязательно.
- Возможность работать по-своему. Никто не будет навязывать свои методы, трекать время и контролировать каждое действие. Делаем так, чтобы каждый был услышан и мог влиять.
- Бесплатное обучение: ты сможешь ездить на IT-конференции, митапы и хакатоны и проходить курсы за счёт компании. А ещё пользоваться нашей библиотекой и платформой с онлайн-курсами.
- После испытательного срока: бесплатная страховка здоровья со стоматологией и корпоративный психолог.
- Онлайн-кабинет сотрудника наподобие госуслуг, где ты можешь заказать справку, поставить отпуск или отгул, заказать технику или посмотреть выплаты.
- Активная корпоративная жизнь: мы проводим спортивные марафоны, гастрономические вечера, музыкальные лайвы и многое другое.
Анна Волкова IT Recruiter