О команде
Ты будешь работать в команде, которая следит за бесперебойной работой IT-систем Точки, а также:
- Развивает процессы и инструменты для повышения надёжности компании.
- Быстро передаёт информацию о сбоях командам, которые за них отвечают.
- Предоставляет удобную и полезную аналитику по сбоям для каждой команды и всей компании.
- Помогает разрабатывать и проверять гипотезы, чтобы сократить ошибки и время их устранения.
В ближайших планах — создать и развивать платформы управления инцидентами, нагрузочного тестирования и инструменты Chaos Engineering. В команде уже есть главный SRE-инженер, дежурные инженеры мониторинга 24/7, IT-аналитики. Сейчас мы расширяемся и ищем опытных разработчиков с фокусом в SRE.
Чем предстоит заниматься
70% времени ты будешь тратить на разработку внутренних инструментов и сервисов для повышения надёжности и наблюдаемости, например:
- Платформу управления инцидентами: референс Grafana Incident, incident io.
- Сервис для управления SLO: референс Pyrra-dev, Sloth.
- Доску или календарь событий по всем изменениям в production.
- Платформу для нагрузочного тестирования.
- Инструменты Chaos Engineering.
В остальное время предстоит:
- Участвовать в развитии SRE-практик в продуктовых командах.
- Проводить анализ первопричин масштабных инцидентов.
- Проводить исследования и эксперименты по повышению надёжности.
- Прорабатывать требования к надёжности информационных систем.
- Участвовать в проектировании целевой IT-архитектуры.
Ты подойдёшь, если
- Есть опыт коммерческой или Open-source разработки на Go от 3 лет.
- Можешь рассказать о своём вкладе в прошлые проекты.
- Понимаешь, что такое асинхронное программирование, работаешь с микросервисной архитектурой.
- Обладаешь хорошими знаниями в System Engineering. Тебя не пугают *nix и Kubernetes.
- Умеешь создавать надёжные и масштабируемые системы. Знаешь основные паттерны дизайна систем на отказ, а также алгоритмы шардирования, кэширования и балансировки.
- Разбираешься в SRE-практиках, понимаешь что такое SLO, MTTR и зачем они нужны.
- Понимаешь, как устроен современный мониторинг. Есть опыт работы как минимум с одним из инструментов Observability: Prometheus, Thanos, VictoriaMetrics, AlertManager, Sentry, Grafana, Coroot или другими релевантными.
- Умеешь смотреть на процессы со стороны и находить то, что можно улучшить или автоматизировать.
Будет преимуществом
- Уверенные знания предметной области управления инцидентами и алертами.
- Опыт разработки системных CLI-утилит или операторов Kubernetes.
- Опыт использования инструментов нагрузочного тестирования: например, JMeter, Yandex Tank, Grafana k6 или других.
Что ждёт тебя в Точке
- Официальная зарплата до 500 000 ₽. Точная сумма зависит от твоих навыков и ожиданий — обсудим их на собеседовании.
- Пятидневная рабочая неделя с гибким началом и окончанием дня.
- Удалёнка или любой офис Точки в городах присутствия. Наши офисы — это продуманные опенспейсы, где есть индивидуальные места для работы, зоны отдыха и кухни с кофе и перекусами. Ты можешь самостоятельно выбрать, где работать — ходить в офис необязательно.
- Возможность работать по-своему. Никто не будет навязывать свои методы, трекать время и контролировать каждое действие. Делаем так, чтобы каждый был услышан и мог влиять.
- Бесплатное обучение: ты сможешь ездить на IT-конференции, митапы и хакатоны и проходить курсы за счёт компании. А ещё пользоваться нашей библиотекой и платформой с онлайн-курсами.
- После испытательного срока: бесплатная страховка здоровья со стоматологией и корпоративный психолог.
- Онлайн-кабинет сотрудника наподобие госуслуг, где ты можешь заказать справку, поставить отпуск или отгул, заказать технику или посмотреть выплаты.
- Активная корпоративная жизнь: мы проводим спортивные марафоны, гастрономические вечера, музыкальные лайвы и многое другое.
Как мы работаем
Кросс-функциональные команды
- В каждой команде есть разработчики, тестировщики, продакты, дизайнеры, редакторы и даже исследователи: синхронизируемся раз в неделю.
Без ограничений
- Мы свободны в принятии технических и продуктовых решений, не трекаем рабочее время и не привязываем к офису. Работать можно когда и где удобно.
Новые технологии
- Внедряем технологии машинного обучения и Big Data в наши продукты и процессы, используем актуальный стек.
Создаём продукт, который любят
- Наш онлайн-банк 5 лет подряд побеждал в рейтинге Markswebb, а ещё у нас есть 30+ других сервисов для бизнеса. Всего с Точкой работают 500 000 клиентов.