
DevOps-инженер (Server Infrastructure)
в Yandex Cloud
350 000 — 600 000 ₽/мес на руки
Технологии/инструменты
Команда Server Infrastructure занимается эксплуатацией быстро растущей инфраструктуры Yandex Cloud в рамках подразделения Cloud Foundation Services. Мы строим надёжную и масштабируемую инфраструктуру, поверх которой запускаются виртуальные машины пользователей и внутренние сервисы. В сервисах реализуем различные сценарии работы с железом: от процессов ввода, вывода, починки до бесшовного обновления ОС на всём кластере.
Наши сервисы работают с большим количеством облачных и общих яндексовых систем, собирают данные о хостах, метрики состояния железа и кластера в целом, чтобы планировать обслуживание серверов и распределять ресурсы. Мы предоставляем сервисы и инструменты, которые упрощают и автоматизируют внутренние процессы, делают инфраструктуру прозрачнее и стабильнее, снимают с инженеров рутинную работу.
Под нашим управлением уже более 16 тыс. серверов в трёх дата-центрах Яндекса, и их количество непрерывно растёт. Мы разрабатываем и постоянно совершенствуем способы мониторинга наших серверов и подходы к нему так, чтобы заранее и автоматически диагностировать неполадки и выполнять обслуживание, не дожидаясь выхода серверов из строя.
В работе мы используем
- Golang и Python для разработки сервисов и автоматики.
- SaltStack и Terraform для описания инфраструктуры.
- TeamCity и Spinnaker для процессов CI/CD.
Какие задачи вас ждут
Отказоустойчивость и масштабируемость
Вам предстоит отвечать за здоровье и аптайм облачной инфраструктуры. Обеспечивать её отказоустойчивость, масштабируемость и бесперебойную работу, внедрять современные облачные технологии. Улучшать процессы регулярных учений — отключений ДЦ и внедрения контролируемых отказов инфраструктуры и сервисов.
Вы будете проводить оптимизацию производительности и дебаг возникающих проблем. Поддерживать и развивать облачные системы в новых ДЦ и странах (более 25 000 серверов в России). Участвовать в разборах сбоев, искать root cause и внедрять решения, которые предотвратят повторные проблемы.
Проектирование и автоматизация
Предстоит участвовать в проектировании архитектурных решений для Yandex Cloud и автоматизации инфраструктурных сценариев и процессов. Помогать разработчикам проектировать производительные отказоустойчивые сервисы. Улучшать архитектуру систем управления и автоматизации работы кластера.
Observability и CI/CD
Нужно будет улучшать наши инструменты диагностики, мониторинга. Разрабатывать новые мониторинги и улучшать имеющиеся. Настраивать графики и алерты, уменьшать количество ложных срабатываний, повышать скорость реакции на критические события. Разрабатывать и совершенствовать процессы деплоя инфраструктурных сервисов и пайплайны CI (Kotlin DSL), переводить существующие механизмы на K8s.
Разработка и поддержка сервисов
Вы будете разрабатывать и поддерживать сервисы на Python и Go. Создавать инструменты автоматизации управления инфраструктурой и ускоряющие рутинные задачи.
Мы ждем, что вы
- Писали код на Python и/или Go.
- Работали с Unix-системами и сетевыми технологиями.
- Имели дело с SRE-подходами или DevOps-практиками.
- Любите улучшать процессы и автоматизировать задачи: писали сервисы и утилиты для автоматизации.
- Умеете не только решать проблемы, но и находить причины их возникновения.
- Знаете, как сделать отказоустойчивый масштабируемый сервис.
- Способны учиться и готовы делиться опытом.
Что мы предлагаем
Здоровье
Расширенная медицинская страховка начинает работать с первого месяца в Яндексе. В неё входят: стоматология, ежегодные чекапы, неотложная помощь за рубежом, лечение критических заболеваний, в том числе онкологии, и страхование от несчастных случаев.
А также
- Психотерапия в офисе или онлайн-сервисах.
- Лазерная коррекция зрения через год работы.
- Ведение беременности и роды — через два года.
Страховка для родственников по системе 80/20
- Мы оплачиваем 80% стоимости ДМС для детей и супругов, вы — остальные 20%.
Рост и развитие
В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей.
Также мы оплачиваем участие в профильных конференциях — как в качестве спикера, так и в качестве участника.
Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов.
Спорт
Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей. Можете заниматься самостоятельно, а можете с корпоративным тренером.
А также скидки в фитнес-клубах, бассейнах, студиях йоги, скалодромах и других местах.
Спортивный клуб Яндекса
- В Яндексе есть спортивный клуб и много спортивных команд. У них есть свои лидеры, чаты, программы тренировок. А ещё они регулярно участвуют в забегах, триатлонах, «Гонке героев», футбольных и других соревнованиях. Вы сможете присоединиться к существующим командам или собрать свою.
И еще
- Гибкий график. У нас нет фиксированного времени начала и конца рабочего дня — работайте так, как удобно вам и вашей команде.
- Жилищные займы. Льготная ставка на покупку жилья и улучшение жилищных условий — в зависимости от стажа, позиции и результатов ревью. Действует для сотрудников, работающих в российских офисах Яндекса.
- Всё для детей. Страхование, детские дни в офисе, подарки на рождение детей и чекапы при планировании беременности.

О компании Yandex Cloud
Yandex Cloud — публичная облачная платформа, которая предоставляет корпорациям, среднему бизнесу и частным разработчикам масштабируемую инфраструктуру, сервисы хранения данных, инструменты машинного обучения и средства разработки. С 2018 года платформа выросла вдвое не только по суммарному доходу, но и по клиентской базе: ежедневно сервисы используют более 10 тысяч компаний.