Вакансия в архиве
Компания больше не ищет сотрудника. Посмотрите похожие предложения

Site Reliability Engineer (Внутреннее облако)

в Yandex Infrastructure

200 000 —‍ 350 000 ₽/‍мес на руки

📍 Москва (м. Парк культуры)

Санкт-Петербург (м. Площадь Ленина)

Гибрид

Специализация

DevOps

Уровень

Senior

Требуемый опыт

3+ лет

Технологии/инструменты

Go/Python

AWS

Azure

GCP

Yandex Cloud

Мы развиваем инфраструктурное (внутреннее) контейнерное облако, в котором расположены сервисы, создаваемые тысячами разработчиков Яндекса. Всё ради того, чтобы запуск и эксплуатация сервиса занимали минимум времени, а стоимость ресурсов облака была минимальной.

В нашем облаке развёрнуты как крупные потребители, например Поиск или MapReduce в лице YT, так и десятки тысяч микросервисов, например весь Такси.

Мы не только позволяем настраивать и запускать сервисы, но и даём пользователю всё что нужно, чтобы этот сервис эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), с помощью которой разработчики смогут удобно и надёжно разрабатывать и эксплуатировать свои сервисы, используя как стандартные механизмы API/UI, так и подход Infrastructure as Code.

Под управлением внутреннего облака находятся более 120 тысяч серверов и более 50 тысяч приложений (суммарно около миллиона контейнеров), а также суперкомпьютеры, входящие в мировой топ-100. Чтобы все они работали как положено, мы создаём, поддерживаем и используем множество сервисов и инструментов. При необходимости чиним opensource-компоненты и отправляем патчи в Upstream. Стремимся применять лучшие практики SRE, минимизировать рутину и автоматизировать эксплуатацию.

В нашу команду ищем опытного инженера. Вы будете строить гибридные облака и обеспечивать безопасную эксплуатацию кластера.

Что вам предстоит делать

Контролировать, как автоматика выполняет критичные операции, устранять конфликты между подсистемами.
Развивать автоматику, чтобы операции выполнялись более эффективно.
Заниматься исследованиями и доработками, чтобы разворачивать наши инфраструктурные сервисы на базе вычислительных ресурсов вне Яндекса.
Искать решения аппаратных проблем и особенностей, улучшать автоматическое обнаружение и устранение проблем.
Профилировать и тонко настраивать параметры оборудования, ядра, ОС.

Мы ждем, что вы

Пишете на Go или Python.
Понимаете, как устроены большие кластеры и как их обслуживать.
Работали с публичными облаками: AWS, Azure, GCP, Yandex Cloud.
Имеете опыт работы от 3-х лет.

Будет плюсом, если вы:

Умеете и любите разбираться в новых технологиях.
Пишете на C++ и хотите развиваться в системном программировании для ОС Linux.

О компании Yandex Infrastructure

Сфера

Продуктовая компания

Команда Yandex Infrastructure создаёт и предоставляет внутреннюю инфраструктуру Яндекса — фундамент из продуктов и технологий, на базе которого тысячи инженеров разрабатывают, деплоят и эксплуатируют основные сервисы Яндекса: Поиск, Такси, Маркет, Алису, Кинопоиск и многие другие.