Компания больше не ищет сотрудника. Посмотрите похожие предложения

Site Reliability Engineer (Внутреннее облако)
в Yandex Infrastructure
200 000 — 350 000 ₽/мес на руки
Технологии/инструменты
Мы развиваем инфраструктурное (внутреннее) контейнерное облако, в котором расположены сервисы, создаваемые тысячами разработчиков Яндекса. Всё ради того, чтобы запуск и эксплуатация сервиса занимали минимум времени, а стоимость ресурсов облака была минимальной.
В нашем облаке развёрнуты как крупные потребители, например Поиск или MapReduce в лице YT, так и десятки тысяч микросервисов, например весь Такси.
Мы не только позволяем настраивать и запускать сервисы, но и даём пользователю всё что нужно, чтобы этот сервис эксплуатировать: настраиваем балансировку, предоставляем мониторинг поднятых сервисов, собираем логи, поддерживаем интеграцию с CI/CD и не только. Мы стремимся сделать из облака единую тесно интегрированную платформу (PaaS), с помощью которой разработчики смогут удобно и надёжно разрабатывать и эксплуатировать свои сервисы, используя как стандартные механизмы API/UI, так и подход Infrastructure as Code.
Под управлением внутреннего облака находятся более 120 тысяч серверов и более 50 тысяч приложений (суммарно около миллиона контейнеров), а также суперкомпьютеры, входящие в мировой топ-100. Чтобы все они работали как положено, мы создаём, поддерживаем и используем множество сервисов и инструментов. При необходимости чиним opensource-компоненты и отправляем патчи в Upstream. Стремимся применять лучшие практики SRE, минимизировать рутину и автоматизировать эксплуатацию.
В нашу команду ищем опытного инженера. Вы будете строить гибридные облака и обеспечивать безопасную эксплуатацию кластера.
Что вам предстоит делать
- Контролировать, как автоматика выполняет критичные операции, устранять конфликты между подсистемами.
- Развивать автоматику, чтобы операции выполнялись более эффективно.
- Заниматься исследованиями и доработками, чтобы разворачивать наши инфраструктурные сервисы на базе вычислительных ресурсов вне Яндекса.
- Искать решения аппаратных проблем и особенностей, улучшать автоматическое обнаружение и устранение проблем.
- Профилировать и тонко настраивать параметры оборудования, ядра, ОС.
Мы ждем, что вы
- Пишете на Go или Python.
- Понимаете, как устроены большие кластеры и как их обслуживать.
- Работали с публичными облаками: AWS, Azure, GCP, Yandex Cloud.
- Имеете опыт работы от 3-х лет.
Будет плюсом, если вы:
- Умеете и любите разбираться в новых технологиях.
- Пишете на C++ и хотите развиваться в системном программировании для ОС Linux.


О компании Yandex Infrastructure
Команда Yandex Infrastructure создаёт и предоставляет внутреннюю инфраструктуру Яндекса — фундамент из продуктов и технологий, на базе которого тысячи инженеров разрабатывают, деплоят и эксплуатируют основные сервисы Яндекса: Поиск, Такси, Маркет, Алису, Кинопоиск и многие другие.