YT, или YTsaurus в опенсорсе, — основная платформа Яндекса для хранения и обработки больших данных, ad-hoc-аналитики, построения ETL-задач и регулярных batch-процессов. В YT работает почти четверть всех вычислительных мощностей компании, а в самом большом кластере — больше миллиона процессорных ядер, десятки тысяч подов и тысячи физических серверов.
YT — очень большой сервис, состоящий из нескольких команд, которые отвечают за разные подсистемы YT.
Наша команда занимается эксплуатацией кластеров YT как внутри компании, так и для опенсорс-версии. При таких объёмах ручное управление кластерами обречено на провал, поэтому основная задача нашей команды — разработка инструментов автоматизации рутинных задач по обслуживанию кластеров как для нас самих, так и для смежных команд YT.
У нас небольшая дружная команда, которая решает очень разнообразные задачи. Если вы хотите расширить свой кругозор, увидеть, как работают очень большие информационные системы, узнать, какие процессы нужны для их эффективной и безопасной эксплуатации, мы ждём вас.
Мы развиваем и поддерживаем ряд сервисов взаимодействия с инфраструктурой компании. Два основных — сервис автоматической починки оборудования и сервис автоматизированного управления правами. Первый выполняет большую часть рутинных работ по безопасному выводу оборудования для починки или обслуживания и позволяет силами небольшой команды управлять десятками тысяч серверов. Второй сервис интегрирует систему прав и пользователей YT-кластеров в общую для всей компании систему управления доступами. Каждый день выполняются сотни переконфигураций прав без непосредственного участия команды YT.
Наша команда разрабатывает инструменты для автоматизации конфигурирования и обновлений кластеров YT. Этими инструментами пользуются наши коллеги для самостоятельного обновления и конфигурирования различных компонентов системы.
Управление мониторингами и нотификацией, управление конфигурациями, планирование и проведение регламентных работ на кластерах YT, управление железом, YT-кластерами в Yandex Cloud с опенсорс-версией сервиса, расследование инцидентов и траблшутинг — все эти задачи выполняет наша команда или помогает с ними коллегам из YT. Примерно две трети наших инструментов написаны на Go, остальные — на Python. Около 50% времени наши инженеры занимаются разработкой, часть времени уходит на задачи по реконфигурации кластеров и проведению регламентных операций.
Будет плюсом, если вы
Здоровье
А также
Страховка для родственников по системе 80/20
Рост и развитие
В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей.
А также
Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов.
Спорт
Во всех крупных офисах Яндекса есть спортзалы со всем необходимым: тренажёрами, спортивным инвентарём, душевыми, шкафчиками для одежды и вещей. Можете заниматься самостоятельно, а можете с корпоративным тренером.
А также
Спортивный клуб Яндекса
И ещё
Команда Yandex Infrastructure создаёт и предоставляет внутреннюю инфраструктуру Яндекса — фундамент из продуктов и технологий, на базе которого тысячи инженеров разрабатывают, деплоят и эксплуатируют основные сервисы Яндекса: Поиск, Такси, Маркет, Алису, Кинопоиск и многие другие.