Дата-центры — это основа функционирования любой современной IT-компании. Они обеспечивают надёжную работу сервисов, хранение и обработку огромных объёмов данных, поддерживают непрерывность бизнес-процессов. Без эффективных дата-центров невозможно представить работу облачных платформ, онлайн-сервисов, систем машинного обучения и других высокотехнологичных решений.
Мы разрабатываем DCIM — основу современного автоматизированного дата-центра. Наша платформа объединяет управление устройствами, учёт IT-активов, планирование мощностей и мониторинг. Она является критически важной инфраструктурой для работы всех сервисов Яндекса — от облачных гиперскейлеров до финансовых систем и AI/ML-платформ.
Чем предстоит заниматься
- Проектировать и совершенствовать модели данных, которые описывают тысячи единиц оборудования с их сложными взаимосвязями. Это основа для принятия стратегических решений по развитию парка.
- Разрабатывать алгоритмы для оценки и прогнозирования потребления критических ресурсов дата-центров: электропитание, охлаждение, физическое пространство. Ваши решения помогут оптимально планировать развитие инфраструктуры на годы вперёд.
- Развивать системы, которые «по кнопке» настраивают firmware серверов, устанавливают ОС, проводят нагрузочное тестирование и мониторинг состояния оборудования.
Мы ожидаем, что вы
- Уверенно владеете Python и занимались бэкенд-разработкой на нём больше 5 лет.
- Работали с реляционными и нереляционными СУБД.
- Готовы нести ответственность за продукт в целом, а не только за код.
- Имеете опыт работы с CI/CD, контейнерами и системами виртуализации.
- Обладаете системным мышлением и умеете работать со сложными доменными областями.
Будет плюсом
- Глубокое понимание сетевых технологий (в т.ч. различий между IPv4 и IPv6 и других ключевых аспектов).
- Знание архитектуры и принципов работы ядра Linux.
- Интерес к инфраструктурным задачам и аппаратному обеспечению (hardware).
- Опыт работы с большими объёмами данных, включая их обработку и структурирование.