Timeweb Cloud — российский облачный провайдер с масштабируемой геораспределённой IaaS/PaaS-инфраструктурой. Мы развиваем собственную платформу с сервисами Managed Kubernetes, DBaaS, S3-объектным хранилищем, LBaaS и виртуальными сетями.
У нас высокие требования к надёжности и отказоустойчивости, поэтому ищем сильного лидера для управления L3-командой системных инженеров.
О команде
Системные инженеры — это L3-команда, работающая на переднем крае стабильности платформы. Они следят за мониторингом, устраняют инциденты, обеспечивают ввод серверов в эксплуатацию, участвуют в плановых работах и анализируют сложные ситуации.
Что делать
- Руководить группой системных инженеров: координировать задачи, ставить цели, обеспечивать круглосуточный мониторинг и оперативное реагирование на инциденты.
- Формировать вовлечённую и эффективную команду: развивать сотрудников, проводить 1:1, выстраивать кадровый резерв и культуру ответственности.
- Оптимизировать процессы дежурств, эскалаций, онбординга и управления инцидентами — делая их прозрачными, устойчивыми и управляемыми.
- Обеспечивать стабильность и высокую доступность платформы: устранять риски до инцидентов, проектировать надёжные схемы резервирования и дежурств.
- Внедрять изменения с минимальными рисками и без потери стабильности, ориентируясь на максимальный uptime и качество сервиса.
- Сотрудничать с поддержкой, разработкой и другими командами для повышения надёжности и улучшения взаимодействия.
- Планировать и запускать новые серверы и мощности на основе анализа нагрузки и приоритетов бизнеса.
Требования
- Опыт управления технической командой в сфере инфраструктуры или эксплуатации.
- Знания Linux и опыт администрирования серверов и сервисов.
- Понимание принципов отказоустойчивости, масштабирования, SLA/SLO.
- Лидерские качества: умение вдохновлять команду и внедрять изменения без потери устойчивости.
- Знание технологического стека: Linux/Bash, QEMU/KVM, Zabbix/Prometheus, Dovecot/Exim, Kubernetes/Docker stack.
- Знание SRE-подходов, опыт построения высоконагруженных систем.
- Навыки работы с: Kubernetes, Docker, Zabbix, Prometheus, KVM, Bash.
Будет плюсом
- Опыт работы в облачном провайдере, хостинг-компании или дата-центре.
Мы предлагаем
- Участие в развитии высоконагруженной облачной платформы с реальным влиянием на архитектуру и процессы.
- Гибкий график и гибридный формат: современный офис у м. «Московские Ворота».
- Команду профессионалов, готовую к развитию и переменам.
- Пространство для экспериментов и роста — как технического, так и управленческого.