
Системный администратор (Cloud Infrastructure)
в Timeweb
80 000 — 150 000 ₽/мес на руки
Технологии/инструменты
Мы — Timeweb Cloud, провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем полноценную IaaS/PaaS-платформу, которая включает сервисы Managed Kubernetes, DBaaS, объектное хранилище S3, Load Balancing as a Service (LBaaS) и виртуальные приватные сети.
Наша ценность — создавать мощные технологичные продукты, за которыми стоит сложная и по-настоящему интересная инженерная работа.
Наша цель — сделать облачные технологии доступными каждому.
Мы ищем системного администратора, который будет заниматься нетиповыми конфигурациями серверов, расследовать сложные инциденты и автоматизировать всё, что движется.
Фокус роли — инфраструктура облака: виртуализация, сеть (overlay/underlay), производительность, инциденты уровня платформы.
Основной результат — устранение первопричин и автоматизация, а не ручные правки на серверах.
Ты — последняя линия обороны: если младшие команды не смогли решить проблему, эстафета переходит к тебе.
Работа не про тикеты пользователей. Это SRE-стиль: инциденты платформы, RCA, улучшения, постмортемы.
Наш стек:
- ОС и виртуализация: Linux (ядро, systemd), QEMU/KVM, libvirt.
- Сети: VLAN, VxLAN, BGP, OpenvSwitch, OpenFlow, FRR.
- Автоматизация: SaltStack, Ansible, Bash, Python (скриптинг).
- Мониторинг: Zabbix, Prometheus/Node Exporter, VictoriaMetrics.
- Хранилища: базовое взаимодействие с Ceph.
- CI/CD: GitLab CI/CD.
Что предстоит делать
Расследование сложных проблем
- Анализировать логи, трейсы и метрики, чтобы находить корневые причины инцидентов в любой части облака.
- Диагностировать проблемы на уровне Python-сервисов и скриптов (достаточно понимания кода, активная разработка не требуется).
- Работать с ядром Linux, сетевым стеком для поиска узких мест.
Проектирование и установка нетиповых конфигураций
- Разворачивать распределённые системы в проде и на живой нагрузке.
- Оптимизировать производительность хостов виртуализации и сетевых dataplane-компонентов (NUMA, IRQ/RPS, I/O, планировщики).
- Участвовать в архитектурном проектировании новых решений вместе с командой.
Автоматизация
- Писать скрипты на Bash и Python для автоматизации установки ПО и конфигурации серверов.
- Работать с системами управления конфигурациями (SaltStack/Ansible).
- Настраивать и развивать мониторинг (Zabbix и другие системы).
On-call и эскалации
- Участвовать в дежурствах (примерно неделя в месяц, oncall).
- Подключаться к решению аварийных ситуаций, когда штатные средства и младшие команды не справляются.
Мы ждём от тебя
Hard skills
Linux
- Глубокое понимание работы ОС: cgroups, namespaces, сетевой стек, systemd, процессы и система инициализации.
- Понимание топологии процессоров, включая NUMA, и умение учитывать это при настройке производительности.
- Умение расследовать проблемы на уровне ядра и системных вызовов: от анализа логов и strace до поиска узких мест.
- Понимание устройства дискового ввода-вывода, файловых систем, вольюм менеджеров и планировщиков.
Виртуализация
- Опыт работы с QEMU/KVM и Libvirt.
- Понимание различий между виртуальными машинами и контейнерами.
Сети
- Понимание VLAN, VxLAN, BGP.
- Опыт работы с OpenvSwitch, понимание OpenFlow.
Автоматизация и мониторинг
- Опыт работы с SaltStack и/или Ansible.
- Настройка и поддержка мониторинга (Zabbix или аналоги).
Скриптинг и диагностика
- Python на уровне чтения кода (понимание, что происходит в сервисах и скриптах).
- Уверенное владение Bash.
Soft skills
- Готовность аргументировать и отстаивать свои технические решения.
- Системное мышление и способность выстраивать картину происходящего и доводить её до проверяемых гипотез.
Будет огромным плюсом
Хранилища
- Базовое понимание Ceph: что это такое, как на нём строятся S3 и RBD-диски для виртуалок.
- Опыт работы с SAN/NAS.
SDN и виртуализация
- Опыт работы с OpenStack/OpenNebula/oVirt.
- Знакомство с SDN-решениями (OVN, Tungsten Fabric).
Почему тебе стоит откликнуться
- Сложные и нестандартные задачи: ты не будешь крутить типовые конфигурации — каждый случай уникален.
- Высокий уровень ответственности: ты — последняя инстанция, эскалация для младших команд. Твои решения напрямую влияют на стабильность всего облака.
- Развитие экспертизы: ты будешь работать с современными технологиями, углублять знания Linux, сетей и виртуализации на задачах уровня платформы.
- Влияние на архитектуру: ты участвуешь в проектировании новых решений, а не просто выполняешь задачи.
- Сильная команда: мы собираем инженеров, которым интересно разбираться в сложном и строить надёжные системы.


О компании Timeweb
Timeweb — экосистема международных технологических продуктов в области хостинга, образования, контента и рекламы (более 2 500 серверов, 200 000+ клиентов). Примерно каждый десятый сайт в рунете размещается в Timeweb.