Вакансия в архиве
Компания больше не ищет сотрудника. Посмотрите похожие предложения

Все вакансииSystem AdministrationСанкт-ПетербургMiddle

Системный администратор (Cloud Infrastructure)

в Timeweb Cloud

80 000 —‍ 150 000 ₽/‍мес на руки

📍 Санкт-Петербург (м. Московские ворота)

Гибрид

📍 Весь мир

Удалённо

Специализация

System Administration

Уровень

Middle, Senior

Технологии/инструменты

Linux

systemd

QEMU/KVM

VLAN

BGP

SaltStack

Ansible

Python

Bash

Zabbix

VictoriaMetrics

Ceph

GitLab CI/CD

NUMA

Libvirt

Open vSwitch

VxLAN

Наша ценность — создавать мощные технологичные продукты, за которыми стоит сложная и по-настоящему интересная инженерная работа.

Наша цель — сделать облачные технологии доступными каждому.

Мы ищем системного администратора, который будет заниматься нетиповыми конфигурациями серверов, расследовать сложные инциденты и автоматизировать всё, что движется.

Фокус роли — инфраструктура облака: виртуализация, сеть (overlay/underlay), производительность, инциденты уровня платформы.

Основной результат — устранение первопричин и автоматизация, а не ручные правки на серверах.

Ты — последняя линия обороны: если младшие команды не смогли решить проблему, эстафета переходит к тебе.

Работа не про тикеты пользователей. Это SRE-стиль: инциденты платформы, RCA, улучшения, постмортемы.

Наш стек:

ОС и виртуализация: Linux (ядро, systemd), QEMU/KVM, libvirt.
Сети: VLAN, VxLAN, BGP, OpenvSwitch, OpenFlow, FRR.
Автоматизация: SaltStack, Ansible, Bash, Python (скриптинг).
Мониторинг: Zabbix, Prometheus/Node Exporter, VictoriaMetrics.
Хранилища: базовое взаимодействие с Ceph.
CI/CD: GitLab CI/CD.

Что предстоит делать

Расследование сложных проблем

Анализировать логи, трейсы и метрики, чтобы находить корневые причины инцидентов в любой части облака.
Диагностировать проблемы на уровне Python-сервисов и скриптов (достаточно понимания кода, активная разработка не требуется).
Работать с ядром Linux, сетевым стеком для поиска узких мест.

Проектирование и установка нетиповых конфигураций

Разворачивать распределённые системы в проде и на живой нагрузке.
Оптимизировать производительность хостов виртуализации и сетевых dataplane-компонентов (NUMA, IRQ/RPS, I/O, планировщики).
Участвовать в архитектурном проектировании новых решений вместе с командой.

Автоматизация

Писать скрипты на Bash и Python для автоматизации установки ПО и конфигурации серверов.
Работать с системами управления конфигурациями (SaltStack/Ansible).
Настраивать и развивать мониторинг (Zabbix и другие системы).

On-call и эскалации

Участвовать в дежурствах (примерно неделя в месяц, oncall).
Подключаться к решению аварийных ситуаций, когда штатные средства и младшие команды не справляются.

Мы ждём от тебя

Hard skills

Linux

Глубокое понимание работы ОС: cgroups, namespaces, сетевой стек, systemd, процессы и система инициализации.
Понимание топологии процессоров, включая NUMA, и умение учитывать это при настройке производительности.
Умение расследовать проблемы на уровне ядра и системных вызовов: от анализа логов и strace до поиска узких мест.
Понимание устройства дискового ввода-вывода, файловых систем, вольюм менеджеров и планировщиков.

Виртуализация

Опыт работы с QEMU/KVM и Libvirt.
Понимание различий между виртуальными машинами и контейнерами.

Сети

Понимание VLAN, VxLAN, BGP.
Опыт работы с OpenvSwitch, понимание OpenFlow.

Автоматизация и мониторинг

Опыт работы с SaltStack и/или Ansible.
Настройка и поддержка мониторинга (Zabbix или аналоги).

Скриптинг и диагностика

Python на уровне чтения кода (понимание, что происходит в сервисах и скриптах).
Уверенное владение Bash.

Soft skills

Готовность аргументировать и отстаивать свои технические решения.
Системное мышление и способность выстраивать картину происходящего и доводить её до проверяемых гипотез.

Будет огромным плюсом

Хранилища

Базовое понимание Ceph: что это такое, как на нём строятся S3 и RBD-диски для виртуалок.
Опыт работы с SAN/NAS.

SDN и виртуализация

Опыт работы с OpenStack/OpenNebula/oVirt.
Знакомство с SDN-решениями (OVN, Tungsten Fabric).

Почему тебе стоит откликнуться

Сложные и нестандартные задачи: ты не будешь крутить типовые конфигурации — каждый случай уникален.
Высокий уровень ответственности: ты — последняя инстанция, эскалация для младших команд. Твои решения напрямую влияют на стабильность всего облака.
Развитие экспертизы: ты будешь работать с современными технологиями, углублять знания Linux, сетей и виртуализации на задачах уровня платформы.
Влияние на архитектуру: ты участвуешь в проектировании новых решений, а не просто выполняешь задачи.
Сильная команда: мы собираем инженеров, которым интересно разбираться в сложном и строить надёжные системы.

О компании Timeweb Cloud

Сфера

Продуктовая компания

Размер

201 - 500

Мы — Timeweb Cloud, провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем полноценную IaaS/PaaS-платформу, которая включает сервисы Managed Kubernetes, APPS Platform, DBaaS, объектное хранилище S3, Load Balancing as a Service (LBaaS) и виртуальные приватные сети. Наша цель — создавать мощные и технологичные продукты, за которыми стоит сложная и интересная разработка. Один из основных продуктов — платформа Kubernetes as a Service (KaaS). Мы строим публичное облако и управляем тысячами клиентских кластеров с помощью собственного control plane. Мы не используем готовые решения — мы пишем свою логику оркестрации, автоматизируем установку и масштабирование кластеров.