
Senior System Administrator (Cloud DBaaS)
в Timeweb
200 000 — 250 000 ₽/мес на руки
Технологии/инструменты
О нас
Мы — Timeweb Cloud, провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем полноценную IaaS/PaaS-платформу, которая включает сервисы Managed Kubernetes, APPS Platform, DBaaS, объектное хранилище S3, Load Balancing as a Service (LBaaS) и виртуальные приватные сети. Наша цель — создавать мощные и технологичные продукты, за которыми стоит сложная и интересная разработка.
Один из ключевых продуктов — платформа Database as a Service (DBaaS). Мы предоставляем клиентам managed-инстансы популярных СУБД и очередей: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka.
Мы не используем готовые решения — мы пишем свою логику оркестрации, автоматизируем установку и масштабирование кластеров. Мы ищем инженера, который хочет работать со сложной инфраструктурой, разбираться в устройстве разных типов баз данных, их оптимизации и автоматизации управления.
Что предстоит делать
Развитие платформы
- Автоматизировать развёртывание и управление тысячами инстансов баз данных с помощью симбиоза собственного control plane и SaltStack.
- Проектировать архитектуру DBaaS: выбирать и внедрять подходы к резервному копированию (WAL-G, pgBackRest), репликации, failover'у и кластеризации.
- Участвовать в создании новых продуктов вокруг баз данных: от идеи до продакшна (новые версии СУБД, типы инстансов, дополнительные движки).
Работа с кодом и автоматизацией
- Писать и поддерживать Salt-модули (states, pillars) для развёртывания и конфигурации СУБД и очередей.
- Разрабатывать скрипты автоматизации на Python (основной язык для логики управления жизненным циклом баз).
- Пакетировать ПО: сборка deb-пакетов для внутренних нужд и кастомных версий СУБД.
Администрирование и надёжность
- Обеспечивать 24/7 доступность сервисов DBaaS и инфраструктурных компонентов: мониторинг, резервное копирование, управление кластерами.
- Развивать мониторинг и алертинг: работа с Prometheus, VictoriaMetrics, экспортерами (Postgres Exporter, MySQL Exporter и др.), настройка дашбордов в Grafana.
- Работать с логами: централизованный сбор через Vector, хранение в VictoriaLogs (или аналогичной системе), анализ и алертинг по логам.
- Расследовать инциденты на уровне компонентов СУБД, ядра Linux и сети.
- Автоматизировать рутинные операции через CI/CD и скрипты.
Мы ждём от тебя
Hard skills
Базы данных и очереди
- Знание отличия синхронной и асинхронной репликации, шардирование.
- Глубокое понимание устройства хотя бы одной из реляционных СУБД (PostgreSQL / MySQL): процессы, журналы, буферы, изоляция транзакций, бэкапы и PITR.
- Опыт администрирования production-инстансов СУБД и очередей (не менее 4 из списка: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka) — настройка, оптимизация запросов, тюнинг, резервное копирование, репликация.
Linux
- Экспертный уровень Linux: понимание cgroups, namespaces, systemd, работа с дисками и файловыми системами, умение расследовать проблемы на уровне ОС (лаги, утечки, I/O).
- Опыт сборки deb-пакетов.
- Понимание работы systemd на уровне написания своих юнитов.
Сеть
- Уверенное знание сетевого стека Linux: iptables/nftables, сетевые namespace'ы, тюнинг сетевых параметров для баз данных, диагностика сетевых проблем.
- VLAN/VXLAN/BGP.
Инструменты автоматизации
- Опыт работы с системами управления конфигурациями: обязательное знание SaltStack (states, pillars, reactor) или Ansible с готовностью перейти на Salt.
- Опыт написания скриптов на Python (уровень: автоматизация рутинных задач, написание вспомогательных сервисов).
- Понимание CI/CD (GitLab CI или аналоги) для автоматизации развёртываний.
Мониторинг и логи
- Опыт работы с Prometheus и экспортерами, VictoriaMetrics, Grafana.
- Понимание архитектуры сбора логов: Vector/Fluent Bit, централизованное хранение и анализ.
Виртуализация и контейнеризация
- Работа с виртуализацией на уровне хоста (KVM/QEMU): управление выделением ресурсов, расследование проблем производительности и эффекта "шумных соседей".
- Контейнеризация: глубокое понимание работы Docker и контейнерной изоляции (namespaces, cgroups), сборка и оптимизация образов, безопасность контейнеров.
Soft skills
- Готовность аргументировать и отстаивать свои технические решения.
- Системное мышление и умение видеть картину целиком: от железа и сети до клиентского опыта.
- Ответственность за надёжность платформы и умение работать в режиме инцидентов.
Будет огромным плюсом:
Глубокое знание СУБД
- Опыт настройки асинхронной и синхронной репликации, Patroni, HAProxy/Keepalived для PostgreSQL.
- Опыт работы с шардированием (Citus, ClickHouse sharding, MongoDB sharding).
Разработка
- Опыт написания операторов для Kubernetes на Go (если планируется миграция или интеграция).
- Опыт создания Salt-модулей на Python.
Инфраструктурные сервисы
- Опыт работы с HashiCorp Vault / OpenBao для управления секретами.
- Опыт администрирования Harbor (если используются кастомные образы).
Бэкапы
- Опыт работы с WAL-G, pgBackRest, XtraBackup.
Наш стек
- Платформа: Виртуальные машины (OpenStack/KVM), собственный control plane на SaltStack.
- СУБД и очереди: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Apache Kafka.
- Бэкапы: WAL-G, pgBackRest, XtraBackup, инструменты дампа.
- Мониторинг и логи: Prometheus, VictoriaMetrics, VictoriaLogs, Vector, Grafana, экспортеры.
- CI/CD: GitLab CI.
- Языки: Python (основной), Go (вспомогательный), Bash.
- Управление конфигурациями: SaltStack.
Ключевые навыки
PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka, Linux, SaltStack, Python, Prometheus, VictoriaMetrics, Grafana, Vector, репликация, бэкапы, WAL-G, iptables/nftables, systemd, GitLab CI.
Почему вам стоит откликнуться
- Масштаб и сложность: Тысячи клиентских баз данных, собственный control plane, высокие нагрузки.
- Многообразие технологий: Ты будешь работать с восемью различными движками (SQL, NoSQL, очереди) — это уникальный опыт.
- Влияние на продукт: Ты участвуешь в создании новых фич и сервисов, а не просто поддерживаешь существующее.
- Развитие в Python: Основной язык команды — Python, ты будешь писать логику автоматизации.
- Сильная команда: Мы собираем инженеров, которым интересно копать глубоко и строить сложные системы.

О компании Timeweb
Timeweb — экосистема международных технологических продуктов в области хостинга, образования, контента и рекламы (более 2 500 серверов, 200 000+ клиентов). Примерно каждый десятый сайт в рунете размещается в Timeweb.