Timeweb

Senior System Administrator (Cloud DBaaS)

в Timeweb

200 000 —‍ 250 000 ₽/‍мес на руки

📍 Санкт-Петербург (м. Московские ворота)
Весь мир
Полная удалёнка
Специализация
System Administration
Уровень
Senior
Требуемый опыт
5+ лет

Технологии/инструменты

Ansible
Bash
ClickHouse
Docker
GitLab
Go
iptables
KVM
MongoDB
MySQL
PostgreSQL
Python
Redis
Salt
SQL
VLAN

О нас

Мы — Timeweb Cloud, провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем полноценную IaaS/PaaS-платформу, которая включает сервисы Managed Kubernetes, APPS Platform, DBaaS, объектное хранилище S3, Load Balancing as a Service (LBaaS) и виртуальные приватные сети. Наша цель — создавать мощные и технологичные продукты, за которыми стоит сложная и интересная разработка.

Один из ключевых продуктов — платформа Database as a Service (DBaaS). Мы предоставляем клиентам managed-инстансы популярных СУБД и очередей: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka.

Мы не используем готовые решения — мы пишем свою логику оркестрации, автоматизируем установку и масштабирование кластеров. Мы ищем инженера, который хочет работать со сложной инфраструктурой, разбираться в устройстве разных типов баз данных, их оптимизации и автоматизации управления.

Что предстоит делать

Развитие платформы

  • Автоматизировать развёртывание и управление тысячами инстансов баз данных с помощью симбиоза собственного control plane и SaltStack.
  • Проектировать архитектуру DBaaS: выбирать и внедрять подходы к резервному копированию (WAL-G, pgBackRest), репликации, failover'у и кластеризации.
  • Участвовать в создании новых продуктов вокруг баз данных: от идеи до продакшна (новые версии СУБД, типы инстансов, дополнительные движки).

Работа с кодом и автоматизацией

  • Писать и поддерживать Salt-модули (states, pillars) для развёртывания и конфигурации СУБД и очередей.
  • Разрабатывать скрипты автоматизации на Python (основной язык для логики управления жизненным циклом баз).
  • Пакетировать ПО: сборка deb-пакетов для внутренних нужд и кастомных версий СУБД.

Администрирование и надёжность

  • Обеспечивать 24/7 доступность сервисов DBaaS и инфраструктурных компонентов: мониторинг, резервное копирование, управление кластерами.
  • Развивать мониторинг и алертинг: работа с Prometheus, VictoriaMetrics, экспортерами (Postgres Exporter, MySQL Exporter и др.), настройка дашбордов в Grafana.
  • Работать с логами: централизованный сбор через Vector, хранение в VictoriaLogs (или аналогичной системе), анализ и алертинг по логам.
  • Расследовать инциденты на уровне компонентов СУБД, ядра Linux и сети.
  • Автоматизировать рутинные операции через CI/CD и скрипты.

Мы ждём от тебя

Hard skills

Базы данных и очереди

  • Знание отличия синхронной и асинхронной репликации, шардирование.
  • Глубокое понимание устройства хотя бы одной из реляционных СУБД (PostgreSQL / MySQL): процессы, журналы, буферы, изоляция транзакций, бэкапы и PITR.
  • Опыт администрирования production-инстансов СУБД и очередей (не менее 4 из списка: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka) — настройка, оптимизация запросов, тюнинг, резервное копирование, репликация.

Linux

  • Экспертный уровень Linux: понимание cgroups, namespaces, systemd, работа с дисками и файловыми системами, умение расследовать проблемы на уровне ОС (лаги, утечки, I/O).
  • Опыт сборки deb-пакетов.
  • Понимание работы systemd на уровне написания своих юнитов.

Сеть

  • Уверенное знание сетевого стека Linux: iptables/nftables, сетевые namespace'ы, тюнинг сетевых параметров для баз данных, диагностика сетевых проблем.
  • VLAN/VXLAN/BGP.

Инструменты автоматизации

  • Опыт работы с системами управления конфигурациями: обязательное знание SaltStack (states, pillars, reactor) или Ansible с готовностью перейти на Salt.
  • Опыт написания скриптов на Python (уровень: автоматизация рутинных задач, написание вспомогательных сервисов).
  • Понимание CI/CD (GitLab CI или аналоги) для автоматизации развёртываний.

Мониторинг и логи

  • Опыт работы с Prometheus и экспортерами, VictoriaMetrics, Grafana.
  • Понимание архитектуры сбора логов: Vector/Fluent Bit, централизованное хранение и анализ.

Виртуализация и контейнеризация

  • Работа с виртуализацией на уровне хоста (KVM/QEMU): управление выделением ресурсов, расследование проблем производительности и эффекта "шумных соседей".
  • Контейнеризация: глубокое понимание работы Docker и контейнерной изоляции (namespaces, cgroups), сборка и оптимизация образов, безопасность контейнеров.

Soft skills

  • Готовность аргументировать и отстаивать свои технические решения.
  • Системное мышление и умение видеть картину целиком: от железа и сети до клиентского опыта.
  • Ответственность за надёжность платформы и умение работать в режиме инцидентов.

Будет огромным плюсом:

Глубокое знание СУБД

  • Опыт настройки асинхронной и синхронной репликации, Patroni, HAProxy/Keepalived для PostgreSQL.
  • Опыт работы с шардированием (Citus, ClickHouse sharding, MongoDB sharding).

Разработка

  • Опыт написания операторов для Kubernetes на Go (если планируется миграция или интеграция).
  • Опыт создания Salt-модулей на Python.

Инфраструктурные сервисы

  • Опыт работы с HashiCorp Vault / OpenBao для управления секретами.
  • Опыт администрирования Harbor (если используются кастомные образы).

Бэкапы

  • Опыт работы с WAL-G, pgBackRest, XtraBackup.

Наш стек

  • Платформа: Виртуальные машины (OpenStack/KVM), собственный control plane на SaltStack.
  • СУБД и очереди: PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Apache Kafka.
  • Бэкапы: WAL-G, pgBackRest, XtraBackup, инструменты дампа.
  • Мониторинг и логи: Prometheus, VictoriaMetrics, VictoriaLogs, Vector, Grafana, экспортеры.
  • CI/CD: GitLab CI.
  • Языки: Python (основной), Go (вспомогательный), Bash.
  • Управление конфигурациями: SaltStack.

Ключевые навыки

PostgreSQL, MySQL, Redis, MongoDB, OpenSearch, ClickHouse, RabbitMQ, Kafka, Linux, SaltStack, Python, Prometheus, VictoriaMetrics, Grafana, Vector, репликация, бэкапы, WAL-G, iptables/nftables, systemd, GitLab CI.

Почему вам стоит откликнуться

  • Масштаб и сложность: Тысячи клиентских баз данных, собственный control plane, высокие нагрузки.
  • Многообразие технологий: Ты будешь работать с восемью различными движками (SQL, NoSQL, очереди) — это уникальный опыт.
  • Влияние на продукт: Ты участвуешь в создании новых фич и сервисов, а не просто поддерживаешь существующее.
  • Развитие в Python: Основной язык команды — Python, ты будешь писать логику автоматизации.
  • Сильная команда: Мы собираем инженеров, которым интересно копать глубоко и строить сложные системы.
Timeweb

О компании Timeweb

Сфера
Продуктовая компания
Размер
201 - 500

Timeweb — экосистема международных технологических продуктов в области хостинга, образования, контента и рекламы (более 2 500 серверов, 200 000+ клиентов). Примерно каждый десятый сайт в рунете размещается в Timeweb.