Проектировать и поддерживать устойчивую, масштабируемую и высокодоступную инфраструктуру.
Обеспечивать высокую доступность и отказоустойчивость сервисов.
Внедрять и развивать практики мониторинга, алертинга, логирования и observability на базе стека VictoriaMetrics, Grafana и других инструментов.
Обеспечивать полную наблюдаемость систем за счёт организации сбора метрик, логов и трейсов.
Определять, внедрять и поддерживать SLI/SLO, проводить анализ первопричин (RCA) и постмортем-встречи.
Вести техническую экспертизу инцидентов, а также инициировать и реализовывать улучшения на основе проведённого анализа.
Тесно взаимодействовать с командами разработки и DevOps, участвовать в процессах CI/CD и работе над улучшением пайплайнов.
Активно использовать подход "Infrastructure as Code" (Terraform, Ansible) в ежедневной работе.
Присоединяйся!
Мы — Navio.
Мы компания-разработчик технологии и продуктов автономного вождения с применением искусственного интеллекта. Наш флагманский продукт — это универсальная технология автономного вождения, включающая Software и Hardware компоненты, R&D, уникальный процесс тестирования и экосистему сервисов для обработки данных и управления автономным флотом автомобилей. Сегодня наш основной фокус — Автономные магистральные грузоперевозки.
Navio объединяет культуру автопроизводителей и IT-компаний. Больше 800 специалистов каждый день работают над тем, чтобы доставка грузов стала быстрее и эффективнее, а городской транспорт — безопаснее и комфортнее.