📍 Москва (м. Сухаревская)Можно удалённо из РФ
Мы в Rubbles занимаемся разработкой и внедрением DS-продуктов в крупные бизнесы. Например, системами предсказания спроса на товары в ритейле и FMCG, рекомендательными системами, системами предсказания поломок оборудования, поисковыми системами для онлайн-магазинов, системами оптимизации производства в промышленности, цифровые двойники и многим другим. Алгоритмы Rubbles ежедневно улучшают работу крупнейших банков, ритейл-сетей, нефтегазовых компаний и других предприятий.
Мы ищем Senior MLOps-инженера способного проектировать, разрабатывать и поддерживать такие платформы.
Технологии/инструменты
KubernetesHelmTerraformAnsiblePrometheusGrafanaLokiAirFlowHadoop/SparkMLFlowSeldon CorePythonCI/CDFastAPIFlaskLinux
- Компоненты чаще всего построены на базе открытых решений, например Hadoop/Spark, Terraform, Ansible, JupyterLab, MLFlow, Feast, Seldon Core, Gitlab CI/CD, Prometheus, Grafana, Loki и т.д.
О проектах
Мы разрабатываем MLOps-платформы, которые предназначены для продуктивизации ML-моделей. Типичная платформа включает себя:
- Рабочее место DS/DA/DE.
- Хранилище моделей.
- Фичестор.
- Решение для сервинга моделей.
- Пайплайны и их автоматизация.
- Мониторинг и логирование.
Задачи
- Участие в построении MLOps-платформ на всех этапах, включая аудит, проектирование, разработку и эксплуатацию.
- Взаимодействие с бизнесом, формирование беклога задач MLOps-команды.
- Проработка, распределение задач, проведение код ревью.
- Разработка и поддержание в актуальном состоянии документации по процессу и инструментам.
- Автоматизация процессов обучения, тестирования и доставки моделей в среду исполнения.
- Взаимодействие с тимлидом команды, выработка решений по стеку проекта, внедрению, модернизации инструментов.
- Участие во встречах со смежными техническими командами, защита решений, проработка интеграций.
- Оценка вычислительной и пропускной способности.
- Нагрузочное и функциональное тестирование.
- Обеспечение SLA по уровню доступности сервисов.
- Решение инцидентов и проблем, анализ корневых причин, участие в устранении и расследовании причин сбоев.
Ожидания
- Опыт работы в MLOps-проектах от 3 лет.
- Опыт работы с инструментами развертывания и оркестрации: Kubernetes, Helm, Terraform, Ansible.
- Опыт работы с системами мониторинга и логирования: Prometheus, Grafana, Loki.
- Опыт работы с открытыми решениями, используемыми в MLOps-платформах, такими как AirFlow, Hadoop/Spark, MLFlow, Seldon Core.
- Опыт выработки архитектурных решений и декомпозиции задач.
- Уверенное знание Python.
- Опыт построения CI/CD пайплайнов.
- Опыт разработки REST-сервисов (FastAPI, Flask).
- Знание и практический̆ опыт администрирования Linux-систем.
- Коммуникативные навыки, способность работать, как в команде, так и самостоятельно.
Будет плюсом:
- Знания по принципам работы ML-моделей и методологии их разработки.
- Опыт работы с инфраструктурой облачных провайдеров, таких как AWS, Azure, Google Cloud Platform, Я.Облако.
- Знание Argo-стека: ArgoCD, ArgoWorkflow, ArgoEvents.
Условия
- Работа в одной из самых сильных ML-команд в России.
- Участие в росте компании, работающей на перспективном AI-рынке.
- Гибкий график работы, гибкое предоставление отгулов и отпусков.
- Гибкий формат работы: полная удаленка/гибрид/офис в Москве. Но для данной позиции важно находиться в пределах РФ.
- Поддержка в профессиональном и карьерном росте, оплата профильного обучения, конференций и книг, корпоративные скидки на курсы английского.
- Совместная работа с опытными разработчиками, аналитиками данных, менеджерами, продуктологами.
- ДМС со стоматологией после испытательного срока (3 месяца) по всей России.
- При желании работать из офиса — уютный офис в центре Москвы (2 минуты от м. Сухаревская) со всем необходимым для комфортной работы.
Особенно актуальное:
- Мы аккредитованная ИТ-компания со всеми вытекающими льготами.
Елена Амвросова Recruiter