Все вакансииData Scientist & Machine LearningМоскваSenior

Senior AI/ML Engineer (LLM Agents & Classical ML)

в Название скрыто

от 383 000 ₽/‍мес на руки

📍 Москва (м. Технопарк)

Гибрид

📍 Россия

Новосибирская область

Екатеринбург

Санкт-Петербург

Омск

Казань

Нижний Новгород

Удалённо

Специализация

Data Scientist & Machine Learning

Уровень

Senior

Требуемый опыт

5+ лет

Технологии/инструменты

Langgraph

VLLM

LightGBM

XGBoost

PySpark

Kubernetes

FastAPI

Hadoop

MLflow

Docker

Ключевое о роли

это позиция на стыке двух миров. Мы ищем инженера, для которого LLM-агентные системы и классический ML — равноценные части работы. Вам предстоит не просто экспериментировать, а строить продакшен-решения, где надежность банка сочетается с гибкостью современных моделей.

О команде и проекте

Команда Collateral Machine автоматизирует оценку залогов в банке. Наш флагман — Залоговый Copilot: агентная LLM-система, которая берет на себя рутину от анализа документов до подготовки решений, постепенно выводя человека из операционной цепочки (но сохраняя контроль качества).

Ваша задача: развивать архитектуру агентов и одновременно поддерживать и улучшать классические ML-модели оценки имущества.

Наш стек

Основное (LLM/агенты): Python 3.10+, LangChain/LangGraph, Pydantic AI, vLLM/LiteLLM, Langfuse/Langsmith, векторные БД (pgvector/Milvus/Qdrant), Hugging Face Transformers.

ML и данные: pandas, scikit-learn, LightGBM/XGBoost, PyTorch, spaCy, Spark, Hive, Hadoop, Airflow, MLflow.

Инфраструктура и сервисы: FastAPI, Docker, Kubernetes, GitLab, Prometheus, Grafana.

Стек большой — не нужно владеть всем. Под основным мы понимаем то, на чём держится продукт; остальное используется точечно. Важнее инженерное мышление и сила в LLM и классическом ML, чем галочка по каждой технологии.

Задачи

проектировать и выводить в прод LLM-агентов и ассистентов для работы с залогами: multi-step и agentic workflow, оркестрация моделей, инструментов и внешних сервисов.
строить и развивать RAG-системы поверх залоговых документов и структурированных данных банка.
проектировать архитектуру LLM-решений с явным учётом trade-off'ов по качеству, latency, стоимости, надёжности и наблюдаемости.
выстраивать систему оценки качества (eval) агентов: датасеты, метрики, отлов регрессий при смене промптов и моделей.
обеспечивать надёжность и безопасность LLM-систем в банковском контуре: guardrails, защита от prompt injection и утечек данных, контроль галлюцинаций.
участвовать во всём жизненном цикле решения — от обсуждения задачи с бизнесом и декомпозиции до деплоя и мониторинга в production.
общаться с бизнес-заказчиками напрямую, превращать их боли в технические задачи, а не в «красивый график».
поддерживать и развивать ML-составляющую оценки имущества там.
следить за развитием области LLM и агентов и аргументированно решать, что стоит и что не стоит тащить в прод.
работать в Agile/LeSS и участвовать в улучшении подходов команды.

Требования

LLM и агентные системы — ядро роли

опыт продуктового внедрения LLM-систем: хотя бы одна система с реальными пользователями, доведённая до прода (а не пет-проект или демо в ноутбуке), с метриками и интеграцией в процессы компании.
опыт построения production-grade retrieval (RAG и за его пределами): гибридный поиск и reranking, агентный/multi-hop retrieval, понимание трейд-оффов между retrieval и длинным контекстом; умение строить retrieval с аудируемым следом для регулируемых решений, а не просто «поиск похожих чанков».
опыт разработки мультиагентных систем: проектирование multi-step и agentic workflow, оркестрация моделей и инструментов, интеграция со структурированными и неструктурированными источниками.
уверенный context engineering: управление контекстом и персистентной памятью между сессиями (накопление состояния от взаимодействия к взаимодействию), компактизация, логика прогрузки.
умение самостоятельно проектировать архитектуру сложного LLM-решения с обоснованием архитектурных решений (качество / latency / стоимость / надёжность / развиваемость).
практика оценки качества LLM-систем: построение eval-датасетов, выбор метрик, отлов регрессий — критично для продукта, где LLM влияет на решения.
понимание рисков LLM в проде: галлюцинации, prompt injection, утечки данных и как с этим бороться.

Инженерная база

сильный Python (3.10+), умение писать продакшен-код, а не только эксперименты.
опыт LLMOps/MLOps: версионирование, воспроизводимость, мониторинг качества в проде, автоматизация пайплайнов деплоя.
уверенная работа с данными: сбор, очистка и первичное исследование датасетов.
навык работы с кодинг-агентами (Claude Code, Codex и подобными).

Классический ML — равноценная часть роли

практический опыт классического (в т.ч. табличного) ML на senior-уровне: построение, обучение и улучшение моделей оценки имущества (LightGBM/XGBoost, scikit-learn).
уверенный feature engineering и анализ качества данных: контроль корректности признаков и глубокое понимание ограничений источников.
полный цикл ML-модели в проде: от гипотезы и экспериментов до деплоя, мониторинга и контроля дрейфа данных.
умение балансировать классические ML-подходы и LLM — выбирать правильный инструмент под задачу, а не тащить LLM туда, где достаточно бустинга (и наоборот).

Soft-составляющая

умение вести техническую дискуссию простым языком с разными стейкхолдерами.
стратегическое мышление: видеть общую картину и тренды, балансировать детальный и абстрактный уровни.
продуктовый взгляд: ориентация на пользу и долгосрочное развитие, а не на разовый результат.
готовность брать задачу end-to-end и нести за неё ответственность.

Будет плюсом

опыт работы с big-data стеком: Spark, Airflow, Hadoop/Hive.
опыт с NLP-задачами на документах (spaCy, Transformers) — у нас много неструктурированных залоговых документов.
опыт с банковскими/регулируемыми доменами и требованиями к explainability решений.
практический опыт настройки observability для LLM (трейсинг вызовов, дашборды по качеству и расходам на токены).
опыт с графами знаний / семантическим слоем для retrieval (актуально для связанных сущностей: залог, заёмщик, оценка, обременения).

Условия и бенефиты

локация: Москва (возможна удаленная работа).
возможность работать над комплексными задачами, которые видны бизнесу и напрямую влияют на процессы банка.
продуктовый подход: мы нацелены на внедрение и результат, а не только на research.
работу в сильной команде с опытными коллегами.
современный технологический стек и пространство для профессионального роста.
ДМС со стоматологией, массажем, телемедициной, ежегодными чек-апами, которое работает как в Москве, так и в регионах.
страхование от несчастных случаев и онкологических заболеваний, страхование выезжающих за границу.
поддержка опытного наставника, обучающие курсы для комфортной адаптации, помощь в развитии экспертизы со стороны профессиональных сообществ банка.
бесплатные индивидуальные консультации психологов, юристов, экспертов по личным финансам и консультантов по здоровому образу жизни, карьерные консультации.
льготные условия на банковские продукты и услуги.
скидки от партнеров банка в приложении PrimeZone в сферах здоровья, развлечений, творчества и интернет-покупок.