MTS Web Services

Senior Data Scientist (MWS Data Copilot, Big Data)

в MTS Web Services

300 000 —‍ 350 000 ₽/‍мес на руки, по версии getmatch

📍 Москва (м. Технопарк)
Санкт-Петербург (м. Горный институт / м. Площадь Александра Невского,)
Гибрид
Специализация
Data Scientist & Machine Learning
Уровень
Senior
Требуемый опыт
3+ лет

Технологии/инструменты

Python
PyTorch
Transformers
Langgraph
LangChain
VLLM
TGI
ClickHouse
PostgreSQL
Vector DBs
Kubernetes
FastAPI
MLflow

МТС Web Services (MWS) — bigtech-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform.

Big Data – один из ключевых юнитов МТС.

Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде.

Мы находимся в поиске Senior ML Engineer в продукт MWS Data Copilot.

MWS Data Copilot — ИИ-ассистент для работы с данными, который преобразует запросы на естественном языке в точные SQL-запросы и аналитические выводы. В основе лежит production-ready Text2SQL-конвейер на мультиагентной архитектуре: система самостоятельно разрешает schema linking среди тысяч таблиц DWH, динамически подбирает few-shot примеры через продвинутый RAG, генерирует и валидирует код, а качество ответов непрерывно улучшается через RLHF на реальных пользовательских логах. Вы будете проектировать семантический слой, выбирать между fine-tuning Open-Source LLM и закрытыми API, выстраивать eval-инфраструктуру и влиять на архитектуру с ранних этапов — это сильный инженерный кейс на стыке NLP, semantic parsing и production ML.

Чем предстоит заниматься

  • Проектировать и развивать конвейер Text-to-SQL: от классификации запроса до генерации и валидации SQL.
  • Внедрять продвинутые техники: Agentic RAG (поиск релевантных таблиц/колонок), dynamic few-shot подбор примеров, Chain-of-Thought reasoning.
  • Разрабатывать компоненты schema linking, которые по вопросу пользователя находят релевантные сущности в DWH, решая проблему attention-окна модели.
  • Создавать «семантический слой»: абстрагировать физическую модель данных в бизнес-понятия (например, «активный пользователь» → сложное условие WHERE).
  • Реализовывать гибридный ML-подход: сравнивать и выбирать между продуктивизацией Open-Source LLM, дообученных под конкретную схему, и закрытыми API, а также внедрять систему обучения с подкреплением (RLHF/RLAIF) на реальных логах диалогов пользователей.
  • Внедрять RLHF/RLAIF-пайплайны на основе реальных диалогов пользователей для улучшения качества ответов.
  • Координировать группу из 2-3 ML-инженеров: декомпозиция задач, планирование спринтов, менторинг, code review.
  • Обеспечивать быстрое прототипирование гипотез с фокусом на eval и production-ready решения.

Что мы ожидаем

  • Опыт работы в ML / NLP / LLM от 3 лет, из них 2+ года — разработка production AI-решений на базе LLM.
  • Глубокое понимание современных подходов: Transformer, attention, embeddings, instruction tuning, reasoning pipelines.
  • Практический опыт создания AI-агентов (1+ год): multi-step reasoning, tool calling, memory, planning; работа с LangGraph, LangChain, AutoGen или аналогами.
  • Экспертиза в MLOps/LLMOps: оптимизация инференса (KV-cache, quantization, speculative decoding), деплой на GPU, работа с vLLM/TGI/TensorRT-LLM.
  • Опыт построения RAG-систем: chunking, reranking, hybrid search, vector DBs; fine-tuning LLM (SFT, LoRA/QLoRA, DPO/RLHF — будет плюсом).
  • Опыт разработки Text2SQL / semantic parsing систем: schema linking, query planning, SQL validation, mitigation hallucinations.
  • Навыки оценки качества AI-систем: offline eval, benchmarking, detection hallucinations, метрики accuracy/faithfulness/latency/cost.
  • Уверенный Python, опыт backend-разработки (FastAPI, async, Microservices), понимание CI/CD, Docker, Kubernetes.

Будет плюсом: опыт координации ML-команды (1+ год): roadmap, декомпозиция, техническое менторство, hiring.

Что мы предлагаем

  • Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах.
  • Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше.
  • Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации.
  • Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch.
  • Полезные курсы и вебинары в корпоративном университете и электронную библиотеку.
  • ДМС с первого месяца работы, включая стоматологию.
  • Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях.
  • Отпуск 28 календарных дней (+3 дополнительных дня за ненормированный рабочий день).
  • Гибридный формат работы.
  • Прием врачей общей практики и массаж в офисе.
  • Мобильная связь за счет компании и льготные тарифы для близких.
  • Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.
MTS Web Services

О компании MTS Web Services

Сфера
Облачные технологии / IT-инфраструктура / PaaS-решения
Инвестиции
Приватное финансирование
Размер
1001+

МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform.