
Senior/Middle AI Engineer (LLM)
в Салют для Бизнеса
от 300 000 ₽/мес до налогов

Технологии/инструменты
Мы — команда GigaChat Enterprise, дочерняя организация Сбера, мы занимаем лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Мы предлагаем полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации. В своей работе мы помогаем нашим партнерам перейти от экспериментов с технологией к промышленному масштабированию, обеспечивая безопасность, адаптивность и экономическую выгоду.
Обязанности
- Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation.
- Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking).
- Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя.
- Настраивать и оптимизировать векторный и гибридный поиск.
- Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов.
- Разрабатывать агентные системы с использованием инструментов и многошаговым планированием.
- Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели.
- Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy).
- Контейнеризировать и деплоить решения на on-prem инфраструктуру.
Требования
- Опыт работы от 3 лет.
- Опыт работы с AI-инструментами: от года.
- Опыт создания RAG-систем.
- Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference.
- Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках.
- Знание LangChain, LlamaIndex.
- LLM-инференс: OpenAI API, GigaChat API, LLM, Ollama.
- Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch.
- Знание Hybrid search: BM25 + dense retrieval, reciprocal rank fusion.
- Опыт построения Embedding-модели: e5, bge, multilingual-e5.
- Знание Python, Git, Docker, Docker Compose.
- Знание PostgreSQL, Redis.
- Методы оценки: hit rate, RAGAS, human evaluation.
- Способность объяснить принятые технические решения и их trade-offs.
Условия
- Достойная заработная плата + годовой бонус.
- Сильная команда.
- ДМС, с первого рабочего дня.
- Работа в аккредитованной IT-компании.
- Льготная ипотека от Сбера.
- Локация: Москва, м. Цветной бульвар, формат работы преимущественно удалённый / гибридный с редкими визитами в офис в Москве по необходимости.

О компании Салют для Бизнеса
Команда ООО "Салют для бизнеса", дочерняя организация Сбера, занимает лидирующие позиции в сфере коммерциализации технологии GenAI с продуктом GigaChat. Предлагает полный цикл решений: LLM-модель GigaChat для локальной и облачной инсталляции, инфраструктуру для GenAI, платформу для разработки агентных систем, готовые GenAI-решения для быстрого старта в типовых задачах, реализацию уникальных клиентских кейсов, консалтинг по GenAI-трансформации.