Big Data MegaFon — это команда, которая строит масштабные AI-решения: от рекомендательных систем и речевых технологий до генеративных моделей и внутренних ML-платформ.
Мы активно развиваем направление NLP и GenAI: создаём ассистентов, анализируем тексты и диалоги, проектируем LLM-решения.
Наш стек: Python, PyTorch, Hugging Face, LangChain, LangGraph, vLLM, SGLang, Triton, Docker, Kubernetes, MLflow, Linux, Git.
Чем предстоит заниматься
- Разработка, тестирование и улучшение алгоритмов и моделей NLP в задачах обработки, понимания и генерации естественного языка.
- Исследование и внедрение передовых подходов в области NLP, LLM и мультимодальных моделей (text, audio, image).
- Адаптация и оптимизация LLM под внутренние задачи и домены.
- Внедрение LLM-решений в бизнес-процессы, оценка эффекта и качества моделей.
- Взаимодействие с командами разработки и бизнес-заказчиками.
Что для этого нужно
- Глубокие знания алгоритмов машинного обучения, статистики, принципов работы LLM и NLP моделей (Transformer, Attention, RLHF, RAG и др.).
- Уверенное владение PyTorch, опыт построения и отладки кастомных пайплайнов.
- Наличие успешно реализованных и внедрённых проектов с применением LLM/NLP в продакшене.
- Умение проектировать эксперименты, проводить анализ качества и интерпретировать результаты.
- Самостоятельность, умение принимать технические решения и вести проект.
Будет плюсом
- Опыт менторства и технического лидерства.
- Знание принципов работы и оптимизации LLM-инференса.
- Понимание DevOps/MLOps практик (Docker, Triton, Kubernetes, MLflow).
Примеры задач
- Разработка и масштабирование интеллектуальных ассистентов и агентов на базе LLM для внутренних и внешних пользователей.
- Создание сервисов генерации и анализа текстовой, аудио и визуальной информации.
- Проектирование и оптимизация пайплайнов для работы с корпоративными базами знаний.
- Внедрение подходов оценки качества LLM-решений (LLM-as-judge, automatic evaluation).