📍 Москва (м. Аэропорт)Офис или гибрид
Специализация
Data Scientist & Machine Learning
Технологии/инструменты
Python/C++PyTorchTransformers
Сегодня почти вся онлайн-жизнь собрана в почтовых и облачных сервисах. Лента фото и документов в Облаке, билеты, заказы и чеки в Почте — это далеко не все артефакты, которые при правильном подходе могут улучшить качество онлайн-потребления для пользователей Mail. Наша задача как ML-команды машинного обучения заключается в том, чтобы эту информацию отфильтровать, структурировать и предоставить пользователю в наиболее удобном и ценном виде. Это умная часть сервисов Mail.
Что мы предлагаем
- Возможность работать над продуктами, которыми пользуются миллионы людей.
- Реализация передовых ML-решений в HighLoad-окружении: через нас проходят миллиарды писем и файлов пользователей, которые необходимо обрабатывать и анализировать.
- Работа над широким спектром задач: классический ML, NLP/LLM, CV.
- Возможность тесной связи с продуктовыми командами и прямое влияние на ключевые бизнес-показатели.
Мы ищем специалистов, которые
- Любят разбираться во внутренних тонкостях алгоритмов и кастомизировать их для повышения продуктового эффекта.
- Проявляют живой интерес к последним тенденциям в машинном обучении и практикам разработки, стремятся их применять в наших сервисах.
Мы будем рады вашему отклику и при обоюдном интересе предложим условия и проекты, от которых не захочется отказываться.
Задачи
- Representation learning для описания поведения и интересов пользователей.
- Извлечение сущностей и создание событий в Календаре и Покупках.
- Развитие наших LLM-моделей.
- Разработка нейродайджеста.
- Автоматизация поддержки пользователей генеративными и дискриминативными моделями.
Требования
- Отличное знание основ машинного обучения.
- Два-три года опыта разработки с использованием Python/C++.
- Уверенное знание теории вероятностей и математической статистики.
- Понимание структур данных и алгоритмов.
- Знания современных алгоритмов обработки естественного языка (Word Embeddings, LSTM, Transformers, LLM, etc.).
- Опыт работы с библиотеками для глубокого обучения (PyTorch, Transformers, etc.).
Будет плюсом
- Отличные коммуникативные навыки.
- Опыт разработки микросервисных архитектур.
- Знание стека технологий Hadoop (Spark/YT).
- Опыт работы с фреймворками LLM/TensorRT.
- Опыт обучения LLM с использованием RL, а также разработки проектов на базе агентов и RAG.
- Опыт использования Docker/Kubernetes.
Евгений Кузнецов Менеджер по подбору персонала