
Data Scientist (Deep Personalization / Deep Learning)
в Avito
350 000 — 500 000 ₽/мес на руки
Технологии/инструменты
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды "Авито" разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы.
О команде
Мы отвечаем за персонализацию и рекомендации: развиваем двухбашенную трансформерную модель (retrieval) и запускаем трек генеративных рекомендаций (SIDS, OneRec, PLUM и т.п.). Работаем в полном цикле — от данных и обучения до продакшен-инференса и A/B-экспериментов.
Вам предстоит
- Проектировать и поддерживать пайплайны данных на Spark для рекомендаций: витрины, фичи, контроль качества, инкрементальные обновления.
- Развивать мультимодальные рекомендации: использовать текст и изображения объявлений, подключать внешние эмбеддинги и улучшать способы их интеграции.
- Улучшать контур продакшена: регулярные обновления моделей, экспорт и оптимизация (например, ONNX).
- Внедрять моделей не только в рекомендации, но и в поисковые и ассистентские сценарии.
- Развивать U2I / retrieval-дообучение на целевые действия и сигналы (например, клики/контакты/покупки).
- Развивать и ускорять пайплайны обучения: multi-GPU и multi-node обучение, оптимизация throughput/стабильности, отладка распределённых джобов.
- Заниматься ресерчем и прототипированием в генеративных рекомендациях: listwise/session-wise generation, SFT/дообучение, RL-подходы, подготовка к online-экспериментам.
Мы ждём, что вы
- Уверенно пишете на одном или нескольких языках программирования; у нас в основном Python.
- Хорошо владеете PyTorch и имеете продакшен-опыт обучения DL-моделей на больших данных (важен опыт построения пайплайнов, датасетов, метрик, воспроизводимости экспов).
Будет здорово, если вы:
- Понимаете, как устроены рекомендации: метрики, классические и DL-подходы, и можете задизайнить базовый двухстадийный стек (candidate generation + ranking).
- Работали со Spark/SQL на больших объёмах данных.
- Имеете опыт в одном или нескольких направлениях: NLP / CV / RL.
Работа у нас — это
- Возможность улучшать опыт миллионов пользователей.
- Интересные и сложные задачи на большом масштабе.
- Сильная команда, которая всегда готова прийти на помощь.
- Возможность изучать и пробовать новое, мощное железо для этого.
- Бюджет на обучение, который можно тратить на курсы или профессиональную литературу.
- Забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист.
- Возможность работать удалённо или из офисов в четырёх городах России.

О компании Avito
Avito — самый популярный сайт объявлений в России, классифайд №1 в мире. Месячная аудитория составляет 57,4 млн. — это больше трети населения России. Количество активных объявлений превысило 125 млн. Каждую секунду на “Авито” совершается более восьми сделок. А география сервиса — это вся Россия — от Калининграда до Дальнего Востока.