Привет! Это команда "Факторы ранжирования".
У нас петабайты реальных логов событий пользователей и возможности быстро проверять гипотезы, которые влияют на продукт, которым пользуются десятки миллионов людей. Мы делаем прогрессивные вещи и применяем cutting-edge-технологии. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D-лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления. Мы ищем DS в новообразованную группу "Факторов ранжирования". Группа отвечает за весь процесс разработки и внедрения факторов: от первичного анализа данных до организации хранения и реализации расчета факторов в поисковом runtime.
Наш стек: Python, PySpark, ClickHouse, Airflow, MLflow, PyTorch, CatBoost, Java.
Вы будете
- Заниматься полным циклом разработки факторов для моделей ранжирования со стороны ML: исследование исходных данных, автоматизации пайплайнов для регулярных расчетов факторов и агрегатов на PySpark, проведение приемки разработанных факторов.
- Разрабатывать новые сложные факторы ранжирования в поиске и каталоге: текстовые на основе foundation-моделей, персонализация, факторы из рекомендаций и др.
- Искать подходящие ML-решения для бизнес-задач, планировать и проводить офлайн- и онлайн- (А/Б) эксперименты.
Примеры задач
- Разработка процедуры приемки для offline-оценки полезности разработанных факторов.
- Разработка факторов под нужды отдельных товарных категорий (одежда, продукты с express-доставкой и др.).
- Разработка факторов для достижения различных бизнес-целей компании: снижение сроков доставки заказанных из поиска товаров, достижение более конкурентной цены товаров в поисковой выдаче и др.
- Оптимизация хранения и процесса расчета факторов за счет разделения на расчет агрегатов в Hadoop и вычисления конечных факторов по агрегатам в поисковом runtime.
- Улучшение существующего DSSM-фактора с помощью использования foundation-модели карточки товара с целью улучшить релевантность поисковой выдачи.
Нам важно
- Опыт работы в Data Science от 3 лет.
- Уверенные теоретические знания ML.
- Сильный Python.
- Уверенное знание Hadoop-стека, опыт работы с большими данными.
Будет плюсом
- Опыт работы с рекомендательными системами/NLP.
- Опыт работы с высоконагруженными системами.
- Опыт разработки на Java.
Мы предлагаем
- Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.
- Свободу действий в принятии решений.
- Достойный уровень заработной платы.
- Профессиональную команду, которой мы гордимся.
- Возможность развиваться вместе с нашим бизнесом.