📍 Москва (м. Смоленская)Санкт-Петербург (м. Площадь Ленина)Офис или гибрид
Специализация
Data Science / Machine Learning
Каждый месяц миллионы человек выбирают товары в тысячах магазинов на Маркете. Наш сервис располагает огромной базой данных о предложениях магазинов, актуальной информацией о ценах и наличии товаров, сроках и стоимости доставки. Маркет помогает пользователям выбирать лучшие товары, а продавцам — продвигать свой ассортимент.
Большим преимуществом Маркета на рынке E-commerce являются автоматические инструменты для систематизации предложений на площадке маркетплейса. Это позволяет продавцам выгружать данные о своих товарах на сервис в виде неструктурированных текстов, а дальше происходит магия Маркета, и товары отображаются на сервисе в удобном для пользователя виде.
Технологии/инструменты
SQLHadoopPyTorch
Наши алгоритмы работают в трёх больших направлениях
- Для пользователей — обеспечение удобного поиска товаров по структурированному каталогу с возможностью фильтровать товары по параметрам, обеспечение конкуренции цен предложений продавцов на карточках товаров.
- Для аналитиков рынка — сопоставление внешних данных с каталогом товаров Маркета для построения отчётов об объёмах продаж в различных сегментах рынка и оптимизации процессов ценообразования собственного ассортимента.
- Для внутренних процессов Маркета — оптимизация и ускорение процессов модерации контента за счёт предоставления саджестов и рекомендаций, снижение порога входа на Маркет для продавцов.
Какие задачи вас ждут
Собирать различные выборки и обучать на них модели машинного обучения (в том числе BERT, DSSM, CatBoost, YandexGPT).
- Мы в команде решаем задачи, связанные с матчингом товаров между собой, классификацией товаров по товарному дереву и автоматизацией ручных процессов и разметок.
- Мы постоянно разрабатываем новые инструменты, адаптируем существующие под конкретные бизнес-задачи, а также внедряем крупные ML-технологии, появляющиеся в Яндексе.
Взаимодействовать с системами краудсорсинга по разметке данных для обучения.
У нас нет пользовательских логов в привычном понимании, поскольку наши пользователи — продавцы. Для новой задачи почти никогда нет готовой разметки, её приходится собирать с помощью асессоров. Вы будете участвовать в составлении инструкций для асессоров и в борьбе за качество разметки, строить процессы автоматизации сбора таких данных.
Исследовать данные Маркета и делать выводы на их основе.
Вам предстоит анализировать партнёрский контент — описание, параметры и прочую метаинформацию о товарах, а также историю прохождения конкретных товаров через внутренние бизнес-процессы, делать выводы об эффективности этих процессов и искать узкие места.
Мы ждём, что вы
- Имеете опыт работы от 3-х лет.
- Обладаете аналитическим складом ума.
- Разрабатывали нейросети с использованием PyTorch или другого фреймворка для работы с текстами.
- Понимаете принципы работы распределённых вычислительных систем, работали со стеком Hadoop (Spark, Hive).
- Знаете классические алгоритмы и структуры данных.
- Способны самостоятельно искать и находить ответы на вопросы, разбираться в сложных системах и сервисах, читая код и документацию.
- Хорошо знаете SQL, умеете писать сложные запросы.
- Способны быстро обучаться и воспринимать большой объём новой информации.
Будет плюсом, если вы:
- Стремитесь учиться и развиваться в области анализа данных.
- Имели опыт продакшн-разработки на Java.
- Работали системным аналитиком.
- Знакомы с системами Unix.
Что мы предлагаем
- Официальное трудоустройство.
- Современный офис с парковкой и всем необходимым для комфортной работы и отдыха.
- Вакансию в команде талантливых экспертов, у которых можно многому научиться и перенять полезный опыт, в компании с развитой культурой открытости и взаимопомощи. У нас работают увлечённые люди, которые любят своё дело и всегда готовы помочь.
- Компенсацию оплаты питания на территории офиса и в его окрестностях.
- Гибкий график, возможность частично удалённой работы: главное — это результат.
- Расширенную программу ДМС со стоматологией, обследованиями, вызовом врача на дом, оплату 80% стоимости ДМС для супругов и детей.
- Достойный доход и премии каждые полгода для всех, кто работает эффективно.
- Возможность участвовать в образовательных программах, лекциях, митапах Яндекса.
- Возможность быстро увидеть результаты своей работы в продукте, которым пользуются миллионы людей вокруг.
Анна Романова IT Recruiter