Специализация
Data Science / Machine Learning
Мы делаем ИТ для ритейла реального времени.
Наши ИТ-продукты автоматизируют разные этапы цепочки создания ценности для клиента доставки: закупки, логистику, работу дарксторов, сборку и доставку заказа до двери, управление промокампаниями и остальные этапы большого процесса. Используем интеллектуальные системы прогнозирования, а разные этапы выполнения заказа автоматизируем роботическими системами.
Наши ключевые направления: Быстрая доставка, Маркетплейс, Логистика.
Наша цель — сделать все необходимые ИТ-инструменты и инфраструктуру, чтобы все нужные товары могли попадать домой к людям мгновенно (насколько это возможно в физическом мире).
Сейчас несколько команд в поиске опытного ML-инженера/дата-сайентиста, которому предстоит заниматься задачами NLP.
Технологии/инструменты
Python
Что у нас интересного
- Масштаб: разрабатываем инструменты для крупнейших в России сервисов ритейла реального времени.
- Вызовы: мы массовые и технологичные, новые и надёжные, меняем модель потребления — тут нет готовых решений, но есть пространство для творчества и экспериментов.
- Темп: в 2020 году наши ИТ-продукты помогали доставлять 1.6 миллиона заказов в месяц в 4 городах России, сейчас — более 10 миллионов заказов в месяц в более чем 100 городах.
NLP-проекты в команде Клиентских сервисов:
Диалог. Разработка чатбота-консультанта для подбора товаров на МегаМаркет.
- ML-задачи: генерация текста, карты знаний для LLM, RAG-системы, выделение сущностей (NER), классификация (интенты, тематика диалога и тд), обучение.
- Продуктовые задачи: аналитика логов общения чатбота с пользователями, предложение и разработка дополнительных навыков чатбота для закрытия основных проблем.
Модерация контента (отзывы, вопросы, ответы, комментарии), определение оптимальной бонусной цены за оставленный отзыв, генерация ответов на пользовательские вопросы по товарам, разработка суммаризированного отзыва:
- ML-задачи: классификация, суммаризация/перифраз, оптимизация размера бонусных выплат, тематическое моделирование, генерация текста.
- Продуктовые задачи: доработка системы модерации контента, борьба с новыми видами фрода (сгенерированные отзывы и тд). Определение оптимального размера выплат за пользовательские отзывы в зависимости от товара.
SEO. Генерация контента на карточке товара для повышения внешнего трафика из Google, Яндекс (описания товаров, мета-теги веб-страниц).
- ML-задачи: Генерация текста, перифраз, проверка сгенерированного текста на галлюцинации.
- Продуктовые задачи: улучшение алгоритмов составления мета-тегов веб-страниц. Повышение качества сгенерированных описаний под товарами. Экстракция дополнительной информации по характеристикам товарам из картинок/отзывов и тд.
Что мы ждём от тебя
- Опыт работы с ML-моделями от 3 лет (классическими и NLP, с NLP не менее 2 лет).
- Опыт разработки на Python в ML от 3 лет.
- Опыт продуктивизации классических/NLP моделей.
- Структурное мышление, системный подход.
Будет плюсом:
- Опыт работы с LLM.
- Опыт разработки ML-сервисов.
- Опыт общения с продуктом/бизнесом.
Работа в Samokat tech
- Все классические условия: Samokat.tech — аккредитованная IT-компания, поэтому: белая зарплата и ДМС, возможность работать удаленно или ходить в офис в Москве или Санкт-Петербурге.
- Сообщество: внутри — комьюнити и митапы; снаружи — митапы и конференции; собственное внешнее мероприятие Samokat Tech Meetup; Open Source; Хабр.
- Атмосфера: собираемся на неформальные встречи команд, проводим English-клуб и разное другое — развиваться, отдыхать и жить чуть-чуть интереснее.