Компания больше не ищет сотрудника. Посмотрите похожие предложения

Data Scientist (NLP)
в 2ГИС
от 200 000 ₽/мес на руки

Технологии/инструменты
Мы расширяем NLP-команду 2ГИС и ищем несколько Data Scientist уровня Middle или Senior.
Мы являемся сервисной командой и решаем различные задачи для заказчиков внутри нашей компании.
Стек команды:
- Пишем на PyTorch, делаем Unit-тесты, используем CI, Jenkins, Git, Merge Request и Review — всё, что нужно для командной работы.
Основные сферы деятельности нашей команды
- Товары/услуги в продукте — занимаемся майнингом данных, дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий.
- UGC (User Generated Content) — занимаемся извлечением фактов из отзывов компаний (aspect extraction), модерацией отзывов, суммаризацией (задача multi-document summarization).
- Поиск — разрабатываем системы исправления опечаток, транслитерации, улучшаем точность и полноту поиска.
- Автоматическая валидация и сбор данных о фирмах. В задачах валидации и сборки данных о фирмах используем инструменты собственной разработки для парсинга сотен тысяч страниц с целью поиска и валидации контента на них. В ближайшем будущем предполагается решать задачи автоматической генерации различного контента.
Ожидания
- Опыт работы над NLP-задачами от двух лет.
- Хорошее знание Python.
- Опыт работы с PyTorch и/или TensorFlow + NumPy, Scikit-learn.
- Опыт работы с инструментами разработки и CI/CD — Git, Jenkins, GitLab, Jira.
- Опыт работы с брокерами сообщений: RabbitMQ, Kafka.
- Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т. п.), LLM (+ методов их тюнинга RLHF, Lora).
- Знание классических методов — классические языковые модели, TF-IDF, Skip-gram, CBOW, CRF, FSTs, HMM.
- Опыт использования библиотек — KenLM, Transformers, NLTK, pyonmttok, Vowpal Wabbit, Gensim и т.п.
Будет плюсом:
- Опыт участия в соревнованиях по машинному обучению (Kaggle/Boosters.pro и т.п.).
Почему у нас хорошо
- Мы аккредитованная IT–компания.
- Само собой, полностью белая зарплата, размер которой обсуждаем на собеседовании.
- Есть ДМС и все классические IT-плюшки.
- Еще у нас можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, у нас есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске.
- Для комфортной работы доставим всё, что нужно и организуем встречи с командой онлайн и офлайн.


О компании 2ГИС
2ГИС — IT-компания, которая помогает людям жить в городе. Они делают карту со справочником и навигатор. Их сервис работает в более чем 1200 городах России, Казахстана, ОАЭ и ещё семи стран. Каждый месяц их продукты используют более 80 млн пользователей.
За их сервисами стоит 40 команд профессиональных разработчиков. Пишут на C++, .NET, Objective-C, C#, Java, Kotlin, JavaScript, PHP, Go, Python, Scala и Swift. Тестируют автоматически и вручную, по заветам ООП и методам тест-дизайна. Сторонним разработчикам предоставляют доступ через API и SDK.