Вакансия в архиве
Компания больше не ищет сотрудника. Посмотрите похожие предложения
2ГИС

Data Scientist (NLP)

в 2ГИС

от 200 000 ₽/мес на руки

📍 Москва (м. Кутузовская)Санкт-Петербург (м. Маяковская)НовосибирскМожно удалённо из РФ
Специализация
Data Science
Уровень
Middle

Мы расширяем NLP-команду 2ГИС и ищем несколько Data Scientist уровня Middle или Senior.

Мы являемся сервисной командой и решаем различные задачи для заказчиков внутри нашей компании.

Технологии/инструменты

PythonScikit-learnPyTorch/TensorFlow/NumPyGitJenkinsJiraGitlabRabbitMQKafkaCI/CDBERTBARTТ5TransformerspyonmttokVowpal WabbitGensimCBOW
  • Пишем на PyTorch, делаем Unit-тесты, используем CI, Jenkins, Git, Merge Request и Review — всё, что нужно для командной работы.

Основные сферы деятельности нашей команды

  • Товары/услуги в продукте — занимаемся майнингом данных, дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий.
  • UGC (User Generated Content) — занимаемся извлечением фактов из отзывов компаний (aspect extraction), модерацией отзывов, суммаризацией (задача multi-document summarization).
  • Поиск — разрабатываем системы исправления опечаток, транслитерации, улучшаем точность и полноту поиска.
  • Автоматическая валидация и сбор данных о фирмах. В задачах валидации и сборки данных о фирмах используем инструменты собственной разработки для парсинга сотен тысяч страниц с целью поиска и валидации контента на них. В ближайшем будущем предполагается решать задачи автоматической генерации различного контента.

Ожидания

  • Опыт работы над NLP-задачами от двух лет.
  • Хорошее знание Python.
  • Опыт работы с PyTorch и/или TensorFlow + NumPy, Scikit-learn.
  • Опыт работы с инструментами разработки и CI/CD — Git, Jenkins, GitLab, Jira.
  • Опыт работы с брокерами сообщений: RabbitMQ, Kafka.
  • Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т. п.), LLM (+ методов их тюнинга RLHF, Lora).
  • Знание классических методов — классические языковые модели, TF-IDF, Skip-gram, CBOW, CRF, FSTs, HMM.
  • Опыт использования библиотек — KenLM, Transformers, NLTK, pyonmttok, Vowpal Wabbit, Gensim и т.п.

Будет плюсом:

  • Опыт участия в соревнованиях по машинному обучению (Kaggle/Boosters.pro и т.п.).

Почему у нас хорошо

  • Мы аккредитованная IT–компания.
  • Само собой, полностью белая зарплата, размер которой обсуждаем на собеседовании.
  • Есть ДМС и все классические IT-плюшки.
  • Еще у нас можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, у нас есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске.
  • Для комфортной работы доставим всё, что нужно и организуем встречи с командой онлайн и офлайн.
Екатерина Шорникова IT Recruiter
2ГИС

О компании 2ГИС

Сфера
Продуктовая компания
Инвестиции
$40M
Размер
1001+

2ГИС — IT-компания, которая помогает людям жить в городе. Они делают карту со справочником и навигатор. Их сервис работает в более чем 1200 городах России, Казахстана, ОАЭ и ещё семи стран. Каждый месяц их продукты используют более 50 млн пользователей.

За их сервисами стоит 40 команд профессиональных разработчиков. Пишут на C++, .NET, Objective-C, C#, Java, Kotlin, JavaScript, PHP, Go, Python, Scala и Swift. Тестируют автоматически и вручную, по заветам ООП и методам тест-дизайна. Сторонним разработчикам предоставляют доступ через API и SDK.

Похожие вакансии

5 000 – 6 500 €/мес на руки
📍 Лимасол (Кипр), полная удалёнка
400 000 – 500 000 ₽/мес на руки
📍 Москва (м. Краснопресненская), Санкт-Петербург (м. Беговая), можно удалённо из РФ
400 000 – 500 000 ₽/мес на руки
📍 Москва (м. Кутузовская), офис несколько дней в неделю
3 500 – 5 000 €/мес на руки
📍 Лимасол (Кипр), Санкт-Петербург (м. Беговая), помощь с переездом
380 000 – 440 000 ₽/мес на руки
📍 Москва, можно удалённо из РФ