
Data Scientist (NLP Search)
в 2ГИС
от 300 000 ₽/мес на руки

Технологии/инструменты
Привет! Мы — команда NLP Search, делаем поиск организаций в нашем продукте умнее, точнее и удобнее для пользователей. Разрабатываем AI-алгоритмы поиска, ранжирования, понимания текстовых данных и извлечения информации, которые помогают миллионам людей находить нужные места и компании, даже если запросы содержат ошибки или сложные формулировки.
Мы расширяем команду и ищем NLP-инженера, который поможет нам улучшать понимание пользовательских запросов, развивать ML-модели для поиска и работать с большим объемом данных.
Какие задачи мы решаем
- Разрабатываем ML-модели для поиска и ранжирования организаций по пользовательским запросам.
- Улучшаем механизмы понимания и обработки поисковых запросов: сегментация текста, исправление опечаток, генерация автодополнений.
- Разрабатываем ML-модели для объяснимости выдачи: связывание товаров, услуг, атрибутов и отзывов с организациями.
- Делаем классификацию и кластеризацию запросов и организаций для повышения точности поиска.
- Разрабатываем ML-модели для саммаризации отзывов, извлечения фактов и других полезных данных из неструктурированных текстов.
Мы ждем, что Вы
- Работаете над NLP-задачами более 3 лет и имеете опыт реализации решений в реальных продуктах.
- Хорошо понимаете архитектуры современных моделей: BERT, T5, GPT и их вариации — знаете их сильные и слабые стороны.
- Владеете Python и уверенно работаете с PyTorch, Hugging Face Transformers и другими ключевыми ML/DL-библиотеками.
- Умеете строить полный ML-пайплайн: от исследований и обучения до вывода модели в продакшен и поддержки инференса.
- Работали с задачами semantic search, query understanding, извлечения embedding-представлений и reranking.
- Умеете оценивать качество поисковых систем: Recall@K, MRR, NDCG, как в offline, так и в A/B-тестах.
Будет крутым бонусом, если Вы
- Знаете принципы оптимизации ML/DL-моделей и использовали библиотеки Triton, FasterTransformer, ONNX и другие.
- Разрабатывали ML-модели для задач поиска и ранжирования, в частности системы генерации кандидатов и dense retrieval с использованием FAISS, Usearch, ColBERT.
- Имеете опыт взаимодействия с backend/infra: FastAPI, Docker, gRPC, Kafka, Clickhouse, Kubernetes.
- Работали с инструментами для разработки LLM инфраструктуры: LangChain, LoRA/PEFT, vLLM, SGLang и другие.
- Участвовали в исследовательских или pet-проектах в области NLP – особенно приветствуются статьи, open-source и публичные демо.
Почему стоит к нам присоединиться
- Сложные задачи в реальном продукте – миллионы пользователей, огромный справочник организаций, разнообразие и сложность данных.
- Свобода выбирать технологии – мы используем передовые ML/NLP-инструменты и ищем лучшие решения.
- Влияние на продукт – у вас будет возможность создавать полезные фичи, которые делают поиск лучше и помогают людям каждый день.
- Сильная команда – с которой можно расти и масштабировать крутые ML-решения.
- Фокус на эксперименты – много A/B-тестирования, исследовательской работы, поиск оптимальных архитектур.
- Современный стек — PyTorch, Transformers, LangChain, Triton, ONNX, FastAPI, Kafka, Kubernetes.
Почему у нас классно
- 2ГИС — аккредитованная IT-компания.
- Можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске. А также коворкинги в Нижнем Новгороде, Томске, Астане, Алма-Ате.
- Само собой, полностью белая зарплата.
- Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента.
- Если хочешь делиться своим опытом, мы только за – поможем с выступлениями на конференциях и статьями для Хабра/VC.
- Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.
Приходите, у нас хорошо. Как у других, только лучше.


О компании 2ГИС
2ГИС — IT-компания, которая помогает людям жить в городе. Они делают карту со справочником и навигатор. Их сервис работает в более чем 1200 городах России, Казахстана, ОАЭ и ещё семи стран. Каждый месяц их продукты используют более 80 млн пользователей.
За их сервисами стоит 40 команд профессиональных разработчиков. Пишут на C++, .NET, Objective-C, C#, Java, Kotlin, JavaScript, PHP, Go, Python, Scala и Swift. Тестируют автоматически и вручную, по заветам ООП и методам тест-дизайна. Сторонним разработчикам предоставляют доступ через API и SDK.