2ГИС

Data Scientist (NLP Core)

в 2ГИС

от 300 000 ₽/мес на руки

Можно удалённо из РФ
Специализация
Data Scientist & Machine Learning
Уровень
Middle-to-Senior
Требуемый опыт
3+ лет

Технологии/инструменты

PyTorchGitPythonHF TransformersvLLMSGLangLangChainLlamaIndex

Привет! Мы — команда NLP Core, специализируемся на актуализации и сборе данных о компаниях. Работая с неструктурированной и сложной информацией, мы превращаем хаос данных в структурированные и качественные информационные потоки, обеспечивая высокую точность, полноту и актуальность контента в продукте. Наша работа напрямую влияет на качество сервиса и лояльность пользователей. Мы разрабатываем алгоритмические и ML-решения для автоматизации задач, применяя весь спектр инструментов NLP-стека: от расстояния Левенштейна и линейных моделей до коммерческих LLM и их локальных аналогов.

Мы расширяем команду и ищем NLP-инженера которому интересно работать с большими и сложными наборами данных, развивать ML-решения, структурируя их и приводя в порядок.

Какие задачи мы решаем

  • Добыча данных — умные системы для поиска товаров, контактов, описаний и других данных, связанных с компаниями.
  • Поддержка актуальности информации о компаниях — с помощью данных и моделей проводим валидацию существующей информации о компаниях, добываем новую.
  • Категоризация товаров — автоматическая классификация товаров на основе их описаний и характеристик.
  • Модерация данных — предотвращаем публикацию нежелательных отзывов и товаров в продукте.

Наши ожидания от кандидата

  • Опыт работы с NLP-задачами 3+ лет.
  • Уверенное владение PyTorch, HF Transformers и основными библиотеками для обработки текста и ML/DL.
  • Глубокое понимание LLM: архитектуры моделей, файнтюнинга, техник улучшения качества генерации.
  • Опыт применения LLM-стека.
  • Низкоуровневых решений на vLLM, SGLang.
  • Инструментов для оркестрации и интеграции LangChain, LlamaIndex.
  • Навыки применения классических, глубоких и LLM-моделей.
  • Уверенные навыки разработки на Python и владение Git.
  • Готовность работать на всех этапах разработки: от анализа проблемы и проведения экспериментов до оценки решений и их реализации в виде сервисов.

Будет крутым бонусом

  • Опыт работы с CI/CD и инфраструктурой: Docker, GitLab, Kubernetes, Kafka, FastAPI, gRPC.
  • Глубокое знание Python: multiprocessing, asyncio.
  • Навыки интеграции и деплоя ML-моделей в продуктовые серверные приложения.
  • Навыки оптимизации инференса ML/DL-моделей: distillation, pruning, ORT, Triton.

Почему стоит к нам присоединиться

  • Сложные задачи в реальном продукте — сотни тысяч организаций, горы связанных с ними данных разной степени структурированности.
  • Свобода выбирать технологии — мы используем как классические алгоритмы, так и передовые ML-решения.
  • Влияние на продукт — разрабатываемые нами решения улучшают пользовательский опыт в продуктах компании.
  • Сильная команда — с которой можно расти и умножать свои знания, принося общий вклад.
  • Фокус на исследования — в первую очередь мы занимаемся поиском оптимальных подходов по качеству и производительности.

Почему у нас классно

  • 2ГИС — аккредитованная IT-компания.
  • Можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске. А также коворкинги в Нижнем Новгороде, Томске, Астане, Алма-Ате.
  • Само собой, полностью белая зарплата.
  • Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента.
  • Если хочешь делиться своим опытом, мы только за — поможем с выступлениями на конференциях и статьями для Хабра/VC.
  • Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.

Приходите, у нас хорошо. Как у других, только лучше.

Юлия Минубаева IT Recruiter
2ГИС

О компании 2ГИС

Сфера
Продуктовая компания
Инвестиции
$40M
Размер
1001+

2ГИС — IT-компания, которая помогает людям жить в городе. Они делают карту со справочником и навигатор. Их сервис работает в более чем 1200 городах России, Казахстана, ОАЭ и ещё семи стран. Каждый месяц их продукты используют более 80 млн пользователей.

За их сервисами стоит 40 команд профессиональных разработчиков. Пишут на C++, .NET, Objective-C, C#, Java, Kotlin, JavaScript, PHP, Go, Python, Scala и Swift. Тестируют автоматически и вручную, по заветам ООП и методам тест-дизайна. Сторонним разработчикам предоставляют доступ через API и SDK.

Похожие вакансии

8 100 – 10 000 $/мес на руки
Полная удалёнка
8 000 – 13 000 $/мес на руки
📍 EC, Великобритания, США, полная удалёнка, помощь с переездом
8 000 – 12 000 $/мес на руки
📍 ЕС, Великобритания, США, полная удалёнка, помощь с переездом
7 500 – 10 000 $/мес на руки
Полная удалёнка
7 500 – 9 000 $/мес на руки
Полная удалёнка