
Команда юридических ИИ-систем и автоматизации правового анализа.
- Работа с текстовыми данными в юридическом домене.
- Подготовка интерфейсов разметчика и верификатора на платформе краудсорсинг разметки данных TagMe на основе HTML/JavaScript.
- Использование API LLM при генерации синтетических данных, фильтрации и прочих задачах.
- Загрузка и выгрузка данных для различных источников.
- Дедупликация и фильтрация текстовых данных.
- Написание скриптов сравнения и мэтчинга текстовых данных.
- В работе потребуется терпение, внимательность и способность к рутинным проектам.
– Основы HTML, CSS.
– Основы JavaScript (базовый браузерный JavaScript для валидации данных форм, обработки данных — числа, строки, if-else, циклы, работа с JSON, CSV, данными форм).
– Основы мат. статистики для проектирования и расчета размера перекрытий.
– Python для обработки выгруженных данных.
– Pandas, SQL — для формирования датасетов, выгрузки данных из структурированных источников, аналитики данных.
– Знание основных NLP-метрик (точность, полнота, BLEU, ROUGE, BERT-score и др.).


Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов. Самый дорогой российский бренд и самый сильный банковский бренд в мире по версии Brand Finance.




