Компания больше не ищет сотрудника. Посмотрите похожие предложения

Data Scientist LLM (Global Markets)
в Сбер
200 000 — 500 000 ₽/мес на руки
Технологии/инструменты
Команда, отвечающая за AI-инициативы бизнеса Департамента Глобальных Рынков Сбера.
Департамента Глобальных Рынков (ДГР) предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью на валютном, товарно-сырьевом рынках, структурные продукты.
Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.
Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL-алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей.
Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). На этой позиции вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A-системы, логическое мышление и другие.
Задачи
- Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, Llama 2, GPT-3.5/4).
- Построение пайплайна обработки данных и обучения LLM (LLM-цепочек).
- Разработка векторизованных баз знаний с использованием LangChain, ChromaDB.
- Организация процесса мониторинга качества LLM.
- Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения.
- Участие в формировании требований и необходимых данных по улучшению моделей.
- Оценка как полученное решение достигает поставленных целей.
- Отслеживание последних исследований и инноваций в области языковых моделей и применение их на практике.
- Разработка документации и руководства для пользователей и разработчиков.
- Подготовка и анализ новостей для обучения модели.
Требования
- Знание Python на уровне Middle-разработчика.
- Опыт анализа и обработки данных (NumPy/pandas) и их визуализация (Matplotlib, Seaborn, Plotly).
- Опыт Web Scraping (в идеале — Playwright/Parsel/HTTPX, возможно — Selenium/BeautifulSoup/Requests).
- Опыт работы с БД (ORM).
- Опыт создания дашбордов (Streamlit/Gradio/Dash).
- Опыт асинхронного программирования (asyncio).
- Знание Linux.
- Знание Git.
- Знание Docker.
- Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении.
- Знание PyTorch или TensorFlow для возможности fine-tuning LLM под конкретную задачу.
- Знание LLM-фреймворков и библиотек (в идеале — LangChain, дополнительно как пример — LlamaIndex, OpenAI) для создания LLM-приложений.
- Опыт использования LLM (GPT-3.5 Turbo/GPT-4/Open-source), в идеале — опыт использования их API для создания LLM-приложений.
- Знание методов Prompt Engineering.
- Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшем развитии проектов.
- Наличие публичных проектов, и/или активное участие в разработке Open-source проектов в области NLP/LLM.
- Наличие блога по NLP/LLM.
Условия
- Формат работы: офис (ул. Вавилова, 19), возможен гибрид.
- ДМС с первого дня.
- Скидки на продукты банка и экосистемы.
- Развитая IT-архитектура.
- Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях.
- Развитое DS Community, регулярные митапы, дайджесты и конференции.


О компании Сбер
Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов. Самый дорогой российский бренд и самый сильный банковский бренд в мире по версии Brand Finance.