📍 Москва (м. Верхние Котлы)Офис несколько дней в неделю
Специализация
Data Science / Machine Learning
В команду «SberData» блока Технологии Сбербанка мы ищем специалистов по работе с данными. Вам предстоит работать с графами связей, использующимися для построения моделей и автоматизации, дообучать LLM-модели, работать с различными гео-данными.
Технологии/инструменты
PythonSQLETLELTSparkHadoop
Обязанности
- Построение графовых и LM нейронных сетей.
- Построение и поддержка аналитических моделей: Python + Spark + DS Stack (мы используем PyTorch и PyTorch Geometric).
- Feature Engineering: методы оценки значимости и отбора признаков, методы уменьшения размерности.
- Построение аналитических отчетов по результатам проведенной работы.
- Обеспечение документирования результатов моделирования для передачи на валидацию.
- Получение структурированных и неструктурированных данных из различных источников.
- Исследование источников данных, обеспечение сбора данных.
- Построение и проверка гипотез по запросу Заказчика.
- Построение моделей машинного обучения исходя из потребностей Заказчика.
Ожидания
- Опыт работы в области Data Science от 1 года.
- Хорошее знание алгоритмов машинного обучения, нейронных сетей.
- Python, библиотеки для работы с ML.
- Графовые библиотеки (Torch_geometric, DGL и др.).
- Базовые знания Spark, опыт работы со стеком Hadoop.
- Понимание процессов ETL, ELT.
- Знание SQL.
Будет плюсом:
- Знание особенностей программирования в распределённых системах.
- Опыт работы с NoSQL-базами.
- Знание методов оптимизации ГПУ-вычислений.
- Понимание процессов разработки backend-приложений.
- Знакомство с методами тестирования приложений.
- Умение работать с DVC и MLflow.
Условия
- Развитая IT-архитектура. Мощный GPU-кластер, возможность расчётов на суперкомпьютере.
- Комфортный офис, бесплатный фитнес в офисе.
- ДМС.
- Скидки на продукты банка и экосистемы.
- Постоянное развитие: обучающие курсы от лучших университетов и компаний, участие в международных конференциях.
- Развитое DS Community.