Команда отвечает за автоматизацию процесса оценки залогов в банке. Проекты затрагивают различные домены ML: от классического ML в задачах оценки залогов до NLP для анализа документов. Сейчас команда в поиске Data Scientist, который поддержит полный процесс ведения проекта от обсуждения бизнес-цели с заказчиком до внедрения проекта в прод.
Наш стек технологий:
Python 3.10+, Hadoop, Spark, Hive, Airflow, MLflow, FastAPI, Prometheus, Grafana, GitLab, Docker, K8s.
Наш DS стек по либам: Python, Pandas, NumPy, Jupyter, Geopandas, Scikit-learn, LightGBM, XGBoost, PyTorch, Spacy, Langchain, Hugging Face.
Обязанности
- Руководство функцией внутри команды: координировать работу как DS команды.
- Стратегическое планирование: разрабатывать видение и реализовывать стратегию по его достижению в области ML/AI на платформе.
- Взаимодействие со стейкхолдерами: обеспечивать эффективную коммуникацию.
- Поиск новых возможностей: помогать продуктовым командам находить и внедрять новые решения на основе ML/AI технологий.
- Обучение и развитие команды: менторить DS специалистов, способствовать профессиональному росту команды, проводить обучение.
- Развивать и поддерживать высокую культуру MLOps процессов в команде.
- Обсуждать с бизнесом проекты, декомпозировать их на логически связанные куски с переводом на язык DS.
- Развивать проект распознавания документов; погружаться в исходные "сырые" данные и процессы залогового отдела для формирования новых инициативных гипотез, которые смогут улучшить текущие процессы.
Требования
- Глубокая техническая экспертиза: умение вести дискуссию на технические темы простом языком в области машинного обучения (от Python и деплоя сервисов до современных методов глубинного обучения).
- Servant leadership: умение вдохновлять команду, работать с ее потребностями, желание слушать и помогать людям; коммуникативные навыки: способность эффективно общаться с различными стейкхолдерами с разным бэкграундом.
- Стратегическое мышление и видение: умение видеть общую картину и тренды, балансирую между детальным и абстрактным уровнем.
- Понимание продуктового подхода: взгляд на мир и свою работу через призму непрекращающегося улучшения и развитие в течение длительного периода.
- Уверенные знания и практический опыт в области ML: табличные данные.
- Опыт работы с Spark, Airflow, Hadoop.
- Опыт в MLOps-процессах: мониторинг моделей, логирование экспериментов и моделей.
- Опыт продуктового внедрения LLM (оптимизация инференса, fine-tune open source моделей, дисцилляция и проч.).
- Уверенные навыки промпт-инжиниринга.
- Опыт построения RAG-систем.
- Желание и умение решать NLP задачи без LLM: регулярные выражения, классические BERT-подобные классификаторы и т.д.
- Умение самостоятельно реализовать весь пайплайн деплоя ML-модели в прод: от постановки гипотезы до мониторинга работы модели.
- Умение самостоятельно генерировать идеи, общаться с бизнесом, планировать эксперименты, объяснить все сложное простыми словами.
Будет плюсом
- Наличие опыта работы с классическими моделями.
Условия
- Полностью дистанционный формат работы, а при желании — возможность работать в комфортном современном офисе, гибкий график и отсутствие дресс-кода.
- Возможность выбора оборудования.
- Доплата по больничным, отпуск в январе и мае без потери в заработной плате, корпоративный пенсионный план.
- Широкие возможности по обучению и повышению компетенций за счет внутренней IT-академии, внешних курсов и профессиональных конференций.
- Активные внутренние IT-сообщества.
- Льготные условия на продукты банка, программа корпоративных скидок и многое другое.
- Отличный социальный пакет: ДМС с первого месяца со стоматологией и массажем, страхование выезжающих за рубеж, скидки на корпоративные продукты, тренажерный зал в офисе.