📍 Москва (м. ЗИЛ)Можно удалённо из РФ
Специализация
Data Science / Machine Learning
У нас есть Core-команда — это Data-домен, который предоставляет для других продуктовых команд возможности по самостоятельной работе с данными.
Data-домен состоит из трех команд:
- Data Platform — развитие и поддержка дата-платформы на 400 ТБ данных и более 150 баз данных.
- Data Management — интеграция источников в платформу, предоставление BI-инструментов и DQ/DG.
- Data Accelerator — разработка дата-продуктов — моделей или алгоритмов, которые помогают нам или экономить и зарабатывать как компании.
Кроме Data Domain в нашей компании есть ещё 19 доменов, и почти в каждом из них есть дата-команда, в которой есть DE, DS, DA, DataOps.
Технологии/инструменты
PythonScikit-learnNumPyPlotly/Matplotlib/SeabornCatBoostLightGBMXGBoostSQLGitpandas
Задачи
- Автоматизация процесса обработки больших данных с использованием машинного обучения для решения практических задач компании.
- Разработка моделей как с использованием алгоритмов машинного обучения, так и без, их внедрение в бизнес-процессы компании, повышение их точности прогнозирования.
- Взаимодействие с заказчиками моделей, дата-инженерами и дата-аналитиками в рамках задачи по разработке и внедрению моделей. Задачи включают разработку модели любой сложности (логистические регрессии, классификации, нейросети, AI и т.д.).
- Формализация требований к сбору обучающей выборки.
- Генерация и проверка гипотез.
- Проведение исследований алгоритмов машинного обучения.
- Дизайн, разработка и тюнинг моделей машинного обучения.
- Построение и оптимизация пайплайнов от признаков до обучения моделей.
- Продуктивизация ML-решений.
- Проведение аналитических исследований и R&D на больших данных с применением ML.
- Нахождение оптимального архитектурного решения для удовлетворения потребностей бизнеса.
- Поддержка работоспособности решений, контроль качества получаемых данных.
Наши ожидания
- Техническое образование (можно неполное высшее).
- Опыт работы в аналитике/Data Science от 1-го года.
- Знание теории вероятности, мат. анализа и линейной алгебры, достаточного для чтения научных статей и проведения экспериментов.
- Умение проверять статистические гипотезы, знание основных критериев.
- Знание и понимание основных метрик и принципов оценки качества моделей и получаемого с их помощью результата, способов валидации моделей.
- Уверенное знание Python (+ классический набор библиотек для анализа данных/машинного обучения: Scikit-learn, NumPy, pandas, Plotly/Matplotlib/Seaborn).
- Опыт обучения моделей градиентного бустинга, использования одной из библиотек (CatBoost, LightGBM, XGBoost).
- Знание SQL, опыт работы с реляционными СУБД на уровне пользователя.
- Умение работать с Git.
Мы предлагаем
- Гибкую систему премирования.
- Расширенный социальный пакет: ДМС со стоматологией с первого месяца работы, психолога и страхование жизни, компенсацию питания и оплату мобильной связи.
- Работу в компании с развитой инженерной культурой.
- Автономность работы, возможность менять правила, ошибаться и создавать новое.
- Возможность профессионального роста, программы развития для сотрудников.
- Корпоративное обучение и доступ к базе знаний.
- Внутренние профессиональные сообщества и мероприятия.
- Гибридный формат работы.
- Современный офис в 2-х минутах ходьбы от МЦК ЗИЛ.
С каждым годом на выбор сотрудника становится доступно больше дополнительных опций. Например, частичная компенсация путешествий, затрат на обучение, спортивных занятий.