Юзтех — группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.
ГК Юзтех является технологическим партнером таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, ГоИнвест, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет, Х5 Retail Group, Газпромнефть, Лемана ПРО, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.
Сейчас мы в поиске инженера данных с акцентом на ETL-процессы и высоконагруженные пайплайны обработки больших данных на банковский проект.
Итак, ваши задачи
- Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем.
- Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения.
- Разработка и поддержание в актуальном состоянии документации по разработанному функционалу.
- Своевременное отражение статуса выполнения задач в Jira.
- Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных.
Мы будем рады рассмотреть вашу кандидатуру, если у вас есть
- Python — уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных — NumPy, pandas.
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, XML, JSON) из внешних источников.
- Способность разобраться с API поставщиков данных, используя доступную документацию.
- SQL — умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, PostgreSQL, Greenplum.
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных — Airflow.
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark.
Мы предлагаем
- Карьерную и профессиональную возможность в стабильной, аккредитованной ИТ-компании.
- Расширенный полис ДМС со стоматологией, корпоративный психолог.
- Удаленную работу и гибкий график.
- Необходимую технику для комфортной работы.
- Обучение, сертификацию, Usetech English Club — онлайн-изучение английского.
- Доступ к Корпоративной библиотеке и к Корпоративному университету.
- Внутрикорпоративные профильные коммьюнити.
- Заботу о детях сотрудников: корпоративные скидки, подарки, детские дни.
- Геймифицированную программу лояльности: поверь, ты будешь восторге от нашего корпоративного магазина.
- Корпоративную жизнь: мы много работаем и классно отдыхаем.