Специализация
Data Science / Machine Learning
X-ON с 2005 года помогает реализовывать IT–проекты для компаний: от авторских бизнес-идей и наставничества до комплексного анализа, сопровождения и развития проекта. Среди клиентов: Сбербанк, Дикси, РАНХиГС, Allianz и другие.
В настоящий момент мы ищем Разработчика ETL (SQL / Python): Oracle->Greenplum.
Обязательные требования к кандидату на этой должности:
- Знание SQL, Python: опыт работы в рамках компетенции не менее 2 лет.
- Опыт работы с Airflow или Pentaho: опыт работы в рамках компетенции, не менее 2 лет.
- Знание инструментов CI/CD (Gitlab, Jenkins): опыт работы в компетенции не менее 2 лет.
- Знание теоретических основ построения БД и хранилищ данных: опыт работы в компетенции не менее 2 лет.
- Опыт работы с одной из МРР-систем (Teradata или Greenplum или Vertica): опыт работы в компетенции не менее 2 лет.
Технологии/инструменты
PythonSQLPostgreSQLETL/ELTPL/pgSQLGitlabJenkinsCI/CDTeradata/Greenplum/VerticaAirflow/Pentaho
Основные задачи
- Выполнение роли ведущего разработчика корпоративного аналитического Хранилища данных и роли ведущего технического эксперта по миграции ХД с Oracle Exadata на Greenplum.
- Построение и оптимизация целевого масштабируемого отказоустойчивого аналитического ХД на базе Greenplum.
- Реализация сложной логики и задач ядра хранилища данных.
- Проектирование и реализация структур данных, разработка физической модели данных, алгоритмов загрузки и обработки данных в ХД.
- Документирование ХД, включая описание алгоритмов обработки данных и др.
- Формирование состава документов для процесса миграции и эксплуатации ХД на новой платформе.
- Подготовка и развертывание релиза в среде разработки и тестирования, проверка работоспособности фичи в релизе.
- Участие в процессе приемки-передачи ХД на новой платформе в промышленную эксплуатацию.
- Взаимодействие со смежными подразделениями.
Ожидания
- Оконченное высшее образование по технической специальности.
- Практический экспертный опыт построения отказоустойчивых масштабируемых аналитических ХД на базе Greenplum (понимание MPP систем) от 3 лет.
- Опыт построения промышленных ХД на базе PostgreSQL от 5 лет.
- Практический экспертный опыт реализации ETL / ELT.
- Экспертное знание SQL, PL/pgSQL.
- Опыт курирования команды разработчиков.
- Знание подходов к разработке, документированию, тестированию ХД (в частности согласно архитектурному подходу Data Vault).
- Знание методологий разработки (Agile, Scrum, Waterfall).
- Желателен опыт работы с Oracle DB.
- Желателен опыт миграции структур данных, данных, кода SQL и PL/SQL из Oracle в Greenplum (PostgreSQL).
- Желателен опыт работы с Apache Hadoop, Apache Spark, ClickHouse.
- Желателен опыт работы с Jira, Confluence, Git, Jenkins.
Условия
- Формат работы удаленный, город не имеет значения.
Максим Гинзбург Founder and CEO