Мы в поиске аналитика-разработчика, который будет заниматься преобразованием сырых данных в удобный формат для продуктовых аналитиков в бизнес-слое хранилища и позволит аналитикам сосредоточиться на бизнес-выводах, а команде — повысить качество и производительность аналитической инфраструктуры за счёт стандартизации, ускорения расчётов и улучшения документации.
Формировать единый слой отчётных данных (проектировать и поддерживать дата-марты/витрины в Trino + S3, описывать их в DBT с полнотой тестов и документации).
Сквозная разметка событий (совместно с product manager’ами задавать схемы event-tracking’а для веб- и мобильных приложений, проверять корректность внедрения, поддерживать словарь событий).
Разрабатывать правила контроля (t-tests, аномалия-алерты, SLA), вести каталог сущностей и атрибутов, инициировать улучшения качества данных.
Автоматизация и прозрачность. Настраивать CI/CD для DBT, писать поверх Trino/Python скрипты автопроверок, поддерживать репозитории и шаблоны исследований.
Обмен знаниями. Проводить код-ревью, демо и внутренние воркшопы; senior-аналитики курируют методологию, middle получают менторство и растут в T-shape.
Технологии: уверенный SQL (Trino/Hive/Presto), DBT (models + tests), BI-инструменты (желательно Superset), Python для расчётов; Git-workflow, CI/CD.
Домен: понимание MDM, принципов построения DWH в объектных хранилищах (S3/Parquet), событийных схем (Snowplow/Mixpanel или аналоги), Data Governance & Quality-frameworks.
Аналитические навыки: статистика, A/B-методологии, продвинутая визуализация, storytelling.
Будет плюсом:
Свободный выбор рабочего формата: удалённый внутри страны или гибридный в Москве;
Приятное дополнение:
Название скрыто под NDA. Крупная компания в России, предоставляющая цифровые медицинские сервисы. Все подробности рекрутер раскроет лично сразу после отклика.