Наша команда занимается построением и масштабированием хранилищ данных для экосистемы VK, где ежедневно обрабатываются петабайты информации и миллиарды событий. Наши решения используют такие продукты, как "Почта", "Облако", "RuStore", "VK Tech", "Маруся" и многие другие.
Вам предстоит разрабатывать и поддерживать ETL-процессы с использованием Apache Airflow и Apache Spark, глубоко погружаться в оптимизацию запросов ClickHouse и распределённых вычислений в Apache Spark. Мигрировать наши продукты в облачные сервисы с использованием Kubernetes и Yandex Tank, развивать инструменты, позволяющие аналитикам самостоятельно строить витрины данных.
Ключевые технологии, с которыми вы будете работать: Python как основной язык разработки, ClickHouse для аналитических запросов, Apache Spark для распределённой обработки данных, Apache Airflow для оркестрации процессов.
Если вы хотите работать с реальными Big Data в распределённых системах — добро пожаловать в нашу команду! Мы предлагаем возможность участвовать в масштабных проектах, профессионально расти и решать интересные технологические задачи.
Будет плюсом
VK (200+ технологичных проектов) делает современные и быстрые интернет-сервисы, доступные каждому. Каждый день миллионы россиян общаются ВКонтакте и в Одноклассниках, слушают VK Музыку и смотрят VK Клипы, скачивают приложения в RuStore, создают и читают контент в Дзене, играют в игры на VK Play, продают вещи на Юле и становятся умнее со SkillBox и GeekBrains. Штаб-квартира расположена в Москве, также есть представительства в 14 городах по всему миру.