DataLens — облачный сервис визуализации и анализа данных. Он широко используется как внутри Яндекса, так и за его пределами: в составе платформы Yandex Cloud. Сервис позволяет подключаться ко множеству различных источников данных, строит поверх них абстракции в виде датасетов и предоставляет инструменты для отображения этих данных в нужном виде. На входе — исходные данные, на выходе — красивые и удобные дашборды.
Ядро сервиса разрабатывается в опенсорсе с открытой лицензией.
Бэкенд DataLens решает следующие задачи:
Чтобы больше узнать о сервисе, вы можете посмотреть краткий проморолик или более подробное демо.
Мы ищем опытных Python-разработчиков. Ждём и тех, кто отлично владеет другими языками и готов перейти на Python. У нас живой и дружный коллектив, мы вместе формулируем цели и принимаем решения. Присоединяйтесь!
Строить гибкий API для решения задач анализа данных, оптимизировать построение модели данных.
Датасеты — это способ объединить большое количество данных в модель, которая независимо от источника данных позволяет строить запросы к нему благодаря универсальному API. Датасеты должны быстро работать с любым количеством полей: это достигается различными оптимизациями и несколькими уровнями кеширования. Помимо развития API датасетов, мы также наполняем сервис и другими возможностями, улучшающими пользовательский опыт (это, к примеру, экспорты, алертинг, публичный API).
Разрабатывать коннекторы для подключения к новым источникам.
Мы постоянно увеличиваем набор доступных коннекторов к источникам данных, чтобы покрывать больше сценариев аналитики. Задача подключения каждого нового источника по-своему уникальна: необходимо не только разобраться в тонкостях его работы, но и продумать взаимодействие с коннектором с точки зрения пользователя.
Работать над масштабированием, стабильностью и скоростью работы сервиса.
Наша команда отвечает за все этапы жизни сервиса, от проектирования и разработки до развёртывания и поддержания работоспособности всех окружений. Мы сами обслуживаем как DataLens внутри Яндекса — одну из крупнейших инсталляций среди подобных инструментов, так и DataLens в Yandex Cloud — крупнейший облачный сервис аналитики и визуализации в России. Оптимизация пайплайнов CI/CD, улучшение инструментов мониторинга, развитие средств диагностики без прямого доступа к инсталляции и данным пользователей — в наших планах всегда находится место для актуальных инфраструктурных задач.
Развивать ядро сервиса в опенсорсе, чтобы открыть новые возможности для его расширения.
Чтобы каждый желающий мог добавить в сервис новый коннектор или иную функциональность, собрать и настроить систему под свои требования, необходимо поддерживать и развивать модульную архитектуру кода: выделять общие части, предоставляя точки для расширения.
Будет плюсом, если вы
Здоровье
А также
Страховка для родственников по системе 80/20
Рост и развитие
В Яндексе есть всё, чтобы постоянно развиваться и учиться новому: внутренняя образовательная платформа, менторство и программы для начинающих и опытных руководителей.
А также
Кроме того, в Яндексе есть внутренние проекты, где наши сотрудники делятся экспертизой, обсуждают сложные темы и разбирают кейсы своих проектов.
Спорт
А также
Спортивный клуб Яндекса
И ещё
Yandex Cloud — публичная облачная платформа, которая предоставляет корпорациям, среднему бизнесу и частным разработчикам масштабируемую инфраструктуру, сервисы хранения данных, инструменты машинного обучения и средства разработки. С 2018 года платформа выросла вдвое не только по суммарному доходу, но и по клиентской базе: ежедневно сервисы используют более 10 тысяч компаний.