Приглашаем вас присоединиться к разработке нового сервиса в Яндексе. Сервис обеспечивает командам разработки полный спектр инструментов по realtime наблюдению за системой — метрики, логи, трейсы.
Мы предоставляем командам сервис, который собирает данные со всего кластера в виде логов и трейсов (OpenTracing), и разрабатываем единое окно по оперативному поиску, наблюдению и реагированию на основании собранных данных о работе приложений.
Вам предстоит разрабатывать систему, которая должна собирать, хранить и предоставлять поиск по большому потоку событий (в первую очередь это логи и трейсы) с realtime задержкой в распределенном кластере со всех сервисов Яндекса, предоставив единый и связанный инструмент по управлению этими данными, поиску проблемных мест в системе, анализу пути выполнения каждого запроса и затраты на его обработку. В разработке мы ориентируемся на такие системы, как Jaeger, DataDog, AWS Cloud Op (CloudWatch / X-Ray), Scuba by Facebook.
Мы любим продукт, который развиваем. Делаем его и для самих себя, всячески мониторим свою же систему своими же инструментами.
Будет плюсом:
Команда Yandex Infrastructure создаёт и предоставляет внутреннюю инфраструктуру Яндекса — фундамент из продуктов и технологий, на базе которого тысячи инженеров разрабатывают, деплоят и эксплуатируют основные сервисы Яндекса: Поиск, Такси, Маркет, Алису, Кинопоиск и многие другие.