Сервисы Яндекса порождают огромные объёмы данных, которые хранятся и обрабатываются на кластерах из десятков тысяч машин под управлением YT. Большая часть этих данных служит для регулярной и ad-hoc-аналитики пользовательских сессий, подсчёта статистики посещений и иных сценариев.
В современном мире большие данные зачастую анализируются с помощью различных диалектов SQL — достаточно гибкого инструмента, который позволяет разработчикам думать о том, что нужно, а не о том, как это получить.
SQL-подобные движки применяются для вычислений в самых разных частях YT. Для ad-hoc-аналитики и регулярных расчётов очень больших данных используется YQL. Для реактивного построения выжимок и BI-витрин — вычислительный движок ClickHouse поверх данных в YT. Для OLAP-запросов к динамическим таблицам YT, высокопроизводительным транзакционным key-value-хранилищам, — собственная вариация языка SQL.
Многообразие SQL-инструментов порождает инфраструктурные задачи, которые нужно решать:
Мы ищем разработчика, который поможет нам с решением этих и других задач.
Будет плюсом, если вы:
Яндекс — одна из крупнейших ИТ-компаний в России. Мы развиваем самую популярную в стране поисковую систему и создаём сервисы, которые помогают людям в повседневных делах. С их помощью можно искать информацию в интернете, слушать музыку, выбирать товары и места, заказывать еду, перемещаться по городу и делать многое другое. Яндекс предлагает также продукты для бизнеса.