📍 МоскваСанкт-ПетербургПолная удалёнка
Специализация
Data Science / Machine Learning
Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.
Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.
Ежемесячная аудитория превышает 21 млн человек. Растить число пользователей, и решать их проблемы помогают уже больше 1000 человек.
Технологии/инструменты
PythonHadoopHDFSSparkSpark Streaming
- Используем стек технологий: Python 3, Scala, Hadoop 3, Spark, Spark Streaming, Hive, Kafka, Hbase, Presto, Cassandra, Airflow, Trino, Amundsen, Iceberg.
О команде
Команда Machine Learning состоит из 23 человек (DS, DE, backend-разработчики, CRM-аналитики, дата аналитики, системный аналитик + PM).
Основная цель ML — повышать качество и достоверность контента, который публикуется на нашем сайте — для нас важно, чтобы за каждым объявлением скрывался реальный объект.
Команда Data Platform — 4 человека, занимаются всем, что связано с etl процессами, собирают в единое хранилище (Hadoop) всю информацию о тех событиях, которые происходят на сайте.
Из интересного, сейчас пилим свой фича-стор для ML моделей (батчевый и стриминговый!), DS-ы уже пользуются, но предстоит еще много работы по выстраиванию правильных процессов валидации, добавления / выпиливания фичей.
Чем предстоит заниматься
- Менеджмент команды дата инженеров.
- Развитие процессов доставки, накопления и валидации данных.
- Организация и развитие процесса развития компетенций DE в команде.
- Выстраивание долгосрочной стратегии развития процессов и инфраструктуры дата-платформы.
- Разработка внутренних библиотек и тулинга для автоматизации рутинных задач.
- Поддержка работоспособности существующих ETL-пайплайнов.
Кого мы видим на этой позиции
- Имеет опыт менеджмента команды из 4+ человек.
- Умеет выстраивать деловые отношения с заказчиками. Умеет понять где болит и предложить системное решение.
- Умеет строить вижн развития команды на полгода-год.
- Умение отслеживать прогресс по планам в течение квартала и вовремя корректировать в случае изменений.
- Имеет опыт работы с Hadoop стеком и Python.
- Верхнеурово понимает архитектуру работы HDFS.
- Имеет опыт работы со Spark и Spark Streaming.
Что предлагаем
- Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе — кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки.
- Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft / hard skills на практике, обучении, конференциях.
- Плюшки: ДМС с первого дня (стоматология, госпитализация, полис ВЗР), ежегодная компенсация спорта, 5 day off в год, помимо основного отпуска.