📍 Москва (м. Преображенская площадь)Санкт-Петербург (м. Адмиралтейская)НовосибирскМожно удалённо из РФ
Специализация
Data Science / Machine Learning
Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.
Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.
Cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.
Ежемесячная аудитория около 18,7 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1000 человек.
Мы ищем Senior Data Scientist в команду Ранжирования и рекомендаций: новое направление “поиск 3.0”.
Технологии/инструменты
PythonSQLApacheHDFS/Kafka/Spark
- Пишем преимущественно на Python (Numpy, SciPy, Pandas, sklearn, PyTorch).
- Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер.
- Для автоматизации запусков наших пайплайнов используем Airflow.
- Для технических метрик — Grafana, для бизнес-метрик — FineBI.
О команде
В Циан большая команда ML — DS, DE, своя MLOps-платформа.
Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.
Сейчас направление фокусируется на развитии интеллектуального помощника для поиска недвижимости, основанного на чат ботах.
Основные задачи
- Развитие интеллектуального помощника по поиску недвижимости: обучение собственных LLM-моделей на базе opensource, исследование готовых решений от OpenAI/Yandex и других.
- Написание микросервисов с моделями и выкатка их в A/B-эксперименты.
- Разработка и внедрение в продакшн моделей машинного обучения для улучшения пользовательского опыта.
Ожидания от кандидата
- Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.
- Python: пишет легко читаемый и поддерживаемый код.
- SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов.
- Знаком с Apache стек: HDFS/Kafka/Spark (DF API).
- Опыт в DL: обучение/дообучение собственных глубоких нейросетей.
- Опыт разработки NLP моделей: от tfi-df до LLM.
- Классический ML: бустинги, линейные модели.
- Имеет базовые знания CV: классификация, детекция, сегментация.
- Понимает ценность MLOps, и ценность переиспользования уже готовых решений внутри компании.
- Имеет кругозор или непосредственный опыт в реализации проектов для C и B пользователей.
- Способен самостоятельно коммуницировать с заказчиками и смежниками.
- Опыт работы: 3–6 лет.
Что мы предлагаем
- Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе — кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки.
- Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
- Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях.
- ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны).
- 5 day off в год, помимо основного отпуска.
- Кафетерий льгот Benefactory.
Алина Дмитренко Technical Recruiter