Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.
Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.
cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.
Ежемесячная аудитория около 18,7 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1000 человек.
О команде
В Циан большая команда ML — DS, DE, своя MLOps-платформа.
Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.
Мы ищем Middle Data Scientist в команду Модерации. Команда отвечает за качество контента на площадке и делает так, чтобы пользователи видели только актуальные и настоящие объявления. Для эффективной борьбы с множеством нарушений коллеги разрабатывают инструменты, которые обрабатывают миллионы изображений, звонков, чатов и кликов пользователей.
Стек
- Пишем преимущественно на Python (NumPy, SciPy, pandas, scikit-learn, PyTorch).
- Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер.
- Для автоматизации запусков наших пайплайнов используем Airflow.
- Для технических метрик — Grafana, для бизнес-метрик — Superset/FineBI.
Основные задачи, которые нужно будет решать
- Разработка моделей машинного обучения, направленных на борьбу с нарушениями правил площадки и недобросовестными пользователями (формализация и постановки задачи, сбор данных, обучение, онлайн/офлайн-оценка качества, мониторинг).
- Внедрение своих ML-моделей в продакшн: написание микросервисов и Airflow DAG’ов.
- Коммуникация с продуктом и разработкой.
Примеры задач в обозримом будущем
- Развитие моделей обнаружения подозрительных объявлений в Посутке по ходу жизненного цикла объявления.
- Построение моделей оценки качества коммуникаций риелторов в чатах и во время звонков.
- Автомодерация отзывов на объявления и агентов.
Требования к кандидату
- От 4 лет релевантного опыта на позиции DS в продуктовой компании. Опыт доведения ML-моделей до продакшена и оценки влияния на бизнес от внедрения.
- Python: навык писать легко читаемый и поддерживаемый код, опыт выкатки сервисов в продакшн.
- Классический ML: бустинги, ApproxNN.
- Deep Learning: опыт обучения CV/NLP-моделек на PyTorch (хотя бы в рамках учебных курсов).
- SQL: оконные функции, оптимизация запросов.
- Желателен опыт с Apache-стеком: HDFS/Kafka/Spark/Airflow.
Что мы предлагаем
- Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе — кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело-парковки.
- Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов): есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
- Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/hard skills на практике, обучении, конференциях.
- ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны).
- 5 day-offs в год, помимо основного отпуска.
- Кафетерий льгот Benefactory.