📍 Москва (м. Павелецкая)Полная удалёнка
Специализация
Data Science / Machine Learning
Английский
B2 — Upper-IntermediateB2 — Upper-Intermediate
Миссия BostonGene — способствовать переходу здравоохранения к персонализированной медицине с использованием молекулярного и иммунного профилирования на основе искусственного интеллекта для повышения уровня медицинской помощи, ускорения исследований и улучшения экономики медицинской системы.
Они открывают вакансию Senior Data Engineer для разработки программной платформы, которая поможет улучшить точность назначения противораковой терапии.
Проект по анализу иммунного статуса был начат в 2020 году, в его ходе команда иммунологов и биоинформатиков занималась поиском того, как состояние иммунитета человека может помочь в диагностике и лечении заболеваний. И теперь, спустя год, они ищут разработчика, который сможет взять на себя ответственность за разработку и интеграцию нового пайплайна для обработки данных, получаемых из их лаборатории в Бостоне.
Технологии/инструменты
PythonLinuxKubernetesDockerGCSAWSAzureAirflowPandasPostgreSQL
О проекте
На данный момент у них есть набор google sheet-ов с данными, разрозненные файлы с результатами экспериментов и множество обрабатывающих скриптов. Все эти разработки необходимо будет объединить в работающую систему и интегрировать с основным продуктом — системой, генерирующей персональные рекомендации для подбора противораковой терапии.
Задачи
- Писать пайплайны обработки данных.
- Придумывать решения оптимальные каждой встреченной ситуации.
- Искать существующие процессы, подсвечивать и автоматизировать их.
- Собирать данные и предоставлять для использования своей команде. Иногда можно даже писать интерфейсы.
- Помогать биоинформатикам по части разработки.
- Писать API для доступа к данным для других сервисов.
- Общаться с другими командами, искать общие места и ставить задачи.
- Чуть позже после начала: придумывать, какие сервисы оптимизируют работу других людей или подразделений.
Требования
- 4+ года опыт коммерческой разработки на Python. Не менее 2 лет в позиции, которая соответствует Data Engineer (загрузка, преобразование данных и формирование отчётов).
- Разработка под Linux.
- Знание и опыт использования облачных сервисов и технологий виртуализации (Kubernetes, Docker, опыт взаимодействия с облачными платформами: GCS, AWS, Azure).
- Опыт с Airflow и Pandas 2+ года.
- Опыт работы с PostgreSQL 3+ года.
- Жгучее желание узнавать новое. Это понадобится для совместной работы со специалистами-биоинформатиками (они помогут).
- Готовность работать в проекте с высоким уровнем неопределенности.
Будет плюсом
- Опыт работы в науке / лаборатории.
- Базовые знания биологии / биоинформатики.
- Знание английского B2+ (может понадобиться общаться с коллегами из США).
- Знакомство с Kubernetes, Helm.
Что предлагают
- Возможность поработать в составе уникальной команды, выступить не как просто “кодер”, “инженер” или “вон тот парень, который знает как на сайт лиды загрузить”, а в роли эксперта и наставника.
- Жизнь в команде биоинформатиков, биологов, медиков и разработчиков.
- Полный рабочий день.
- Офис в 5 минутах от ст. м. Павелецкая.
- Удаленная / гибридная работа до конца пандемии, далее — по договоренности.
- ДМС, корпоративные программы, обучение.
- Вознаграждение определяется по результатам собеседования.
Екатерина Титова Senior Recruiter