Мы ищем руководителя группы Машинного зрения, который готов присоединиться к нашей R&D-команде для разработки генеративных мультимодальных моделей (VLM).
Основной фокус: мультимодальная генеративная модель для обработки видео и автоматической генерации субтитров, VLM для OCR и обработки документов.
Руководить командой CV-инженеров: нанимать, развивать, выстраивать процессы.
Ставить цели команде, декомпозировать их на понятные и достижимые задачи.
Участвовать в планировании и проектировании архитектуры ML-решений и их интеграции в продукты.
Следить за трендами в области AI/ML и Computer Vision, исследовать новые подходы.
Анализировать состояние проектов и качество решений, доносить их до стейкхолдеров.
Уверенное владение Python и опыт работы с PyTorch.
Понимание жизненного цикла ML-решений и опыт их эксплуатации.
Опыт руководства ML-командой от года.
Опыт работы с мультимодальными моделями (VLM) или большими языковыми моделями (LLM) и понимание принципов их работы.
Присоединяйтесь к нашей команде, чтобы создавать сервисы и технологии, которые улучшают качество жизни миллионов людей.
VK (200+ технологичных проектов) делает современные и быстрые интернет-сервисы, доступные каждому. Каждый день миллионы россиян общаются ВКонтакте и в Одноклассниках, слушают VK Музыку и смотрят VK Клипы, скачивают приложения в RuStore, создают и читают контент в Дзене, играют в игры на VK Play, продают вещи на Юле и становятся умнее со SkillBox и GeekBrains. Штаб-квартира расположена в Москве, также есть представительства в 14 городах по всему миру.