Мы ищем эксперта в области компьютерного зрения, который готов присоединиться к нашей RnD команде для создания и совершенствования ключевых технологий, решающих задачи визуального анализа на платформах VK. Ваши разработки станут основой для улучшения пользовательского опыта, автоматизации процессов и масштабирования наших сервисов. Вы будете создавать технологии для задач поиска видео и клипов на платформах компании VK, разрабатывать методы распознавания текстов, улучшать модели для модерации и категоризации визуальной информации, а также исследовать мультимодальные языковые модели (VLM) для решения задач внутренних продуктов компании.
Задачи
- Обучать большие языковые модели работать с визуальной информацией;
- Улучшать CV технологии для извлечения информации из визуальных данных;
- Строить дата-пайплайны для сбора обучающих выборок и формирования бенчмарков;
- Развивать пайплайны обучения и инференса моделей на GPU-кластере;
- Изучать и реализовывать идеи и алгоритмы из актуальных научных статей;
- Адаптировать модели и методы под продуктовые задачи;
Требования
- Знаете алгоритмы и структур данных, а также глубоко понимаете современные подходы в машинном обучении;
- Уверенно владеете Python и имеете индустриальный опыт работы с PyTorch;
- Обучали и внедряли модели LLM, сегментации, детекции, image и видео retrieval, а также другие нейросетевые решения в продакшн-окружение;
- Интересуетесь последними достижениями в областях Vision-Language Models (VLM), Large Language Models (LLM), Computer Vision (CV) и Natural Language Processing (NLP);
- Умеете самостоятельно ставить исследовательские задачи, планировать эксперименты и доводить их до результата.
Мы предлагаем
Формат работы
Уровень
График работы
VK
VK — это более 200 технологичных проектов, больше 15 000 сотрудников и безграничные возможности проявить себя. Мы делаем современные и быстрые интернет-сервисы, доступные каждому.