Mы - группа модальности аудио в составе отдала экспериментальных технологий в направлении рекомендаций. Сейчас отдел состоит из более чем 30 человек, среди которых выпускники ШАД, МФТИ, ФКН и других топовых вузов. Одно из направление отдела - мультимодальные контентные и языкове модели.
В фокусе нашей группы - развитие аудио-модальности для задач рекомендаций и не только. Одна из основных задач - разработка foundation аудио-моделей. Мы верим, что глубокое понимание аудио-контента (музыка, подкасты, звук в видео) откроет новые возможности в персонализированных рекомендациях (музыки, видео, клипов) и позволит придумать уникальные продуктовые фичи.
Технологии:
Стандартный ML-стек: python3 + PyTorch.
Хранение и обработка данных: YTsaurus, s3, k8s
Удаленная разработка и запуск экспериментов на кластере с GPU (сотни a100 и h100)
Рост:
На регулярных 1-1 мы фокусируемся на профессиональном росте и стремимся, чтобы каждый занимался тем, что ему интересно. Мы активно принимаем участие в конференциях и готовим статьи уровня A*/A (совместно с отделом исследований, которым руководит Александр Дьяконов).
Задачи
- Исследовать и воспроизводить последние научные достижения (SOTA) в области ML для аудио;
- С нуля проектировать, обучать и оценивать большие аудио-модели на масштабных данных;
- Разрабатывать контентные аудио модели для работы в различных доменах VK;
- Готовить данные, строить пайплайны, проводить эксперименты, анализировать результаты;
- Доводить успешные эксперименты до пилота и внедрения в продукт совместно с продуктовыми командами;
- Делиться результатами через публикации и выступления.
Требования
- Практический опыт работы в ML;
- Опыт построения нейросетевых моделей;
- Уверенное знание Python и PyTorch;
- Опыт оптимизации и внедрения моделей в продакшн;
- Знание классических алгоритмов и структур данных.
Будет плюсом
- Подтвержденный опыт работы с аудио данными;
- Опыт чтения и воспроизведения алгоритмов из научных статей;
- Опыт работы с YTsaurus и k8s;
- Знание SQL;
- Опыт построения рекомендательных систем.
Мы предлагаем
Формат работы
Уровень
График работы
AI VK
Мы развиваем технологии искусственного интеллекта для ключевых продуктов VK, создаём систему рекомендаций и поиска контента на наших платформах.