Мы создаём самую большую рекомендательную систему в России, выпускаем приложения под Android и iOS, разрабатываем редактор видео и помогаем интересным блогерам найти новую аудиторию, а пользователям — интересные публикации. За этим стоят сложные алгоритмы, сотни тестов и сервис, который обрабатывает 150 тысяч запросов в секунду.
О проекте
Команда предиктивной аналитики профилей является центром экспертизы по автоматизированной разметке, за счёт которой работает поведенческий антифрод и управление контентом наших социальных платформ (ОК, Дзен, VK). Именно наша команда строит ML-модели и предоставляет предиктивную аналитику по профилям для бизнес-юнитов холдинга. Для этого мы выстраиваем end-to-end пайплайны обработки и дистрибуции данных. Наш основной фокус — создание ML-based разметок и антифрода в группе компаний.
Так как всё большему количеству бизнес-юнитов требуется наша экспертиза, мы ищем Senior Data Scientist с перспективой роста в Team lead.
Задачи
Построение и улучшение ML-архитектуры процессов обработки данных
Разработка ML-моделей, настраивание их качественной и количественной оценки, анализ результатов
Работа с инструментами разметки (LLM, краудсорсинг, асессоры) для подготовки Ground Truth данных
Взаимодействие с заказчиками, грумминги, декомпозиция крупных ML-проектов
Менторство двух DS
Требования
Высшее техническое или математическое образование
Более двух лет опыта на позиции Data Science или Machine learning
Опыт работы с Python (Pandas, NumPy, SciPy, CatBoost, XGBoost), SQL (оконки, процедуры) — для подготовки данных и обучения ML-моделей
Опыт работы с антифродом
Опыт работы с Airflow и BI-системами — Datalens/Superset/Tableu/Power-BI
Опыт вывода в прод классических ML-моделей (например, бустингов)
Умение работать с математической статистикой для управления статзначимостью метрик моделей и пайплайнов
Будет плюсом
Опыт управления небольшой командой
Мы предлагаем
Формат работы
Уровень
График работы

AI VK
Мы развиваем технологии искусственного интеллекта для ключевых продуктов VK, создаём систему рекомендаций и поиска контента на наших платформах.