Команда предиктивной аналитики управляет контентом, обогащая его дополнительной информацией за счёт ML-моделей, краудсорсинга, LLM. Мы являемся центром экспертизы по автоматизированной разметке, за счёт которой работают рекомендации, поиск, модерация и антифрод. Именно наша команда строит ML-модели и предоставляет предиктивную аналитику по контенту и профилям для бизнес-юнитов холдинга. Для этого мы выстраиваем end-to-end пайплайны обработки и дистрибуции данных, обучаем и используем как классические ML-модели, так и LLM (LLaMa, ChatGPT и другие).Так как всё большему количеству бизнес-юнитов требуется наша экспертиза, мы ищем Senior Data Scientist с опытом вывода ML-моделей в прод.
Задачи
- Построение и улучшение ML-архитектуры процессов обработки данных;
- разработка ML-моделей, настраивание их качественной и количественной оценки, анализ результатов;
- работа с инструментами разметки (LLM и краудсорсинг) для подготовки Ground Truth данных;
- взаимодействие с заказчиками, грумминги, декомпозиция крупных ML-проектов.
Требования
- Высшее техническое или математическое образование;
- более двух лет опыта на позиции Data Science или Machine learning;
- опыт работы с Python (Pandas, NumPy, SciPy, CatBoost, XGBoost), SQL (оконки, процедуры) — для подготовки данных и обучения ML-моделей;
- опыт работы с Airflow, BI-системами — Datalens/Superset/Tableu/Power-BI;
- опыт вывода в прод классических ML-моделей (например, бустингов);
- умение работать с математической статистикой для управления статзначимостью метрик моделей и пайплайнов.
Будет плюсом
- Опыт работы с LLM-моделями или краудсорсингом.
Мы предлагаем
Формат работы
Уровень
График работы
Технический департамент
Объединяем специалистов, которые обслуживают IT-инфраструктуру продуктов VK. Отвечаем за бесперебойную работу высоконагруженных систем и сервисов, за сеть передачи данных, за развитие сети центров обработки данных и сервисов для наших сотрудников.