Junior ML engineer в команду Лента (OK.RU), Санкт-Петербург
Одноклассники — это крупнейшая развлекательная социальная сеть в России. Место, где можно всегда оставаться на связи со своими друзьями и близкими, выкладывать и редактировать фотографии, слушать любимую музыку, смотреть самые популярные видео и многое другое!
Мы расширяем нашу молодую и горячую DS-команду и ищем человека, который будет участвовать в разработке сервисов "Ленты" и "Дискавери".
Лента - это сервис с десятками миллионов DAU на всех платформах (web, mob.web, android, ios). Это ключевая часть социальной сети, в которой пользователи получают всю информацию, на которую они подписались: контент друзей, фото, посты и видео из сообществ, дружбы и т.д.
Дискавери - сервис с миллионами DAU, в котором пользователю рекомендуется контент, исходя из его предпочтений с помощью различных моделей машинного обучения и не только.
В задачу сервисов входит не только отобрать интересный контент пользователю, но и сделать это быстро. Для решения этих задач мы используем гибкую систему экспериментов, в которых задействованы различные алгоритмы ML.
Задачи
Работа с контентом (CV/NLP):
- разработка моделей по генерации/модификации аудио-визуального контента;
- разработка моделей по работе с текстовым контентом.
Рекомендательные системы:
- автороцентричное ранжирование;
- реалтайм адаптация к текущим интересам пользователя;
- как сделать рекомендации разнообразными;
- участвовать в создании новых контентных фичей с помощью компьютерного зрения и текстовой генерации;
- автоматический поиск и оценка перспективных создателей контента.
Ранжирование:
- как измерять и влиять на "счастье" пользователей;
- как оптимизировать системы так, чтобы были счастливы и создатели и потребители контента;
- как корректно проводить тестирование новых функциональностей в системе с сильным сетевым эффектом.
Требования
- понимание принципов работы классических ML подходов;
- понимание принципов работы CV/NLP моделей;
- опыт разработки на Python;
- умение прочитать, а затем воспроизвести в коде статью.
Будет плюсом
- опыт применения DevOps практик в контексте разработки ML моделей;
- понимание SOTA подходов в NLP / CV;
- знание основных нейросетевых архитектур в CV/NLP;
- опыт в разработке рекомендательных систем;
- опыт промышленной разработки на Java/Scala;
- опыт работы с современным BigData стеком (Hadoop/Spark/Airflow).
Мы предлагаем
Формат работы
Уровень
График работы

Одноклассники
Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок.