Инженер-разработчик Data Science (проект "Лента"), Санкт-Петербург
Мы расширяем нашу молодую и горячую DS-команду и ищем человека, который будет участвовать в разработке сервисов "Ленты" и "Дискавери". Если ты эксперт в CV/NLP или умеешь качественно шатать таблички в Big Data стеке и понимаешь бизнес, то для тебя тоже найдутся задачи.
Лента - это сервис с десятками миллионов DAU на всех платформах (web, mob.web, android, ios). Это ключевая часть социальной сети, в которой пользователи получают всю информацию, на которую они подписались: контент друзей, фото, посты и видео из сообществ, дружбы и т.д.
Дискавери - сервис с миллионами DAU, в котором пользователю рекомендуется контент, исходя из его предпочтений с помощью различных моделей машинного обучения и не только.
В задачу сервисов входит не только отобрать интересный контент пользователю, но и сделать это быстро. Для решения этих задач мы используем гибкую систему экспериментов, в которых задействованы различные алгоритмы ML. Для обеспечения быстродействия и отказоустойчивости у нас поднято более 600 инстансов в трех датацентрах.
Задачи
Рекомендательные системы:
- автороцентричное ранжирование;
- реалтайм адаптация к текущим интересам пользователя;
- как сделать рекомендации разнообразными;
- участвовать в создании новых контентных фичей с помощью компьютерного зрения и текстовой генерации;
- автоматический поиск и оценка перспективных создателей контента.
Ранжирование:
- как измерять и влиять на "счастье" пользователей;
- как оптимизировать системы так, чтобы были счастливы и создатели и потребители контента;
- как корректно проводить тестирование новых функциональностей в системе с сильным сетевым эффектом.
Требования
- умение прочитать, а затем воспроизвести в коде статью;
- опыт в разработке рекомендательных систем;
- опыт промышленной разработки на Java/Scala/Python;
- опыт работы с современным BigData стеком (Hadoop/Spark/Airflow).
Будет плюсом
- опыт применения DevOps практик в контексте разработки ML моделей;
- знание основных нейросетевых архитектур в CV/NLP.
Мы предлагаем
Формат работы
Уровень
График работы

Одноклассники
Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок.