ML Engineer в команду Ленты, Санкт-Петербург

Откликнуться

Одноклассники — это крупнейшая развлекательная социальная сеть в России. Недавно у нас было масштабное обновление: теперь ОК — это территория увлечений. Здесь можно найти много классного и качественного контента, посвящённого даже очень редкому хобби.

А ещё ОК — это команда, получающая искренние эмоции и удовольствие от бренда, контента и цифровых технологий с 2006 года. Пул задач в ОК шире, чем в большинстве проектов. Это классный драйвер для изучения топовых технологий, подходов и решений в реальных условиях.

Мы расширяем нашу ML-команду и ищем эксперта, который будет участвовать в разработке сервисов ленты рекомендаций. Лента — это сервис с десятками миллионов DAU на всех платформах. В нашей ленте есть два типа контента:

1. подписной — контент, который пользователи хотят просматривать сами;
2. неподписной — контент, который мы с помощью различных моделей машинного обучения (и не только) рекомендуем исходя из предпочтений пользователя. Эти сервисы не только отбирают интересный пользователю контент, но и делают это быстро, в том числе формируя рекомендации на лету, в реальном времени анализируя данные об активности пользователя на сайте.

Что необходимо знать о нас:

Данные. Несколько HDFS-кластеров с общим объёмом данных более 200 ПБ, подробная история активности пользователей за несколько лет.
Железо. Вычислительный кластер на 200+ TБ RAM, 60K cores, десятки тысяч задач в день.
Масштаб влияния на бизнес. Непосредственное влияние на основные метрики бизнеса: DAU, Retention, Timespent, NPS.
Уровень развития Data Science в компании. Налажены все основные процессы со сбором признаков, обучением и инференсом моделей, запуском и анализом А/В-экспериментов.
Роль ML-инженера. ML-инженер может участвовать во всех этапах жизненного цикла моделей — от идеи до внедрения. В основном, вы будете реализовывать сбор признаков, обучать и конфигурировать модели, принимать решения по результатам А/В-экспериментов, реализовывать инференс моделей в продакшене, сопровождать модель в дальнейшем.
Коммуникация внутри команды. Один общекомандный созвон в неделю для синка по задачам. Bi-weekly синки со всей ML-командой, где обсуждают интересные кейсы. Ежемесячные 1-1 с руководителем команды.
Prod/Research. По большей части — прод, но иногда бывают задачи, для решения которых необходимо предварительно проводить исследования, читать статьи и реализовывать идеи из них.

Задачи

разрабатывать новые и совершенствовать существующие рекомендательные модели в ленте неподписного контента, адаптировать рекомендации к интересам пользователя в реальном времени, увеличивать разнообразие рекомендаций;
реализовывать батчевые и стриминговые пайплайны для сбора признаков, обработки данных и инференса моделей в продакшене;
обрабатывать и анализировать большие данные, выдвигать гипотезы;
проводить А/В-эксперименты, выполнять их статистическую оценку.

Требования

имеете опыт работы на должностях, связанных с Big Data и ML-инженерией, от трёх лет;
хорошо знаете Java/Scala и Python (pandas/numpy/scikit-learn/xgboost);
уже работали с продуктами стека Big Data (Hadoop, Spark);
уже работали с инструментами потоковой обработки данных (Apache Samza или Spark Streaming, Apache Kafka);
знаете алгоритмы классического машинного обучения и основы математической статистики;
понимаете принципы работы и подходы к построению рекомендательных систем.

Будет плюсом

имеете представление о современных принципах построения и работы нейронных сетей (Deep Learning, PyTorch/TensorFlow, attention/трансформеры);
уже настраивали пайплайны машинного обучения от сбора данных до инференса моделей в продакшене;
представляете, как работает Apache Airflow, MLFlow, Spark ML, Faiss;
умеете прочитать статью, а затем воспроизвести её в коде.

Мы предлагаем

Гибкий график работы

Офис в центре города

ДМС

Профессиональная команда

Интересные задачи

Откликнуться

Формат работы

офисный

комбинированный

дистанционный

Уровень

middle

senior

График работы

полный

ОК

Команда OK.TECH объединяет сотни специалистов разработки, дизайна, маркетинга, машинного обучения, поддержки пользователей и не только. Каждый из нас влияет на то, каким увидят ОК миллионы пользователей.

Подробнее о проекте

Мы предлагаем

Гибкий график работы

Офис в центре города

ДМС

Профессиональная команда

Интересные задачи

ML Engineer в команду Ленты, Санкт-Петербург

ML Engineer в команду Ленты, Санкт-Петербург

Задачи

Требования

Будет плюсом

Мы предлагаем

Формат работы

Уровень

График работы

ОК

Мы предлагаем

Похожие вакансии

Руководитель команды машинного обучения

Machine Learning Engineer в VK Знакомства

Программист-исследователь

ML Developer

DevOps-инженер в Data Platform (Big Data)

ML engineer

ML Lead

Lead команды discovery-рекомендаций

ML инженер

Продуктовый менеджер Data-сервисов

ML - программист

ML Lead

ML Lead (Ранжирование)

ML-инженер в СМБ

Старший продуктовый аналитик (новый продукт в VK)

Senior Java-разработчик (ML команда)

DL researcher (распознавание речи)

Менеджер продукта в команду потребления контента и рекомендаций

Аналитик

Data Engineer

DL researcher (синтез речи)

Java Developer в группу разработки базовых сервисов

ML-разработчик (Музыкальные рекомендации)

Data engineer в команду поисковой базы

Project Manager в команду Data Platform