ML Engineer в команду ленты, Санкт-Петербург

ML Engineer в команду ленты, Санкт-Петербург

Одноклассники — это крупнейшая развлекательная социальная сеть в России. Недавно у нас было масштабное обновление: теперь ОК — это территория увлечений. Здесь можно найти много классного и качественного контента, посвящённого даже очень редкому хобби.

А ещё ОК — это команда, получающая искренние эмоции и удовольствие от бренда, контента и цифровых технологий с 2006 года. Пул задач в ОК шире, чем в большинстве проектов. Это классный драйвер для изучения топовых технологий, подходов и решений в реальных условиях.

Мы расширяем нашу ML-команду и ищем эксперта, который будет участвовать в разработке сервисов ленты рекомендаций. Лента — это сервис с десятками миллионов DAU на всех платформах. В нашей ленте есть два типа контента:

1. подписной — контент, который пользователи хотят просматривать сами;
2. неподписной — контент, который мы с помощью различных моделей машинного обучения (и не только) рекомендуем исходя из предпочтений пользователя. Эти сервисы не только отбирают интересный пользователю контент, но и делают это быстро, в том числе формируя рекомендации на лету, в реальном времени анализируя данные об активности пользователя на сайте.

Что необходимо знать о нас:

  • Данные. Несколько HDFS-кластеров с общим объёмом данных более 200 ПБ, подробная история активности пользователей за несколько лет.
  • Железо. Вычислительный кластер на 200+ TБ RAM, 60K cores, десятки тысяч задач в день.
  • Масштаб влияния на бизнес. Непосредственное влияние на основные метрики бизнеса: DAU, Retention, Timespent, NPS.
  • Уровень развития Data Science в компании. Налажены все основные процессы со сбором признаков, обучением и инференсом моделей, запуском и анализом А/В-экспериментов.
  • Роль ML-инженера. ML-инженер может участвовать во всех этапах жизненного цикла моделей — от идеи до внедрения. В основном, вы будете реализовывать сбор признаков, обучать и конфигурировать модели, принимать решения по результатам А/В-экспериментов, реализовывать инференс моделей в продакшене, сопровождать модель в дальнейшем.
  • Коммуникация внутри команды. Один общекомандный созвон в неделю для синка по задачам. Bi-weekly синки со всей ML-командой, где обсуждают интересные кейсы. Ежемесячные 1-1 с руководителем команды.
  • Prod/Research. По большей части — прод, но иногда бывают задачи, для решения которых необходимо предварительно проводить исследования, читать статьи и реализовывать идеи из них.

Задачи

  • Разрабатывать новые и совершенствовать существующие рекомендательные модели в ленте неподписного контента, адаптировать рекомендации к интересам пользователя в реальном времени, увеличивать разнообразие рекомендаций;
  • реализовывать батчевые и стриминговые пайплайны для сбора признаков, обработки данных и инференса моделей в продакшене;
  • обрабатывать и анализировать большие данные, выдвигать гипотезы;
  • проводить А/В-эксперименты, выполнять их статистическую оценку.

Требования

  • Имеете опыт работы на должностях, связанных с Big Data и ML-инженерией, от трёх лет;
  • хорошо знаете Java/Scala и Python (pandas/numpy/scikit-learn/xgboost);
  • уже работали с продуктами стека Big Data (Hadoop, Spark);
  • уже работали с инструментами потоковой обработки данных (Apache Samza или Spark Streaming, Apache Kafka);
  • знаете алгоритмы классического машинного обучения и основы математической статистики;
  • понимаете принципы работы и подходы к построению рекомендательных систем.

Будет плюсом

  • Имеете представление о современных принципах построения и работы нейронных сетей (Deep Learning, PyTorch/TensorFlow, attention/трансформеры);
  • уже настраивали пайплайны машинного обучения от сбора данных до инференса моделей в продакшене;
  • представляете, как работает Apache Airflow, MLFlow, Spark ML, Faiss;
  • умеете прочитать статью, а затем воспроизвести её в коде.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Формат работы

офисный
комбинированный
дистанционный

Уровень

middle
senior

График работы

полный

ОК

Команда OK.TECH объединяет сотни специалистов разработки, дизайна, маркетинга, машинного обучения, поддержки пользователей и не только. Каждый из нас влияет на то, каким увидят ОК миллионы пользователей.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Похожие вакансии

Программист-исследователь (CV)

Поиск
Москва, комбинированный

Machine Learning Engineer

VK Реклама
Москва, гибкий

Late night offer для ML (сентябрь)

AI VK
Москва, гибкий

DevOps-инженер в Data Platform (Big Data)

VK Tech
Москва, гибкий

ML Lead (ранжирование)

AI VK
Москва, гибкий

Руководитель команды машинного обучения

Клиентский опыт
Москва, гибкий

ML-программист

VK Predict
Москва, комбинированный

ML Engineer

ОК
Санкт-Петербург, комбинированный

ML-инженер

Средний и малый бизнес
Москва, гибкий

ML Lead

Дзен
Москва, офисный

Старший продуктовый аналитик (новый продукт в VK)

VK
Москва, гибкий

Программист-исследователь

AI VK
Москва, комбинированный

Lead команды discovery-рекомендаций

AI VK
Москва, гибкий

Senior ML researcher (RecSys)

AI VK
Москва, гибкий

Data engineer в команду поисковой базы

AI VK
Москва, гибкий

Java Developer в группу разработки базовых сервисов

Дзен
Москва, гибкий

Руководитель разработки ML Training Platform

AI VK
Москва, офисный

Machine Learning Engineer в команду ML-алгоритмов умной ленты

ВКонтакте
Санкт-Петербург, гибкий

Senior ML-разработчик (музыкальные рекомендации)

AI VK
Москва, комбинированный

Менеджер продукта в команду потребления контента и рекомендаций

ВКонтакте
Москва, гибкий