ML Engineer в команду Ленты, Санкт-Петербург

ML Engineer в команду Ленты, Санкт-Петербург

Одноклассники — это крупнейшая развлекательная социальная сеть в России. Недавно у нас было масштабное обновление: теперь ОК — это территория увлечений. Здесь можно найти много классного и качественного контента, посвящённого даже очень редкому хобби.

А ещё ОК — это команда, получающая искренние эмоции и удовольствие от бренда, контента и цифровых технологий с 2006 года. Пул задач в ОК шире, чем в большинстве проектов. Это классный драйвер для изучения топовых технологий, подходов и решений в реальных условиях.

Мы расширяем нашу ML-команду и ищем эксперта, который будет участвовать в разработке сервисов ленты рекомендаций. Лента — это сервис с десятками миллионов DAU на всех платформах. В нашей ленте есть два типа контента:

1. подписной — контент, который пользователи хотят просматривать сами;
2. неподписной — контент, который мы с помощью различных моделей машинного обучения (и не только) рекомендуем исходя из предпочтений пользователя. Эти сервисы не только отбирают интересный пользователю контент, но и делают это быстро, в том числе формируя рекомендации на лету, в реальном времени анализируя данные об активности пользователя на сайте.

Что необходимо знать о нас:

  • Данные. Несколько HDFS-кластеров с общим объёмом данных более 200 ПБ, подробная история активности пользователей за несколько лет.
  • Железо. Вычислительный кластер на 200+ TБ RAM, 60K cores, десятки тысяч задач в день.
  • Масштаб влияния на бизнес. Непосредственное влияние на основные метрики бизнеса: DAU, Retention, Timespent, NPS.
  • Уровень развития Data Science в компании. Налажены все основные процессы со сбором признаков, обучением и инференсом моделей, запуском и анализом А/В-экспериментов.
  • Роль ML-инженера. ML-инженер может участвовать во всех этапах жизненного цикла моделей — от идеи до внедрения. В основном, вы будете реализовывать сбор признаков, обучать и конфигурировать модели, принимать решения по результатам А/В-экспериментов, реализовывать инференс моделей в продакшене, сопровождать модель в дальнейшем.
  • Коммуникация внутри команды. Один общекомандный созвон в неделю для синка по задачам. Bi-weekly синки со всей ML-командой, где обсуждают интересные кейсы. Ежемесячные 1-1 с руководителем команды.
  • Prod/Research. По большей части — прод, но иногда бывают задачи, для решения которых необходимо предварительно проводить исследования, читать статьи и реализовывать идеи из них.

Задачи

  • разрабатывать новые и совершенствовать существующие рекомендательные модели в ленте неподписного контента, адаптировать рекомендации к интересам пользователя в реальном времени, увеличивать разнообразие рекомендаций;
  • реализовывать батчевые и стриминговые пайплайны для сбора признаков, обработки данных и инференса моделей в продакшене;
  • обрабатывать и анализировать большие данные, выдвигать гипотезы;
  • проводить А/В-эксперименты, выполнять их статистическую оценку.

Требования

  • имеете опыт работы на должностях, связанных с Big Data и ML-инженерией, от трёх лет;
  • хорошо знаете Java/Scala и Python (pandas/numpy/scikit-learn/xgboost);
  • уже работали с продуктами стека Big Data (Hadoop, Spark);
  • уже работали с инструментами потоковой обработки данных (Apache Samza или Spark Streaming, Apache Kafka);
  • знаете алгоритмы классического машинного обучения и основы математической статистики;
  • понимаете принципы работы и подходы к построению рекомендательных систем.

Будет плюсом

  • имеете представление о современных принципах построения и работы нейронных сетей (Deep Learning, PyTorch/TensorFlow, attention/трансформеры);
  • уже настраивали пайплайны машинного обучения от сбора данных до инференса моделей в продакшене;
  • представляете, как работает Apache Airflow, MLFlow, Spark ML, Faiss;
  • умеете прочитать статью, а затем воспроизвести её в коде.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Формат работы

офисный
комбинированный
дистанционный

Уровень

middle
senior

График работы

полный

ОК

Команда OK.TECH объединяет сотни специалистов разработки, дизайна, маркетинга, машинного обучения, поддержки пользователей и не только. Каждый из нас влияет на то, каким увидят ОК миллионы пользователей.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Похожие вакансии

Руководитель команды машинного обучения

Клиентский опыт
Москва, гибкий

Machine Learning Engineer в VK Знакомства

ВКонтакте
Санкт-Петербург, комбинированный

Программист-исследователь

AI VK
Москва, комбинированный

ML Developer

VK Play
Москва, гибкий

DevOps-инженер в Data Platform (Big Data)

VK Tech
Москва, гибкий

ML engineer

ОК
Санкт-Петербург, комбинированный

ML Lead

Дзен
Москва, офисный

Lead команды discovery-рекомендаций

AI VK
Москва, гибкий

ML инженер

Клиентский опыт
Москва, гибкий

Продуктовый менеджер Data-сервисов

VK Tech
Москва, гибкий

ML - программист

VK Predict
Москва, комбинированный

ML Lead

AI VK
Москва, гибкий

ML Lead (Ранжирование)

AI VK
Москва, гибкий

ML-инженер в СМБ

VK
Москва, гибкий

Старший продуктовый аналитик (новый продукт в VK)

VK
Москва, гибкий

Senior Java-разработчик (ML команда)

AI VK
Москва, гибкий

DL researcher (распознавание речи)

Маруся и VK Капсула
Москва, комбинированный

Менеджер продукта в команду потребления контента и рекомендаций

ВКонтакте
Москва, гибкий

Аналитик

Оператор рекламных данных
Москва, гибкий

Data Engineer

VK Реклама
Москва, комбинированный

DL researcher (синтез речи)

Маруся и VK Капсула
Москва, комбинированный

Java Developer в группу разработки базовых сервисов

Дзен
Москва, гибкий

ML-разработчик (Музыкальные рекомендации)

VK Музыка
Москва, комбинированный

Data engineer в команду поисковой базы

AI VK
Москва, гибкий

Project Manager в команду Data Platform

ВКонтакте
Москва, гибкий