ML Engineer в команду Ленты, Санкт-Петербург

ML Engineer в команду Ленты, Санкт-Петербург

Одноклассники — это крупнейшая развлекательная социальная сеть в России. Недавно у нас было масштабное обновление: теперь ОК — это территория увлечений. Здесь можно найти много классного и качественного контента, посвящённого даже очень редкому хобби.

А ещё ОК — это команда, получающая искренние эмоции и удовольствие от бренда, контента и цифровых технологий с 2006 года. Пул задач в ОК шире, чем в большинстве проектов. Это классный драйвер для изучения топовых технологий, подходов и решений в реальных условиях.

Мы расширяем нашу ML-команду и ищем эксперта, который будет участвовать в разработке сервисов ленты рекомендаций. Лента — это сервис с десятками миллионов DAU на всех платформах. В нашей ленте есть два типа контента:

1. подписной — контент, который пользователи хотят просматривать сами;
2. неподписной — контент, который мы с помощью различных моделей машинного обучения (и не только) рекомендуем исходя из предпочтений пользователя. Эти сервисы не только отбирают интересный пользователю контент, но и делают это быстро, в том числе формируя рекомендации на лету, в реальном времени анализируя данные об активности пользователя на сайте.

Что необходимо знать о нас:

  • Данные. Несколько HDFS-кластеров с общим объёмом данных более 200 ПБ, подробная история активности пользователей за несколько лет.
  • Железо. Вычислительный кластер на 200+ TБ RAM, 60K cores, десятки тысяч задач в день.
  • Масштаб влияния на бизнес. Непосредственное влияние на основные метрики бизнеса: DAU, Retention, Timespent, NPS.
  • Уровень развития Data Science в компании. Налажены все основные процессы со сбором признаков, обучением и инференсом моделей, запуском и анализом А/В-экспериментов.
  • Роль ML-инженера. ML-инженер может участвовать во всех этапах жизненного цикла моделей — от идеи до внедрения. В основном, вы будете реализовывать сбор признаков, обучать и конфигурировать модели, принимать решения по результатам А/В-экспериментов, реализовывать инференс моделей в продакшене, сопровождать модель в дальнейшем.
  • Коммуникация внутри команды. Один общекомандный созвон в неделю для синка по задачам. Bi-weekly синки со всей ML-командой, где обсуждают интересные кейсы. Ежемесячные 1-1 с руководителем команды.
  • Prod/Research. По большей части — прод, но иногда бывают задачи, для решения которых необходимо предварительно проводить исследования, читать статьи и реализовывать идеи из них.

Задачи

  • разрабатывать новые и совершенствовать существующие рекомендательные модели в ленте неподписного контента, адаптировать рекомендации к интересам пользователя в реальном времени, увеличивать разнообразие рекомендаций;
  • реализовывать батчевые и стриминговые пайплайны для сбора признаков, обработки данных и инференса моделей в продакшене;
  • обрабатывать и анализировать большие данные, выдвигать гипотезы;
  • проводить А/В-эксперименты, выполнять их статистическую оценку.

Требования

  • имеете опыт работы на должностях, связанных с Big Data и ML-инженерией, от трёх лет;
  • хорошо знаете Java/Scala и Python (pandas/numpy/scikit-learn/xgboost);
  • уже работали с продуктами стека Big Data (Hadoop, Spark);
  • уже работали с инструментами потоковой обработки данных (Apache Samza или Spark Streaming, Apache Kafka);
  • знаете алгоритмы классического машинного обучения и основы математической статистики;
  • понимаете принципы работы и подходы к построению рекомендательных систем.

Будет плюсом

  • имеете представление о современных принципах построения и работы нейронных сетей (Deep Learning, PyTorch/TensorFlow, attention/трансформеры);
  • уже настраивали пайплайны машинного обучения от сбора данных до инференса моделей в продакшене;
  • представляете, как работает Apache Airflow, MLFlow, Spark ML, Faiss;
  • умеете прочитать статью, а затем воспроизвести её в коде.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Формат работы

офисный
комбинированный
дистанционный

Уровень

middle
senior

График работы

полный

ОК

Команда OK.TECH объединяет сотни специалистов разработки, дизайна, маркетинга, машинного обучения, поддержки пользователей и не только. Каждый из нас влияет на то, каким увидят ОК миллионы пользователей.

Мы предлагаем

Гибкий график работы
Офис в центре города
ДМС
Профессиональная команда
Интересные задачи

Похожие вакансии

Руководитель группы машинного обучения

Клиентский опыт
Москва, гибкий

Machine Learning Engineer в VK Знакомства

ВКонтакте
Санкт-Петербург, гибкий

Data Scientist R&D

VK Реклама
Москва, гибкий

ML Developer

Технический департамент
Москва, гибкий

Программист-исследователь

Антиспам
Москва, гибкий

NLP Lead

Маруся и VK Капсула
Москва, гибкий

Data Scientist (реклама и медиа)

VK Реклама
Москва, гибкий

ML инженер в Почту и продукты Mail.ru

Mail.ru
Москва, гибкий

Инженер по машинному обучению

Клиентский опыт
Москва, гибкий

ML Engineer

VK Реклама
Москва, гибкий

Программист-исследователь

Маруся и VK Капсула
Москва, комбинированный

Python developer в команду ML

VK Assistant
Москва, гибкий

ML - программист

VK Predict
Москва, комбинированный

ML инженер в СМБ

VK
Москва, гибкий

Аналитик-разработчик (А/Б платформа)

ОК
Москва, гибкий

Эксперт по безопасности инфраструктуры

ОК
Москва, гибкий

ML Engineer (LLM)

Департамент AI
Санкт-Петербург, комбинированный

ML-инженер в группу машинного обучения

VK Реклама
Москва, гибкий

Менеджер продукта в команду потребления контента и рекомендаций

ВКонтакте
Москва, гибкий

Senior ML-разработчик

Дзен
Москва, гибкий

ML-инженер в команду Гео

VK Реклама
Москва, гибкий

ML Engineer

VK Видео
Москва, гибкий

ML-разработчик (Музыкальные рекомендации)

Департамент AI
Москва, гибкий

Deep Learning Engineer (NLP)

Маруся и VK Капсула
Москва, гибкий

Data Scientist

VK Реклама
Москва, гибкий

Project Manager в команду Data Platform

ВКонтакте
Москва, гибкий

ML-разработчик (ML для авторов)

Департамент AI
Москва, гибкий

Senior ML Разработчик (RnD)

Департамент AI
Москва, гибкий