Data Scientist, Москва
В связи с расширением команды ищем Middle Data Scientist (в особых случаях готовы рассмотреть Junior+/Middle-) на проект VK Predict (https://vk.company/ru/company/business/predict/), основной фокус которого - создание и внедрение аналитических сервисов, основанных на ML-решениях.
О нашем подразделении:
- Мы представляем B2B-направление, то есть у вас будет возможность принести пользу российскому бизнесу и повлиять на развитие экономики.
- Также вы получите уникальный опыт взаимодействия с компаниями из различных сфер и приобретёте уникальные компетенции в моделировании.
- Ценим классический ML во всех его проявлениях.
- Любим заниматься инфраструктурными задачами (автоматизацией рутинных задач, оптимизацией) и выкатывать модели в production.
- Работаем в гибридном формате. Есть возможность работать в тех городах, где есть офисы VK.
Задачи
- выполнение adhoc задач по применению существующих моделей и сервисов.
- разработка различных моделей машинного обучения на новых данных.
- изучение и обработка данных из различных источников.
- внедрение регулярного расчёта новых признаков, улучшение мониторинга качества данных.
- генерация и проверка гипотез по повышению качества текущих моделей и создания новых, более высокого качества.
- развитие инфраструктуры существующих сервисов.
- написание продуктивизируемых пайплайн скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов.
Требования
- высшее техническое образование (с обязательным IT-профилем). Готовы также рассмотреть кандидатов с экономическим образованием или студентов последних курсов при условии наличия повышения квалификации на специализированных курсах (например, MADE VK, ШАД и так далее).
- наличие релевантного коммерческого опыта от 1 года.
- умение разрабатывать пайплайны для эффективной обработки данных в Python, Pyspark.
- желание заниматься и развиваться в задачах с классическим ML и DS, а также в задачах с развитием инфраструктуры development и production.
- глубокие знания классического ML.
- сильные математические знания (особенно по теории вероятностей и статистике), понимание математических основ алгоритмов машинного обучения.
- уверенное программирование на Python (базовый ООП и прикладные библиотеки - NumPy, Pandas, Sklearn, LightGBM, CatBoost, Pyspark).
- знание SQL и основ баз данных.
Будет плюсом
- опыт в задачах DE/MLE.
- опыт работы с PySpark, Hadoop.
- написание bash-скриптов, понимание возможностей интерфейса командной строки Unix-подобных операционных систем.
- опыт решения базовых задач обработки текстовых данных и последовательностей.
- знание luigi.
Мы предлагаем
Формат работы
Уровень
График работы

PREDICT
PREDICT (Predictive Analytic Solutions) – проект VK, ключевой задачей которого является создание для клиентов продуктов и сервисов на основе предиктивных моделей, построенных с использованием методов машинного обучения.