Data Scientist (Антиспам), Санкт-Петербург
Одноклассники — это крупнейшая развлекательная социальная сеть в России. Место, где можно всегда оставаться на связи со своими друзьями и близкими, выкладывать и редактировать фотографии, слушать любимую музыку, смотреть самые популярные видео и многое другое!
На данный момент, мы в поиске специалиста по машинному обучению, который возьмет на себя направление по работе с табличными данными в Антиспам команде OK.RU. В команде мы в основном практикуем end-to-end решения задач, поэтому предполагается, что кандидат не боится "испачкать руки" в продакшен коде.
Наш стек:
- Языки: Python, Java, Scala;
- Технологии которые часто используем в работе: PyTorch, DVC, MlFlow, Hadoop,Spark, Airflow, Kafka.
Задачи
- составление моделей сегментирования данных и методик обнаружения случаев мошенничества;
- разработка моделей сегментации клиентов на основании их профилей и анализа их поведения;
- исследование поведенческих паттернов и нахождение зависимостей в данных используя статистические методы анализа;
- проведение аналитики табличных данных, временных рядов.
Требования
- обладаешь уверенными навыками программирования на Python и хотя бы в одном статически типизированном языке;
- имеешь опыт с DL библиотеками (Pytorch/TF);
- имеешь хорошие теоретические знания классического ML;
- работаешь с современным BigData стеком (Hadoop/Spark/Airflow).
Будет плюсом
- опыт оптимизации DL решений на инференс;
- уметь прочитать, а затем воспроизвести в коде статью;
- опыт промышленной разработки на Java/Scala/Python;
- опыт разработки промышленных AI сервисов;
- опыт применения DevOps практик в контексте разработки ML моделей;
- опыт применения ML в cybersecurity и общее представление об этой сфере.
Мы предлагаем
Формат работы
Уровень
График работы

Одноклассники
Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок.