Data scientist/Разработчик-исследователь (NLP), Москва
Data Office — центральный хаб данных VK. Мы создаем data-продукты для экосистемы VK, делаем единую точку входа для всей аналитики в VK и автоматизируем различные сценарии работы с данными.
Мы находимся в поиске самостоятельного специалиста по большим данным и машинному обучению с фокусом на обработку текстовых данных, который будет помогать нам создавать новые и развивать существующие data-продукты. Если ты любишь копаться в данных и интересуешься продуктовой частью, то тебе должно быть у нас интересно.
Чем привлекает наша позиция:
- объём данных, с которыми будешь работать — в нашем хранилище десятки петабайт данных
- разнообразие задач как с технической, так и с продуктовой точки зрения
- возможность влиять на результат и видеть эффект от своей работы
Задачи
- Исследование данных
- Построение и оптимизация ML-моделей
- Разработка и развитие продакшн пайплайнов для процессинга больших объемов текстовых данных с использованием ML
Требования
- Хорошая математическая подготовка
- Знание классических алгоритмов и структур данных
- Уверенное владение Python и SQL
- Знание ML (алгоритмы, метрики) и опыт работы с ML-библиотеками
- Знание современных методов обработки естественных языков
- Опыт работы с Hadoop (Spark, Hive, HDFS)
- Опыт работы с luigi или airflow
- Linux, уверенная работа в командной строке
Мы предлагаем
Формат работы
Уровень
График работы

Data office
Data office — подразделение в департаменте по экосистемным продуктам. Команда строит внутренние сервисы и продукты для использования данных в аналитике, развитии продуктов и машинном обучении. Наша ключевая цель — сделать данные полезными для каждого сервиса в группе и всей экосистемы в целом.