Мы развиваем поисковый саджест, spellchecker и классификацию запросов. Наши сервисы используются в почти всех продуктах VK: Видео, Музыка, Дзен и другие. На каждый из наших сервисов приходится нагрузка порядка 20 000 RPS.
Это важная часть поискового процесса: от неё зависит, насколько быстро человек сформулирует запрос, увидит нужную подсказку и вообще попадёт в правильный сценарий.
Сейчас мы ищем ML-инженера уровня middle–senior, который поможет системно развивать наше направление.
Мы ищем человека, которому интересно экспериментировать и доводить решения до рабочего production-состояния: с понятными метриками, мониторингом, low-latency ограничениями и качественной инженерной эксплуатацией.
Задачи
- Участвовать в процессе генерации и приоритизации идей, определения направления развития наших сервисов: что имеет смысл делать в первую очередь, где будет заметный эффект
- Выстроить прозрачные и надёжные процессы вокруг моделей: офлайн-оценку, регулярное переобучение, мониторинг и контроль деградаций
- Писать production и интеграционный код вокруг моделей, участвовать в выводе решений в прод и их дальнейшей эксплуатации
- По возможности помогать команде в целом лучше работать с ML: делиться практиками, подходами к оценке качества и здравыми инженерными принципами
Требования
- Есть опыт коммерческой разработки и внедрения ML-решений в production
- Понимаете полный жизненный цикл модели: от подготовки данных и обучения до выкладки, мониторинга, переобучения и работы с деградациями
- Уверенно владеете Python и используете его не только для экспериментов, но и для практической работы с пайплайнами и ML-инструментами
- Понимаете, как контролировать latency, надёжность и наблюдаемость, откаты, контроль качества
- Умеете самостоятельно разбираться в уже существующих решениях, замечать риски и предлагать реалистичный план улучшений
- Готовы работать в связке с backend-разработчиками, аналитиками, ML-специалистами и менеджментом
Будет плюсом
- Опыт в поиске, саджесте, spell correction, ranking, candidate generation, query understanding или NLP-задачах
- Опыт с embeddings, retrieval-подходами и задачами понимания запроса
- Опыт внедрения ML-решений в low-latency сервисы
- Опыт работы с C++ или желание в него погружаться
- Опыт работы с YT/YTsaurus
- Опыт выстраивания MLOps-процессов, мониторинга качества моделей и настройки алертов на деградации
- Опыт технического аудита ML-систем
- Умение объяснять ML-подходы простым инженерным языком
Мы предлагаем
Формат работы
Уровень
График работы
Поиск
Поиск понимает смысл поисковых запросов при помощи нейросетей, мы используем обширный граф знаний и компьютерное зрение, развиваем рекомендательную систему, детектируем спам и другой вредоносный контент.