Site Reliability Engineer (SRE), Москва

Откликнуться

Отдел эксплуатации VK — техническое сердце компании. Мы собрали одну из лучших команд в рунете, обладающую уникальной экспертностью в области сетевых технологий и системного администрирования. Мы используем всё самое выдающееся, что есть на рынке, а зачастую и создаём передовые технологии.

SRE занимаются эксплуатацией всех продуктов компании и обеспечивают 24/7 доступность сервисов для наших пользователей, и сейчас мы ищем сильных инженеров в несколько разных проектов VK.

Задачи

Обеспечение непрерывного доступа к ресурсам для внешних и внутренних пользователей;
развитие и масштабирование продуктов — наша инфраструктура состоит из множества сервисов в геораспределённых дата-центрах, мы также планируем наши вычислительные ресурсы и прогнозируем их утилизацию;
оперативная работа с мониторингом и стратегическая с инцидентами — мы не только разрешаем текущие инциденты, но и постоянно работаем над предотвращением их появления в будущем;
автоматизация работы с инфраструктурой — наши команды SRE занимаются полным циклом сопровождения продуктовой среды, от удалённой установки ОС до описания деплойментов (Helm-чартов, Kubernetes-операторов, манифестов Puppet, Playbook Ansible);
участие в жизненном цикле продуктов — мы тесно связаны с нашими командами разработки, двусторонняя обратная связь между нашими командами позволяет добиться лучших результатов в продукте и совместно влиять на наиболее критичные, узкие места в наших сервисах и инфраструктуре.

Требования

Опыт работы с ОС Linux от 3 лет и более — на интервью мы поговорим обо всём, от syscall до cgroups и namespaces;
понимание принципов работы с Сетью — мы уверены, что вы точно знаете, чем отличаются L3, L4 и L7, а также назовете практическую разницу между DROP и REJECT;
опыт работы с СУБД (основные для нас MySQL и PostgreSQL) — высокая доступность, планы запросов, оптимизация работы сервера, метрики и мониторинг;
системы управления конфигурациями, деплоймент и шаблонизация, ожидаем, что вы знакомы с Ansible/Puppet или Salt, а также использовали Helm;
мониторинг — мы ожидаем, что вы знакомы с Graphite, Prometheus или Grafana;
CI/CD — считаем, что вы знакомы с непрерывной поставкой кода и практиковали это ранее.

Будет плюсом

RHEL / CentOS / Almalinux — мы используем именно это семейство ОС;
возможность решать поставленные задачи на Python или Golang;
продуктовый опыт работы с ClickHouse, MongoDB или Redis.

Мы предлагаем

Гибкий график работы

Бонусы и скидки от партнеров

Офис в центре города

ДМС

Профессиональная команда

Бонусы от партнеров

Интересные задачи

Откликнуться

Формат работы

офисный

комбинированный

дистанционный

Уровень

middle

senior

График работы

полный

сменный

Технический департамент

Объединяем специалистов, которые обслуживают IT-инфраструктуру продуктов VK. Отвечаем за бесперебойную работу высоконагруженных систем и сервисов, за сеть передачи данных, за развитие сети центров обработки данных и сервисов для наших сотрудников.

Подробнее о проекте

Мы предлагаем

Гибкий график работы

Бонусы и скидки от партнеров

Офис в центре города

ДМС

Профессиональная команда

Бонусы от партнеров

Интересные задачи

Site Reliability Engineer (SRE), Москва

Site Reliability Engineer (SRE), Москва

Задачи

Требования

Будет плюсом

Мы предлагаем

Формат работы

Уровень

График работы

Технический департамент

Мы предлагаем

Похожие вакансии

Архитектор решений

Программист C++

DevOps в команду автоматизации разработки

Специалист технической поддержки L2 в VK Cloud

Go developer в команду экспериментальных продуктов

Middle Go Developer

Golang-разработчик (команда Core API)

DevOps-инженер на проект DevPlatform

DevOps

DevOps-инженер в Data Platform (Big Data)

Руководитель команды бэкенда в направление экспериментальных продуктов

Dev Platform Architect

Delivery Engineer Cloud Storage

Специалист технической поддержки в БЦ Skylight

DevOps-инженер в команду developer experience Почты Mail.ru

Python Developer

Go Developer

DevOps в DevDomains Infrastructure

С++ разработчик

Системный администратор в группу эксплуатации ClickHouse

Системный администратор в ОАТП

Старший разработчик C

DevOps-инженер в команду экспериментальных продуктов

Руководитель направления backend

SRE Engineer 3-й линии поддержки в команду VK Звонков

SRE в команду поддержки Kubernetes

DevOps в MyTracker

Python Developer (для DevOps, желающих в разработку)

Пресейл Архитектор в команду публичного облака

C++ Developer в Новости

Системный администратор Kubernetes

Go Developer в технические команды

Старший системный инженер

Java Developer в группу разработки базовых сервисов

SRE / Системный администратор Linux (One Cloud)

Инженер