Site Reliability Engineer (SRE), Москва
Отдел эксплуатации VK — техническое сердце компании. Мы собрали одну из лучших команд в Рунете, обладающую уникальной экспертизой в области сетевых технологий и системного администрирования. Мы используем все самое выдающееся, что есть на рынке, а зачастую и создаем передовые технологии.
SRE занимаются эксплуатацией всех продуктов компании и обеспечивают 24х7 доступность сервисов для наших пользователей, и сейчас мы ищем сильных инженеров в несколько разных проектов VK.
Задачи
- обеспечение непрерывного доступа к ресурсам для внешних и внутренних пользователей;
- развитие и масштабирование продуктов — наша инфраструктура состоит из множества сервисов в геораспределенных дата-центрах, мы также планируем наши вычислительные ресурсы и прогнозируем их утилизацию;
- оперативная работа с мониторингом и стратегическая с инцидентами — мы не только разрешаем текущие инциденты, но и постоянно работаем над предотвращением их появления в будущем;
- автоматизация работы с инфраструктурой — наши команды SRE занимаются полным циклом сопровождения продуктовой среды, от удаленной установки ОС до описания деплойментов (Helm-чартов, Kubernetes-операторов, манифестов Puppet, Playbook Ansible);
- участие в жизненном цикле продуктов — мы тесно связаны с нашими командами разработки, двусторонняя обратная связь между нашими командами позволяет добиться лучших результатов в продукте и совместно влиять на наиболее критичные, узкие места в наших сервисах и инфраструктуре.
<span></span>
Требования
- опыт работы с ОС Linux от 3 лет и более — на интервью мы поговорим обо всем, от syscall до cgroups и namespaces;
- понимание принципов работы с Сетью — мы уверены, что вы точно знаете, чем отличаются L3, L4 и L7, а также назовете практическую разницу между DROP и REJECT;
- опыт работы с СУБД (основные для нас MySQL и PostgreSQL) — высокая доступность, планы запросов, оптимизация работы сервера, метрики и мониторинг;
- системы управления конфигурациями, деплоймент и шаблонизация, ожидаем, что вы знакомы с Ansible/Puppet или Salt, а также использовали Helm;
- мониторинг — мы ожидаем, что вы знакомы с Graphite, Prometheus или Grafana;
- CI/CD — считаем, что вы знакомы с непрерывной поставкой кода и практиковали это ранее.
Будет плюсом
- RHEL / CentOS / Almalinux — мы используем именно это семейство ОС;
- возможность решать поставленные задачи на Python или Golang;
- продуктовый опыт работы с Clickhouse, MongoDB или Redis.
Мы предлагаем
Формат работы
Уровень
График работы

Технический департамент
Команда технического департамента помогает бизнесу быстрее запускать сервисы и обеспечивать их надежность, производительность и безопасность, делать ежедневную работу сотрудников нашей компании удобной и приятной. Команда отвечает за общую инфраструктуру компании и развитие внутренних инструментов.
В технический департамент VK входит отдел эксплуатации, а также техническая поддержка, автоматизация внутренних процессов, информационная безопасность, сетевой отдел и департамент информационных технологий.