OneCloud — внутреннее облако VK, в котором мы запускаем сервисы, базы данных и серверы очередей.
Основанное на открытых решениях, облако обеспечивает высокую доступность сервисов и ускоряет запуск проектов.
Сейчас мы в команде эксплуатации решаем задачи, связанные с укрупнением облака — автоматизируем рутину и предотвращаем инциденты.
Ищем специалиста, который поможет нам поддерживать бесперебойную работу сервиса и внедрять новые решения для задач бизнеса.
Задачи
- Эксплуатировать парк серверов облака — более 10 000 хостов;
- постоянно обновлять парк серверов — мы стараемся эффективнее использовать каждый юнит в дата-центрах;
- управлять инцидентами — в связке с командами мониторинга и разработки устранять сбои и предотвращать их повторение;
- автоматизировать процессы эксплуатации и оркестрации — при наших объёмах задачи решаются через код;
- участвовать в разработке и внедрении новой функциональности облака.
Требования
Middle:
- Вы не менее трёх лет работали с парком bare-metal серверов (обязательно) и с серверной инфраструктурой на базе Linux;
- понимаете принципы работы с сетью — iptables, BGP, VRRP.
- использовали SCM — Puppet, Salt, Ansible;
- автоматизировали рутину с помощью скриптов на bash и Python.
Senior:
- Вы имеете опыт управления большим парком bare-metal серверов;
- умеете решать задачи на Python и используете PyPi;
- знаете, как эксплуатировать и проектировать высокодоступные кластеры;
- готовы обсуждать и ставить ТЗ команде разработки;
- знакомы с эксплуатацией сервисов на Java и не боитесь in-house решений.
Будет плюсом
- вы работали с системами на базе RHEL;
- работали с веб-хостингом — nginx, серверы приложений, MySQL, Postgres;
- использовали CFEngine, Cassandra, Zabbix и Vault;
- знаете Golang и Java.
Мы предлагаем
Формат работы
Уровень
График работы
Единые облачные технологии
Мы создаём и внедряем облачные технологии для одной из крупнейших серверных инфраструктур. Наша технологическая платформа включает S3-хранилища, базы данных, облако One Cloud, системы метрик, единой конфигурации, мониторинга, средства и инструменты разработки и диагностики. Разрабатываем новые решения и создаём программы с открытым исходным кодом.