One Cloud — это технологический фундамент для всех продуктов компании. Мы предоставляем единую среду запуска приложений, хранилищ, баз данных и любых других сервисов.
Сейчас One Cloud - это 12 000 серверов в 9 дата центрах, загрузка более 1 000 000 процессорных ядер, объем хранилища в 5 000 Терабайт и 400 Тбит/сек по сети.
Перед командой стоят задачи развития и масштабирования, повышения надежности, разработки внутренних инструментов и анбординг новых проектов. Ключевая цель – стать самым передовым внутренним облаком среди аналогичных платформ.
Мы ищем Site Reliability Engineer, готовых разделить с нами задачи по эксплуатации, инцидент-менеджменту, R&D, а также принять технический вызов кратного роста Облака и амбициозности поставленных перед командой задач.
Стек: Linux, Python, Golang, CFEngine, AWX.
Задачи
- Эксплуатировать парк серверов облака (в том числе bare metal) — более 10 000 хостов;
- постоянно обновлять парк серверов — мы стараемся эффективнее использовать каждый юнит в дата-центрах;
- управлять инцидентами — в связке с командами мониторинга и разработки устранять сбои и предотвращать их повторение;
- автоматизировать процессы эксплуатации и оркестрации — при наших объёмах задачи решаются через код;
- участвовать в разработке и внедрении новой функциональности облака.
Требования
- Коммерческий опыт работы в релевантной роли SRE, DevOps, системного инженера от 3х лет;
- опыт работы с серверной инфраструктурой на базе Linux, уверенные знания Linux;
- опыт работы с сетью — iptables, BGP, VRRP;
- опыт работы с SCM — Puppet, Salt, Ansible;
- опыт автоматизации на Bash.
Будет плюсом
- Опыт работы с системами на базе RHEL;
- опыт работы с веб-хостингом — nginx, серверы приложений, MySQL, Postgres;
- опыт работы с CFEngine, Cassandra, Zabbix и Vault;
- знание Golang и Java.
Мы предлагаем
Формат работы
Уровень
График работы

Единые облачные технологии
Мы создаём и внедряем облачные технологии для одной из крупнейших серверных инфраструктур. Наша технологическая платформа включает S3-хранилища, базы данных, облако One Cloud, системы метрик, единой конфигурации, мониторинга, средства и инструменты разработки и диагностики. Разрабатываем новые решения и создаём программы с открытым исходным кодом.