Site Reliability Engineer в MAX, Москва
Формат работы
Комбинированный
Дистанционный
Уровень
Middle
Senior
График работы
Полный
Мы создаём единую коммуникационную платформу, которая станет универсальным решением для всех платформ группы по общению пользователей.
Усиливаем команду и ищем новых сотрудников!
Задачи
- Развивать и сопровождать инфраструктуру, автоматизировать рутинные процессы, связанные с эксплуатацией системы
- Осуществлять и развивать мониторинг инфраструктуры, настраивать алерты, делать борды и так далее
- Взаимодействовать со смежными командами, которые предоставляют инфраструктурные сервисы
- Дежурить (on-call), оперативно реагировать и устранять инциденты, проводить постанализ
Требования
- Опыт работы в SRE / DevOps / системным инженером от трёх лет
- Прочные знания Linux (администрирование, сеть, производительность)
- Понимание сетевых основ (TCP/IP, DNS, HTTP, LB) на уровне, достаточном для диагностики проблем
- Умение читать чужой код (Python, Go, Java) для диагностики и писать свой код для автоматизации (Bash/Python/Go)
- Знание Prometheus/Grafana/Graylog, умение делать борды и настраивать алерты
- Понимание, что такое контейнеры и как с ними работать
- Готовность участвовать в дежурствах и работе с инцидентами
Будет плюсом
- Опыт работы с базами (PostgreSQL, Cassandra и так далее)
- Понимание сопровождения java-приложений
Мы предлагаем
Бонусы и скидки от партнеров
Гибкий график работы
Офис в центре города
Профессиональная
команда
команда
Интересные задачи
Полис ДМС