img img
Site Reliability Engineer в MAX, Москва
Формат работы
Комбинированный
Дистанционный
Уровень
Middle
Senior
График работы
Полный
Откликнуться

Мы создаём единую коммуникационную платформу, которая станет универсальным решением для всех платформ группы по общению пользователей.


Усиливаем команду и ищем новых сотрудников!


Задачи

  • Развивать и сопровождать инфраструктуру, автоматизировать рутинные процессы, связанные с эксплуатацией системы
  • Осуществлять и развивать мониторинг инфраструктуры, настраивать алерты, делать борды и так далее
  • Взаимодействовать со смежными командами, которые предоставляют инфраструктурные сервисы
  • Дежурить (on-call), оперативно реагировать и устранять инциденты, проводить постанализ

Требования

  • Опыт работы в SRE / DevOps / системным инженером от трёх лет
  • Прочные знания Linux (администрирование, сеть, производительность)
  • Понимание сетевых основ (TCP/IP, DNS, HTTP, LB) на уровне, достаточном для диагностики проблем
  • Умение читать чужой код (Python, Go, Java) для диагностики и писать свой код для автоматизации (Bash/Python/Go)
  • Знание Prometheus/Grafana/Graylog, умение делать борды и настраивать алерты
  • Понимание, что такое контейнеры и как с ними работать
  • Готовность участвовать в дежурствах и работе с инцидентами

Будет плюсом

  • Опыт работы с базами (PostgreSQL, Cassandra и так далее)
  • Понимание сопровождения java-приложений
Мы предлагаем
img
Бонусы и скидки от партнеров
img
Гибкий график работы
img
Офис в центре города
img
Профессиональная
команда
img
Интересные задачи
img
Полис ДМС
Откликнуться