Карьера в MAX

Site Reliability Engineer в MAX, Москва

Формат работы

Комбинированный

Дистанционный

Уровень

Middle

Senior

График работы

Полный

Мы разрабатываем крупнейший мессенджер в России, чтобы соединять людей, сервисы и компании. Создаём простые и удобные инструменты коммуникации.

Задачи

Развивать и сопровождать инфраструктуру, автоматизировать рутинные процессы, связанные с эксплуатацией системы
Осуществлять и развивать мониторинг инфраструктуры, настраивать алерты, делать борды и так далее
Взаимодействовать со смежными командами, которые предоставляют инфраструктурные сервисы
Взаимодействовать с командами разработки
Оперативно реагировать и устранять инциденты, проводить постанализ

Требования

Опыт работы в SRE/DevOps/системным инженером от трёх лет
Прочные знания Linux (администрирование, сеть, производительность)
Понимание сетевых основ (TCP/IP, DNS, HTTP, LB) на уровне, достаточном для диагностики проблем
Навыки диагностирования трафика: tcpdump/Wireshark
Умение читать чужой код (Python, Go, Java) для диагностики и писать свой код для автоматизации (Bash/Python/Go)
Знание Prometheus/Grafana/Graylog, умение делать борды и настраивать алерты
Понимание, что такое контейнеры и как с ними работать
Готовность участвовать в дежурствах и работе с инцидентами

Будет плюсом

Опыт работы с базами (PostgreSQL, Cassandra, redis и так далее)
Понимание сопровождения java-приложений
Понимание, как устроены VoIP/real‑time звонки и что влияет на качество (задержка, джиттер, потери)

Мы предлагаем

Бонусы и скидки от партнеров

Гибкий график работы

Офис в центре города

Профессиональная
команда

Интересные задачи

Полис ДМС