Site Reliability Engineer в MAX, Москва
Формат работы
Комбинированный
Дистанционный
Уровень
Middle
Senior
График работы
Полный
Мы разрабатываем крупнейший мессенджер в России, чтобы соединять людей, сервисы и компании. Создаём простые и удобные инструменты коммуникации.
Задачи
- Развивать и сопровождать инфраструктуру, автоматизировать рутинные процессы, связанные с эксплуатацией системы
- Осуществлять и развивать мониторинг инфраструктуры, настраивать алерты, делать борды и так далее
- Взаимодействовать со смежными командами, которые предоставляют инфраструктурные сервисы
- Взаимодействовать с командами разработки
- Оперативно реагировать и устранять инциденты, проводить постанализ
Требования
- Опыт работы в SRE/DevOps/системным инженером от трёх лет
- Прочные знания Linux (администрирование, сеть, производительность)
- Понимание сетевых основ (TCP/IP, DNS, HTTP, LB) на уровне, достаточном для диагностики проблем
- Навыки диагностирования трафика: tcpdump/Wireshark
- Умение читать чужой код (Python, Go, Java) для диагностики и писать свой код для автоматизации (Bash/Python/Go)
- Знание Prometheus/Grafana/Graylog, умение делать борды и настраивать алерты
- Понимание, что такое контейнеры и как с ними работать
- Готовность участвовать в дежурствах и работе с инцидентами
Будет плюсом
- Опыт работы с базами (PostgreSQL, Cassandra, redis и так далее)
- Понимание сопровождения java-приложений
- Понимание, как устроены VoIP/real‑time звонки и что влияет на качество (задержка, джиттер, потери)
Мы предлагаем
Бонусы и скидки от партнеров
Гибкий график работы
Офис в центре города
Профессиональная
команда
команда
Интересные задачи
Полис ДМС