InfraDev Meetup #4: Summer Edition
InfraDev Meetup #4: Summer Edition
Офлайн + онлайн
Прямо сейчас мы наблюдаем как AI в SDLC меняет процесс разработки — об удачных примерах и кейсах поговорим в этот раз. Обсудим, как разрабатывать инфраструктурные сервисы с помощью AI и как построить MLOps-платформу для обучения моделей. И не только: пока AI не перестроил DevOps-цикл, классические вызовы сборки образов для виртуальных машин остаются актуальными.
InfraDev Meetup — это серия мероприятий, посвященных разработке и эксплуатации инфраструктурных платформ, от разработчиков инфраструктурных сервисов. Мы предоставляем площадку для обмена опытом программистам, архитекторам, DevOps, SRE и всем, кто создаёт платформы и хочет развиваться в этой сфере.
Вас ждут хардовые доклады от спикеров из VK Tech (VK Cloud) и Avito. После докладов — афтепати с нетворкингом.
Программа:
- 18:00-19:00 — Сбор гостей
- 19:00-19:05 — Приветственное слово
- 19:05-19:45 — "Вы не поверите, на что мы тратим время после прихода LLM в команду". Кирилл Фролов, эксперт-разработчик в отделе разработки базовых сервисов, VK Cloud, VK Tech
- 19:45–20:25 — "Дивный мир инфраструктуры обучения больших моделей на HPC". Павел Шипилов, старший разработчик ML Платформы в Avito
- 20:25-20:40 — Перерыв
- 20:40-21:20 — "Сборка имаджей для облака: надо всего лишь…". Александр Александров, системный архитектор в направлении разработки и управления инфраструктурой, VK Cloud, VK Tech
- 21:20-23:59 — Афтепати и нетворкинг
Доклады:
Вы не поверите, на что мы тратим время после прихода LLM в команду
Кирилл Фролов, эксперт-разработчик в отделе разработки базовых сервисов, VK Cloud, VK Tech
Идея ускорить разработку с помощью AI не нова, но когда речь заходит про инфраструктурный сервис уровня Bare-Metal-as-a-Service, где цена ошибки в проде высокая, многие справедливо опасаются доверять агентам системные компоненты. Мы прошли этот путь от первых экспериментов до состояния, когда часть нашей кодовой базы пишется с участием LLM — и при этом мы сохраняем контроль над тем, что уезжает в прод. Ключ оказался не в доверии к LLM, а в структуре: архитектуре, спецификациях и тестах. В докладе расскажу, как у нас сместилось понимание того, что является исходным кодом, почему задача больше не «писать больше», а «писать меньше», и какие принципы инженерии оказались критичны при работе «рука об руку» с агентами — от управления архитектурными слоями и спецификациями до организации Code Review и тестирования.
Дивный мир инфраструктуры обучения больших моделей на HPC
Павел Шипилов, Старший разработчик ML Платформы в Avito
Распределённое обучение LLM на кластере из HGX — это не просто «больше GPU». Это новый уровень сложности: Kubernetes должен дружить с InfiniBand и GPU, стабильно работать с системой, стартовать быстро большие контейнеры и правильно их шедулить.
В докладе расскажу про запуск нашего HPC, как мы в Avito прошли этот путь при создании Aviflow: от размещения железок в ДЦ, до создание отдельного сервиса для запуска распределенных задач. Покажем эволюционный путь который прошли с выбором между Slurm и Kubernetes, шедулером и другими компонентами инфраструктуры. Подсветим проблемы, которые к нас возникли в ходе эксплуатации и развертывании кластера.
Сборка имаджей для облака: надо всего лишь...
Александр Александров, системный архитектор в направлении разработки и управления инфраструктурой, VK Cloud, VK Tech
Кажется, что собрать образ ВМ — дело пяти минут: взял готовый ISO, установил ОС, далее-далее, загрузил в хранилище. Пока у вас не появились десятки дистрибутивов, требования к «запечённой» конфигурации, необходимость тестировать каждый билд на IaaS и PaaS, и понимание, что готовых образов для ваших задач просто нет. Как мы автоматизировали весь цикл — от сборки до скрытия старых релизов — и сократили время исправления бага в образе Linux до пары часов, расскажу в докладе.
Программный комитет
- Георгий Меликов. Founder инфраструктурной платформы Exordos (бывш. Genesis Core), экс-руководитель направления разработки IaaS в VK Cloud. Контрибьютор и фанат OpenZFS. Увлекается созданием программно-определяемых сетей и хранилищ. Разработал и внедрил собственный SDN. Автор open-source инструмента EVPN-сonnector.
- Александр Попов. Техлид IaaS-направления в облачной платформе VK Cloud. Занимается разработкой и эксплуатацией сетевых и SDN-решений для облачных платформ: разработал и внедрил собственный SDN. Автор open-source инструмента EVPN-сonnector.
- Евгений Зобницев. CTO Factor Group, экс-руководитель эксплуатации/развития сети магистрального оператора связи, преподаватель.
- Влад Одинцов. Tech Lead и Product Owner сетевых сервисов в K2 Cloud. Работает с облачными сетевыми сервисами более 10 лет, интересуется виртуализацией, SDN и hardware acceleration. Контрибьютор Open vSwitch, OVN и других проектов. Создатель Телеграм-сообщества OVS/OVN russian community.
Время и место:
- Офлайн – 10 июня с 18:00 до 23:00
Адрес: Ленинградский пр., 70. Офис VK Tech, БЦ Алкон
Мероприятие бесплатное, вход по предварительной регистрации (с собой нужен паспорт). Количество мест ограничено — пожалуйста, дождитесь подтверждения на вашу электронную почту. - Онлайн – при регистрации укажите, что вы будете онлайн. Ссылку на трансляцию направим на вашу электронную почту.
С вопросами можно писать деврелу VK Tech, Настасье Распономарёвой.



