Ко всем курсам Event-менеджмент Excel и Google Таблицы MBA PR-менеджмент Аналитика для руководителей Антикризисный менеджмент Арт-менеджмент Бухгалтерский учет Геймификация Деловые переговоры и коммуникация Документационное обеспечение Закупки и тендеры Кадровое делопроизводство и охрана труда Клиентский сервис Комьюнити-менеджмент Консалтинг Коучинг Курсы для директоров Маркетплейсы и e-commerce Менеджмент в индустрии моды Менеджмент в образовании Музыкальный менеджмент Нетворкинг Операционный менеджмент Открытие бизнеса Подбор и управление персоналом Продакт-менеджмент Разработка онлайн-курсов Рекрутмент Ресторанный менеджмент Создание презентаций Спортивный менеджмент Строительство и недвижимость Тимбилдинг Управление бизнесом Управление командами Управление продажами Управление проектами Управление производством Управление разработкой и IT Финансовый менеджмент

SRE: data-driven подход к управлению надежностью систем от Слёрма

Вы научитесь

Практикум поможет инженерам эксплуатации и разработчикам освоить SRE, а бизнесу – быстрее вводить нововведения и обеспечить надёжность всех внутренних систем.Вы поработаете со стабильностью сервиса. Научитесь устранять разные сбои и внедрять правки. Изучите вопрос поддержания инфраструктуры. Узнаете о метриках и сможете грамотно их собирать. Разберётесь в том, как улучшить качество и скорость работы внутри команды. Приобретёте лидерские качества. Поймёте, как снизить ущерб от отказов в дальнейшем. Дадите определение понятию деплоймента и познакомитесь с соответствующим инструментарием. 
Тип курса
Онлайн
Тип обучения
Курс
Локация
Длительность
1 месяц
Стоимость
90000 ₽
Помощь в трудоустройстве
Да
Выдача сертификата
Да
Вы научитесь
#01
Внедрять правки
#02
Собирать метрики
#03
Проводить деплоймент
#04
Снижать ущерб от отказов
#05
Выстраивать работу внутри команды
#06
Работать над стабильностью сервиса и поддержанием инфраструктуры
Программа курса

Вы будете самостоятельно осваивать теоретический материал и выполнять практические задания в командах и под присмотром наставников. У вас также будут встречи со спикерами курса. Они ответят на любые вопросы.

1 день: установочная AMA-сессия

Определите цели и задачи практикума. Узнаете, что такое SRE. Разделитесь на команды. Изучите теорию мониторинга и Site Reliability Engineering.

2 день: разбор практик и кейсов

Создадите простой дашборд, добавите SLO/SLI и настроите алёрты. Узнаете, как качественно настроить свой сервис в условиях, когда соседний сервис неработоспособен. 

3 день: AMA-сессия, ответы на вопросы

Узнаете про upstream и распространённые проблемы с архитектурой. Научитесь управлять инцидентами. Усвоите правила работы пожарной бригады. Поймёте, как работать с постмортемами. 

4 день: разбор практик и кейсов

Рассмотрите вопрос согласования метрик. Научитесь предупреждать возникновение проблем с базами данных. Напишите свой post mortem.

5 день: AMA-сессия, ответы на вопросы

Узнаете, как компании внедряют в свои системы SRE. Разберёте различные способы осуществления деплоймента. Поймёте, как настроить сервис так, чтобы его можно было взять на поддержку.

6 день: разбор практик и кейсов

Научитесь создавать качественный Healthcheck. Сможете обнаружить сбоящий сервис и перекрыть трафик к нему. Подведёте итоги всего курса.

Отзывы о данном курсе
На этот курс ещё нет отзывов.
Слёрм
Школа
Слёрм — это онлайн-школа, специализирующаяся на обучении специалистов из IT-области, инженеров и TechLead. У Слёрм вы сможете найти курсы для начинающих, программы по повышению квалификации и предложение для корпоративных клиентов.