Ко всем курсам Event-менеджмент Excel и Google Таблицы MBA PR-менеджмент Аналитика для руководителей Антикризисный менеджмент Арт-менеджмент Бухгалтерский учет Геймификация Деловые переговоры и коммуникация Документационное обеспечение Закупки и тендеры Кадровое делопроизводство и охрана труда Клиентский сервис Комьюнити-менеджмент Консалтинг Коучинг Курсы для директоров Маркетплейсы и e-commerce Менеджмент в индустрии моды Менеджмент в образовании Музыкальный менеджмент Нетворкинг Операционный менеджмент Открытие бизнеса Подбор и управление персоналом Продакт-менеджмент Разработка онлайн-курсов Рекрутмент Ресторанный менеджмент Создание презентаций Спортивный менеджмент Строительство и недвижимость Тимбилдинг Управление бизнесом Управление командами Управление продажами Управление проектами Управление производством Управление разработкой и IT Финансовый менеджмент
Акция

Data Engineering: инженер данных от GeekBrains

Вы научитесь

На факультете Data Engineering вы получите знания, необходимые для работы с данными. Вы узнаете, как устроена система контроля версий Git и как наладить в ней командную работу, научитесь работать с ОС Linux, будете разбираться в устройстве баз данных, сможете работать с Big Data, создавать приложения для потоковой работы с данными, разрабатывать хранилища, использовать продукты экосистемы Hadoop, BI-системы и программировать на Python. Вы сможете получить востребованные профессии инженера данных, ML Engineer или DHW-аналитика. После обучения GeekBrains поможет вам с трудоустройством.
Тип курса
Онлайн
Тип обучения
Курс
Локация
Длительность
12 месяцев
Стоимость
134700 ₽
Помощь в трудоустройстве
Да
Выдача сертификата
Да
Вы научитесь
#01
Использовать Git
#02
Работать с Big Data
#03
Собирать и хранить данные
#04
Обрабатывать данные для ML
#05
Использовать потоковую обработку данных
#06
Строить хранилища для данных в системах аналитики
Программа курса

Большая часть курса — это вебинары, на которых вы сможете задавать вопросы преподавателям и обсуждать пройденный материал. Вы будете постепенно двигаться от легких тем к объемным и сложным.

Подготовительный блок

Вы познакомитесь с системой контроля версий, установите на ПК и настроите её под себя. Рассмотрите базовые команды терминала, научитесь управлять файлами и ветками репозитория и проводить сложные операции. 

Вы познакомитесь с системой контроля версий, установите на ПК и настроите её под себя. Рассмотрите базовые команды терминала, научитесь управлять файлами и ветками репозитория и проводить сложные операции. 

Вы познакомитесь с системой контроля версий, установите на ПК и настроите её под себя. Рассмотрите базовые команды терминала, научитесь управлять файлами и ветками репозитория и проводить сложные операции. 

I четверть. Сбор и хранение данных

Узнаете, как устроены базы данных и изучите язык запросов SQL, чтобы общаться с ними. Научитесь сортировать и фильтровать данные, проводить и оптимизировать сложные запросы. Познакомитесь с функциями, выражениями и словарями этого языка программирования. Изучите принципы ООП и узнаете, как работать с файловой системой. Вы изучите методы парсинга данных с помощью нескольких программ и приложений. Познакомитесь с системами, которые управляют базами данных. Освоите фреймворк Scrapy. Вы с нуля разработаете парсер.

Узнаете, как устроены базы данных и изучите язык запросов SQL, чтобы общаться с ними. Научитесь сортировать и фильтровать данные, проводить и оптимизировать сложные запросы. Познакомитесь с функциями, выражениями и словарями этого языка программирования. Изучите принципы ООП и узнаете, как работать с файловой системой. Вы изучите методы парсинга данных с помощью нескольких программ и приложений. Познакомитесь с системами, которые управляют базами данных. Освоите фреймворк Scrapy.

Узнаете, как устроены базы данных и изучите язык запросов SQL, чтобы общаться с ними. Научитесь сортировать и фильтровать данные, проводить и оптимизировать сложные запросы.

Познакомитесь с функциями, выражениями и словарями этого языка программирования. Изучите принципы ООП и узнаете, как работать с файловой системой.

Вы изучите методы парсинга данных с помощью нескольких программ и приложений. Познакомитесь с системами, которые управляют базами данных. Освоите фреймворк Scrapy.

Вы с нуля разработаете парсер.

II четверть. Построение хранилищ данных для систем аналитики

Вы изучите архитектуру хранилищ и узнаете, как их спроектировать. Научитесь создавать ETL-процессы и управлять качеством обрабатываемых данных. Выполните курсовую работу. Познакомитесь с многомерными хранилищами, научитесь создавать меры и работать с разными измерениями. Сможете оптимизировать процессинг и подключить BI-систему Узнаете, как организовать NoSQL данные несколькими способами. Познакомитесь с MongoDB и изучите Tarantool. Создание собственного хранилища для BI-системы.

Вы изучите архитектуру хранилищ и узнаете, как их спроектировать. Научитесь создавать ETL-процессы и управлять качеством обрабатываемых данных. Выполните курсовую работу. Познакомитесь с многомерными хранилищами, научитесь создавать меры и работать с разными измерениями. Сможете оптимизировать процессинг и подключить BI-систему Узнаете, как организовать NoSQL данные несколькими способами. Познакомитесь с MongoDB и изучите Tarantool.

Вы изучите архитектуру хранилищ и узнаете, как их спроектировать. Научитесь создавать ETL-процессы и управлять качеством обрабатываемых данных. Выполните курсовую работу.

Познакомитесь с многомерными хранилищами, научитесь создавать меры и работать с разными измерениями. Сможете оптимизировать процессинг и подключить BI-систему

Узнаете, как организовать NoSQL данные несколькими способами. Познакомитесь с MongoDB и изучите Tarantool.

Создание собственного хранилища для BI-системы.

III четверть. Распределенные базы данных

Вы научитесь работать с файловой системой, разберетесь с управлением кластерами с помощью HDFS, движком для SQL-запросов Hive, веб-интерфейсом для анализа данных HUE, форматами хранения данных, ETL, нереляционными базами данных и Data Warehouse. Вы познакомитесь с архитектурой фреймворка, узнаете, как он обрабатывает запросы, хранит и читает данные. Научитесь оптимизировать SQL-запросы, проводить операции с данными и разберете тему Machine Learning на PySpark  Узнаете, как разрабатывать и настраивать потоки данных и планировать задачи. Рассмотрите примеры использования задач, которые можно решить с помощью Airflow. Вы создадите ETL-пайплайн, пользуясь инструментами для работы с Big Data.

Вы научитесь работать с файловой системой, разберетесь с управлением кластерами с помощью HDFS, движком для SQL-запросов Hive, веб-интерфейсом для анализа данных HUE, форматами хранения данных, ETL, нереляционными базами данных и Data Warehouse. Вы познакомитесь с архитектурой фреймворка, узнаете, как он обрабатывает запросы, хранит и читает данные. Научитесь оптимизировать SQL-запросы, проводить операции с данными и разберете тему Machine Learning на PySpark  Узнаете, как разрабатывать и настраивать потоки данных и планировать задачи. Рассмотрите примеры использования задач, которые можно решить с помощью Airflow.

Вы научитесь работать с файловой системой, разберетесь с управлением кластерами с помощью HDFS, движком для SQL-запросов Hive, веб-интерфейсом для анализа данных HUE, форматами хранения данных, ETL, нереляционными базами данных и Data Warehouse.

Вы познакомитесь с архитектурой фреймворка, узнаете, как он обрабатывает запросы, хранит и читает данные. Научитесь оптимизировать SQL-запросы, проводить операции с данными и разберете тему Machine Learning на PySpark 

Узнаете, как разрабатывать и настраивать потоки данных и планировать задачи. Рассмотрите примеры использования задач, которые можно решить с помощью Airflow.

Вы создадите ETL-пайплайн, пользуясь инструментами для работы с Big Data.

IV четверть. Real-time обработка данных и инфраструктура

Вы поймете, как обрабатывать данные в реальном времени, используя Kafka и Spark Streaming. Получите навыки DevOps, которые помогут вам в работе.  Вы познакомитесь с устройством Kafka и Workflow. Научитесь применять их в работе. Узнаете, как создавать динамические запросы. Узнаете, зачем используется Docker, что такое контейнеры и микросервисы, познакомитесь с программой Kubernetes и поймете принципы ее работы, разберетесь в устройстве кластеров и научитесь использовать CI/CD. Вы создадите сервис, который будет использовать машинное обучение для оценки способности клиентов банка погашать кредиты.

Вы познакомитесь с устройством Kafka и Workflow. Научитесь применять их в работе. Узнаете, как создавать динамические запросы. Узнаете, зачем используется Docker, что такое контейнеры и микросервисы, познакомитесь с программой Kubernetes и поймете принципы ее работы, разберетесь в устройстве кластеров и научитесь использовать CI/CD.

Вы познакомитесь с устройством Kafka и Workflow. Научитесь применять их в работе. Узнаете, как создавать динамические запросы.

Узнаете, зачем используется Docker, что такое контейнеры и микросервисы, познакомитесь с программой Kubernetes и поймете принципы ее работы, разберетесь в устройстве кластеров и научитесь использовать CI/CD.

Вы создадите сервис, который будет использовать машинное обучение для оценки способности клиентов банка погашать кредиты.

Курсы вне четверти. Предметы с индивидуальным выбором даты старта

Эти курсы обязательны для прохождения и входят в основную программу курса. Вы сами можете выбрать время обучения на этих курсах, чтобы подстроить нагрузку под себя. Вы должны закончить курсы в течение 2,5 лет после покупки курса. Вы узнаете, как работает машинное обучение, что нужно для построения модели и как готовить данные для выполнения разных задач. Установите операционную систему, рассмотрите её интерфейс и командную строку, поймете, как устроена файловая система и как управлять пользователями. Изучите скрипты Bash и узнаете, как обеспечить безопасность сети. Познакомитесь с Docker.

Вы узнаете, как работает машинное обучение, что нужно для построения модели и как готовить данные для выполнения разных задач. Установите операционную систему, рассмотрите её интерфейс и командную строку, поймете, как устроена файловая система и как управлять пользователями. Изучите скрипты Bash и узнаете, как обеспечить безопасность сети. Познакомитесь с Docker.

Вы узнаете, как работает машинное обучение, что нужно для построения модели и как готовить данные для выполнения разных задач.

Установите операционную систему, рассмотрите её интерфейс и командную строку, поймете, как устроена файловая система и как управлять пользователями. Изучите скрипты Bash и узнаете, как обеспечить безопасность сети. Познакомитесь с Docker.

Отзывы о данном курсе
На этот курс ещё нет отзывов.
GeekBrains
Школа
GeekBrains – это одна из крупнейших в России платформ для онлайн-образования, предоставляющая курсы по 3 главным направлениям: IT, маркетинг и дизайн.