Симулятор Data Science – практика на реальных задачах от KARPOV.COURSES
Вы научитесь
Программа курса
В этом симуляторе вас ждёт более восьмидесяти задач трёх уровней сложности. Задания направлены на обучение работе конкретному навыку либо использованию того или иного инструмента.
Новое в подписке
Научитесь рассчитывать Monthly Recurring Revenue и строить дашборд. Познакомитесь с различными видами метрик. Разберётесь, как правильно удерживать пользователей. Научитесь строить простые Q&A сервисы при помощи RAG. Сможете реализовать метод главных компонентов PCA. Узнаете, как сгенерировать краткое содержание любого видеоролика на YouTube. Научитесь грамотно распределять маркетинговый бюджет. Разберётесь, как создавать negation тесты на базе библиотеки Checklist. Освоите mock-тесты Узнаете, как реализовать GPT-2 с нуля.
Научитесь рассчитывать Monthly Recurring Revenue и строить дашборд.
Познакомитесь с различными видами метрик.
Разберётесь, как правильно удерживать пользователей.
Научитесь строить простые Q&A сервисы при помощи RAG.
Сможете реализовать метод главных компонентов PCA.
Узнаете, как сгенерировать краткое содержание любого видеоролика на YouTube.
Научитесь грамотно распределять маркетинговый бюджет.
Разберётесь, как создавать negation тесты на базе библиотеки Checklist.
Освоите mock-тесты
Узнаете, как реализовать GPT-2 с нуля.
Python
Узнаете, как структурировать код согласно принципам объектно-ориентированного программирования. Познакомитесь с декораторами @staticmethod и @classmethod. Изучите элементы функционального программирования в языке Python. Научитесь работать с генераторами в Python. Попрактикуетесь в поисках ошибки в коде. Потренируетесь приводить созданный несколькими людьми документ к общему виду. Научитесь писать функцию для постобработки модели динамического ценообразования. Сможете создать функцию потерь. Разберётесь, как с минимальными затратами ускорить код. Научитесь использовать метод мемоизации. Сможете парсить многоуровневые конфиги в формате YAML. Научитесь оптимизировать код при помощи параллельных вычислений. Узнаете, как извлекать URL-адреса из текстовых сообщений.
Узнаете, как структурировать код согласно принципам объектно-ориентированного программирования.
Познакомитесь с декораторами @staticmethod и @classmethod.
Изучите элементы функционального программирования в языке Python.
Научитесь работать с генераторами в Python.
Попрактикуетесь в поисках ошибки в коде.
Потренируетесь приводить созданный несколькими людьми документ к общему виду.
Научитесь писать функцию для постобработки модели динамического ценообразования.
Сможете создать функцию потерь.
Разберётесь, как с минимальными затратами ускорить код.
Научитесь использовать метод мемоизации.
Сможете парсить многоуровневые конфиги в формате YAML.
Научитесь оптимизировать код при помощи параллельных вычислений.
Узнаете, как извлекать URL-адреса из текстовых сообщений.
SQL
Научитесь рассчитывать одну из наиболее распространённых метрик - Average Check. Научитесь строить метрику DAU. Узнаете, как составлять запросы на языке SQL для первичного анализа данных. Сможете подсчитать, сколько товаров компания продаёт в день. Узнаете, как считать важные метрики ARPU и AOV. Выясните, как рассчитать метрику WAU. Разберётесь, что такое эластичность в данном контексте. Узнаете, как построить дашборд с процентом успешных оплат в месяц. Научитесь деплоить решающие деревья в виде SQL-запросов. Узнаете, как построить эмбеддинги товаров на основе паттернов поведения покупателей. Разработаете модель оттока. Сможете построить дашборд, отображающий сумму успешных оплат за неделю. Напишете запрос, который сегментирует пользователей на основании стоимости их покупок. Научитесь оценивать надёжность предсказаний модели.
Научитесь рассчитывать одну из наиболее распространённых метрик - Average Check.
Научитесь строить метрику DAU.
Узнаете, как составлять запросы на языке SQL для первичного анализа данных.
Сможете подсчитать, сколько товаров компания продаёт в день.
Узнаете, как считать важные метрики ARPU и AOV.
Выясните, как рассчитать метрику WAU.
Разберётесь, что такое эластичность в данном контексте.
Узнаете, как построить дашборд с процентом успешных оплат в месяц.
Научитесь деплоить решающие деревья в виде SQL-запросов.
Узнаете, как построить эмбеддинги товаров на основе паттернов поведения покупателей.
Разработаете модель оттока.
Сможете построить дашборд, отображающий сумму успешных оплат за неделю.
Напишете запрос, который сегментирует пользователей на основании стоимости их покупок.
Научитесь оценивать надёжность предсказаний модели.
Метрики
Разберётесь, как исправить ошибку, не меняя поведение метрики. Научитесь работать с метрикой Average Check. Научитесь считать и строить метрику daily active users. Узнаете, как придумать функцию потерь. Сможете подсчитать, сколько товаров компания продаёт в день. Познакомитесь с различными типами метрик. Изучите различия между основными метриками на примерах. Продолжите знакомиться с их различиями. Научитесь грамотно проводить А/В-тесты для квантилей метрики. Узнаете, как оценить точность алгоритма ранжирования. Сможете подсчитывать ARPU и AOV. Узнаете, как подсчитать weekly active users. Разберётесь, как считать эластичность товаров. Сможете использовать метрики ранжирования. Создадите собственную метрику для оценки разнообразия в выдаче. Попрактикуетесь в построении дашборда с процентом успешных оплат в месяц. Сможете рассчитать Monthly Recurring Revenue и построите дашборд. Узнаете, как понять, даёт ли сервис ценность. Поймёте, что представляет из себя Marketing Mixture Modeling. Проведёте симуляции А/А и А/В тестов. Построите дашборд, отображающий сумму оплат пользователей за каждую неделю.
Разберётесь, как исправить ошибку, не меняя поведение метрики.
Научитесь работать с метрикой Average Check.
Научитесь считать и строить метрику daily active users.
Узнаете, как придумать функцию потерь.
Сможете подсчитать, сколько товаров компания продаёт в день.
Познакомитесь с различными типами метрик.
Изучите различия между основными метриками на примерах.
Продолжите знакомиться с их различиями.
Научитесь грамотно проводить А/В-тесты для квантилей метрики.
Узнаете, как оценить точность алгоритма ранжирования.
Сможете подсчитывать ARPU и AOV.
Узнаете, как подсчитать weekly active users.
Разберётесь, как считать эластичность товаров.
Сможете использовать метрики ранжирования.
Создадите собственную метрику для оценки разнообразия в выдаче.
Попрактикуетесь в построении дашборда с процентом успешных оплат в месяц.
Сможете рассчитать Monthly Recurring Revenue и построите дашборд.
Узнаете, как понять, даёт ли сервис ценность.
Поймёте, что представляет из себя Marketing Mixture Modeling.
Проведёте симуляции А/А и А/В тестов.
Построите дашборд, отображающий сумму оплат пользователей за каждую неделю.
Знакомство с новыми инструментами
Напишете юнит-тесты для трёх бизнес-метрик, применяя Pytest. Научитесь использовать инструмент контейнеризации приложений Docker. Познакомитесь с особенностями архитектуры BERT. Изучите MLflow. Разберётесь, как использовать DVC. Продолжите учиться работать с PySpark.
Напишете юнит-тесты для трёх бизнес-метрик, применяя Pytest.
Научитесь использовать инструмент контейнеризации приложений Docker.
Познакомитесь с особенностями архитектуры BERT.
Изучите MLflow.
Разберётесь, как использовать DVC.
Продолжите учиться работать с PySpark.
Модели прогноза
Сможете правильно оценивать надёжность предсказаний модели. Научитесь строить решающее дерево. Сможете измерять цены похожих товаров. Напишете функцию для постобработки предсказаний моделей. Попрактикуетесь в создании функции потерь. Научитесь проводить А/В-тесты для квантилей метрики. Сможете построить решающее дерево с нуля. Попрактикуетесь в построении дашборда с процентом успешных оплат в месяц. Решите задачу со сторителлингом в четыре шага.
Сможете правильно оценивать надёжность предсказаний модели.
Научитесь строить решающее дерево.
Сможете измерять цены похожих товаров.
Напишете функцию для постобработки предсказаний моделей.
Попрактикуетесь в создании функции потерь.
Научитесь проводить А/В-тесты для квантилей метрики.
Сможете построить решающее дерево с нуля.
Попрактикуетесь в построении дашборда с процентом успешных оплат в месяц.
Решите задачу со сторителлингом в четыре шага.
Динамическое ценообразование
Построите линейную модель предсказания спроса от цены. Узнаете, как спрогнозировать спрос до того, как продажи начались. Научитесь считать ARPU и AOV. Сможете исправлять ошибку в коде, не меняя поведение метрики в остальном. Научитесь рассчитывать Average Check. Узнаете, как определять эластичность товаров. Познакомитесь с пятью способами агрегации цен конкурентов. Разберётесь, как предсказывать стоимость объектов недвижимости на основе их числовых признаков. Попрактикуетесь в написании запроса, сегментирующего пользователей на основании стоимости их покупок. Разработаете алгоритм, максимизирующий выручку для целевой маржи. Узнаете, в чём заключается принцип Кока-Колы.
Построите линейную модель предсказания спроса от цены.
Узнаете, как спрогнозировать спрос до того, как продажи начались.
Научитесь считать ARPU и AOV.
Сможете исправлять ошибку в коде, не меняя поведение метрики в остальном.
Научитесь рассчитывать Average Check.
Узнаете, как определять эластичность товаров.
Познакомитесь с пятью способами агрегации цен конкурентов.
Разберётесь, как предсказывать стоимость объектов недвижимости на основе их числовых признаков.
Попрактикуетесь в написании запроса, сегментирующего пользователей на основании стоимости их покупок.
Разработаете алгоритм, максимизирующий выручку для целевой маржи.
Узнаете, в чём заключается принцип Кока-Колы.
Рекомендательные системы
Оцените точность алгоритма ранжирования до проведения А/В теста. Изучите различные метрики ранжирования. Разберётесь, как создать первую версию рекомендательной системы на основе неявных оценок интересов пользователей. Составите четыре SQL-запроса с целью первичного анализа данных. Создадите собственную метрику для оценки разнообразия в выдаче. Научитесь писать веб-сервисы на FastAPI и распределять трафик между рекламными баннерами. Разберётесь, как внедрить статистические критерии в процедуру валидации. Построите эмбеддинги товаров на основе паттернов поведения покупателей. Напишете запрос, сегментирующий пользователей на основе цен их покупок.
Оцените точность алгоритма ранжирования до проведения А/В теста.
Изучите различные метрики ранжирования.
Разберётесь, как создать первую версию рекомендательной системы на основе неявных оценок интересов пользователей.
Составите четыре SQL-запроса с целью первичного анализа данных.
Создадите собственную метрику для оценки разнообразия в выдаче.
Научитесь писать веб-сервисы на FastAPI и распределять трафик между рекламными баннерами.
Разберётесь, как внедрить статистические критерии в процедуру валидации.
Построите эмбеддинги товаров на основе паттернов поведения покупателей.
Напишете запрос, сегментирующий пользователей на основе цен их покупок.
NLP & LLM
Научитесь строить простые Q&A сервисы при помощи RAG. Разберётесь, как вдвое ускорить код с минимальными правками. Создадите тест, ловящий нежелательное поведение. Научитесь парсить многоуровневые конфиги в формате YAML. Научитесь генерировать краткое значение видеороликов на YouTube. Узнаете, как извлечь URL-адреса из текстовых сообщений. Разберётесь, как контролировать поведение модели даже в наиболее сложных случаях. Познакомитесь с особенностями архитектуры BERT. Сможете реализовать GPT-2 с нуля.
Научитесь строить простые Q&A сервисы при помощи RAG.
Разберётесь, как вдвое ускорить код с минимальными правками.
Создадите тест, ловящий нежелательное поведение.
Научитесь парсить многоуровневые конфиги в формате YAML.
Научитесь генерировать краткое значение видеороликов на YouTube.
Узнаете, как извлечь URL-адреса из текстовых сообщений.
Разберётесь, как контролировать поведение модели даже в наиболее сложных случаях.
Познакомитесь с особенностями архитектуры BERT.
Сможете реализовать GPT-2 с нуля.
Тестирование в Python
Попрактикуетесь в написании теста, который будет ловить баги в коде. Напишете юнит-тесты для трёх бизнес-метрик при помощи Pytest. Разберётесь, как отлавливать проблемы в коде на ранних стадиях. Создадите тест, ловящий нежелательное поведение.
Попрактикуетесь в написании теста, который будет ловить баги в коде.
Напишете юнит-тесты для трёх бизнес-метрик при помощи Pytest.
Разберётесь, как отлавливать проблемы в коде на ранних стадиях.
Создадите тест, ловящий нежелательное поведение.
A/B-тестирование
Узнаете, как правильно проводить А/В-тесты для квантилей метрики. Проведёте симуляцию А/А и А/В тестов. Узнаете, что такое множественное тестирование гипотез. Разберётесь, как внедрить статистические критерии в процедуру валидации.
Узнаете, как правильно проводить А/В-тесты для квантилей метрики.
Проведёте симуляцию А/А и А/В тестов.
Узнаете, что такое множественное тестирование гипотез.
Разберётесь, как внедрить статистические критерии в процедуру валидации.
Матчинг
Создадите постпроцессинг предсказаний для матчинга товаров. Познакомитесь с пятью различными способами агрегации цен конкурентов. Перейдёте к продвинутой валидации модели и расчёту метрик. Сможете оценить точность алгоритма ранжирования. Научитесь находить средневзвешенные цены при помощи готовых эмбеддингов. Построите эмбеддинги товаров на основе паттернов поведения покупателей. Напишете алгоритм поиска ближайших соседей.
Создадите постпроцессинг предсказаний для матчинга товаров.
Познакомитесь с пятью различными способами агрегации цен конкурентов.
Перейдёте к продвинутой валидации модели и расчёту метрик.
Сможете оценить точность алгоритма ранжирования.
Научитесь находить средневзвешенные цены при помощи готовых эмбеддингов.
Построите эмбеддинги товаров на основе паттернов поведения покупателей.
Напишете алгоритм поиска ближайших соседей.
Ещё задачи
Научитесь считать метрики DAU. По шагам построите алгоритм K-means. Напишете SQL-запрос с оконными функциями для построения датасета. Сможете привести созданный несколькими людьми код к общему виду. Разберётесь, как ускорить код вдвое с минимальными усилиями. Подсчитаете, сколько товаров компания продаёт в день. Изучите принцип мемоизации. Научитесь рассчитывать метрику WAU. Сможете применять метод параллельных вычислений. Разберётесь, как эффективно переиспользовать код эффективно с помощью абстрактных классов. Изучите Metric Learning. Узнаете, как построить uplift-модель, предсказывающую нужных покупателей. Построите дашборд, отображающий сумму оплат пользователей за каждую неделю.
Научитесь считать метрики DAU.
По шагам построите алгоритм K-means.
Напишете SQL-запрос с оконными функциями для построения датасета.
Сможете привести созданный несколькими людьми код к общему виду.
Разберётесь, как ускорить код вдвое с минимальными усилиями.
Подсчитаете, сколько товаров компания продаёт в день.
Изучите принцип мемоизации.
Научитесь рассчитывать метрику WAU.
Сможете применять метод параллельных вычислений.
Разберётесь, как эффективно переиспользовать код эффективно с помощью абстрактных классов.
Изучите Metric Learning.
Узнаете, как построить uplift-модель, предсказывающую нужных покупателей.
Построите дашборд, отображающий сумму оплат пользователей за каждую неделю.