ТАРИФ "VIP Канонир" - СКИДКА 50%!

Перед оплатой введите промо-код:

PIRAT.BIZ_50%
  • Объявление

    Гость, Перед публикацией материалов ознакомьтесь с правилами создания и оформления раздач.

[GeekBrains] Машинное обучение. Часть 4 из 5 (2020)

ALVILDA

ПОВЕЛИТЕЛЬНИЦА ИНФО ВОЛКОВ
Боцман
Регистрация
13.07.18
Сообщения
6,311
Реакции
98,225
Депозит
0
Сделки
0
Нарушения
0 / 0
Монетки
1956
    Голосов: 0
    0.0 5 0 0 https://pirat.biz/threads/geekbrains-%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5-%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5-%D0%A7%D0%B0%D1%81%D1%82%D1%8C-4-%D0%B8%D0%B7-5-2020.106780/
  • #1
Автор: GeekBrains
Название: Машинное обучение. Часть 4 из 5 (2020)

1600445370987.png



Описание:

Программа

30+ онлайн-уроков, более 65 часов обучающего контента и практика после каждого занятия
Длительность: 5 месяцев.

Модуль 1. Теория вероятностей и математическая статистика
Модуль 2. Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
Модуль 3. Библиотеки Python для Data Science: продолжение
Модуль 4. Алгоритмы анализа данных
Модуль 5. Системы машинного обучения в Production

Подробная программа:

Теория вероятностей и математическая статистика


  • Случайные события. Условная вероятность. Формула Байеса. Независимые испытания

  • Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона

  • Описательная статистика. Качественные и количественные характеристики популяции. Графическое представление данных

  • Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема

  • Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование

  • Взаимосвязь величин. Параметрические и непараметрические показатели корреляции. Корреляционный анализ

  • Многомерный статистический анализ. Линейная регрессия

  • Дисперсионный анализ. Логистическая регрессия

Курсовой проект
Разведочный анализ данных (EDA) на основе выбранного датасета: визуализация, корреляционный, дисперсионный и факторный анализ


Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn

  • Введение в курс. Вебинар

  • Вычисления с помощью Numpy. Работа с данными в Pandas. Видеоурок

  • Вычисления с помощью Numpy. Работа с данными в Pandas. Вебинар

  • Визуализация данных в Matplotlib. Видеоурок

  • Визуализация данных в Matplotlib. Вебинар

  • Обучение с учителем в Scikit-learn. Видеоурок

  • Обучение с учителем в Scikit-learn. Вебинар

  • Обучение без учителя в Scikit-learn. Видеоурок

  • Обучение без учителя в Scikit-learn и введение в итоговый проект. Вебинар

  • Консультация по итоговому проекту. Вебинар

Курсовой проект
Соревнование на платформе Kaggle по предсказанию цены на недвижимость, решение задачи регрессии


Библиотеки Python для Data Science: продолжение

  • Введение в задачу классификации. Постановка задачи и подготовка данных

  • Анализ данных и проверка статистических гипотез

  • Построение модели классификации

  • Оценка и интерпретация полученной модели. Обсуждение курсового проекта

Курсовой проект
Соревнование на платформе Kaggle по кредитному скорингу, решение задачи классификации


Алгоритмы анализа данных

  • Алгоритм линейной регрессии. Градиентный спуск

  • Масштабирование признаков. L1- и L2-регуляризация. Стохастический градиентный спуск

  • Логистическая регрессия. Log Loss

  • Алгоритм построения дерева решений

  • Случайный лес

  • Градиентный бустинг (AdaBoost)

  • Классификация с помощью KNN. Кластеризация K-means

  • Снижение размерности данных

Курсовой проект
Участие в одном или двух соревнованиях на Kaggle: предсказать средний балл на экзамене по математике, который получают ученики репетиторов (задача регрессии); предсказать, подойдет ли репетитор для подготовки к экзамену по математике (задача классификации)


Системы машинного обучения в Production

  • Введение в задачу предсказания оттока. Формализация задачи и сбор сырых данных

  • Загрузка данных и построение обучающей выборки. Анализ и предобработка датасета. Балансировка классов

  • Выбор и обучение модели на отобранных признаках. Сравнение качества и оценка модели

  • Оценка потенциального влияния на бизнес. Масштабирование решения

  • Подготовка к продакшену. Планировщик задач и перенос проекта из Jupyter в PyCharm

Курсовой проект
Оценка потенциального влияния на бизнес ML-решения, построение модели оттока клиентов в игровых проектах и подготовка кода для Production в PyCharm

Подробнее:
Для просмотра ссылок пройдите регистрацию


Скачать:
Для просмотра ссылок пройдите регистрацию
 
Верх Низ