Python: введение в анализ данных

Программа повышения квалификации направлена на получение навыков работы c языком программирования Python для анализа больших данных.

В рамках данной программы слушатели изучат:

  • Основные типы данных языка Python
  • Алгоритмы для построения прогнозных моделей и моделей классификации
  • Визуализации данных
  • "Очистка" и подготовка данных для построения моделей
  • Времянные ряды
  • Применения языка Python и алгоритмов МО в бизнес-процессах

Обучение состоит из 6 модулей:

1. Библиотеки языка программирования Python.

  •     Основные назначения и функции библиотек;

  •     Виды библиотек для анализа данных: Pandas, Numpy, Statsmodels, Sklearn, Seabourne;

  •     Виды библиотек для визуализации данных;

2. Типы и структуры данных в Python.

  •     Разновидности типов данных: Integer, float, bool, srting, object;

  •     Разновидности структур данных: Dataframe, series, массив, кортежи, списки и др.;

3. Загрузка данных в программу и предварительный анализ.

  •     Загрузка данных разного формата (xlsx, csv, html и др.);

  •     Выявления количества строк и колонок;

  •     Выявление пропущенных значений;

  •     Выявление типов данных в матрице;

4. Функции Python для анализа данных.

  • Функции для получения описательной статистики (нахождение max, min, среднее, медианное значение, квартили);

  • Функции для визуализации плотности распределения данных(Нормальное Гауссово распределение);

  • Функции для создания бинарных переменных (dummies var);

  • Функции алгоритмов машинного обучения для построения моделей( Метод наименьших квадрат, метод опорных векторов, случайных лес, логистическая регрессия, временные ряды);

5. Построение регрессионных моделей.

  • Цель построения линейных регрессий по методу МНК;

  • Выдвижение гипотез и постановка задачи (на основе рабочих данных);

  • Построение регрессионной модели в Python;

  • Оценка значимости полученных коэфф и модели в целом(t-статистика, F-статистика);

  • Оценка качества модели (R2);

  • Проверка предпосылок Гаусса-Маркова;

  • Интерпретация полученных результатов;

6. Построение моделей классификации.

  • Алгоритм Random Forest;

  • Логистическая регрессия;

  • Метод опорных векторов;

 

Продолжительность обучения – 36 часов (24 часов аудиторных занятий с преподавателем, 12 часа - самостоятельное изучение материалов).

Форма обучения – очная с возможностью дистанционного подключения.

Стоимость обучения 30 000 рублей.

Начало занятий - осень 2022 года.

Договоры на обучение заключаются с физическими и юридическими лицами.

Запись на курсы проводится по электронной почте hsmi-dopobr@mail.ru (для физических лиц).

Вы можете обратиться для записи или с вопросами к администратору курса Мартьянову Антону по WhatsApp или Telegram по номеру +79264827721.

Телефон деканата факультета: +74959328073

Информация обновлена: 30.08.2022

Program size: 
36/24 академических часа, в т.ч. 24 часа лекций, практических занятий, семинаров
Duration of studies: 
3-4 недели
Mode of attendance: 
Intra-extramural
Language of study: 
Russian
Issue documents: 

Удостоверение о повышении квалификации Высшей школы управления и инноваций (факультета) МГУ имени М.В.Ломоносова

Head of the program: 
Ивлев Станислав Сергеевич
Common materials: 

Записаться на обучение

Очный; дистанционный (видеоконференция); совмещенный, в зависимости от ситуации; ваш вариант
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.