Python: введение в анализ данных

Программа повышения квалификации направлена на получение навыков работы c языком программирования Python для анализа больших данных.

В рамках данной программы слушатели изучат:

  • Основные типы данных языка Python
  • Алгоритмы для построения прогнозных моделей и моделей классификации
  • Визуализации данных
  • "Очистка" и подготовка данных для построения моделей
  • Времянные ряды
  • Применения языка Python и алгоритмов МО в бизнес-процессах

Обучение состоит из 6 модулей:

1. Библиотеки языка программирования Python.

  •     Основные назначения и функции библиотек;

  •     Виды библиотек для анализа данных: Pandas, Numpy, Statsmodels, Sklearn, Seabourne;

  •     Виды библиотек для визуализации данных;

2. Типы и структуры данных в Python.

  •     Разновидности типов данных: Integer, float, bool, srting, object;

  •     Разновидности структур данных: Dataframe, series, массив, кортежи, списки и др.;

3. Загрузка данных в программу и предварительный анализ.

  •     Загрузка данных разного формата (xlsx, csv, html и др.);

  •     Выявления количества строк и колонок;

  •     Выявление пропущенных значений;

  •     Выявление типов данных в матрице;

4. Функции Python для анализа данных.

  • Функции для получения описательной статистики (нахождение max, min, среднее, медианное значение, квартили);

  • Функции для визуализации плотности распределения данных(Нормальное Гауссово распределение);

  • Функции для создания бинарных переменных (dummies var);

  • Функции алгоритмов машинного обучения для построения моделей( Метод наименьших квадрат, метод опорных векторов, случайных лес, логистическая регрессия, временные ряды);

5. Построение регрессионных моделей.

  • Цель построения линейных регрессий по методу МНК;

  • Выдвижение гипотез и постановка задачи (на основе рабочих данных);

  • Построение регрессионной модели в Python;

  • Оценка значимости полученных коэфф и модели в целом(t-статистика, F-статистика);

  • Оценка качества модели (R2);

  • Проверка предпосылок Гаусса-Маркова;

  • Интерпретация полученных результатов;

6. Построение моделей классификации.

  • Алгоритм Random Forest;

  • Логистическая регрессия;

  • Метод опорных векторов;

 

Продолжительность обучения – 36 часов (24 часов аудиторных занятий с преподавателем, 12 часа - самостоятельное изучение материалов).

Форма обучения – очная с возможностью дистанционного подключения.

Стоимость обучения: 30 800 рублей.

Начало занятий - Весна 2024 года

Договоры на обучение заключаются с физическими и юридическими лицами.

Запись на курсы проводится по электронной почте hsmi-dopobr@mail.ru (для физических лиц) или с  помощью формы регистрации на странице сайта. 

Телефон деканата факультета: +7 (495) 932- 80- 73

Информация обновлена 30.06.2023

Язык преподавания: 
Русский
Руководитель программы: 
Ивлев Станислав Сергеевич

Записаться на обучение

Очный; дистанционный (видеоконференция); совмещенный, в зависимости от ситуации; ваш вариант
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.