• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Машинное обучение в финансах

2022/2023
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 4 модуль

Преподаватель


Голдобин Борис Игоревич

Программа дисциплины

Аннотация

Цель данного курса – познакомить студентов с современными алгоритмами машинного обучения и продемонстрировать возможности их применения для решения задач финансовой науки. Освоение дисциплины даст студентам практический навык обработки экономических данных с помощью языка Python и построения аналитических моделей. В результате прохождения курса студенты научатся самостоятельно формировать массивы данных для анализа и проверять их на полноту и корректность, смогут формулировать гипотезы, выбирать подходящие модели машинного обучения для их проверки и оценивать устойчивость моделей. Особое внимание в рамках курса уделяется специфике работы с экономическими данными, характеризующимися нестационарностью и частыми сменами режимов. Программа курса предполагает знакомство слушателей с основами статистики и эконометрики. Занятия проходят в форме семинаров, в ходе которых студенты работают с программным кодом на языке Python и строят численные эксперименты, раскрывающие механизм работы алгоритмов машинного обучения.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство студентов с современными алгоритмами машинного обучения и продемонстрировать возможности их применения для решения задач финансовой науки.
Планируемые результаты обучения

Планируемые результаты обучения

  • может формулировать гипотезы и использовать данные для их верификации
  • владеет навыком построения базовых моделей машинного обучения в Python
  • понимает статистические особенности финансовых данным и учитывает их при построении моделей и интерпретации
  • умеет формировать подходящие для анализа массивы финансовых данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Сущность машинного обучения. Особенности терминологии. Проблемы использования эконометрики в финансах. Примеры использования машинного обучения для решения финансовых задач.
  • Введение в Python. JupyterLab. Типы переменных. Базовые операции. Pandas, NumPy.
  • Визуализация данных в Python. Matplotlib и Seaborn.
  • Линейные регрессии и k-ближайших соседей. Оценка качества моделей.
  • Логистическая регрессия и линейный дискриминантный анализ. Метрики качества классификации.
  • Выбор параметров модели. Ресэмплинг. Кросс-валидация и бутстрэп.
  • Регуляризация линейных моделей. Гребневая (ridge) и LASSO регрессии
  • Методы снижения размерности данных. Метод главных компонент (PCA). Определение числа значимых компонент.
  • Решающие деревья. Случайные леса. Бустинг.
  • Машины опорных векторов (SVM).
  • Кластеризация по методу k-средних, k-медоидов.
  • Иерархическая кластеризация. Построение дендрограмм.
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
  • неблокирующий Контрольная работа
  • неблокирующий Домашнее задание
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.3 * Экзамен + 0.3 * Домашнее задание + 0.2 * Контрольная работа + 0.2 * Самостоятельная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Изучаем Python, Лутц, М., 2014

Рекомендуемая дополнительная литература

  • Python for data analysis : data wrangling with pandas, numPy, and IPhython, Mckinney, W., 2017
  • Прикладная макроэкономика : учебник, Киреев, А. П., 2006

Авторы

  • Кузьменкова Наталия Николаевна
  • Борисова Елена Феликсовна