We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Machine learning in finance

2020/2021
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Course type:
Compulsory course
When:
1 year, 3, 4 module

Instructor


Литвинов Роман Викторович

Программа дисциплины

Аннотация

В рамках данного курса студенты смогут получить базовые знания программирования на языке на Python и познакомиться со всей необходимой для этого инфраструктурой и библиотеками (Jupyter notebook, Github, Pandas, Numpy, Sklearn, Matplotlib, etc). Мы разберемся в том, как работают основные методы и технологии машинного обучения, как для задач классификации, так и регрессии (от линейной/ логистической регрессии до случайных лесов и глубоких нейронных сетей). Внимание будет уделено процессу гипертюнинга параметров моделей, использованию бустинга, кросс-валидации и тп. Примеры использования данных технологий будут базироваться на задачах, связанных с факторным инвестированием в целом и предсказанием форвардных доходностей акций в частности. Для этого мы разберемся в процессах загрузки и обработки данных, визуализации, расчета факторов, тестирования идей и проч. Попутно студенты смогут получить знания о том, что такое факторное инвестирование, какие бывают факторы и в чем их смысл (risk/reversal, momentum, quality, growth, etc).
Цель освоения дисциплины

Цель освоения дисциплины

  • Получить базовые навыки программирования на языке Python
  • Изучить основные методы и технологии машинного обучения и научиться их успешно применять
  • Ознакомиться с понятием факторного инвестирования и процессом предсказания (prediction) форвардной доходности акций с использованием различных факторов
Планируемые результаты обучения

Планируемые результаты обучения

  • Умение работать в Anaconda, Jupyter notebook
  • Владение базовым математическим аппаратом для понимания методов машинного обучения
  • Умение применить на практике библиотеки языка Python numpy, matplotlib, pandas
  • Владеет процессом предсказания (prediction) форвардной доходности акций с использованием различных факторов
  • Знаком с понятием факторного инвестирования
  • Знание основных методов машинного обучения, их особенностей и отличий
  • Умение применить на практике методы машинного обучения на базе языка Python и соответствующих библиотек
  • Понимание основных методов и моделей машинного обучения, их преимуществ и ограничений
  • Понимание перспектив развития машинного обучения в финансах
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение
    О чем этот курс. Краткое содержание. Организационные вопросы. Подготовительная работы (установка Anaconda, Jupyter notebooks, etc)
  • Математика
    Функции, производная, интеграл. Линейная алгебра. Теория вероятностей. Статистика.
  • Введение в программирование на Python
    Пакеты Numpy, Matplotlib, Pandas
  • Факторное инвестирование
    Разновидности факторов и их смысл. Подготовка данных. Feature engineering.
  • Введение в машинное обучение
    Особенности машинного обучения. Основные типы задач
  • Методы машинного обучения
    Линейная регрессия. Лассо. Ридж. Нелинейная регрессия. Логистическая регрессия. Тюнинг гиперпараметров. Методы повторной выборки (resampling). Кросс-валидация. Бустинг. Деревья решений (decision trees). Случайные леса (random forest). Обобщенные линейные модели (generalized additive models). Глубокие нейронные сети (deep learning networks). Обучение с подкреплением (reinforcement learning).
  • Заключение
    Темы для дальнейшего изучения. Видение: долгосрочное влияние ML/AI на финансы и эволюция профессии.
Элементы контроля

Элементы контроля

  • неблокирующий Самостоятельная работа
  • неблокирующий Контрольная работа
  • неблокирующий Домашнее задание
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.3 * Домашнее задание + 0.2 * Контрольная работа + 0.2 * Самостоятельная работа + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • James, G. et al. An introduction to statistical learning. – Springer, 2013. – 426 pp.

Рекомендуемая дополнительная литература

  • Seemon Thomas. (2014). Basic Statistics. [N.p.]: Alpha Science Internation Limited. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1663598
  • Vanderplas, J. T. (2016). Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). Sebastopol, CA: Reilly - O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081