• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Данные и аналитика в финансах

2025/2026
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 3, 4 модуль

Преподаватель

Программа дисциплины

Аннотация

Дисциплина «Данные и аналитика в финансах» фокусируется на прикладном стеке Python-инструментов для финансового анализа: студенты используют LLM как основной движок для генерации скриптов сбора и обработки данных. Курс включает освоение библиотек для извлечения текстовых слоев из финансовой отчетности и инструментов OCR для оцифровки сканов. Для реализации NLP-задач используются профессиональные библиотеки обработки текста , позволяющие автоматизировать извлечение сущностей (NER) и тематическое моделирование (Topic Modeling). Технологический фокус направлен на создание готовых дата-продуктов через Streamlit и интеграцию аналитических пайплайнов в Telegram-ботов для оперативного финансового мониторинга.
Цель освоения дисциплины

Цель освоения дисциплины

  • Подготовка в области основ гуманитарных, социальных, экономических и математических знаний, получение высшего профессионально профилированного (на уровне бакалавра) образования, позволяющего выпускнику успешно работать в избранной сфере деятельности, обладать универсальными и предметно-специализированными компетенциями, способствующими его социальной мобильности и устойчивости на рынке труда.
  • Формирование социально-личностных качеств студентов: целеустремленности, организованности, трудолюбия, ответственности, активной общественной позиции, коммуникабельности толерантности, повышение их общей культуры и расширение кругозора.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знакомство с парсингом HTML разметки сайтов
  • Умеет загружать данные, обрабатывать и визуализировать в среде RStudio.
  • Знает основы SQL. Умеет создавать различные запросы с использованием команд языка SQL .
  • Выявляет виды цен во внешней торговле: цены реальных сделок, цены предложений, справочные цены, цены каталогов и прейскурантов, средние экспортные и импортные цены, или средняя стоимость единицы экспорта или импорта, биржевые котировки, цены аукционов.
  • Владеет общими понятиями базы данных. Владеет понятием СУБД в прикладных системах. Владеет общими понятиями реляционной модели.
  • Знает методы Sentiment analysis
  • Студенты познакомятся и сформируют первичный опыт работы в среде R
  • Студент способен разрабатывать чат-боты для мессенджера Telegram.
  • Осуществлять парсинг данных с внешних ресурсов
  • Знает основы применения методов обработки текстовых данных
  • Умеет подбирать релевантные для исследовательской задачи инструменты сбора, обработки и анализа данных
  • Использует LLM для автоматизации задач с применением ключевых библиотек Python: Pandas для обработки данных, BeautifulSoup для парсинга сайтов и Aiogram для создания ботов
  • Использовать методы тематического моделирования и кластеризации текстов (LDA, BERTopic, k-means, UMAP) для выявления скрытых тем и группировки документов.
  • Визуализация результатов исследований
  • Знать методы сбора данных парсинг, API, автоматизация
  • применять методы Named Entity Recognition (NER) для автоматического извлечения сущностей из текстов и анализа клиентских данных;
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Основы сбора и предобработки данных
  • Обработка естественного языка
  • Разработка дата-продуктов
Элементы контроля

Элементы контроля

  • неблокирующий Сбор данных
  • неблокирующий Аудиторная работа
  • неблокирующий Итоговый проект
  • неблокирующий Анализ данных
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 4th module
    0.2 * Анализ данных + 0.3 * Аудиторная работа + 0.3 * Итоговый проект + 0.2 * Сбор данных
Список литературы

Список литературы

Рекомендуемая основная литература

  • Alain Zuur, Elena N. Ieno, & Erik Meesters. (2009). A Beginner’s Guide to R. Springer.
  • Petrov, A., & O’Reilly for Higher Education (Firm). (2019). Database Internals : A Deep Dive Into How Distributed Data Systems Work (Vol. First edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2250514
  • Иванченко, И. С.  Производные финансовые инструменты: оценка стоимости деривативов : учебник для вузов / И. С. Иванченко. — Москва : Издательство Юрайт, 2019. — 261 с. — (Высшее образование). — ISBN 978-5-534-11386-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/445194 (дата обращения: 28.08.2023).
  • Производные финансовые инструменты : учебник / В.А. Галанов. — 2-е изд, перераб. и доп.— М. : ИНФРА-М, 2017. — 221 с. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/21804. - Режим доступа: http://znanium.com/catalog/product/610326

Рекомендуемая дополнительная литература

  • Date, C. J. (2015). SQL and Relational Theory : How to Write Accurate SQL Code (Vol. Third edition). Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1099367

Авторы

  • Борисова Елена Феликсовна
  • Маткин Никита Андреевич