• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Введение в Науку о данных

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
7
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 1-3 модуль

Преподаватель

Программа дисциплины

Аннотация

Дисциплина представляет собой вводный курс в Data Science. Он включает в себя изучение необходимых для дальнейшей работы основ математики, прежде всего математической статистики, овладение необходимым инструментарием SPSS и Python; основных задач анализа данных и машинного обучения (регрессия, классификация, кластеризация), методы анализа текстовых данных.
Цель освоения дисциплины

Цель освоения дисциплины

  • Цель дисциплины «Введение в науку о данных» – формирование теоретических и практических компетенций в следующих областях: математическая статистика и методы количественного анализа данных; технологии анализа данных, связанные с манипуляцией большими объемами данных (сбор, очистка, подбор подходящей структуры для формального представления) и методами их визуализации; прикладные навыки в области машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Демонстрирует навыки визуализации данных.
  • Знает основные понятия матема-тической статистики, использует программные средства для ста-тистического анализа.
  • Умеет применить основные методы машинного обучения для решения задач предметной области, может сделать выводы по результатам проделанной работы.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Основы математики
  • Раздел 2. Методы визуализации данных: диаграммы рассеяния, визуализация погрешностей, гистограммы.
  • Раздел 3. Основные задачи и методы машинного обучения.
Элементы контроля

Элементы контроля

  • неблокирующий Проект в рамках 2 и 3 раздела
    Письменный отчёт с постановкой задачи, её решение методами, обсуждаемыми на курсе, и выводы о полученных результатах.
  • неблокирующий Экзамен
    Экзамен по дисциплине пройдет онлайн (в zoom) в период сессии 3-го модуля.
  • неблокирующий Работа на аудиторных занятиях в рамках первого раздела
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 3 модуль
    0.4 * Экзамен + 0.4 * Проект в рамках 2 и 3 раздела + 0.2 * Работа на аудиторных занятиях в рамках первого раздела
Список литературы

Список литературы

Рекомендуемая основная литература

  • Иванов Б.Н. - Теория вероятностей и математическая статистика: учебное пособие - Издательство "Лань" - 2019 - ISBN: 978-5-8114-3636-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113901

Рекомендуемая дополнительная литература

  • Дюк В.А. - Логический анализ данных: учебное пособие - Издательство "Лань" - 2020 - ISBN: 978-5-8114-4180-8 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/126935
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульма - Анализ больших наборов данных - Издательство "ДМК Пресс" - 2016 - ISBN: 978-5-97060-190-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93571