• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Statistical and Empirical Methods of Computing

2019/2020
Academic Year
RUS
Instruction in Russian
5
ECTS credits
Delivered at:
Department of Information Technologies in Business (Faculty of Economics, Management, and Business Informatics)
Course type:
Compulsory course
When:
2 year, 3, 4 module

Instructor

Программа дисциплины

Аннотация

Настоящая программа учебной дисциплины устанавливает требования к образовательным результатам и результатам обучения студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих дисциплину «Статистические и эмпирические методы компьютинга», учебных ассистентов и студентов направления подготовки 09.03.04 Программная инженерия, обучающихся по образовательной программе «Программная инженерия».
Цель освоения дисциплины

Цель освоения дисциплины

  • приобретение студентами базовых знаний по основам анализа данных
  • знакомство с прикладными задачами дисциплины
  • анализ алгоритмов обработки статистических и эмпирических данных, используемых в современном программном обеспечении
  • получения практических навыков использования статистических и эмпирических методов компьютинга в ходе разработки и экспериментального исследования новых программных продуктов
  • развитие умений, позволяющих использовать опыт применения статистических и эмпирических методов обработки данных для решения задач экономического анализа и моделирования
Результаты освоения дисциплины

Результаты освоения дисциплины

  • Решает задачи корреляционного анализа и проверки статистических гипотез на наличие взаимосвязи между признаками. Может оценить взаимосвязь между несколькими переменными. Знает параметрические и непараметрические методы оценки
  • Решает задачи классификации и кластеризации пространства наблюдений
  • Решает задачи построения и проверки на качество регрессионных моделей
  • Решает задачи на проверку данных на выбросы, нормальное распределение.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Раздел 1. Предварительный анализ данных
    Статистические методы обработки экспериментальных данных. Основные понятия и задачи математической статистики. Генеральная совокупность, выборка, результаты наблюдений, статистика, статистическая оценка, требования к оценкам. Классификация признаков по шкалам измерений. Описательная статистика: среднее значение, математическое ожидание, медиана, мода, дисперсия, среднее квадратичное отклонение, коэффициент вариации, показатель точности опыта, минимум, максимум, размах выборки, моменты распределения. Вариационная статистика: параметры классовых интервалов, группировка, функции эмпирического распределения. Ранжирование. Проверка случайности выборки из нормальной совокупности. Статистические гипотезы и статистические критерии. Характеристики критериев. Тест Вальда. Тест Стьюдента. Лемма Неймана-Пирсона. Критерий отношения правдоподобия. Введение в A/B-тестирование. Критерий последовательного отношения правдоподобия. Непараметрические критерии. Формы и методы проведения занятий по разделу, применяемые учебные технологии: лекционные занятия, решение задач на семинарах, самостоятельная работа, проверка усвоенного материала микроконтролем.
  • Раздел 2. Корреляционный анализ данных
    Парный коэффициент корреляции. Проверка гипотезы о значимости коэффициента корреляции. Доверительный интервал для парного коэффициента корреляции. Частный коэффициент корреляции. Проверка гипотезы о значимости частного коэффициента корреляции. Доверительный интервал для частного коэффициента корреляции. Множественный коэффициент корреляции. Проверка гипотезы о значимости множественного коэффициента корреляции. Корреляционный анализ качественных данных. Исследование связи между номинальными переменными (таблица сопряженности признаков, критерий хи-квадрат, меры связи признаков: коэффициенты контингенции, ассоциации, среднеквадратической сопряженности, Пирсона, Крамера). Лямбда меры прогноза Гутмана. Исследование связи между порядковыми переменными (ранговый коэффициент корреляции Спирмена, коэффициент согласованности Кендалла, коэффициент конкордации). Формы и методы проведения занятий по разделу, применяемые учебные технологии: лекционные занятия, решение задач на семинарах, самостоятельная работа, проверка усвоенного материала микроконтролем.
  • Раздел 3. Методы классификации многомерных наблюдений
    Классификация многомерных наблюдений без обучения (непараметрический случай), кластерный анализ. Общая постановка задачи автоматической классификации, классификации без обучения, понятия кластерного анализа. Метрики расстояния и близости между объектами, расстояния между кластерами. Функционалы качества разбиения. Основные типы задач и алгоритмов кластерного анализа. Иерархические, параллельные и последовательные процедуры кластерного анализа. Метод к-средних. Зависимость выбора алгоритма классификации от цели статистического исследования. Классификация многомерных наблюдений при наличии обучающих выборок, дискриминантный анализ. Методы классификации с обучением, основные понятия дискриминантного анализа. Обучающие выборки. Линейный дискриминантый анализ при известных параметрах многомерного нормального закона распределения (случай двух классов и общий случай). Вероятность ошибочной классификации с помощью дискриминантной функции. Оценка качества дискриминантной функции и информативности отдельных признаков. Классификация многомерных наблюдений без обучения (параметрический случай), расщепление смесей вероятностных распределений. Канонические корреляции. Понятие и задача расщепления смеси вероятностных распределений. Алгоритм решения задачи автоматической классификации в рамках модели смеси распределений, приводящий к схеме дискриминантного анализа Канонические корреляции и канонические величины генеральной совокупности, их оценивание, интерпретация и использование в экономических исследованиях. Формы и методы проведения занятий по разделу, применяемые учебные технологии: лекционные занятия, решение задач на семинарах, самостоятельная работа, проверка усвоенного материала микроконтролем.
  • Раздел 4. Регрессионный анализ
    Анализ однофакторной регрессионной модели Простейшая линейная регрессионная модель (ПЛРМ). Природа случайной ошибки. Корреляционное поле наблюдений и его применение к выбору формы регрессии. Оценки методом наименьших квадратов коэффициентов ПЛРМ. Интерпретация коэффициентов ПЛРМ. Коэффициент детерминации и его свойства. Теорема Гаусса–Маркова. Доверительные интервалы для коэффициентов регрессии и проверка гипотез об их значимости (t – тест). Проверка значимости всей регрессии на основе критерия Фишера. Прогнозирование значения зависимой переменной по ПЛРМ, точность прогноза. Функциональные преобразования в линейной регрессионной модели. Линеаризация нелинейной регрессионной модели. Анализ общей линейной модели наблюдений при классических предположениях Множественный регрессионный анализ: особенности спецификации модели, отбор факторов при построении множественной регрессии. Классическая нормальная линейная модель множественной регрессии, оценка параметров методом МНК, ковариационная матрица и ее выборочная оценка. Оценка дисперсии возмущений. Определение доверительных интервалов для коэффициентов и функции регрессии. Оценка значимости множественной регрессии. Анализ линейной модели наблюдений при отклонениях от классических предположений Возможные отклонения от предположений классической общей линейной модели наблюдений (ОЛМН): закон распределения, отличный от нормального; автокорреляция, ее суть, причины, последствия, обнаружение и методы устранения; гетероскедастичность, ее суть, последствия, обнаружение и методы смягчения проблемы гетероскедастичности; Исследовательские методы проверки отсутствия гомоскедастичности: тесты Спирмена, Голдфелда–Квандта, Уайта. Мультиколлинеарность, ее суть, последствия, определение и методы устранения. Взвешенный МНК как частный случай обобщенного МНК; содержательный смысл этого подхода. Метод максимального правдоподобия. Реализация этого метода для модели с двумя группами однородных наблюдений. Формы и методы проведения занятий по разделу, применяемые учебные технологии: лекционные занятия, решение задач на семинарах, самостоятельная работа, проверка усвоенного материала микроконтролем.
Элементы контроля

Элементы контроля

  • неблокирующий Контрольная работа
  • неблокирующий Домашняя работа
  • неблокирующий Самостоятельная работа
  • неблокирующий Аудиторная работа
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.1 * Аудиторная работа + 0.2 * Домашняя работа + 0.2 * Контрольная работа + 0.1 * Самостоятельная работа + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Миркин Б. Г.-ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ. Учебник и практикум-М.:Издательство Юрайт,2019-174-Авторский учебник-978-5-9916-5009-0: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/vvedenie-v-analiz-dannyh-432851
  • Под ред. Елисеевой И.И.-ЭКОНОМЕТРИКА. Учебник для бакалавриата и магистратуры-М.:Издательство Юрайт,2019-449-Бакалавр и магистр. Академический курс-978-5-534-00313-0: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/ekonometrika-431129
  • Под ред. Мхитаряна В.С.-АНАЛИЗ ДАННЫХ. Учебник для академического бакалавриата-М.:Издательство Юрайт,2019-490-Бакалавр. Академический курс-978-5-534-00616-2: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/analiz-dannyh-432178

Рекомендуемая дополнительная литература

  • Демидова О. А., Малахов Д. И.-ЭКОНОМЕТРИКА. Учебник и практикум для прикладного бакалавриата-М.:Издательство Юрайт,2019-334-Бакалавр. Прикладной курс-978-5-534-00625-4: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/ekonometrika-432950
  • Эконометрика. Практикум: Учебное пособие / С.А. Бородич. - М.: НИЦ ИНФРА-М; Мн.: Нов. знание, 2014. - 329 с.: ил.; 60x90 1/16. - (Высшее образование: Бакалавриат). (переплет) ISBN 978-5-16-009429-8 - Режим доступа: http://znanium.com/catalog/product/440758