• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Хакатон в области анализа данных экологического мониторинга – курс «Аналитика в IoT»

В рамках Десятилетия науки и технологий в НИУ ВШЭ – Пермь был проведен хакатон в области анализа данных экологического мониторинга атмосферного воздуха. Цель - привлечение внимания молодежи к вопросам развития цифровых технологий Умных городов, таких как платформы Интернета вещей, за счет разработки и интеграции различных прикладных моделей машинного обучения. Аналитика экологических данных на IoT платформах значительно расширяет функциональность типовых решений, позволяет прогнозировать загрязнения различными вредными веществами или идентифицировать источники выбросов. Участникам хакатона были предложены различные наборы данных, на которых студенты отрабатывали идеи, тренировали и верифицировали модели, формировали практические кейсы по использованию результатов анализа данных. В рамках проекта сотрудниками НУЛ МЭИ был разработан и проведен курс «Аналитика в IoT». Разработчик программы и преподаватель курса поделился, как проходила работа над проектами в рамках курса, и также отметил особо отличившиеся работы.

Photo by iStock

Хакатон был проведен в рамках научно-исследовательского семинара «Аналитика в IoT» для 3 курса бакалавриата образовательной программы «Программная инженерия» НИУ ВШЭ - Пермь. В разработке курса приняли участие стажер-исследователь, аналитик НУЛ МЭИ и приглашенный преподаватель кафедры информационных технологий в бизнесе Горшков Олег Владимирович и приглашенный преподаватель кафедры информационных технологий в бизнесе Воробьев Дмитрий Владимирович.

В ходе знакомства с методами научного исследования, технологиями и программными продуктами, применяемыми в сфере анализа данных Интернета вещей, участники разрабатывают программный продукт, осуществляющий интеллектуальный анализ данных, полученных с измерительных устройств, для решения актуальных вопросов  экомониторинга. Полученные знания, умения и навыки в области инструментов аналитики Интернета вещей находят применение при формировании эффективных управленческих решений в таких областях деятельности, как безопасность и комфорт в зданиях, снижение издержек, энергосбережение, экология и другие.

В рамках хакатона участниками рассматривались инструменты статистического анализа данных, используемые для подготовки линейных, сводных и динамических отчетов, реализующие интеграцию и комбинирование разрозненных данных из различных источников информации, их агрегирование и предварительную подготовку.

Студенты работали в формате проектов: создавали доски в Trello по методологии Agile. На создание проекта было отведено 6 занятий, и в марте 2023 года состоялась защита с запуском проекта и сдачей отчетов.

Процесс работы над проектами и полученные студентами результаты прокомментировал один из разработчиков хакатона и преподаватель курса Олег Владимирович Горшков:

Горшков Олег Владимирович

Сектор эмпирического анализа рынков и компаний: Стажер-исследователь

«Студенты строили прогнозные модели по загрязнению воздуха такими типовыми веществами, как частицами пыли PM2.5 и PM10, диоксидом серы, сероводородом и другими на основе исторических данных по измерениям концентраций. Использовали регрессионные, авторегрессионные, сезонные модели, нейросети, работали с точностью. С практической точки зрения для студентов оказалось полезно не только разобраться в самих моделях, но и корректно интерпретировать результаты их работы с учетом специфики предметной области».

По результатам защит проектов преподавателем курса были отмечены два проекта студентов 3 курса бакалавриата образовательной программы «Программная инженерия» НИУ ВШЭ - Пермь:

1. "Построение прогнозной модели рассеивания CO2" (Меньшиков Олег, Курилов Никита, Калиман Никита)

Горшков Олег Владимирович

Сектор эмпирического анализа рынков и компаний: Стажер-исследователь

«В ходе проекта были реализованы прогнозные модели на базе линейной регрессии и регрессии типа "случайный лес". После оценки точности было определено, что наивысшую точность показала модель "случайный лес". Результаты показали, что точность данных сильно зависит от периода, который взят для обучения. При этом данные модели не учитывают сезонность и внешние факторы, что серьёзно сказывается на точности прогнозов».

2. "Построение прогнозной модели рассеивания частиц РМ 2.5" (Бушмакин Никита, Рудник Кристина, Шевкунова Надежда)

Горшков Олег Владимирович

Сектор эмпирического анализа рынков и компаний: Стажер-исследователь

«В ходе данной работы были рассмотрены и созданы модели прогнозирования изменения степени загрязнения воздуха на основе моделей ARIMA и SARIMA (из библиотеки sarimax python). Модели были рассмотрены, протестированы для использования при прогнозировании. При реализации проекта были рассмотрены принципы действия таких инструментов, как “InfluxDB”, “Grafana”, а также “Trello”. Более того, были получены новые знания при работе с данными инструментами и освоен основной их функционал. В будущем этот аналитический скрипт может быть доработан путем добавления разных методов фильтрации входных данных или же более совершенного подбора параметров для прогнозной модели SARIMA».

Благодарим участников данного проекта, разработчиков хакатона и учебного курса!


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.