We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis Technologies in Internet

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Information Technologies in Business (Faculty of Computer Science, Economics, and Social Sciences)
Course type:
Elective course
When:
4 year, 1, 2 module

Instructor

Программа дисциплины

Аннотация

Учебный курс "Технологии анализа данных в сети Интернет" ориентирован на изучение методов и технологий, используемых при сборе и анализе данных в сети Интернет, а также на получение практических навыков разработки программных решений для автоматизации данных задач. В рамках курса изучаются подходы к извлечению данных из неструктурированных источников (корпуса текстов, web-страницы, социальные сети), вопросы обработки мультимедийной информации и естественного языка, тенденции развития Web-технологий.
Цель освоения дисциплины

Цель освоения дисциплины

  • Развитие у студентов компетенций проектирования и конструирования программного обеспечения с использованием современных языков, технологий и инструментальных средств разработки программного обеспечения
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент знает и способен использовать т векторная модель слов для обработки естественного языка
  • Студент знает и способен использовать технологии Semantic Web
  • Студент знает и способен использовать технологии обработки естественного языка
  • Студент имеет представление об основных тенденциях развития интернет-технологий
  • Студент способен из извлекать информацию из веб-сайтов
  • Студент способен из извлекать информацию из социальных сетей
  • Студент способен из извлекать информацию с использованием Web API
  • Студент способен использовать информационно-поисковые тезаурусы и онтологии при обработке информации
  • Студент способен использовать технологии семантической аннотации при обработке текста
  • Студент способен использовать форматы XML и JSON для хранения и обработки данных
  • Студент способен применять технологию регулярных выражений для обработки текстов
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Регулярные выражения
  • Тема 2. Обработка данных в формате XML и JSON.
  • Тема 3. Скрапинг веб-сайтов
  • Тема 4. Работа с Web API
  • Тема 5. Извлечение данных из социальных сетей
  • Тема 6. Информационно-поисковые тезаурусы и онтологии
  • Тема 7. Семантическая аннотация
  • Тема 8. Основные понятия обработки ЕЯ
  • Тема 9. Библиотеки обработки ЕЯ
  • Тема 10. Векторная модель слов
  • Тема 11. Основные тенденции развития интернет-технологий
  • Тема 12. Технологии Semantic Web
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная работа 4
  • неблокирующий Лабораторная работа 1
  • неблокирующий Лабораторная работа 3
  • неблокирующий Лабораторная работа 2
  • неблокирующий Итоговый проект
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.4 * Итоговый проект + 0.15 * Лабораторная работа 1 + 0.15 * Лабораторная работа 2 + 0.15 * Лабораторная работа 3 + 0.15 * Лабораторная работа 4
Список литературы

Список литературы

Рекомендуемая основная литература

  • Федоров, Д. Ю.  Программирование на языке высокого уровня Python : учебное пособие для прикладного бакалавриата / Д. Ю. Федоров. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2019. — 161 с. — (Бакалавр. Прикладной курс). — ISBN 978-5-534-10971-9. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/437489 (дата обращения: 28.08.2023).

Рекомендуемая дополнительная литература

  • Антамошкин, О. А. Программная инженерия. Теория и практика [Электронный ресурс] : учебник / О. А. Антамошкин. - Красноярск: Сиб. Федер. ун-т, 2012. - 247 с. - ISBN 978-5-7638-2511-4.
  • Сысолетин, Е. Г.  Разработка интернет-приложений : учебное пособие для вузов / Е. Г. Сысолетин, С. Д. Ростунцев ; под научной редакцией Л. Г. Доросинского. — Москва : Издательство Юрайт, 2019 ; Екатеринбург : Изд-во Урал. ун-та. — 90 с. — (Университеты России). — ISBN 978-5-9916-9975-4 (Издательство Юрайт). — ISBN 978-5-7996-1911-4 (Изд-во Урал. ун-та). — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/438148 (дата обращения: 28.08.2023).

Авторы

  • Ланин Вячеслав Владимирович
  • Карпович Марина Валерьевна