Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Cостоялся второй семинар научно-учебной группы

26.04.2017 состоялся очередной семинар НУГ "Разработка программного обеспечения для корпусных исследований", посвященный вопросам применения онтологий в корпусных исследованиях  разработке специализированного ПО и репрезентативности текстовых корпусов.


Доклад Е.А. Смирновой был посвящен анализу репрезентативности изучаемых корпусов. Е.А. Смирнова представила обзор теоретической литературы по данному вопросу, а также рассказала о количественном и качественном методах оценки репрезентативности. В ходе обсуждения было принято решение в качестве инструмента оценки репрезентативности наших корпусов взять инструмент, основанный на законе Ципфа. Он будет включен в разрабатываемое группой программного обеспечение PaperCat ( Презентация).
В обзорном докладе В.В. Ланина  было рассмотрено использование онтологических ресурсов в решении лингвистических задач. Были приведены основные понятия онтологического инжиниринга, состав онтологий и их классификации. В качестве примеров лингвистических онтологий была проведена демонстрация ресурсов WordNet и РуТез ( Презентация).
В докладе С. Филипсон был рассмотрен подход к разработке онтологии, предназначенной для систематизации стилевых маркеров академического английского языка. Разрабатываемая онтология содержит описание общелингвистических понятий, на основе которых описываются конкретные стилевые конструкции. Представление онтологии в человекочитаемом и машиночитаемом форматах позволяет использовать ее как процессе изучения предметной области, так и для автоматической обработки языкового материала ( Презентация).