Научный семинар "Анализ эффективности текстового контента и выявление "ключевых смыслов", влияющих на целевую характеристику"
19 апреля в ауд. 208(3) состоялось очередное заседание научного семинара НУГ «Гетерогенные эффекты воздействия в клиентской аналитике».
Эскендер Джемадинов (студент 2 курса магистерской программы «Информационная аналитика в управлении предприятием») выступил с докладом на тему "Анализ эффективности текстового контента и выявление "ключевых смыслов", влияющих на целевую характеристику".
В докладе были рассмотрены вопросы, касающиеся автоматического выявления “смысловых элементов”, влияющих на целевую характеристику. Это важно для выявления паттернов, которые могут увеличить эффективность написанного текста. Для этого автором используются статистический показатель TF-IDF и embeddings, а также методы машинного обучения.
Под понятием Embeddings понимается множество слов, которое представляется совокупностью векторов в некотором пространстве, расположение которых определяется семантической близостью слов, их образующих.
TF-IDF — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью корпуса текстов. Вес некоторого слова пропорционален частоте его употребления в документе и обратно пропорционален частоте употребления слова во всех документах коллекции.
На примере практической задачи было рассмотрено построение моделей машинного обучения для прогнозирования целевой характеристики текстового контента и оценена точность прогноза.