Как уйти от необходимости задания функции расстояния при кластеризации данных?
В среду, 26 февраля, в пермском кампусе НИУ ВШЭ состоялось очередное заседание семинара цикла «Цифровые трансформации». Докладчиком на мероприятии выступила студентка 4-го курса образовательной программы «Программная инженерия» Марина Хайртдинова, выполняющая выпускную квалификационную работу под руководством старшего научного сотрудника НУЛ междисциплинарных эмпирических исследований, доцента кафедры информационных технологий в бизнесе Алексея Бузмакова.
В рамках семинара Марина Хайртдинова представила предварительные результаты выпускной квалификационной работы, выполняемой под руководством Алексея Бузмакова.
Доклад Марины был посвящен поиску оптимального метода для кластеризации данных при сегментировании клиентов. Как отметил докладчик, популярные методы решения задачи кластеризации используют функцию расстояния для формирования кластеров. На семинаре были рассмотрены причины, по которым использование такой функции имеет некоторые ограничения, а в качестве альтернативного решения задачи была предложена адаптация методов Subgroup Discovery.
Сектор эмпирического анализа рынков и компаний: Старший научный сотрудник
Методы Subgroup discovery, в отличие от методов кластеризации, работают напрямую с характеристиками наблюдений, а не агрегируют их в одно число посредством функции расстояния. Это не только существенно улучшает интепретируемость получаемых результатов, но и повышает вычислительную сложность алгоритмов.
Применение разрабатываемого подхода в области сегментации позволит надежнее выделять сегменты, и, как следствие, принимать лучшие решения по взаимодействию с клиентами.
В следующую среду, 4 марта, на заседании цикла научных семинаров «Цифровые трансформации» выступит доцент департамента истории Санкт-Петербургской школы гуманитарных наук и искусств Юлия Лайус. Приглашаем всех желающих!