• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научный семинар SuDiTE

Анонсы и новости о заседаниях научного семинара НУГ «Гетерогенные эффекты воздействия в клиентской аналитике» можно найти по теме "научный семинар SuDiTE". 

2018-2019 учебный год:

Семинар 15.02.2019

Семинар 22.02.2019
Семинар 01.03.2019
Семинар 15.03.2019
Семинар 05.04.2019
Семинар 19.04.2019
Семинар 26.06.2019

2019-2020 учебный год:

Семинар 11.10.2019


11.10.2019

Докладчики: Степан Гоголев (студент 4 курса программы «Экономика») и Дарья Семенова (студент 2 курса магистратуры «SMART-маркетинг: данные, аналитика, инсайты»).

Тема доклада Степана: Comparison of Machine Learning Algorithms in Restaurant Revenue Prediction

Аннотация доклада:

In our work, we address several aspects of applying classical machine learning algorithms to a regression problem. We compare the predictive power to validate our approach on a data about revenue of a large Russian restaurant chain. We pay special attention to solve two problems: data heterogeneity and a high number of correlated features. We describe methods for considering heterogeneity — observations weighting and estimating models on subsamples. We define a weighting function via Mahalanobis distance in the space of features and show its predictive properties on following methods: ordinary least squares regression, elastic net, support vector regression, and random forest.

Comparison of Machine Learning Algorithms in Restaurant Revenue Prediction (PDF, 392 Кб) 

Тема доклада Дарьи: Сравнение методов оценки индивидуального эффекта от воздействия

Аннотация доклада:

На сегодняшний день оценка эффективности воздействия на индивидуальном уровне является важной проблемой во многих областях науки и бизнеса. Например, в маркетинге оценки эффекта промомеханики; в медицине - оценка индивидуальных эффектов воздействия используются для определения оптимальной дозы лекарства для каждого пациента и так далее. В то же время вопрос о выборе наилучшего метода, то есть метода, обеспечивающего наименьшую прогностическую ошибку (например, RMSE) или наибольшую общую (среднюю) величину эффекта, остается открытым. В данной работе мы сравниваем эффективность методов машинного обучения для оценки индивидуальных эффектов воздействия. Сравнение выполняется на наборе данных Criteo Uplift Dataset. В этой статье мы показываем, что комбинация метода логистической регрессии и подхода двух моделей, а также метод Uplift Random Forest обеспечивают наилучшее выявление индивидуального эффекта от воздействия.

 

21.06.2019

Докладчик: Мария Клейн (студентка 3 курса программы «Экономика»).

Тема доклада: "Связь стратегии управления бонусными баллами в рамках программы лояльности с реакцией клиента на промокампании".

Аннотация доклада:

В работе на основе базы данных крупной ресторанной сети и трех полевых рандомизированных экспериментов была изучена взаимосвязь между стратегией управления клиентом своими баллами внутри балльной программы лояльности и откликом клиентов на промокампании. В качестве инструмента анализа были использованы logit-модели, оценка которых показала, что клиенты, склонные тратить накопленные бонусные баллы в рамках программы лояльности, более вероятно принимали участие в акциях, где посетителям ресторана дарили определенную сумму бонусов. Более того, для изучаемой балльной промокампании было получено, что использование информации о том, как посетители тратили баллы до акции, позволило бы увеличить отклик.

Стратегия управления баллами и реакция на промокампании (PDF, 625 Кб) 

19.04.2019

Докладчик: Эскендер Джемадинов (студент 2 курса магистерской программы «Информационная аналитика в управлении предприятием»).

Тема доклада: "Анализ эффективности текстового контента и выявление "ключевых смыслов", влияющих на целевую характеристику"

Аннотация доклада:

В данном докладе будут рассматриваться вопросы, касающиеся автоматического выявления “смысловых элементов”, влияющих на целевую характеристику. Это важно для выявления паттернов, которые могут увеличить эффективность написанного текста.  Для этого будут использоваться статистический показатель TF-IDF и embeddings, а также методы машинного обучения.

Под понятием Embeddings понимается множество слов, которое представляется совокупностью векторов в некотором пространстве, расположение которых определяется семантической близостью слов, их образующих”.

TF-IDF — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью корпуса текстов. Вес некоторого слова пропорционален частоте его употребления в документе и обратно пропорционален частоте употребления слова во всех документах коллекции.

На примере практической задачи мы рассмотрим построение моделей машинного обучения для прогнозирования целевой характеристики текстового контента и оценим точность прогноза.

05.04.2019

Докладчики: Барсукова Виктория (студентка 4 курса программы «Экономика») и Голдобин Борис (студент 1 курса магистерской программы «Финансы») .

Тема доклада Виктории: Исследование маркетинговой кампании, направленной на оттоковых клиентов.

Аннотация доклада:

Работа посвящена анализу маркетинговой кампании, проведённой в сети ресторанов «Росинтер». Целью кампании было возвращение оттоковых клиентов. Для этого был проведен рандомизированный эксперимент, в котором некоторым клиентам были предоставлены дополнительные баллы в рамках программы лояльности, которыми они могли оплатить до 50% чека. Любопытным представляется посмотреть, оказала ли маркетинговая кампания с данной механикой влияние на возврат клиентов, и как повлиялана изменение их средних чеков.

Тема доклада Бориса: Использование технологии word-embeddings для определения признаков клиентов.

Аннотация доклада

Во многих задачах работы с клиентами бизнесу требуется понимать, к какому классу они относятся: например, часть клиентов могут являться лояльными покупателям, а другая часть - имеет высокий шанс уйти к конкурентам в ближайшее время. Истинный класс клиента может стать известным только по прошествии времени, а работать с клиентами нужно уже сегодня. В связи с чем есть большая потребность в моделях, предсказывающих класс клиента. В данной работе для определения признаков клиента предлагается использовать технологию word-embeddings, и, в частности, алгоритм doc2vec, который является логическим развитием алгоритма word2vec. Этот подход применятся к транзакционным данным крупной ресторанной сети, из которых впоследствии и извлекается набор признаков. Далее, на этих признаках обучаются несколько классических моделей машинного обучения для предсказания оттока клиентов и сравнения качества для разных способов генерации переменных.

15.03.2019

Докладчик: Бузмаков Алексей Владимирович (доцент, старший научный сотрудник лаборатории эмпирического анализа рынков и компаний GAMES).

Тема доклада: "Методы машинного обучения для оценки индивидуальных эффектов от воздействия".

Аннотация доклада:

Оценка эффекта от воздействия на индивидуальном уровне необходима во многих областях знаний от медицины до маркетинга. Действительно, общество выиграет, если будет возможность определять, на кого подействует какое-либо лекарство. А при отправлении рассылки только тем людям, которых интересует конкретный товар, уменьшится количество спама и снизятся издержки рекламной кампании. В докладе рассматриваются существующие методы оценки эффекта от экспериментального воздействия на индивидуальном уровне и показывается на основе компьютерной аппробации необходимость создания новых эффективных методов в этой области знаний.  

Машинное обучение для оценки эффекта от воздействия (PDF, 577 Кб) 

01.03.2019

Докладчик: Виктория Барсукова (студентка 4 курса ОП "Экономика").

Тема доклада: "Обзор методов оценивания среднего эффекта от воздействия".

Аннотация доклада:

Настоящий доклад основан на статье Ениколопова Рубена "Оценивание эффекта воздействия" (Квантиль, №6, стр. 3-14, 2009). В докладе будет предложен обзор методов оценивания среднего эффекта воздействия программ, когда интересующая нас независимая переменная является бинарной. Будут рассмотрены предположения, которые необходимо сделать для того, чтобы было возможно идентифицировать средний эффект воздействия (предположения о несмешиваемости и пересечении). Затем более подробно остановимся на основных идеях таких методов, как регрессии, мэтчинг, мера склонности и некоторых смешанных методах. Стоит отметить, что на практике наиболее важным является проверка уместности выполнения предположений. В том случае, если эти предположения выглядят убедительно, выбор конкретного метода оценивания оказывается не столь принципиальным.

Ениколопов - 2009 - Оценивание эффекта воздействия (PDF, 735 Кб) 

Оценивание эффекта воздействия (PDF, 483 Кб) 

22.02.2019

Докладчик: Потапов Дмитрий Борисович (доцент, заведующий научно-учебной лабораторией эмпирического анализа рынков и компаний GAMES).

Тема доклада: "Эксперименты в социальных науках и бизнес-практиках: зачем, где и как?".

Аннотация доклада: 
В своем выступлении Д. Б. Потапов расскажет, какую роль играют эксперименты в социальных науках и при решении бизнес-задач, почему ряд ключевых закономерностей интересующих нас процессов мы можем понять только через эксперименты. Участники семинара также обсудят, в каких областях распространены эксперименты и что этому способствует. Также будет разобрано, как корректно спланировать эксперимент и как простым способом оценить его результаты.

Эксперименты - введение в НУГ (PDF, 22.89 Мб) 

15.02.2019

Докладчик: Кучумов Артём (студент 2 курса магистерской программы «Информационная аналитика в управлении предприятием»).

Тема доклада: "Сведение задачи оценки эффекта от воздействия к задаче регрессии. Метод двух моделей".

Аннотация доклада: В данном докладе будет рассмотрена проблема вычисления оценки эффекта от воздействия. Для этого мы разберем подход, который сводит решения задачи оценки эффекта от воздействия к задаче регрессии. Подход называется - метод двух моделей. Данный метод требует построения двух регрессионных моделей, с помощью которых будет вычисляться эффект от воздействия. В рамках исследования было произведено тестирование, в котором использовались разные регрессионные модели. В результате тестирования были получены результаты, которые показывают, что для получения хороших результатов достаточно использовать простые регрессионные модели, такие как линейная регрессия и метод опорных векторов.

Метод двух моделей (PDF, 631 Кб) 


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.