Interpreting User Inaction in Recommender System(Recsys 2018)

Abstract

用户与推荐系统的交互有三个方面:浏览,产生点击行为,不作为.在这项工作中,我们在推荐系统中布置了一项调查,根据人类心理上决策理论,中用户和推荐系统的角度解释用户不作为的意义.本文进一步推断用户不作为的原因,并使用离线数据集进行验证,实验表明这种模型能够为推荐系统在用户行为预测等方面为推荐系统提供益处.这篇文章有一些意思,将实证研究和推荐系统结合推断人们不点击推荐系统推荐商品的原因.问卷调查对于周围偏向文科的同学来说不是一个新鲜事,但是"文理结合"这对于我来说还是有一些新鲜感的.

Introduction

想想一下实际的业务场景:你的一个朋友向你寻求餐馆推荐.你告诉她附近有一家寿司店, 但是她下周没有去那里.我们需要考虑的是,经过这个事情,对寿司店的偏好是什么?为什么没有选择去你推荐的寿司店呢?
* 如果她在一周后再次向你寻求参观推荐,你会再次向她推荐寿司店吗?起初你可能会询问她没有去的原因,但是在第二周当你提供寿司店的时候,你可能观察到她的眉头一皱,那么我们可以推断出她可能真的是对寿司店不感兴趣.
* 如果她看起来是想要记住这是你第一次的推荐结果,我们可以推断她可能感兴趣但是对于第一次的推荐结果,她并没有给与足够的重视.

这个故事说明了,用户没有点击推荐结果并不是因为她发自内心的不感兴趣.,从业务来看,Youtube每次推荐的时候都会显示一个列表,那么在列表底部或边缘的部位推荐的商品本身就不够收到用户重视.由用户触发的推荐结果会影响用户对推荐系统的感知和体验,用户包括产生点击行为和不作为.正如操作提供有关用户偏好的反馈一样,用户不作为也应该在(上下文)偏好模型中考虑
之前的工作主要是研究用户反馈行为上(点击/未点击),部分原因是因为用户不作为的动机比用户产生反馈行为更模糊,用户不作为表示了用户的决定,但是也有可能是由于用户注意力不集中造成的.更进一步地,要了解不采取行动的原因,我们需要访问真实用户及其浏览活动数据,以更好地了解不采取行动的原因,并建立模型来预测不作为的类型,通过研究实时推荐系统,我们对不作为的用户采取现场调查,分析建模近一年该用户的浏览交互日志,回答了一下有关用户不作为的问题.
1. 问题一:用户不作为的原因有哪些?
本文研究了几种行为决策理论,提出了用户不采取行动推动我们的调查设计的七大类理由.
2. 问题二:不用类别的用户如何影响用户对未作为商品未来推荐的偏好?
用户对未来未作为商品的推荐表现出明显不同的偏好
3. 问题三:我们如何从用户日志数据推断或分类用户不作为的类别?
为此我们调查了用户日志数据中的因素,这些因素可能预示着推断不作为推荐的类别或类别。 在显着的预测因素中,我们观察到一些有趣但直观的因素,我们可以推断用户不作为类别的概率.
4. 问题四:我们能否对我们以前的模型进行改进呢?
实验表明考虑到用户不作为模型的输出结果,本文可以对现有模型预测结果进行改进,例如:模型如果预测,对于先前用户不作为的商品,用户很有可是在将来感兴趣但是对于现在来说则不是,那么我们可以把我们的推荐建议推迟到下一个会话.
本文的实验结果表明,用户不作为的类别某种程度上可以从用户日志数据中推断出来,可以被用来改进推荐的结果.

Research Platform

我们依托Movielens对电影推荐系统进行了研究,MovieLens的第一部分是top-picks,可以为用户推荐8部电影,用户可以点击上面的“Top Picks”超链接查看更多推荐结果。
Top-Picks
See More
每个电影都支持三个主要功能:评分,点击浏览详细信息,添加到心愿单.用户可以通过电影卡下的评分(半星级增量)输入评分,来告诉用户他对电影的偏好,这个可以改善推荐系统的推荐结果.如果用户想要收集电影供以后观看,他或她可以通过点击电影卡中的按钮将电影添加到个人心愿单中.

Data Collection

为了手机用户不作为的调查数据,我们总结七大用户不作为的原因.用户通常不会观看大多数电影,因而如果一个用户重复观看某一步电影,那么这条数据记录将会极大影响到用户电影的推荐.然而,在一些领域如在线商店,音乐流服务等业务上,用户重复收听/访问是家常便饭.从另一个角度看,用户之前是否看过电影表明用户对该电影有最高的熟悉程度(相比于看剧情介绍,他人推荐等).一个导致用户不作为的重要因素是用户缺乏关注(在Movielens的调查问卷也支持了这一结论.)
党一个页面中有许多推荐结果时,用户可能不会注意到所有的推荐商品,尤其是对于那些没有显示在显著位置的商品来说更是如此.此外,对于调查问卷中的某些问题的先前答案,这些问题可能没有意义,例如:例如,如果用户没有注意到推荐结果,那么询问用户为什么不与其进行交互就不是一个有效的后续问题.
党用户进入探索页面后,我们随机选择了一个在探索页面上显示但是用户没操作的电影("操作":包含用户评分,点击,添加到心愿单,但是不包括鼠标悬停),如果被调查的用户满足如下条件:1. 用户被问卷调查的次数少于四次,且最近一次问卷调查距离现在有一周以上,则会弹出一个调查问题,如下所示:

每个问题的选项顺序是随机的,以免由于题目顺序造成偏差,部分问题框架如下所示:



从调查问卷中,我们把用户不作为划分为七类:"NotNoticed","WouldNotEnjoy","NotNow","OthersBetter","ExploreLater","DecidedToWatch","Watched".这项调查从2017.7.28启动,截止到2018.3.21,3206个用户提供了2923样本,可以确定用户不作为的类别.出了调查数据外,我们还研究了2017.1.1-2018.3.21期间的用户交互日志.用户交互日志包含25k用户浏览53M的电影信息,1.6M个用户评分,369K用户点击信息,167K愿望清单信息,2.8M悬停信息.

Interpreting User Inaction

  1. 问题一:用户不作为的原因有哪些?
    图一显示了用户对这个问题的分布, 我们发现:

    • 38.6%是由于用户缺乏关注(NotNoticed)
    • 18.2%是因为缺乏正确的背景(NotNow)
    • 14.6%是因为用户已经观看了(Watched),但是由于缺乏用户的推荐记录,系统仍然在推荐
    • 9.5%是由于竞争电影的影响(OthersBetter)
    • 5.8%是因为电影与用户口味不服(WouldNotEnjoy)
    • 6.9%需要进一步探索获得更多信息以做决定
    • 5.8%已经决定再次观看(DecidedToWatch)
    • 0.25%给予了free-text回复

这个数字表明,简单的把用户不作为视为负反馈的信号可能是有问题的.,特别是这个调查指出了两个重要的用户不作为因素:用户的注意力(atention)以及用户当前所处的情境(context),这两个因素需要纳入TOP-N推荐模型中的设计中.

Future Recommendation

在这一章节中,我们回答了不用类别的用户如何影响用户对未作为商品未来推荐的偏好问题.我们假设用户未来对未作为商品有三个偏好:"绝对不接受推荐,可能接受推荐,一定会接受推荐,对用户的回答通过六次pairwise的回归模型.我们的结论是,对于不用的不作为用户类别,未来的推荐偏好在统计学上有本质的不同,具体而言,对于七个用户不作为原因,未来推荐的可能性是WouldNotEnjoy请注意,相比于用户注意到且已经看过的电影来说,用户更喜欢被推荐,他们没有注意到的电影

大多数用户看Top-picks主要是为了寻找想看的电影(尽管对应不一定立刻就会看),我们分析"Reason","Familiarity","When"这三项建立序数回归来对影响用户未来推荐偏好进行建模.本文发现与FindFOrSelf相比,FindWithOthers对未来推荐偏好有显著的负面影响.它表明, 当用户给其他人推荐电影时,他们浏览的电影一般不会反映他们自身的偏好,因此系统希望系统在将来不推荐这些电影.,而对于"Familiarity", 我们发现用户是否观看对于未来的偏好有显著的负面影响, 但是却并没有看到"NeverHeardOf"和"VeryFamilar"之间存在显著的差异;对于"When",我们也没有看到显著的差异.然而,我们观察到一种趋势,表明用户可能更希望看到过去一年中观看过的电影,而不是非常遥远观看的电影.

Discussion and Conclusion

在推荐系统中,有多重可能性来解释用户对推荐的不作为行为.不同的可能性也影响了用户对不作为商品的未来偏好,本文发现ExploreLater和DecidedToWatch不作为的情况很有可能是积极的反馈.我们设计并测试了模型以推断用户不采取行动,以便系统可以避免始终询问用户的无所作为的原因。特别是对于某些不作为类别,本文的方法实现了明显优于随机的分类准确性.

发表回复

您的电子邮箱地址不会被公开。