Explainable Cross-Domain Recommendations through Relational Learning(AAAI 2018)

Abstract

这篇文章是我见到的发表在AAAI上的一篇短论文,本文提出了一种可以生成关于跨领域问题的可解释推荐规则.本文的贡献是:使用关系生成规则,这些规则能够解释为什么把商品推荐给特定用户. 2. 使用用户在不同领域的商品偏好, 不同领域的商品偏好能够为用户提供全新的建议. 为了说明我们的方法确实可行和适用,本文在音乐和电影领域进行了实验.

Introduction

本文在开头的部分引出了推荐系统的几大关键问题:推荐准确性,冷启动问题,商品新属性,推荐新颖性与多样性,同时解决一个问题会导致另一个问题,这是一种权衡.在作者看来,这些问题之所以没有得到良好解决的原因是因为当前主流推荐算法似乎被放入了一个黑盒中,算法产生推荐结构后,很难解释为什么会对一组数据输入给出这个推荐结果.如果我们能够理解推荐背后的原因,我们相信我们将能够找到更有效地处理此类问题的方法.如果我们能够理解推荐背后的原因,我们相信我们将能够找到更有效地处理此类问题的方法.

跨域方法通过减少数据稀疏性并通过提供多样性,新颖性和意外发现预测为建议提供附加值来提高预测准确性, 在跨域推荐任务中,系统会将目标域中的项目推荐给源域中的用户.,具体地说有两种类型的跨领域方法, 聚合与迁移,他们之间的区别在于源域的知识是如何被利用的.

关系学习在推荐系统已经被广泛使用,与传统方法想比,关系学习能够通过在不同商品用户之间找到一个关系进而改善推荐系统的性能.因此,关系学习能够为可解释的跨领域推荐提供了可行的解决方案.
本文提出了一种方法,使用关系学习生成关于跨域问题的可解释的推荐规则。 生成的规则解释了系统为什么向用户提供特定推荐.规则简单易懂。源域的规则是基于目标域生成的,因而具有一定的新颖性.

Research Methodology

本文研究了用户如何利用某一个类型商品(电影,图书,游戏)的偏好如何用于预测用户的音乐偏好. 最初的实验室在两个数据集上进行的,利用UCSD上发布的Amazion数据集,我们研究了用户音乐与电影偏好. 用户的特征包含评论等.商品的特征包含一些音乐和电影的特征.这个数据集可以经由Amazon Product API获取到.
本文提出了两种生成音乐推荐规则的方法:

Method 1

使用跨领域的商品信息进行推荐,这种方法是基于传统推荐方法设计的.皮尔森相关系数被用来找到用户之间的相似性,并推导出某些推荐规则, 对于是基于用户的推荐系统来说,电影间相似的偏好将会导致音乐间相似的偏好.对于基于商品的推荐,定义高置信度的规则将会对音乐推荐产生较好的影响.使用Problog语言描述如下(刚开始我还以为是Prolog语言,后来发现根本不是一回事儿),Problog语言分为三步:定义规则,查询,选择输出,对于输出部分,只有大于等于阈值的项才会被输出,下面是一些例子:

Method 2

使用跨领域的商品信息及额外属性进行推荐, 在这个方法中,还考虑到了不同商品域的特征属性,从而生成更加具有新颖性的建议.为了产生音乐推荐,处理步骤设计如下:样本准备, 在此步骤中,需要更多信息(音乐和电影的特征).推荐:使用ProbFOIL学习,ProbFOIL是FOIL的一种拓展,能够从概率数据中学习到概率规则, 一些规则如下:

结果与讨论

方法二生成的规则我推荐系统提供了解释功能.它们清楚地说明了为什么要向特定用户推荐这些物品。 第一条规则,例如,乡村音乐是根据他对西部(牛仔)电影的偏好向用户推荐的.
模型的评估是使用传统RS评估方法,主要通过精确率和一些排序方法进行的.数据划分的方法使用留出法.
实验显示方法1的推荐值为60%,方法2的推荐值为73%.本文方法也是可扩展的,因为系统不仅限于两个域,可以用在多个领域上.但是多个领域容易引发的问题是模型的运行时间受到挑战.这从某种程度看来是一个trade-off, 未来的一些研究会着重解决这个问题.

emmmm,这篇文章的出发点是解决推荐系统的可解释性问题.因为现有的模型的黑箱性因而直接对模型解释一定是行不通的, 本文从概率概率的角度出发,对推荐进行建模获得了具有较好推荐结果的模型.这个想法很新颖,大概这就是能发AAAI的原因吧...

发表回复

您的电子邮箱地址不会被公开。