Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba(KDD 2018)

Abstract 本文的贡献是在传统的word2vec基础上,为了减轻数据系数和冷启动问题,将辅助信息和合并到图embedding框架中。为了将辅助信息合并到图embedding中,本文提出了两种方法,离线的实验结果表明包含了辅助信息的方法要由于不包含辅助信息的方法。在淘宝的A/B测试中也验证的模型的有效性和可行性。 Introduction 本文抽取的关键问题是:淘宝上有10亿用户和20亿件商品,如何帮助用户快速找到所需有趣的商品。尽管当前在学术界和工业界各种推荐方法已经取得了成功。淘宝面临的三大技术挑战:大规模、数据稀疏、冷启动问题。为了解决这些问题,淘宝设计了一个两阶段的推荐框架,召回和排序。在召回阶段,为用户生成一组候选的商品集合;在排序阶段,训练一个深度神经网络模型, 根据用户的偏好对候选商品集合排序。每个阶段有不同独特的问题,每个阶段的目标也不同,这也导致了不同的技术解决方案。 去看看~