Skip to main content

[paper阅读]针对冷启动用户的、基于邻居用户特征映射的跨领域推荐(一)

这周有点事儿,周六见了大学童鞋,周日去了姑姑家玩~ 这周主要介绍论文的摘要、背景介绍、相关工作以及问题形式化等部分,剩余内容请期待下周~

摘要

协同过滤算法是推荐系统中被广泛采用的技术。传统的协同过滤模型主要集中于在某个领域中预测用户对物品的偏好(例如,电影领域或者音乐领域)。这些模型中一个非常大的挑战就是:数据的稀疏性问题,特别是对于那些没有任何评分的冷启动用户而言,协同过滤无法进行精确的预测。在这篇文章中,作者提出了一个跨领域潜在特征的映射模型(Cross-Domain Latent Feature Mapping, CDLFM),用于在目标领域为冷启动用户生成推荐。首先,为了更好地在稀疏领域刻画用户,作者考虑了用户在评分行为上的相似性关系,并且提出了通过融合用户相似性的矩阵分解(Matrix Factorization by incorporating User Similarity, MFUS),考虑了三种不同的度量方法。此外,为了在领域之间执行知识迁移,作者提出了一个基于邻居用户的梯度boosting树方法来学习跨领域用户潜在特征映射函数。对于每个冷启动用户。作者基于那些链接用户的潜在特征对来学习用户的特征映射函数,其中,链接用户为那些辅助领域中与冷启动用户有相似评分行为的用户。而辅助领域中冷启动用户的偏好则可以通过在辅助领域中的映射函数和他们的潜在特征进行预测。

背景介绍

传统的协同过滤模型主要聚焦在单一领域的用户喜好预测,会遇到数据稀疏问题。事实上,许多物品领域和用户在不同领域中的喜好都是相互有关联的。例如,跨领域的协同过滤(Cross-Domain Collaborative Filtering, CDCF)被提出,通过利用多领域评分来丰富目标领域的知识。然而,由于数据的稀疏性,在某个领域中为冷启动用户进行可靠的推荐仍然非常具有挑战性。大部分CDCF模型,例如CBT[1],RMGM[2],TCF[3]被用于缓解单一领域的数据稀疏问题,但是如何高效地为冷启动用户既进行推荐暂时还没被有效地探究。

在目标领域为冷启动用户进行推荐是非常有挑战性的。首先,不同物品领域中的评分矩阵一般来说都是非常稀疏的,因此,如何更好地在不同领域对用户的独特特征进行更好地建模是非常重要的;其次,目标领域中,冷启动用户没有评分数据,不同领域中的用户评分行为相关但是不相同。因此,什么知识应该被迁移,如何在领域之间迁移这些数据仍然是一个值得研究的问题。

冷启动用户的跨领域推荐图示
图1:冷启动用户的跨领域推荐图示

为了解决上述挑战,作者提出了一个跨领域潜在特征映射模型。首先,作者通过结合用户相似性使用矩阵分解的方式处理评分矩阵,以获得稀疏领域中针对领域的用户潜在特征。为了更好地刻画用户的特征,除了观察到的评分,作者也考虑了用户的其它评分行为,例如:未评分的产品以及评分偏好。首先,作者们通过三种相似性计算方法得到用户的评分行为,然后将用户相似性嵌入到矩阵分解模型中。接着,为了在不同的领域之间迁移用户特征的知识,作者提出了一个基于领域用户的梯度boosting树方法来学习跨领域用户的潜在特征映射函数。

对于冷启动用户,
– 找到目标用户的最近邻用户(辅助领域中有相似评分行为的用户)
– 使用邻居用户的潜在特征来学习潜在特征映射函数
– 基于映射函数和目标用户在辅助领域的潜在特征来预测其在目标领域的特征,从而生成推荐

相关工作

邻居模型可以高效地检测局部的关系,而潜在因子模型一般在估计整体结构方法非常高效。MFUS通过将用户相似性融合到矩阵分解过程从而利用了两种方式的优势。不像Koren的方法,本文中的方法并不需要引入额外的参数。

对于跨领域推荐,迁移学习已经被广泛地用来缓解数据稀疏问题。对于冷启动问题,包含基于标签和基于评论的跨领域分解模型。Hu等人[4]提到了对用户而言不熟悉的世界,提出了CDTF通过张量分解来获取用户-物品-领域三组之间的关系。EMCDR[5]试图使用多层感知机以及一个转换举证来在领域之间映射用户特征向量。

问题形式化

冷启动用户的跨领域推荐:给定两个物品领域的两个评分矩阵 R^t R ^ a ,有一部分在目标领域没有评分但是在辅助领域有评分的冷启动用户 U ^ T ,还有一些在两个领域都有评分的用户 U ^ L ,我们的目标是将 U ^ L 作为桥梁进行辅助领域到目标领域的知识迁移,用来预测用户 U ^ T 对物品 P _ t 的偏好。

(CDLFM的工作流框架)
图2:CDLFM的工作流框架

本文中CDLFM模型的工作流如图2所示,主要由两个步骤组成:

  • 提出了一个改进的评分举证分解模型,分别学习用户和物品在两个领域的潜在特征
  • 针对冷启动用户,提出一个基于邻居用户的潜在特征映射方法来学习映射函数

原文:Cross-Domain Recommendation for Cold-Start Users via Neighborhood Based Feature Mapping

参考文献

[1] Li, B., Yang, Q., Xue, X.: Can movies and books collaborate? cross-domain col- laborative filtering for sparsity reduction. IJCAI, 2052–2057 (2009)
[2] Li, B., Yang, Q., Xue, X.: Transfer learning for collaborative filtering via a rating- matrix generative model. ICML, 617–624 (2009)
[3] Pan, W., Yang, Q.: Transfer learning in heterogeneous collaborative filtering do- mains. Artificial Intelligence 197, 39–55 (2013)
[4] Hu, L., Cao, J., Xu, G., Cao, L., Gu, Z., Zhu, C.: Personalized recommendation via cross-domain triadic factorization. WWW, 595–606 (2013)
[5] Man, T., Shen, H., Jin, X., Cheng, X.: Cross-Domain Recommendation: An Em- bedding and Mapping Approach. IJCAI, 2464–2470 (2017)

打赏
微信扫一扫支付
微信logo微信扫一扫, 打赏作者吧~

mickey

记录生活,写给几十年后的自己。