您当前的位置：核心期刊咨询网》经济管理论文》融合多种影响因子的兴趣点推荐算法

融合多种影响因子的兴趣点推荐算法

摘要：摘要：为了解决兴趣点推荐任务中的数据稀疏性问题和充分利用位置社交网络中的多样信息提高个性化推荐质量，提出了一种融合多种影响因子的兴趣点推荐算法。分别对地理信息和社会信息进行地理影响力建模和社会影响力建模，并联合时间信息和地理信息进行时空

　　摘要：为了解决兴趣点推荐任务中的数据稀疏性问题和充分利用位置社交网络中的多样信息提高个性化推荐质量，提出了一种融合多种影响因子的兴趣点推荐算法。分别对地理信息和社会信息进行地理影响力建模和社会影响力建模，并联合时间信息和地理信息进行时空影响力建模，然后以加权求和的方式整合3种影响力评分得到用户偏好分数，根据用户偏好分数为每个用户提供1个包含Top-N个兴趣点的推荐列表。实验结果显示，在2个公开数据集上，融合多种影响因子的兴趣点推荐模型的性能优于对比模型。地理-社会-时空影响是兴趣点推荐任务中的关键，对这3种影响建模可为融合关键信息的兴趣点推荐研究提供参考。

　　关键词：自然语言处理;兴趣点推荐;地理影响力建模;社会影响力建模;时空影响力建模

金融论文发表

　　近年來，随着移动互联网技术的不断发展和成熟，位置社交网络(location-based social network， LBSN)逐渐兴起并成为人们生活中的重要组成部分。兴趣点(point-of-interest， POI)推荐在LSBN中起着至关重要的作用，不仅是推荐领域中一个非常重要的任务，也是时空数据挖掘中的一项极具意义的应用型研究。

　　不同于传统推荐任务，在POI推荐场景中，蕴含着大量的时间信息、地理信息和社会信息，用户在进行下一个兴趣点的选择时，除了遵从自身的喜好外，还可能会受到时间的影响、地理的影响和社会的影响。如图1所示，本文将联合用户和未签到过的兴趣点之间的3种影响力(地理影响力、社会影响力和时空影响力)建模，预测目标用户对未签到过兴趣点的偏好分数。

　　1 相关工作

　　POI推荐最近引起了学术界的广泛关注，已有学者提出了一系列方法以提高POI推荐的性能[1-3]。兴趣点推荐包含不同类型的上下文信息，如兴趣点的地理坐标、用户的签到时间、用户的社会关系等，学者们试图分析用户的签到行为，并纳入这些上下文信息的影响，以提高推荐性能。地理邻近性显著地影响用户在兴趣点上的签到行为，基于地理信息的兴趣点推荐较为复杂的方法是评估签到过的POIs的地理相关性作为所有用户的距离分布，如多中心高斯分布[4]、幂律分布[5-11]和关于每个用户的个性化非参数分布[12]。特别是关于每个用户的地理经纬度坐标，文献[13—14]采用固定带宽核密度估计方法对兴趣点的地理签到分布进行建模。利用用户之间的社会关系可以提高基于位置社交网络的兴趣点推荐系统的质量。当前大部分研究是从用户之间的社会关系中获取相似度，并将其与传统的基于记忆或者基于模型的协同过滤技术相结合[15-17]。在LBSN中，兴趣点推荐具有时间序列模式和时间循环模式。GAO等[18]根据时间是非统一、连续的特性，研究用户签到的时间循环模式。CHENG等[16]通过嵌入时间序列模式，介绍了在LBSN中的连续、个性化的兴趣点推荐任务。ZHANG等[19]提出了GeoSoCa模型，用于对3种类型的上下文信息进行建模，即地理、社会和类别相关性。

　　和上述工作不同的是，本文提出的融合多种影响因子的兴趣点推荐模型同时考虑了地理信息、社会信息和时间信息3种上下文信息，在地理信息的建模上同时捕捉用户角度和兴趣点角度的地理影响力，并融入了兴趣点流行度要素，而且不同于以往的时间序列建模，本文联合时间信息和地理信息进行了时空影响力建模。

　　2 融合多种影响因子的兴趣点推荐模型

　　2.1 问题陈述与模型框架

　　本文所研究的兴趣点推荐算法是为每个用户提供1个包含Top-N个未簽到过的POIs的推荐列表，如果用户将来对这些POIs进行签到，则认为推荐的结果符合用户的判断，是高质量的推荐。形式化描述为，给定包含m个用户的用户集合U={u1，u2，…，um}、包含n个兴趣点的兴趣点集合V={v1，v2，…，vn}、m个用户间构成的社会关系矩阵S∈[KX(]R[KX)]m×m，m个用户对n个兴趣点的签到频率矩阵R∈[KX(]R[KX)]m×n和用户u签到过的兴趣点集合VuV，计算得到一个按照用户未来可能签到概率排序的兴趣点集合X={v1，v2，…，vN}，其中|X|≤N，X∩Vu=。

　　考虑到3种影响力对于兴趣点推荐任务至关重要的意义，本文模型通过整合地理影响力、社会影响力和时空影响力，为兴趣点推荐提出一种新的概率方法，整体模型框架如图2所示，主要分为3个部分：1)地理影响力建模，利用地理信息同时捕捉用户角度和兴趣点角度的地理影响力，而且还考虑了所有用户的兴趣点流行度;2)社会影响力建模，汇总用户好友在兴趣点上的签到频率，将社会签到频率建模为幂律分布[19]，以利用用户之间的社会相关性;3)时空影响力建模，联合考虑时间信息和地理信息，对用户在工作/休息2种时间状态下基于多中心高斯分布[4]的签到行为进行建模。最后通过加权求和的方式将3种影响力整合在一起，选出影响力得分最高的N个兴趣点进行推荐。

　　2.2 地理影响力建模

　　地理影响在POI推荐中起着重要的作用，基于文献\[20\]的思想，本文提出一个同时考虑用户角度、兴趣点角度和兴趣点流行度的地理影响力模型。从用户角度看，地理影响力建模时考虑用户的主要活动区域;从兴趣点角度看，地理影响力建模时考虑目标POI附近的POIs的签到情况。针对兴趣点流行度，地理影响力建模时考虑所有用户对POIs的签到频率。

　　根据签到频率矩阵R∈[KX(]R[KX)]m×n，可以找到每个用户的最频繁活动兴趣点HAL(将用户最频繁签到的兴趣点作为HAL)，也可以计算得到所有兴趣点上的签到频次矩阵

　　P∈[KX(]R[KX)]n×1。式(1)利用签到频率矩阵R和兴趣点签到频次矩阵P的乘积计算用户对兴趣点的偏置B(B∈[KX(]R[KX)]m×1)，以衡量未签到过的兴趣点v在所有兴趣点中的受欢迎程度。式(2)利用偏置矩阵B和兴趣点签到频次矩阵P的转置矩阵的乘积来计算用户对兴趣点的流行度矩阵Y(Y∈[KX(]R[KX)]m×n)。式(3)所计算的θ是在计算地理影响力得分矩阵时所需要用到的一个参数，其中的Yu，v表示用户u对兴趣点v的流行度评分。

　　B=R·P，(1)

　　Y=B·PT，(2)

　　θ=1+|U||V|[∑[DD(X]u∈U ∑[DD(X]v∈Vln(1+Yu，v)]-1。(3)

　　具体的地理影响力模型的细节算法如图3所示。图3中，1—4行是对用户的高活动区域进行建模，第4行中的α是一个距离阈值，若目标兴趣点与最频繁活动兴趣点间的距离小于此阈值，则认为目标兴趣点属于高活动区域。

　　5—10行同时考虑了用户u在与目标兴趣点v邻近的POIs上的签到情况和目标兴趣点v的流行度，计算用户对目标兴趣点v的偏好。根据第6行中的α距离阈值来判断目标兴趣点v与已签到过的POIs的距离是否邻近，在第7行中利用式(4)计算用户在目标兴趣点的邻域内签到过的兴趣点个数Luv。式(5)对兴趣点流行度进行建模(为幂律分布)，fv表示兴趣点流行度Yu，v的概率密度函数，其中的θ由式(3)计算得到。式(6)计算的是地理影响力得分矩阵，目标用户u对兴趣点v的地理影响力得分sGeo可根据式(7)得到。

　　Luv=Luv+1，(4)

　　fv=(θ-1)(1+Yu，v)-θ， Yu，v>0，(5)

　　[AKM^][u，v]=(1-Luv|Vu|)·fv，(6)

　　sGeo=[AKM^]u，v。(7)

　　推荐阅读：中医药学报是科技核心期刊吗

转载请注明来自：http://www.qikan2017.com/lunwen/jgu/18351.html

上一篇：外部融资方式、金融发展与中小企业创新
下一篇：消费与经济同步增长的机理分析与国际比较