图神经网络在物品推荐算法中的研究与应用.docx

上传人:李司机 文档编号:6712826 上传时间:2024-01-08 格式:DOCX 页数:72 大小:381.07KB
返回 下载 相关 举报
图神经网络在物品推荐算法中的研究与应用.docx_第1页
第1页 / 共72页
图神经网络在物品推荐算法中的研究与应用.docx_第2页
第2页 / 共72页
图神经网络在物品推荐算法中的研究与应用.docx_第3页
第3页 / 共72页
图神经网络在物品推荐算法中的研究与应用.docx_第4页
第4页 / 共72页
图神经网络在物品推荐算法中的研究与应用.docx_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《图神经网络在物品推荐算法中的研究与应用.docx》由会员分享,可在线阅读,更多相关《图神经网络在物品推荐算法中的研究与应用.docx(72页珍藏版)》请在三一办公上搜索。

1、摘要随着深度学习和机器学习的发展,在推荐领域中也涌现出很多利用相关技术进行推荐的方法,这些方法往往利用用户以及商品信息实现端到端的推荐系统,提升了推荐的性能和效率。在这个过程中,更多新颖的方法被提出以解决推荐的基本难题,从而拓宽推荐系统的性能边界。其中最重要的一点就是通过引入新的数据或者新的数据处理的方法,来提升原有推荐模型的性能。同时,在自然语言处理中,知识图谱这一种数据存储形式越来越受到研究人员们的重视,许多的研究和工作都证明了在知识图谱上进行表达可以获得许多隐含的信息和内容,从而应用于下游的相关工作。本文关注图谱以及类似的图数据在推荐领域中的应用,研究图神经网络的方法来实现端到端的推荐系

2、统,并提升推荐性能。具体来说,本文基于前人的研究成果,提出了一种图神经网络模型,结合UICker分解进行知识表示,实现基础的物品推荐算法。Tucker分解是一种针对图谱,添加了关系信息的矩阵分解方法,比普通的矩阵分解能更加有效地提取图谱数据的表达。同时,图神经网络,比一般的方法更适合处理图数据这种非欧式数据,从而能更加有效地整合图上信息,最终实现了对于推荐能力的提升。为了更加方便有效地评估模型的有效性,本文基于相关的研究成果一一KGAT所使用的公开数据集进行实验和评估,并采用同一套评价指标来说明本文研究的重要性和优越性。实验结果表明,本文所提出的模型在同样的评估标准上超越了其他几个基线模型的表

3、现。关键词:推荐算法,图数据,图神经网络,tucker分解AbstractWiththedevelopmentofdeeplearningandmachinelearning,therearemanymethodsofrecommendationusingdeeplearningtechnologyinthefieldofrecommendationalgorithm.Thesemethodsuseuseranditeminformationtorealizetheend-to-endrecommendationsystem,whichgreatlypromotesthedevelopment

4、ofrecommendationalgorithm.Inthisprocess,morenovelmethcisareproposedtosolvethebasicproblemofrecommendation,soastobroadentheperformanceboundaryofrecommendationsystem.Themostimportantpointistoimprovetheperformanceoftheoriginalrecommendationmodelbyintroducingnewdataornewdataprocessingmethods.Atthesameti

5、me,innaturallanguageprocessing,knowledgegraph,adatastorageform,hasbeenpaidmoreandmoreattentionbyresearchers.Manyresearchesandworkshaveprovedthattheexpressionofknowledgegraphcanobtainalotofimplicitinformationandcontent,whichcanbeappliedtothedownstreamrelatedwork.Thispaperfocusesontheapplicationofgrap

6、handsimilargraphdatainthefieldofrecommendation,studiesthemethodofgraphneuralnetworktorealizetheend-to-endrecommendationsystemandimprovetherecommendationperformance.Specifically,basedonthepreviousresearchresults,thispaperproposesagraphneuralnetworkmodel,combinedwithTuckerdecompositionforknowledgerepr

7、esentation,toachievethebasicalgorithmofitemrecommendation.Tuckerdecompositionisamatrixdecompositionmethodwhichaddsrelationinformationtothegraph.ltcanextracttheexpressionofgraphdatamoreeffectivelythanthecommonmatrixdecomposition.Atthesametime,thegraphneuralnetworkismoresuitablethanthegeneralmethodtod

8、ealwiththenonEuclideandatasuchasgraphdata,soitcanintegratetheinformationonthegraphmoreeffectively,andfinallyachievetheimprovementofrecommendationability.Inordertoevaluatethevalidityofthemodelmoreconvenientlyandeffectively,thispaperconductsexperimentsandevaluationsbasedontherelevantresearchresults-th

9、eopendatasetusedbyKGAT,andusesthesamesetofevaluationcriteriatoillustratetheimportanceandsuperiorityofthisstudy.Experimentalresultsshowthatthemodelusedinthispaperoutperformsotherbaselinemodelsinthesameevaluationcriteria.Keywords:Recommendationalgorithm,Graphdata,Graphneuralnetwork,Tuckerdecomposition

10、iii摘要iAbstractii图目录IV表目录VI第1章绪论11.1 课题背景11.2 国内外相关研究21.2.1 一般推荐任务概述21.2.2 图上推荐方法概述31.2.3 图神经网络在推荐上的应用41.3 GNN进行推荐的挑战51.4 针对挑战所进行的工作51.5 论文的结构安排6第2章图推荐相关的背景知识72.1 理论的知识背景72.1.1 图神经网络72.1.2 图谱的表示学习152.1.3 推荐算法介绍182.2 开源框架的介绍202.2.1 DGL开源图神经网络框架202.3 本章小结21第3章基于Tucker分解增强的GAT物品推荐模型223.1 任务的详细定义223.1.1

11、数据的抽象结构223.1.2 推荐的具体方式243.2 模型方法的说明243.2.1 模型整体介绍与思考253.2.2 知识表示进行预处理283.2.3 模型结构的具体设计293.3 本章小结36第4章实验设计与结果分析384.1 基准方法概述384.1.1 其他图神经网络方法384.1.2 经典方法404.2 评价指标404.3 整体代码设计414.4 实验流程444.4.1 数据源的分析介绍444.4.2 数据预处理与构图454.4.3 模型构建参数选择464.5 结果分析484.6 本章小结51笫5章总结与展望525.1 全文总结525.2 未来展望52参考文献54作者简历错误!未定义书

12、签。致谢错误!未定义书签。图目录图2.1GraphSAGE的基本流程11图2.2图上注意力机制13图2.3RGCN的基本工作原理14图2.4三种Trans方法的投影16图2.5Tucker分解的核心计算公式示意图17图2.6PinSage核心伪代码流程20图2.7DGL框架消息传递基本示意图21图3.1CF侧数据与KG侧数据的示意图23图3.2三种构图方式结构和所包含信息上的区别24图3.3模型方法整体概述25图3.4一阶的共同行为27图3.5二阶的共同行为27图3.6采样的策略36图4.1代码整体框架42图4.2两种模型初始化与不初始化训练的情况对比图49图4.3注意力端值的比较51表目录表

13、4.1数据源边数与节点数统计表44表4.2具体数据表44表4.3TkGAT与其他GNN方法实验结果对比48表4.4模型在不同超参下的实验对比结果48表4.5模型与其他基准模型的实验对比结果49表4.6采样做为正则手段的实验对比结果50第1章绪论Ll课题背景随着电商与网络娱乐产业的快速发展,为用户进行个性化推荐商品或者广告己经是互联网公司最重要的能力之一。在如今的互联网公司,各种推荐算法和工程框架层出不穷,而为了拓宽推荐能力的边界,有越来越多新颖的模型与方法被用于推荐任务。随着近年来图神经网络的发展,对于图这样的非欧式数据的探索也越来越多,自然地也有许多研究人员将图神经网络应用到推荐相关的任务上

14、。同时,利用图神经网络(GraPhNerUaINetWork)()不光从方法上有别于一般的推荐算法,其可用的数据范围也扩展到了所有的图结构数据,而使用Sideinfonnation来增强推荐的能力,尤其是利用知识图谱的信息更是工业界和学术界都在探索的一个方向。基于此,本文将立足于开源数据集和公司的业务数据,研究如何在知识图谱等图结构数据上,更好地利用图神经网络实现推荐任务。具体来说,如今的推荐算法,通过这几年的不断发展,已经利用深度学习的技术获得了长足的进步。越来越多的工作也说明了深度学习技术在推荐算法中的可行性和重要性。例如由YoUTUbe在2016年提出的这一架构,可以算是深度学习在推荐中

15、工业落地的一个最佳范例,后来在国内的电商推荐环境中,也基本采用了这种形式。后续更多的推荐模型被提出,这些模型或从经典的FMI3算法脱胎而来;或是引入了注意力机制,例如根据当前用户历史行为对用户的兴趣进行捕捉的DIN4、MINDISi等算法;以及利用CNN机制进行推荐的DeepCoCNNL6模型。但上述模型的改进更多的是研究模型本身对于推荐性能的提升,并不关注数据本身的特性。因此,更多的研究开始关注于使用更加新颖、更加先进的深度学习技术来提升现有推荐算法的边界,这其中比较重要的一个工作就是利用图谱数据进行推荐任务。例如,基于图的推荐工作,首先是将用户和物品的交互行为表示为图结构或者网络结构,然后

16、利用图上的表示学习来表达节点或者边的语义信息。更进一步,使用图谱进行推荐比较经典的做法是基于路径的推荐方法718在这里,本文选择采用的方法是图神经网络。基于深度学习的方法,在图上进行卷积从而对图数据进行处理,以发掘其规律和特征,这类模型被统称为图神网络(GNN)OGNN的一个发展方向,是借鉴CNN的思路,如何在图上进行卷积从而实现图上的卷积神经网络是GNN重点需要解决的问题。而GNN的一个很重要的作用和知识表示类似,是图上节点和边的稠密低纬表示。本文所要做的工作就是在充分研究了己有GNN相关成果的基础上,提出一种合适的模型,在公开数据集上完成相关的推荐任务,并取得推荐性能的提升。1.2 国内外

17、相关研究1.2.1 一般推荐任务概述从历史的发展来看,推荐系统的研究起源于国外,可以追溯到1994年明尼苏达大学GroUPLenS研究组推出的GroUPLenS系统P,该系统首次使用了协同过滤的算法为USer推荐item,并且为后面的推荐系统建立了一个形式化的模型框架。而当今工业界,往往会将推荐系统分成matching和ranking两个阶段来实现,即对应了粗排和精排。这一架构源于论文2,由YOUTUbe于2016提出。在国内的电商推荐环境中,也基本采用了这种形式。自1994年开始协同过滤算法应用在推荐系统以来的二十多年间,协同过滤依然是推荐的核心思路之一。所谓协同过滤就是基于群体的信息,对个

18、体信息进行过滤。协同过滤推荐算法基本可以分为基于用户、基于物品以及基于模型三类。基于用户的协同过滤最早就是由文章19提出,它的核心思路是相似用户之间对于物品的喜好可能相同。基于物品的协同过滤则是由亚马逊于2001年提出10,它的核心思路则是喜欢A物品的人也会喜欢与A相似的物品B。基于模型的协同过滤可以大致分为基于矩阵分解的方法与基于分类模型的方法。SVD奇异值分解是数学上的一种比较经典的矩阵分解方法,可以将一个矩阵表示成三个矩阵相乘。而SVD+则是不光利用用户的评分矩阵,也引入了用户的行为矩阵,从而使得信息更加完善和稠密叽除了直接拟合矩阵值的矩阵分解之外,还有一种基于排序的矩阵分解形式。它的核

19、心思路在于用户对于一个正例商品与一个负例商品,应该使得对于正例的评分高于负例。BPR121就是这样的一个方法,通过构造正负样本对的损失函数,使得USer和item最终的隐式表达的乘积互相远离,实际上后来很多的推荐模型,都会使用类似的损失函数。基于分类模型的方法中比较经典的算法是分解机(FM)算法,该算法在工业界往往应用于ranking阶段。FM算法13通过引入特征的二阶项,从而缓解特征稀疏的问题,同时将二阶项的权重分解成两个向量的乘积,因此即便在稀疏特征下也能训练该权重。FM在之后又有FFMl,I、DeePFMLlSl等变种,是推荐在精排阶段非常重要的算法之一。而随着深度学习的发展,也有越来越

20、多利用深度学习技术实现的经典的推荐算法,例如NCF(16|、PNN7LDSSMI8、WidC&Dccp19等算法模型。其中DeCPFML炉是将Wide&Deep中的Wide部分替换成了FM,然后利用FM实现特征的自动交叉。而Deep部分则建模特征间的高阶关联,从而优化了原来的FM算法。后续还有优化的XDeePFMl20、NFMP等算法。同时,引入注意力机制,实现根据当前用户历史行为对用户的兴趣进行捕捉,也是DIN、MlND等算法的核心思路。这些算法在推荐的召回阶段发挥了不小的作用。此外,还有利用CNN实现的推荐模型,例如DeePCoCNN。1.2.2 图上推荐方法概述基于图的推荐工作,是与本研

21、究内容密切相关的一部分工作。将用户和物品的交互行为表示为图结构或者网络结构,然后利用图上的表示学习来表达节点或者边的语义信息是图上推荐的一般做法。在这里可以将其分成两类:单纯的表示学习与引入KG的推荐模型。单纯的表示学习其基本思路是参照NLP技术中WOrd2vec的方法,通过SkipGram算法来学习节点之间共现的隐式表达。具体来说,可以从一个节点出发,通过随机游走的方式,找到一批认为与这个点相似的点,通过这种共现学习节点的Embedding表示。这种稠密的低维度表示可以在matching阶段表示商品与商品之间的相似度,也可以在ranking阶段作为特征输入到更复杂的模型中用于精排。DeepW

22、alkl22被认为是第一个利用NLP中EInbedding的技术来学习节点表示的方法;而LINEl23则是在方法22的基础上引入了不同与邻接相似的二阶相似,拓宽了节点相似的范围,使得节点的表达更加抽象。2加2丫*1241则是在方法122|的基础上通过引入了更加灵活的随机游走方式,同时也能对高阶的相似进行建模。上文的模型都只考虑了同构图的情况,而对于异构图MetaPath2VecF5则提出了利用元路径来指导随机游走的策略,从而学习节点表达。使用图谱进行推荐比较经典的做法就是上文提到的异构图推荐的做法,即基于路径的推荐方法26北127。该类方法将知识图谱构建成一张异构信息网络,然后构造物品之间基于

23、meta-path的特征,但这种方法的缺点也很明显,人为地构造meta-path的工作量过于繁琐,且难以普适地应用于各种场景。近年来研究人员对于如何将图谱数据应用于推荐也有很多探索和尝试,本课题的核心内容也在于探究如何利用图神经网络将例如知识图谱这样的图数据应用到推荐任务中。1.2.3 图神经网络在推荐上的应用正如上文所言,图上的推荐任务已经颇有成效。自然地,随着图神经网络的兴起,许多研究人员开始尝试利用图神经网络模型来训练端到端(End-toEnd)的推荐系统,以充分挖掘图数据的潜力和价值。PinSageP8J是GCN方法在工业界的一次很好的落地实现,该算法通过randomwalk和GCN来

24、生成涵盖了图结构信息和节点特征的节点嵌入表示,其主要的改进点在于对于利用随机游走生成子图,并在子图上进行GCN的操作,这样大大节省了内存开销;同时推荐向的训练则是参考了BPR(12)的损失函数,最大化正负样本的得分差。GCMCl29是利用图生成的方法来实现推荐的方法。它的主要想法就是将用户和物品的交互构建成图中的边,然后通过随机掩盖边的方法,让模型学习用户和物品之间存在边的概率。通过这种方法,GCMC将原先的推荐任务转变了成了图上的链接预测。且它的训练过程是将原图进行嵌入之后再让模型尝试还原,因此也是AUto-Encoder框架的一个很好的应用。KGATI30、KGCNl3”是最近一段时间里比

25、较明确地利用GNN方法将知识图谱应用推荐任务的两种方法。KGATL-O应用GAT的思想对图谱数据进行了操作。Item本身是图谱中的实体,而USer和Item可以通过是否行为构建出一条边,因此通过这条边可以将USer引入现有的图谱图中,从而构建了一张CKG(协同知识图谱)。主要思路是通过GAT对USer和ItemEmbeddingft,然后训练BPR损失,这是属于CF训练的一部分。而图谱的方法中同时引入了TranSR,TransR训练出来结果作为CF训练中注意力权重的来源,也就是在TranS算法中更接近的实体之间,其注意力值要相对高一些。KGCN31将GCN方法应用到图谱上,但说是GCN的方法,

26、实际上也是一种注意力模型。它为每一个用户针对每一个关系都生成了不同的注意力权重,这就从某种程度上实现了每个用户对于商品的关注点都有所不同,这也应该是做USerMem交互预测的核心思路。不过这样使得模型训练的成本大大提高,论文本身也采用了邻接采样的机制来降低训练成本,不过它做AttemiOn的思路值得借鉴。可以预见,随着图神经网络和知识图谱的不断发展,会有越来越多的利用GNN实现个性化推荐的方法涌现出来。1.3 GNN进行推荐的挑战图数据是一种隐含结构信息且内容丰富的数据,将其应用到推荐任务上,普通的方法可能并不能得到足够有效的结果;而利用GNN可以天然地使用图数据的结构信息,并将图上节点做更加

27、丰富的表达。然而将GNN运用到推荐任务中仍需要克服以下几个问题:1 .图谱数据的结构和表达本文选择了使用NLP中的知识图谱数据来作为推荐的基础数据。从一方面来说,图谱数据对于推荐任务来说是非常宝贵的sideinformation,可以从不同的维度很好地补充推荐任务需要的额外信息;从另一方面说,图谱数据也是非常典型的图数据,有着丰富的结构和边信息。而如何使用图谱数据,挖掘图谱数据隐含的特点和信息就成为了本文所要解决的核心问题。GNN模型的选择和构建自然是一方面的难点,还有一方面的难点在于针对图谱数据本身,是否有比较通用的挖掘其信息表达的方式,从而增强GNN模型的能力,最终提升推荐的性能。2 .图

28、模型的选择和构建显然,本研究的第二个难点就是如何选择和构建合适本推荐任务的GNN模型。总的来说,现有的许多GNN模型基本都是脱胎于GCN的基础框架,并在GraphSAGE的改进之上继续发展而来的。简单地说,模型都基于两个阶段:即如何聚集节点的邻居节点信息以及聚合之后做何种处理。本文也将沿用这种模式,探究一种合适的聚合方式,使得该GNN模型能够在本问题上有较好的表现。问题的难点就在于,如何根据不同的图谱表示方法,来更好地设计模型的聚合方式,以及通过不同的实验来证明,哪些模型结构更加适合本问题的解决。L4针对挑战所进行的工作本文的任务是研究如何更好地实现在图数据上的物品推荐算法。该方法是在现有相关

29、研究基础上,进行一次拓展和尝试的方法,主要进行的工作包括以下几占八、(1)在已有推荐算法的基础上,尝试使用图神经网络的技术来实现图数据上的推荐。(2)图谱信息的表达:针对图谱这种特殊的图数据,利用不同的图表示学习的方法,来提取和挖掘图数据的信息,并将其与GNN模型进行有机的结合。(3)提出了一种基于tucker分解增强的GAT模型结构,以及尝试了其他不同类型的GNN模型及其相关变种。(4)利用开源框架DGL和深度学习框架PytorCh构建模型,完成实验代码,尝试上面提出的不同的想法并进行实验。(5)对于异构同构等图上问题,进行了不同的考量和实验,对于图数据的预处理做了充分的准备。L5论文的结构

30、安排本文研究的是利用图神网络进行物品推荐的任务,全文总共分成五个部分,具体的内容安排如下所示:第一章为绪论,阐述了本文的研究背景和国内外的相关研究情况,并对本研究的难点和主要工作做了简单的叙述。第二章则是将文本研窕过程中涉及到的知识内容和模型方法做了统一的阐述,主要是围绕GNN模型、图数据表示方法、推荐算法和开源框架这几个方面展开的。第三章则详细介绍了本文提出的方法,一种基于tucker分解的GAT推荐模型,详细说明了设计思路和模型的具体结构。第四章则是详细地说明了本文的实验环境,和实验设计的过程,对于具体的代码内容也有基本的概述。分析和阐述实验结果,利用表格以及一些图形化的展示,来说明研究的

31、结果。第五章对本文的工作做了总结,并对未来的研究做了展望。第2章图推荐相关的背景知识2.1 理论的知识背景2.1.1 图神经网络图神经网络是最近几年以来兴起的一种基于图数据结构的广义神经网络架构。传统的深度学习模型,例如LSTMl32和CNN,是在欧式空间的数据上进行训练,并取得了许多不错的成绩。但是对于非欧式空间的数据,例如社交网络、知识图谱这些有着非规则连边的数据,直接利用深度模型有许多的局限性。针对这种问题,研究者们引入了图来表示非欧式数据,并利用深度学习的方法,在图上进行卷积从而对图数据进行处理,以发掘其规律和特征。GNN的一个发展方向,是借鉴CNN的思路,如何在图上进行卷积从而实现图

32、上的卷积神经网络是GNN重点需要解决的问题。而GNN的一个很重要的作用和知识表示类似,是图上节点和边的稠密低纬表示,上文提到的DeePWalk和LINE说明了网络表示的有效性,但这些方法并不系统且计算复杂,GNN旨在解决这些问题1GNN值得学习的根本理由有以下三点。第一,像上文所说的传统的CNN和RNN模型并不能很好地处理图数据的输入,因为它们的特征需要按照特定的顺序进行叠加,而图中的点往往是无序的。如果为了完整地表达一张图,可能就需要把所有的顺序都作为输入,显然这是非常冗余且难以实现的。GNN解决这个问题的方法就是将特征在每个节点上进行传播,从而忽略了节点输入的顺序。也就是说,GNN的输出与

33、节点输入的顺序是无关的。第二,传统的神经网络结构中,对于边信息是无法建模的,往往边信息会被简化成节点本身的特征信息,而GNN则可以通过图结构实现信息的传递,从而利用边信息进行特征的隐式表达。第三,图形数据本身是推理的一个非常重要的组成,人脑的推理过程几乎都是基于从日常经验中提取的图信息。尽管CNN可以很好的处理图片信息,而RNN在文本信息的处理中也有不俗的表现,但它们仍然不能从大型实验数据中学习推理图,然而,GNN为探索这些非结构化数据生成图信息提供了一个新的方向和思路,从而可能演化出更进一步的高级人工智能。除此之外,一个未经训练的简单架构的GNN也被证明具有良好的性能,图结构本身成为了GNN

34、模型的重要组成部分。2.1.1.1 GraphConvolutionalNetwork(GCN)借助图的拉普拉斯的特征值和特征向量来研究图的基本性质,是GCN的理论基础。具体详细的理论研究并不是本文要讨论的重点,因此这里只是简单概述-TGCN理论的发展情况和核心内容。首先是关于图上卷积的计算的推导,以下的内容来自于论文33的提炼和理解。图的拉普拉斯矩阵是指,对于图G=(V,E),其拉普拉斯矩阵的定义为L=D-A,其中D表示整个图的顶点度矩阵,而A则表示了整张图的邻接矩阵。事实上,这只是拉普拉斯矩阵的其中一种定义,总的来说,图上的拉普拉斯矩阵一共有以下三种定义:LL=D-A2 .L=OTLDT很

35、多GCN的论文中使用的是这种定义3 .L=D-ILGCN的核心就是基于图上拉普拉斯矩阵的谱分解,由于拉普拉斯矩阵是半正定的对称矩阵,因此它的特征向量相互正交,从而有如公式(2.1)所示的结论:然后仿照传统的傅里叶变换的定义,可以得到图上的N维向量在图上的傅里叶变换定义,如公式Q.2)所示:F(a)=f(a)=ZN1 f()ui(l)2)将其推广到矩阵形式,就可以得到如公式Q.3)所示的形式:7(1)11(l)Ul(N)(八八八(23)/()/Vun(I)uw(N)/V()也就是说,解图上的傅里叶变换的矩阵形式如公式(24)所示:f=UTf(2.4)类似地,可以得到怵图上的逆傅里叶变换的矩阵形式

36、如公式(25)所示:f=f(2.5)根据卷积定理,可以得到图上的卷积公式如公式(26)所示:萍(八)(*h)G=U.Uf(2.6)(n)/得到这个核心公式之后,就可以展开说明GCN的发展过程了。首先是第一代的GCNF4,直接学习公式中的卷积核参数,也是就说它将上述的卷积公式,简化成了如公式(27)的形式:Youtput=(Ug0(八)U7x)(2.7)其中,sigmoid是激活函数,裱示神经网络中可学习的参数,U是拉普拉斯矩阵谱分解后列向量为单位特征向量的矩阵,而X则是节点上的向量表示。这种方法的问题在于每次计算的时候代价太大,需要计算三个矩阵的乘积,这三个矩阵的大小往往是顶点数的平方级别,同

37、时模型自由度也过高。因此后来的一篇论文133对这个形式又做了进一步的改进,提出了一种多项式近似的方法来降僻莫型参数数量,并通过公式的推导和简化得到新的卷积公式,它的优点在于减少了模型参数,降低了过拟合的风险,同时新的公式也不再需要对图的拉普拉斯矩阵进行特征分解,具体来说,它将公式Q6)中的h(八)设计成了如公*2.8)的形式:(2.8)/=0lgclf-loopOReLU Jrel-N(in)_ rel_N(out) IllOi*7 =。(EeZ叫=必胃 +(2.20)其中N/表示节点i通过关系r连接的节点集合。可以发现,它与基本的GCN公式在形式的差别就在于凡这个权重矩阵。对于GCN而言,它

38、采用了和CNN一样的共享权重机制,当前这一层特征使用相同的权重进行聚合;而RGCN则是对于不同的关系,使用不同的权重矩阵进行对应的特征聚合。而且,除了利用权重矩阵进行简单的映射之外,也可以利用多层的神经网络实现消息的传递和特征的图2.3RGCN的基本工作原理聚合。通过论文的图示,可以更好地理解RGCN的工作原理,如图2.3所示:当然,这样简单地为每一种关系一一对应一个权重矩阵存在一个很明显的问题,就是可训练参数过多,导致模型易于过拟合,如何对当前这个模型进行一个合理的正则化是RGCN需要考虑的重要问题。论文中提出的方法是,对权重矩阵Wl做分解,分解的方式也比较简单,就是将原来的矩阵W;eRR+D+Dz,拆分成两个更小的矩阵的乘积,系数矩阵arbERR=base与基矩阵V,ERbase+D*Dz,然后训练这两个小矩阵,减少可训练参数的个数,如公式(2.21)所示(2.21)w1=2小%那么实际上,新Wr就是基矩阵的在不同参数a下的线性组合,某种程度上又实现了参数共享的机制。2.1.2 图谱的表示学习表示学习是知识图谱应用中非常重要的一个环节,它的意义在于通过一些通用的

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号