一种利用网络拓扑特性构建加权网络的链路预测方法与流程

文档序号:19739205发布日期:2020-01-18 04:57阅读:993来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种利用网络拓扑特性构建加权网络的链路预测方法与流程

本发明涉及一种复杂网络中的链路预测,尤其是一种利用网络拓扑特性构建加权网络的链路预测方法,属于网络信息挖掘技术领域。



背景技术:

复杂网络中的链路预测问题越来越受到各个领域的关注。链路预测是指预测网络中缺失的链接或者将来可能出现的链接,它可用于提取缺失信息,识别虚假交互,评估网络演化机制,帮助提高生物实验的效率,微博中的关注对象推荐,商品推荐系统中为其推荐满意的商品等。目前复杂网络链路预测已经取得了很多成果。链路预测算法主要分为四类:基于节点属性相似性的方法、基于网络结构的方法、基于最大似然估计的方法和机器学习方法。其中基于网络结构相似性的方法因其计算复杂度低,精度高,受到广泛的关注。gao等人提出了一种结合节点度和节点聚类系数的链路预测算法,充分利用了网络局部结构信息,还体现出了共同邻居节点之间的差异性。fan等人将共同邻居节点的聚类系数归一化后的平均值考虑在内,提高了链路预测的精度。

随着复杂网络研究的深入,一些简单的无向无权网络已经不能涵盖网络的大部分特征,在真实网络中链接大部分都是带有权重的,murata等人首次将网络中连边的权重考虑在内,提出加权的相似性指标,实验证明,链接权重在链路预测的过程中起到了积极作用。qian等人提出wfr算法,利用真实社交网络好友推荐策略,在fr算法的基础上,增加了可以有效区分候选节点与中介节点的权重,预测效果优于fr算法。chen等人提出一种改进的加权网络链接预测方法,该方法基于这一假设:当链接xz为强关系而链接zy为弱关系时,链路<x,z,y>对节点x和y之间形成链接的贡献最低,该方法在auc指标上具有一定的优势。

然而现有的加权网络链路预测方法大都根据网络中链接的自然权重进行研究,考虑到一些网络权重信息很难获取,即使获取也通常伴随着噪音,使得链路预测水平提升较小。



技术实现要素:

该方法考虑网络中边的聚类和扩散两大特性,并将其设置为网络中边的拓扑权重值,基于wcn,waa,wra,wlp这四个局部结构相似性指标,提出了一种新的链路预测方法。在四个权威数据集上进行实验,仿真结果表明,提出的预测方法使预测精度明显提升。

一种利用网络拓扑特性构建加权网络的链路预测方法,包括以下步骤:

步骤1),将输入的数据集转换成相应的网络的邻接矩阵;

步骤2),计算网络中每条边的聚类特性jc(exy)和扩散特性kd(exy),其中jc(exy)=|{△xyk:△xyk∈△g}|,式中△xyk表示以x,y,k为顶点组成的三角形,△g表示网络中所有的三角形构成的集合,jc(exy)表示以节点x,y为顶点组成三角形的数目。其中γ(x,y)表示节点x,y的邻居节点集合,γ(x,y)\x,y表示节点x,y的邻居节点集合中去除节点x,y后构成的集合,指在集合γ(x,y)\x,y中不能和节点x,y构成三角形的节点的集合;

步骤3),根据边的聚类和扩散特性,定义综合指标cd(exy)=α×jc(exy)+(1-α)×kd(exy),α∈(0,1),并将其作为网络中边的拓扑权重值,其中参数α用来衡量边聚类和扩散特性的相对重要程度;

步骤4),生成带权的邻接矩阵,并将其按随机抽样的方法划分为训练集和测试集,划分后应保证训练集网络的连通性,划分比例为9:1;保证训练集网络的连通性的方法为,随机选择一条边,判断去掉这条边之后,所选边的两端节点是否可以通过网络中的其他边相连,若两端节点可达,则把这条边放入测试集,否则从新选边;

步骤5),将权重cd(exy)应用到wcn,waa,wra,wlp指标中,生成相对应指标wcd-cn,wcd-aa,wcd-ra,wcd-lp,其定义如下所示:

步骤6),根据公式(1)-(4),计算被预测节点对x,y的相似度分数sxy,并生成相应的sim矩阵;

步骤7),根据相似度矩阵,测试集和不存在边集合,计算各个指标的auc值。

附图说明

图1是本发明的方法流程图;

图2是在usair,bibble,pblogs,dolphins四个真实网络中,参数α从0到1取不同值时,wcd-cn,wcd-aa,wcd-ra,wcd-lp四个预测指标auc值的变化曲线。

图3是在usair,bibble,pblogs,dolphins四个真实网络中,训练集占整个数据集比例分别为50%,60%,70%,80%,90%时,对实验结果的影响。

图4为本发明中步骤2的示意图。

图5为本发明中步骤4的示意图,其中(a)为完整的网络,(b)中虚线表示测试集,实线表示训练集。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1示,该方法包括以下步骤:

步骤1),将输入的数据集转换成相应的网络的邻接矩阵。该步骤是网络的输入与构建,将网络的边列表linklist文件格式转换成网络的邻接矩阵。

步骤2),计算网络中每条边的聚类特性jc(exy)和扩散特性kd(exy),其中jc(exy)=|{△xyk:△xyk∈△g}|,式中△xyk表示以x,y,k为顶点组成的三角形,△g表示网络中所有的三角形构成的集合,jc(exy)表示以节点x,y为顶点组成三角形的数目。其中γ(x,y)表示节点x,y的邻居节点集合,γ(x,y)\x,y表示节点x,y的邻居节点集合中去除节点x,y后构成的集合,指在集合γ(x,y)\x,y中不能和节点x,y构成三角形的节点的集合。

如图4所示,以边e12组成了3个三角形,所以jc(e12)=3,节点1,2的邻居节点有8个,去掉能和节点1,2构成三角形的节点,剩下的5个节点代表了边e12的扩散能力,信息可以通过这些节点扩散到其他节点,所以kd(e12)=5。

步骤3),根据边的聚类和扩散特性,定义综合指标cd(exy)=α×jc(exy)+(1-α)×kd(exy),α∈(0,1),并将其作为网络中边的拓扑权重值,其中参数α用来衡量边聚类和扩散特性的相对重要程度。这一步骤是网络拓扑权重的设置,网络中一条边的重要性与这条边的信息传播过程有关,我们在定义一条边的权重时,综合应用边的聚类特性和扩散特性,并引入参数α来调节聚类特性和扩散特性所占的比重。

步骤4),生成带权的邻接矩阵,并将其划分为训练集和测试集,划分比例为9:1。将步骤3中生成的权重赋值给每一条边,生成带权重的邻接矩阵,接着按随机抽样的方法将网络划分成训练集和测试集,划分后应保证训练集网络的连通性,图5所示,(a)为完整的网络,(b)图中虚线表示测试集,实线表示训练集,按照9:1的比例进行划分。

步骤5),将权重cd(exy)应用到wcn,waa,wra,wlp指标中,生成相对应指标wcd-cn,wcd-aa,wcd-ra,wcd-lp,其定义如下所示:

步骤6),根据公式(1)-(4),计算被预测节点对x,y的相似度分数sxy,并生成相应的相似度矩阵(sim矩阵)。

步骤7),根据相似度矩阵,测试集和不存在边集合,计算各个指标的auc值。auc作为精度测量,从整体上衡量算法的准确度。其定义如下所示:

通过在四个真实网络中进行仿真验证,各个网络的参数如下表:

表1:

其中n代表网络的节点数,m代表网络连边数,<k>表示网络的平均度,ρ为网络密度,<d>表示网络的平均距离,c是网络的聚类系数。

在图2中,我们可以明显的看出,当α值逐渐增大的时候,聚类特性所占比例逐渐增加,扩散特性所占比例逐渐较少,auc值也随之波动,并且产生了最大值,在usair网络中,我们取α值为0.4,在bibble网络中,α取值为0.6,在pblogs网络中,α取值为0.6,在dolphins网络中,α取值为0.7。这也证明了在定义网络连边的拓扑权重时,聚类特性和扩散特性都是不可或缺的,从而证明了我们方法的有效性。在图3中,我们比较了不同训练集比例对实验结果的影响,我们可以看到,随着训练集比例的增加,预测精确度也相应的提高,这是因为训练集比例增加,能够利用的网络拓扑信息就越多,对聚类和扩散特性的计算就越准确,所以基于链接拓扑权重的wcd含权预测指标的精确度就越高。

本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 基于深度学习对风力发电系统进...
  • 一种降噪式换热器的优化设计方...
  • 基于T-S模糊模型的汽轮机阀...
  • 一种基于EASI的线性结构工...
  • 一种基于泽尼克多项式系数与最...
  • 一种平面、柱面、球面滑移网格...
  • 一种高压断路器生命周期评估及...
  • 优化FIR滤波器的方法、装置...
  • 一种核电设计任务管理系统,方...
  • 大容量电力电子系统的离散状态...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

深圳SEO优化公司南京高端网站设计报价揭阳网站定制公司深圳网络广告推广价格海东百搜标王公司宝安网页设计报价昌吉网站制作设计临夏外贸网站制作报价丽江企业网站设计海南关键词排名包年推广价格海北企业网站设计报价玉树网站搭建多少钱莆田百度seo推荐汕头网站定制公司伊犁设计公司网站价格自贡企业网站改版多少钱塘坑百姓网标王推广推荐包头网站改版哪家好湛江百度标王多少钱莆田设计公司网站天水网站制作设计多少钱南宁网络营销多少钱保定网站建设设计公司坂田seo排名报价郑州网站改版公司四平网站建设设计多少钱怀化百度标王长葛外贸网站制作报价汕头关键词排名包年推广邯郸网站推广报价常德百姓网标王哪家好歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化