一种网络水军账户识别方法及系统与流程

文档序号:14774588发布日期:2018-06-23 02:45阅读:441来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种网络水军账户识别方法及系统与流程

本发明涉及网络水军账户识别领域,特别是涉及一种网络水军账户识别方法及系统。



背景技术:

随着互联网技术的快速发展,各种各样的网络社交平台相继出现,人们的日常生活交往也越来越依靠于网络,但是日益增长的网络数据也给网络监管带来了很大的挑战,大量网络营销号利用虚拟的网络环境制造公众话题,引导舆论方向,以此来提高网友对某个人或者某件事的关注度,并从中谋取利益。网络水军的发帖形式表现为,在某一个时间段里大量账号同时发布相同或相近的内容,或者在他人帖子下面重复发布某商品广告以及链接,这些水帖不仅使网络环境显得杂乱无章,更严重的是大量带有引导性的舆论水帖可能会使网友对某件事做出错误的判断,甚至影响一些低龄网友形成正确的三观。

已有的通过机器学习来识别网络水军的方法,首先将样本帖划分为多个子集,然后针对这些子集分别训练出分类器,再使用这组分类器来识别出水军贴。但是在训练样本中水军帖所占的比例对分类器的结果有很大影响,而且水军在不同的时间段或者针对不同的话题的发帖内容也不一样,需要针对各种情况训练不同的分类器,工作量太大。为了减小工作量,现有技术中对于水军账户的识别通常采用基于粒子群算法的网络水军识别方法识别水军账户,但是粒子群算法随着迭代的进行,微粒都朝着个体极值和全局极值的方向聚集,在后期会变得较为集中,甚至会出现多次迭代后极值未发生变化的情况,群体多样性降低;群体多样性不足,使算法容易陷入局部极值,从而引起早熟早收敛,无法收敛到全局最优点,进而导致搜索水军账户不彻底,识别效率及搜索效率低的问题。



技术实现要素:

本发明的目的是提供一种网络水军账户识别方法及系统,以解决网络水军账户识别效率及搜索效率低的问题。

为实现上述目的,本发明提供了如下方案:

一种网络水军账户识别方法,包括:

获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量;

根据所述每个用户的相关指标确定每个用户的位置向量;

对所述每个用户的相关指标分配权重,得到若干个权重向量;

根据所述位置向量以及所述权重向量的点积确定适应度函数;

利用适应度函数计算爆炸半径;

根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;

利用适应度函数计算所述火花的适应度;

判断所述适应度是否大于适应度阈值,得到第一判断结果;

若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。

可选的,所述利用适应度函数计算爆炸半径,具体包括:

根据公式计算所述爆炸半径;

其中,Ai为所述爆炸半径,为爆炸半径预设值,ymin为最小适应度,f(Xi)为适应度函数,N为烟花种群总数,ε为实数。

可选的,所述根据所述爆炸半径,采用烟花算法确定火花,具体包括:

根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;

根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;

其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。

可选的,所述利用公式得到爆炸火花之后,还包括:

修正所述爆炸火花的数量。

可选的,所述根据所述爆炸半径,采用烟花算法确定火花,具体包括:

根据公式和

公式对所述初始烟花炸点进行爆炸处理,得到高斯火花;

其中,rand(-1,1)~U(-1,1),Gaussion(-1,1)~N(0,1)。

可选的,在所述根据所述爆炸半径,采用烟花算法确定火花之后,还包括:

判断所述火花是否超出可行域阈值,得到第二判断结果;

若所述第二判断结果表示为所述火花超出可行域阈值,根据火花映射规则确定下一个烟花炸点;

若所述第二判断结果表示为所述火花未超出可行域阈值,根据选择策略确定下一个烟花炸点。

一种网络水军账户识别系统,包括:

相关指标获取模块,用于获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量;

位置向量确定模块,用于根据所述每个用户的相关指标确定每个用户的位置向量;

权重向量确定模块,用于对所述每个用户的相关指标分配权重,得到若干个权重向量;

适应度函数确定模块,用于根据所述位置向量以及所述权重向量的点积确定适应度函数;

爆炸半径计算模块,用于利用适应度函数计算爆炸半径;

火花确定模块,用于根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花;

火花适应度计算模块,用于利用适应度函数计算所述火花的适应度;

第一判断模块,用于判断所述适应度是否大于适应度阈值,得到第一判断结果;

水军账户确定模块,用于若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。

可选的,所述利爆炸半径计算模块,具体包括:

爆炸半径计算单元,用于根据公式计算所述爆炸半径;

其中,Ai为所述爆炸半径,为爆炸半径预设值,ymin为最小适应度,f(Xi)为适应度函数,N为烟花种群总数,ε为实数。

可选的,所述火花确定模块,具体包括:

初始烟花炸点确定单元,用于根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;

爆炸火花确定单元,用于根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;

其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。

可选的,所述爆炸火花确定单元之后,还包括:

爆炸火花数量修正单元,用于修正所述爆炸火花的数量。

根据本发明提供的具体实施例,本发明公开了以下技术效果:烟花算法可以通过不同的爆炸半径产生距离烟花不同位置的火花,烟花算法在迭代过程中,种群中每个烟花个体在一次迭代过程中会产生多个个体,而粒子群优化算法通常只产生一个个体,烟花算法的这种爆炸机制使得其对于烟花附近的区域的搜索更加彻底,因此,提高了对网络水军账户的识别效率及搜索效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例所提供的网络水军账户识别方法流程图;

图2为本发明另一种实施例所提供的网络水军账户识别方法流程图;

图3为本发明实施例所提供的网络水军账户识别系统结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种网络水军账户识别方法及系统,能够提高对网络水军账户的识别效率及搜索效率。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例所提供的网络水军账户识别方法流程图,如图1所示,一种网络水军账户识别方法,包括:

步骤101:获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量。

步骤102:根据所述每个用户的相关指标确定每个用户的位置向量。

步骤103:对所述每个用户的相关指标分配权重,得到若干个权重向量。

步骤104:根据所述位置向量以及所述权重向量的点积确定适应度函数。

不同位置向量根据适应度函数计算出不同的适应度值。

步骤105:利用适应度函数计算爆炸半径。

每个适应度函数都能够计算出一个爆炸半径,所述利用适应度函数计算爆炸半径,具体包括:根据公式计算所述爆炸半径;其中,Ai为所述爆炸半径,为爆炸半径预设值,f(Xi)为适应度,ymin为最小适应度,N为烟花种群总数,ε为实数,ε可以是一个机器最小量(即无穷小的实数),用来避免除零操作。

步骤106:根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花。

所述步骤106具体包括:根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。

得到爆炸火花之后还包括:修正所述爆炸火花的数量。

为了避免爆炸烟火数量向“好”烟花以压倒性优势倾斜,对产生烟火数量进行修正,可以采用公式对所述爆炸火花的数量进行修正。

在爆炸算子的作用下,依据各个烟花的适应度值,其产生不同个数的火花和不同的爆炸幅度,保证了火花个数和爆炸幅度的多样性。

所述步骤106具体包括:

根据公式和

公式对所述初始烟花炸点进行爆炸处理,得到高斯火花;

其中,rand(-1,1)~U(-1,1),Gaussion(-1,1)~N(0,1)。

在变异算子的作用下,选中的烟花需要乘以一个满足高斯分布的随机数,保证了爆炸的多样性。

在步骤106之后,还包括:判断所述火花是否超出可行域阈值,若是,根据火花映射规则确定下一个烟花炸点。

无论爆炸算子还是变异算子所产生爆炸火花或高斯火花过程中可能会有超出可行域Ω的范围,当火花Xi在维度K上超出边界将通过映射规则映射到下一个烟花炸点,即:其中,式中XUBk和XLBk分别为解空间在维度K上的上边界和下边界。

如否,根据选择策略确定下一个烟花炸点。

为了保证烟花炸点数目保持不变,需要选择一定量的烟火作为下一代的烟花,若需要选择N个烟火作为下一代的烟花炸点,选择策略适应度值最好的烟火直接被选择,其它N-1个烟火根据概率来选择,其概率计算公式为:

其中R(Xi)为当前个体到除Xi之外的候选者集合K中所有个体间的距离之和。

步骤107:利用适应度函数计算所述火花的适应度。

步骤108:判断所述适应度是否大于适应度阈值,若是,执行步骤109,若否,返回步骤106,再根据下一个烟花的爆炸半径,采用烟花算法确定当前烟花所对应的火花;其中,返回步骤106实际是重新选择一个可疑水军用户对其使用烟花算法。

步骤109:确定所述火花对应的用户为水军账户。

采用本发明所提供的烟花算法中每个烟花的位置可以采用实数编码表示;烟花算法可以通过不同的爆炸半径产生距离烟花不同位置的爆炸火花,烟花算法有寻优能力强,计算复杂度低,计算速度快、具有局部覆盖性,能更加精细地搜索最优解;在迭代过程中,种群中每个烟花个体在一次迭代过程中会产生多个个体,而粒子群优化算法通常只产生一个个体,烟花算法的这种爆炸机制使得其对于烟花附近的区域的搜索更加彻底。

图2为本发明另一种实施例所提供的网络水军账户识别方法流程图,如图2所示,

一种基于烟花算法的网络水军识别方法,具体包括:

步骤201:收集N个用户的用户信息,从所述每个用户信息中提取X个相关指标,得到N个指标向量,每个指标向量中包括X个指标,X和N均为大于1的自然数。

步骤202:对X个指标根据需要分配权重,得到权重向量。

步骤203:将N个指标向量按照同一维度中每个指标大小进行排序,得到X个序列。

步骤204:选取每个用户为烟花,选取用户的指标向量为烟花的位置信息,应用烟花算法,将符合条件的烟花保存到水军用户列表。

选取每个用户为烟花,选取用户指标向量为烟花位置向量,选取权重向量与用户指标向量的点积作为适应度函数。

计算得到每个烟花的爆炸算子、变异算子和烟火数目,依据映射规则和选择策略得到下一代烟花群体。

按照步骤203得到的序列,将每个烟花移动到一个最近的位置,所述最近的位置是距离爆炸火花最近的位置,直到烟花移动的次数是否达到移动次数阈值或者三个烟花收敛到同一位置,输出最优解并退出程序。

将迭代过程中所有符合预设条件的烟花保存到用户水军列表。

步骤205:选取水军用户列表中所有可疑水军用户,将符合条件的所有爆炸火花加入水军用户列表。

选取水军用户列表中的一个可疑水军用户,计算得到其爆炸产生的火花位置。

判断所有火花的权重向量与用户指标向量的点积是否小于设定值,如果是,将所有点积小于设定值的火花保存到水军用户列表,将水军用户列表中的邻居作为一个可疑水军用户;否则,判断是否存在未使用烟花算法产生火花的可疑水军用户,如果有,利用烟花算法重新选取水军用户列表中的可疑水军用户,继续使用烟花算法搜索其各个维度上的邻居;否则,结束。

图3为本发明实施例所提供的网络水军账户识别系统结构图,如图3所示,一种网络水军账户识别系统,包括:

相关指标获取模块301,用于获取每个用户的相关指标;所述相关指标包括内容格式、重合度、商品名称、电话、链接、发帖数量。

位置向量确定模块302,用于根据所述每个用户的相关指标确定每个用户的位置向量。

权重向量确定模块303,用于对所述每个用户的相关指标分配权重,得到若干个权重向量。

适应度函数确定模块304,用于根据所述位置向量以及所述权重向量的点积确定适应度函数。

爆炸半径计算模块305,用于利用适应度函数计算爆炸半径。

所述利爆炸半径计算模块305具体包括:爆炸半径计算单元,用于根据公式计算所述爆炸半径;其中,Ai为所述爆炸半径,为爆炸半径预设值,f(Xi)为适应度,ymin为最小适应度,f(Xi)为适应度函数,N为烟花种群总数,ε为实数。

火花确定模块306,用于根据所述爆炸半径,采用烟花算法确定火花;所述火花为爆炸火花或高斯火花。

所述火花确定模块306具体包括:初始烟花炸点确定单元,用于根据所述爆炸半径确定烟花种群中的初始烟花炸点;所述烟花种群为多个用户,一个用户为一个烟火炸点;爆炸火花确定单元,用于根据公式对所述初始烟花炸点进行爆炸处理,得到爆炸火花;其中,Si为爆炸火花,M为爆炸火花预设值,ymax为最大适应度。

所述爆炸火花确定单元306之后还包括:爆炸火花数量修正单元,用于修正所述爆炸火花的数量。

火花适应度计算模块307,用于利用适应度函数计算所述火花的适应度。

计算离火花最近的位置的用户的适应度。

第一判断模块308,用于判断所述适应度是否大于适应度阈值,得到第一判断结果。

水军账户确定模块309,用于若所述第一判断结果表示为所述适应度大于适应度阈值,确定所述火花对应的用户为水军账户。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 基于单目标优化的社交影响力计...
  • 基于相位差波前重构的压缩进化...
  • 一种简易贴片元件计数装置的制...
  • 一种金属色料的智能卡及其制备...
  • 支付卡、开票系统及开票方法与...
  • 无源RFID电缆测温标签的制...
  • 一种带有校验码的编码方式的制...
  • 一种网页二维码生成方法与流程
  • 物品条形码解析方法、装置及计...
  • 一种用于智能交通工具的行李提...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

深圳SEO优化公司临夏网站推广方案公司东营网站制作设计公司宁波百姓网标王桐城网站制作设计报价黄南营销型网站建设多少钱杭州企业网站制作苏州网站推广工具哪家好徐州网络广告推广公司惠州百度竞价包年推广报价泰安百度seo公司抚州营销型网站建设石岩企业网站设计公司安康建设网站价格南阳网络营销凉山网站定制公司湘西模板制作多少钱龙岗外贸网站设计推荐南宁SEO按天扣费哪家好湘潭百度网站优化排名价格昌都企业网站改版推荐连云港网站建设价格西安SEO按天收费报价铁岭模板制作报价唐山网站优化按天收费公司朝阳企业网站建设推荐果洛seo排名苏州外贸网站建设价格凉山外贸网站设计永湖企业网站设计公司坑梓至尊标王推荐歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化