仿冒app识别系统的制作方法

文档序号:30370890发布日期:2022-06-11 00:34阅读:201来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
仿冒app识别系统的制作方法

1.本发明涉及计算机技术领域,尤其涉及一种仿冒app识别系统。


背景技术:

2.随着移动应用市场的迅速发展,海量app(应用程序)应运而生,各种各样的app给人们的生活带来的极大的便利,但是同时也出现了大量的仿冒app,通过换壳、马甲包等形式伪造一个apk,并设置与正常app相同的app名称,来欺骗用户安装使用,从而来进行非法活动,给用户带来损失。因此,需要及时并准确地识别出仿冒app,减少给用户带来的损失。但是,由于app数量巨大,且每日新增的app数量也很多,为仿冒app的识别带来很大困难。由此可知,如何快速准确地从海量app中的识别出仿冒app成为亟待解决的技术问题。


技术实现要素:

3.本发明目的在于,提供一种仿冒app识别系统,能够快速准确地从海量app中的识别出仿冒app。
4.根据本发明第一方面,提供了一种仿冒app识别系统,包括数据库、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报的app安装记录,并实时动态更新,所述app安装记录包括设备id、app名称、app包名和安装时间字段,每一app的安装包名唯一,当所述处理器执行所述计算机程序时,实现以下步骤:
5.步骤s1、基于所述数据库获取预设初始时刻对应的每一app的安装量,所述app的安装量为安装过该app的设备id数量;
6.步骤s2、将安装量超过预设的第一安装阈值的app划分至头部app候选区,将安装量低于预设的第二安装阈值的app划分至尾部app候选区,所述第一安装阈值大于所述第二安装阈值,且二者处于不同的数量级;
7.步骤s3、遍历所述数据库,获取所述头部app候选区中每一头部候选app的首次安装时间并判断首次安装时间距离所述初始时刻的时间间隔是都大于预设的时间间隔阈值,若大于,则基于所述数据库获取该头部候选app距所述初始时刻预设第一历史时间段内的app安装态势,并判断所述app安装态势是否平稳,若平稳,则将该头部候选app确定为头部目标app,生成头部目标app集;
8.步骤s4、遍历尾部app候选区,将包名中包含预设分身字符串的尾部候选app从所述尾部app候选区中删除,生成尾部目标app集;
9.步骤s5、遍历所述尾部目标app集和所述头部目标app集,将在所述头部目标app集存在相同app名称的尾部目标app确定为仿冒app。
10.本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种仿冒app识别系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
11.本发明通过确定头部目标app集和尾部目标app集能够快速准确识别仿冒app,此
外后续通过更新头部目标app集和尾部目标app集,能够保证仿冒app识别的准确性和识别效率。
12.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
13.图1为本发明实施例提供的仿冒app识别系统示意图。
具体实施方式
14.为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种仿冒app识别系统的具体实施方式及其功效,详细说明如后。
15.在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
16.本发明实施例提供了一种仿冒app识别系统,如图1所示,包括数据库、处理器和存储有计算机程序的存储器,所述数据库用于存储设备上报的app安装记录,并实时动态更新,所述app安装记录包括设备id、app名称、app包名和安装时间字段,每一app的安装包名唯一,可以作为数据库中识别该app的唯一主键,可以理解的是,所述设备可以物理实现为智能手机、pad等能够安装app的移动设备,当所述处理器执行所述计算机程序时,实现以下步骤:
17.步骤s1、基于所述数据库获取预设初始时刻对应的每一app的安装量,所述app的安装量为安装过该app的设备id数量;
18.其中,所述预设初始时刻可以设置为系统冷启动的时刻,也可以根据应用需求指定其他时刻为初始时刻。
19.步骤s2、将安装量超过预设的第一安装阈值的app划分至头部app候选区,将安装量低于预设的第二安装阈值的app划分至尾部app候选区,所述第一安装阈值大于所述第二安装阈值,且二者处于不同的数量级;
20.需要说明的是,头部app指的是大众app,尾部app指的是小众app,第一安装阈值和第二安装阈值可以基于数据库中全量app中大众app和小众app对应的安装量的分布来确定。作为一种示例,第二安装阈值可设置为10万量级,第一安装阈值可设置为百万量级,可以理解的是,安装量位于第二安装阈值和第一安装阈值中间的通常app既不可能为头部目标app,也不可能为尾部目标app,因此,安装量处于该区域的app可以不予考虑,减少不必要的计算量。
21.步骤s3、遍历所述数据库,获取所述头部app候选区中每一头部候选app的首次安装时间并判断首次安装时间距离所述初始时刻的时间间隔是都大于预设的时间间隔阈值,
若大于,则基于所述数据库获取该头部候选app距所述初始时刻预设第一历史时间段内的app安装态势,并判断所述app安装态势是否平稳,若平稳,则将该头部候选app确定为头部目标app,生成头部目标app集;
22.步骤s4、遍历尾部app候选区,将包名中包含预设分身字符串的尾部候选app从所述尾部app候选区中删除,生成尾部目标app集;
23.可以理解的是,头部目标app为可能被仿冒的正常app,尾部目标app为可能是仿冒app的app。有些正常app会存在分身app,分身app的安装量级通常位于尾部app候选区,且分身app的名称与对应的正常app的名称也相同,分身app的包名中通常存在特定的分身字符串,如“dkplugin”。因此可直接基于预设分身字符串将分身app从尾部app候选区中删除,避免产生噪声,减少计算量。
24.步骤s5、遍历所述尾部目标app集和所述头部目标app集,将在所述头部目标app集存在相同app名称的尾部目标app确定为仿冒app。
25.本发明实施例通过确定头部目标app集和尾部目标app集能够快速准确识别仿冒app,此外,后续通过更新头部目标app集和尾部目标app集,能够保证仿冒app识别的准确性和识别效率。
26.作为一种实施例,所述步骤s3中,获取所述头部app候选区中每一头部候选app的首次安装时间包括:
27.步骤s31、基于每一头部候选app的安装包名检索所述数据库,将最早上报的该头部候选app对应的安装记录所对应的安装时间确定为该头部候选app的首次安装时间。
28.作为一种实施例,所述app安装态势可以直接基于app安装量来描绘,为了进一步提高app安装态势描绘的准确性,作为另一种实施例,可以将app安装和app卸载结合来描述app安装态势描绘的准确性,具体的,所述数据库中还包括设备上报的app卸载记录,所述app卸载记录包括设备id、app名称、app包名和卸载时间字段,当所述处理器执行所述计算机程序时,实现以下步骤:
29.步骤s011、获取app在初始时刻以及每一周期时刻对应的安装存量,所述安装存量=上一周期的安装存量+本周期的安装量-本周期的卸载量;
30.步骤s012、基于所述初始时刻,以及每一周期时刻对应的安装存量拟合app安装存量变化曲线。
31.基于上述实施例,在所述步骤s3中,基于所述数据库获取该头部候选app距所述初始时刻预设第一历史时间段内的app安装态势,并判断所述app安装态势是否平稳,包括:
32.步骤s311、基于所述初始时刻,以及所述初始时刻前m个预设周期时刻在头部候选app的安装存量变化曲线对应的曲线段,获取对应的第一曲线的倾斜角;
33.步骤s312、判断所述第一曲线的倾斜角是否小于预设的第一倾斜角阈值,若小于,则判断所述app安装态势平稳。
34.作为一种实施例,第一倾斜角设置为30
°

35.数据库中每天都可能新增大量的app,因此作为一种实施例,从所述初始时刻开始,对于所述数据库新增的app安装记录,执行以下步骤:
36.步骤s6、判断新增的安装记录对应的app包名是否为新增app包名,若是,则将该app的名称与当前头部目标app集进行匹配,若所述当前头部目标app集中存在与该app相同
的头部目标app,则将该新增app确定为仿冒app。
37.可以理解的是,新增app的安装量通常为尾部候选app,也不可能为头部目标app,因此对于新识别的新增app可以直接采用步骤s6识别是否为仿冒app,提高了仿冒app识别的效率。需要说明的是,新增app中也可以先进行过滤分身app操作后再当前头部目标app集进行匹配,提高仿冒app识别的准确性。
38.由于已有app的相关特征不断的更新,或者不断有新增的app,为了进一步提高仿冒app识别的准确性和及时性,因此,可以定时更新头部目标app集和尾部目标app集。作为一种实施例,从所述初始时刻开始,每间隔预设的周期,执行以下步骤:
39.步骤s01、获取当前周期内每一新增的app的安装量,并与所述第一安装阈值和所述第二安装阈值对比,若高于所述第一安装阈值,则将该新增的app划分至所述头部app候选区,若低于所述第二安装阈值则划分至所述尾部app候选区,将当前周期被划分至所述尾部app候选区的新增app确定为待选新增app;
40.步骤s02、获取当前周期内每一待选新增app的app安装增长率,并判断是否高于预设的安装增长率阈值,若高于,则将该待选新增app划分至所述头部app候选区,否则,判断该待选新增app对应的app包名中是否包含预设分身字符串,若不包括,则将该待选新增app更新至所述尾部目标app集中;
41.作为一种示例,预设周期可以设定为一周,需要说明的是,在当前周期内,由于待选新增app首次出现的时间不同,因此在当前周期对应的存在时间也有差别,每一待选新增app的app安装增长率是基于该待选新增app在本周期内的存在时间来确定的。基于步骤s01到步骤s02能够定期准确地更新头部app候选区和尾部目标app集。
42.步骤s03、判断当前头部app候选区中是否存在首次安装时间距离当前时刻的时间间隔大于所述时间间隔阈值且app安装态势平稳的头部候选app,若存在,则将该头部候选app更新至所述头部目标app集中。
43.通过步骤s03能够将头部app候选区中满足头部目标app的头部候选app更新至所述头部目标app集,提高头部目标app集的准确性和可靠性。
44.由于app的数量庞大,且尾部目标app集和头部目标app集也需要不断更新,因此需要设置一个合理的算法机制,来减少计算量,并保证仿冒app的识别准确性。作为一种实施例,当前周期最终确定的尾部目标app集包括第一尾部目标app子集和第二尾部app子集,所述第一尾部目标app子集为当前周期原始尾部目标app集,所述第二尾部app子集为当前周期新增尾部目标app集;当前周期最终确定的头部目标app集包括第一头部目标app子集和第二头部app子集,所述第一头部目标app子集为当前周期原始头部目标app集,所述第二头部app子集为当前周期新增头部目标app集;所述步骤s03之后还包括:
45.步骤s04、遍历所述第二头部app子集和所述当前周期最终确定的尾部目标app集,将所述当前周期最终确定的尾部目标app集中与所述第二头部app子集存在相同app名称的尾部目标app确定为仿冒app;
46.步骤s05、遍历所述第二尾部app子集和所述第一头部目标app子集,将所述第二尾部app子集中与所述第一头部目标app子集存在相同app名称的尾部目标app确定为仿冒app。
47.除了定时将符合条件的头部目标app和尾部目标app加入对应的集合中以外,随着
各个app特征的变化,有可能出现部分头部目标app和尾部目标app也不再符合预设条件,如果继续留在头部目标app集和尾部目标app集中,由于app数量庞大,势必会增加很多不必要的计算量,从而降低仿冒app的识别效率,因此,作为一种实施例,从所述初始时刻开始,每间隔预设的周期,还执行以下步骤:
48.步骤s10、遍历当前尾部目标app集,获取距当前时刻之前预设第二时间段内每一尾部目标app的安装量曲线,并将所述安装量曲线划分为第一曲线段和第二曲线段;
49.步骤s20、获取第一曲线段的振幅衰减斜率和第二曲线段对应的安装量总和,所述所述振幅衰减斜率小于预设的振幅衰减斜率阈值,且所述第二曲线段对应的安装量总和小于预设的安装量阈值,则将该尾部目标app从当前尾部目标app集中删除。
50.通过步骤s10-步骤s20可以确定出已经消亡的尾部目标app,从而提升仿冒app的识别效率和准确性。
51.作为一种实施例,从所述初始时刻开始,每间隔预设的周期,还执行以下步骤:
52.步骤s100、遍历当前头部目标app集,基于所述数据库获取每一头部目标app距离当前时刻预设第二历史时间段内的app安装态势,并判断所述app安装态势是否平稳,若不平稳,则将该头部目标app从所述目标app集中删除。
53.所述步骤s100包括:
54.步骤s101、基于当前时刻,以及所述当前时刻前n个预设周期时刻在所述安装存量变化曲线对应的曲线段获取对应的第二曲线的倾斜角;
55.步骤s312、判断所述第二曲线的倾斜角是否大于预设的第二倾斜角阈值,若大于,则判断所述app安装态势不平稳。
56.作为一种实施例,第二倾斜角阈值为45
°

57.通过步骤s100,可以将当前头部目标app集中不符合条件的头部目标app从当前头部目标app集中删除,提高头部目标app集的准确性。可以理解的是,当前剔除的头部目标app,可以遍历当前尾部目标app集,将已被确认为当前剔除的头部目标app对应的仿冒app的尾部目标app更新为非仿冒尾部目标app。本发明通过定时更新头部目标app集和尾部目标app集,提高了仿冒app识别的效率和准确性。
58.以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 实时数据获取与记录系统查看器...
  • 一种基于机器学习的石油钻井大...
  • 一种基于动态代码配置的自动巡...
  • 视频的超分辨率处理方法、装置...
  • 一种用于供需预测偏差二次修正...
  • 基于零样本域适应的图像分类方...
  • 基于快速标签提取和自适应拓扑...
  • 基于图注意力卷积神经网络的人...
  • 一种异常流量检测方法、系统和...
  • 一种分布式环境中请求日志的记...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

深圳SEO优化公司普洱seo排名价格黄冈关键词按天收费哪家好昌吉网站推广方案报价海东网站设计报价平凉如何制作网站晋城模板网站建设报价德阳关键词排名包年推广昭通企业网站设计林芝网站改版推荐武威网站制作设计报价福田网站优化按天扣费贺州网页制作多少钱济宁网站优化排名柳州阿里店铺运营报价昆明百度爱采购公司衡阳seo网站优化多少钱庆阳企业网站建设报价坪地百度竞价南通百度爱采购哪家好吉林企业网站建设哪家好大连百度爱采购报价淄博百度seo公司宜宾网站优化按天计费推荐安顺网站推广工具报价秦皇岛建网站多少钱咸宁企业网站建设阜阳网站优化排名价格临沂SEO按天收费价格绵阳关键词排名哪家好酒泉百度网站优化价格歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化