一种日志数据采集方法与流程

文档序号:32527612发布日期:2022-12-13 21:26阅读:89来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种日志数据采集方法与流程

1.本发明属于软件技术领域,具体涉及一种日志数据采集方法。


背景技术:

2.日志,是记录服务器等电脑设备或软件的运作。日志文件提供精确的系统记录,根据日志最终定位到错误详情和根源。日志的特点是,它描述一些离散的(不连续的)事件。例如:应用通过一个滚动的文件输出 info 或 error 信息,并通过日志收集系统,存储到一些存储引擎(如elasticsearch)中方便查询。应用日志框架技术架构一般包括日志门面和日志实现(请参考图1)。
3.日志门面:解决系统与日志实现框架的耦合性,提供了一个日志抽象层,可以在后台使用任意一个日志类库。日志实现:包含目前市面上主流的日志框架(如log4j、log back、log4j2、jul等)。每一种框架都有自己的api,使用对应框架就需要对应的api,这样就大大增加了程序代码对日志框架的耦合度,所以应用程序和日志框架之间应该有一个沟通的桥梁,无论底层的日志框架如何变,应用程序都不需要有任何感知。有了日志门面之后,应用开发人员永远都是面向日志门面编程就算更换日志框架,应用程序也不需要更改代码。日志门面主要的作用是提供接口,其他的由日志框架来实现。日志框架的具体架构请参考图2,具体内容如下:1、应用使用日志门面,可以选择接入任一种日志框架,达到灵活可插拔的目的,减少因更换底层日志框架带来的代码改动适配风险。2、使用日志门面作为接入层,提供统一的操作api,应用选择具体某一个日志框架就可以根据标准统一的api进行相关日志打印操作。
4.现有技术的局限和缺点:1、随着业务规范及监管要求需要将应用业务日志与审计操作日志分离,现有日志框架组件配置繁琐,开发人员需要修改程序来进行适配,需要通过修改日志配置来解决日益增长的日志存档监管需求。2、伴随新应用增加,需要进行审计日志与业务日志分离的需求越来越强烈,因此开发人员需要对应用进行程序修改来进行适配,每个应用重复开发审计日志打印逻辑,增加开发人员负担,同时也增加了应用运行和维护的风险。3、随着应用上容器云,传统日志文件输出到共享文件系统会存在文件名一样从而导致日志采查询存在混乱等问题,区分不出文件里哪行日志是哪个应用打印的。4、由于业务日志打印要求根据每个业务场景要求不一样,有的日志字段值存在数据量大而不需要打印的情况,现有的日志框架没法灵活配置日志字段打印,同时也存在日志存储空间的浪费,降低了资源利用率。5、当某个http请求到来时,没有自动的日志打印机制打印其请求参数及响应参数。


技术实现要素:

5.针对现有技术的不足,本发明提供日志数据采集方法。
6.本发明提供一种日志数据采集方法,其包括步骤:s1:在配置文件中配置的采集规则;
s2:根据配置文件预先的配置对日志组件进行初始化;s3:判断日志采集请求是否需要记录审计日志;当不需要记录审计日志时拒绝日志采集请求,当需要记录审计日志时拒绝日志采集请求,根据采集规则对日志文件进行数据脱敏处理。
7.优选地,在s2步骤后还包括如下步骤:根据当前运行环境是属于虚拟机还是容器云环境,生成对应的日志文件。
8.优选地,在s3步骤中,通过http filter拦截机制动态根据采集规则判断该次请求是否存在敏感数据,如果存在敏感数据则进行数据脱敏处理。
9.优选地,在s2步骤时,根据读取配置文件动态判断日志采集请求是否存在数据量大的字段,如果存在数据量大的字段则忽略该字段的打印。
10.优选地,所述日志组件提供系统接入口,通过系统接入口与应用通讯连接;所述日志组件还包括显示模块,通过所述显示模块控制日志的打印及日志的字段显示。
11.优选地,所述日志组件包括数据采集模块、数据接入模块、流式计算模块和数据输出模块,通过数据采集模块从各节点上实时采集数据,通过数据接入模块在采集数据和数据处理之间进行消息缓冲,流式计算模块对采集到的数据进行实时分析,数据输出模块对对分析后的数据进行输出。
12.优选地,所述日志组件还包括异步打印模块和链路跟踪模块,通过异步打印模块异步对日志文件进行读取,通过链路跟踪模块对采集的数据进行链路跟踪。
13.本发明在另一方面提供一种计算机设备,其包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现根据权利要求1至7中任一项所述的日志数据采集方法。
14.本发明在另一方面提供一种计算机可读存储介质,其中存储有程序,所述程序被计算机执行时实现根据上述的日志数据采集方法。
15.本发明提供的日志数据采集方法在配置文件中配置的采集规则,应用可据配置文件预先的配置对日志组件进行初始化,判断日志采集请求是否需要记录审计日志;当不需要记录审计日志时拒绝日志采集请求,当需要记录审计日志时拒绝日志采集请求,根据采集规则对日志文件进行数据脱敏处理。本发明可将应用业务日志与审计操作日志分离,实现了松耦合、可配置、高性能、可动态解析的日志打印采集组件。
附图说明
16.通过附图中所示的本发明优选实施例更具体说明,本发明上述及其它目的、特征和优势将变得更加清晰。在全部附图中相同的附图标记指示相同的部分,且并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本的主旨。
17.图1为现有的日志框架技术架构图;图2为现有的日志体系架构图;图3为实施例提供的流程图。
具体实施方式
18.为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。
19.需要说明的是,当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件并与之结合为一体,或者可能同时存在居中元件。本文所使用的术语“安装”、“一端”、“另一端”以及类似的表述只是为了说明的目的。
20.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术领域的技术人员通常理解的含义相同。本文中说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
21.本发明提供的日志数据采集方法在配置文件中配置的采集规则,应用可据配置文件预先的配置对日志组件进行初始化,判断日志采集请求是否需要记录审计日志;当不需要记录审计日志时拒绝日志采集请求,当需要记录审计日志时拒绝日志采集请求,根据采集规则对日志文件进行数据脱敏处理。从而实现了松耦合、可配置、高性能、可动态解析的日志打印采集组件。
22.优选地,在s2步骤后还包括如下步骤:根据当前运行环境是属于虚拟机还是容器云环境,生成对应的日志文件。随着应用上容器云,传统日志文件输出到共享文件系统会存在文件名一样从而导致日志采查询存在混乱等问题,区分不出文件里哪行日志是哪个应用打印的。当前运行环境是容器云环境时,根据应用容器镜像id生成日志文件存储至共享目录中;当前运行环境是属于虚拟机环境时,根据应用唯一的id生成日志文件。本发明应用根据当前运行环境是属于虚拟机还是容器云环境,根据应用唯一id还是容器id动态选择生成日志文件,便于开发人员和运维人员查看日志;基于应用的唯一id名或者容器hostname区分应用日志,避免日志文件名给日志采集程序造成困扰及开发人员查看问题造成混淆。
23.优选地,在s3步骤中,通过http filter拦截机制动态根据采集规则判断该次请求是否存在敏感数据,如果存在敏感数据则进行数据脱敏处理。金融行业通常涉及对客户姓名、银行卡号、手机号、身份证号、密码等隐私数据的采集与处理,若直接把这些隐私数据记录到系统日志里,当管理不善时就会造成客户隐私数据的泄露,而且这么做也不符合监管要求。数据脱敏是使用给定的脱敏规则和策略,对隐私数据进行变形处理,从而达到保护隐私数据安全的一种方法。本发明能根据业务要求在配置文件配置屏蔽打印敏感字段,或者在对日志打印时对敏感字段的段值加星号打印展示,从而实现字段的打印达到脱敏效果,避免信息泄露。
24.优选地,在s2步骤时,根据读取配置文件动态判断日志采集请求是否存在数据量大的字段,如果存在数据量大的字段则忽略该字段的打印。由于业务日志打印要求根据每个业务场景要求不一样,有的日志字段值存在数据量大而不需要打印的情况,现有的日志框架没法灵活配置日志字段打印,同时也存在日志存储空间的浪费,降低了资源利用率。本技术通过读取配置文件动态判断日志采集请求是否存在数据量大的字段,如果存在数据量大的字段则忽略该字段的打印可以很好解决上述问题。
25.优选地,所述日志组件提供系统接入口,通过系统接入口与应用通讯连接;所述日志组件还包括显示模块,通过所述显示模块控制日志的打印及日志的字段显示。本发明基于开源日志框架,通过将可配置及动态解析的功能统一成日志组件的形式;日志组件提供系统接入口,通过系统接入口与应用通讯连接;所述日志组件还包括显示模块,通过所述显示模块控制日志的打印及日志的字段显示,以达到灵活控制日志的打印及字段的显示,并
且以日志工厂的方式灵活选择业务日志与审计日志打印。
26.优选地,所述日志组件包括数据采集模块、数据接入模块、流式计算模块和数据输出模块,通过数据采集模块从各节点上实时采集数据,通过数据接入模块在采集数据和数据处理之间进行消息缓冲,由于采集数据的速度和数据处理的速度不一定同步,因此添加一个消息中间件作为缓冲;通过选用kafka来实现,从而大大降低运维工作压力和保证系统可用性。流式计算模块对采集到的数据进行实时分析,数据输出模块对对分析后的数据进行输出,数据输出模块可以使用hdfs、mysql等。
27.优选地,所述日志组件还包括异步打印模块和链路跟踪模块,通过异步打印模块异步对日志文件进行读取,通过链路跟踪模块对采集的数据进行链路跟踪。本发明增加异步打印模块提升系统的并发处理能力,日志采集平台进行数据采集时异步对日志文件进行读取,供日志查询平台进行检索;通过在日志组件打印链路跟踪唯一id,能方便应用开发人员及运维人员准确定位问题,提高开发运维效率。
28.本发明建立灵活可配置及可动态解析的日志打印采集机制,将应用和日志打印逻辑进行解耦,统一关键日志输出格式方便日后进行可视化统计与分析,通过应用引入日志组件的形式实现日志打印规则可配置化及日志内容动态解析,能根据业务要求配置屏蔽打印敏感字段或者敏感字段值加星号部分打印展示,操作简单、收集方便,能减少业务依赖,增加同步与异步打印机制提升系统的并发处理能力,从而取代通用的日志打印框架,实现了松耦合、可配置、高性能、可动态解析的日志打印采集组件。
29.在优选实施例中,日志组件还设计配置中心,计配置中心为日志配置项提供统一配置中心进行集中配置,将应用和配置进行解耦;日志组件还设计动态配置组件,其实现参数配置变更热加载,当日志配置项发生变更时可以实现热加载。
30.在本技术中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
31.在本说明书的描述中,参考术语“优选实施例”、“再一实施例”、“其他实施例”或“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
32.尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 基于数字孪生的泵站机组水力部...
  • 导读文本显示方法、系统、装置...
  • 音频播报方法、装置、电子设备...
  • 一种编译器自动调参方法与流程
  • 广告分发系统及智能广告分发机...
  • 利用合成磁共振成像数据基于深...
  • 基于贝叶斯优化及K-cent...
  • 一种文档处理方法、装置、电子...
  • 一种基于互联网的工程信息发布...
  • 一种变电站设备主人制管理系统...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

深圳SEO优化公司爱联企业网站改版塘坑网站推广系统广州网站制作大运SEO按天计费盐田优秀网站设计福永百姓网标王石岩SEO按天收费宝安百度网站优化排名大运seo优化盐田阿里店铺托管东莞seo东莞网站优化广州至尊标王福田百姓网标王推广罗湖百搜词包大芬网站搜索优化塘坑阿里店铺运营布吉网站推广深圳企业网站制作爱联优秀网站设计沙井阿里店铺托管南澳网站关键词优化南澳百度网站优化大鹏关键词按天扣费塘坑网站推广方案盐田网站制作惠州企业网站建设松岗SEO按天扣费同乐关键词按天计费吉祥百度网站优化歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化