备案 控制台
文档
产品文档

混合云监控实战

更新时间:
一键部署
我的收藏

本实践通过对平台侧和租户侧的产品进行监控平台的配置和展示,梳理了混合云平台的监控告警流程,这样在混合云使用、运维过程中,可以更好的了解云平台的健康状况。

前提条件

本实践适用于专有云企业版3.16版本。

使用场景

混合云监控可分为云平台本身和租户侧资源两个维度。其中租户侧可以分为资源实例本身和业务应用部分。

当前专有云提供云监控CMS,用于资源实例本身的监控,可监控包括云服务器ECS,云数据库RDS,对象存储OSS等多种产品。另外云平台也提供监控服务Prometheus,应用实时监控服务ARMS等产品,来方便进行业务应用的监控。

对于云平台本身组件、即底座的监控,云平台提供tianjimon组件,可针对物理设备,OS层等IaaS指标,底座管控软件等PaaS指标进行统一监控。

方案概述

1、本文通过对云监控CMS,tianjimon等组件进行实际的操作演示,可以使大家更好的了解混合云的监控体系,便于在后续使用、运维过程中对云平台的稳定性有更清晰的理解。

2、租户侧,会介绍云监控CMS,监控服务Prometheus等产品,通过监控项的配置实现业务侧的监控运维。

3、云平台侧,会介绍tianjimon是如何监控云底座各个组件的,如何通过底座的监控信息查看当前云平台的运行情况。

实践步骤

  1. 租户资源监控。

    1. 基础资源层。

      云监控CMS是一项针对阿里云资源进行监控的服务,为云上用户提供开箱即用的企业级开放型一站式监控解决方案。云监控用于监控各云服务资源的监控指标,探测云服务ECS的可用性,并针对指定监控指标设置报警。使您全面了解混合云上资源的使用情况和业务运行状况,并及时对故障资源进行处理,保证业务正常运行。

      云监控CMS支持主机云服务器ECS监控,通过在主机上安装插件,为您的主机提供监控功能。目前云监控仅支持为Linux和Windows操作系统的主机安装插件。对云主机的监控,除了基础的CPU,内存等,还支持针对进程的监控。123

      云监控CMS还支持网络负载均衡的监控,可针对每个负载均衡实例(监听端口)进行分别监控。可在最上方选择具体的监听实例。4

      云监控CMS还支持丰富的告警配置,可针对各种监控指标创建对应的告警规则。

      通过设置告警时间,使告警仅在指定时间生效,对不同时间段设置不同阈值的告警规则。可对多个实例进行统一的告警规则设置,以达到简化步骤,告警聚合的目的。1

      如果配置了ANS告警网关服务,还可以将告警发送到邮件、钉钉等服务中,方便的通知到运维人员。6

    2. 业务资源层。

      对于业务监控,云平台提供了应用实时监控服务ARMS(Application Real-Time Monitoring Service),这是一款应用性能管理(APM)产品,包含应用监控、监控服务Prometheus和前端监控三大子产品,涵盖分布式应用、容器环境等领域的性能管理,可实现全栈式性能监控和端到端全链路追踪诊断。

      1. 单击接入prometheus监控可一键接入容器集群,内置了丰富的监控模板。7

      2. 可直接打开Grafana的监控界面,查看监控信息。8

      3. 接入监控实例后,单击设置,可进行监控服务Prometheus配置。1

      4. 通过应用实时监控服务ARMS,单击左侧导航栏链路追踪可以进行应用、链路跟踪监控。对于分布式架构,可监控Java应用,查看应用拓扑、接口调用、异常事务、慢事务等信息,全面的了解业务的运行情况。111

  2. 云平台底座监控。

    云平台底座监控由tianjimon统一支持,系统模型如下。模型

    指标采集包括metric,Log,DB等多种渠道,并内置硬件、系统,产品管控等丰富的监控告警指标。

    1. 产品服务监控。

      1. 打开天基平台,可以查看各个服务产品的状态信息。产品正常则显示已达终态0

      2. 当产品未达终态,可单击产品名称后面的角色,查看具体报错的服务名称。1

      3. 单击具体报错的服务名称可查看错误详情,根据详细的错误信息登录Terminal进行处理。14

    2. 硬件监控。

      • tianjimon平台支持服务器硬件监控,比如资产信息数据,传感器信息,如CPU温度、风扇转速等,SmartLog信息,如各种Smart字段监控等,可在tianji中搜索hardware_monitor_new,查看硬件告警信息。1

      • tianjimon会部署agent到服务器上,每个产品集群的tianjiservice中都会配置收集硬件监控数据,并转化为metric指标。同时针对异常指标metric进行报警配置1617

      • tianjimon平台支持OS等IaaS监控内容,通过tianjiagent或者系统日志进行指标收集和展示。119

      • 单击上图中的日志监控可以查看tianjimon收集的监控日志,方便检查当前的监控链路是否正常。tianjimon默认根据监控的采样频率配置对应的日志存储时长,并定期清理过期日志内容,避免发生日志存储空间不足的问题从而影响监控信息展示。2021

      • tianjimon还提供了整体的监控大盘,可统一查看当前监控系统的运行状态。2223

      • 以及可查看每个产品,当前生效的监控模板、监控项。24

      • 为了避免由于tianjimon自身故障,而导致异常无法被检测,当前tianjimon还支持自身的监控告警。可在Apsara Uni-manager运维控制台搜索selfmonitor查看自身告警。1

    3. 告警配置。

      • tianjimon会根据监控指标的结果配置告警规则,根据对云平台造成的影响不同,将告警设置为不同级别,并统一通过Apsara Uni-manager运维控制台进行展示通知。26

      • 在具体的告警信息后面,还可以对告警条目进行分析处理,以便更快的定位、解决云平台故障。27

      • 如果云平台部署了ans告警网关,还可以在Apsara Uni-manager运维控制台进行告警通知设置。28

      • 对于预期内的告警行为,比如主动维修造成的告警,可以通过告警屏蔽进行临时处理。29

  • 本页导读

深圳SEO优化公司菏泽百度竞价公司六安网站排名优化价格襄樊百度网站优化黔西南网站seo优化推荐天水百度网站优化价格同乐seo网站推广德阳关键词按天扣费多少钱梅州企业网站建设价格温州SEO按天收费公司昭通SEO按效果付费多少钱德阳至尊标王哪家好新乡网站排名优化哪家好通辽网站关键词优化报价荆州网站优化按天计费报价郴州网站推广系统公司宜春SEO按天计费公司丹竹头百度标王珠海seo优化报价襄樊优化铜川seo网站推广价格马鞍山SEO按效果付费推荐内江seo网站推广多少钱南澳百度seo南平百姓网标王推广公司安康百度竞价包年推广推荐迁安百姓网标王多少钱蚌埠关键词排名包年推广价格焦作网站建设设计价格滁州seo排名哪家好常州百度关键词包年推广歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化