近日,由中国银行业协会金融科技专业委员会指导,金科创新社主办的“第二届金融数据智能优秀解决方案评选”结果揭晓。经过建设银行、农业银行、民生银行、中国人寿、太平洋保险等大中型金融机构的数十位IT专家的严格评审、打分和答辩环节的详细问询,云智慧“金融行业智能业务运维解决方案”获得“2020金融数据智能·专家推荐TOP10优秀解决方案”和“2020金融数据智能·运维创新优秀解决方案”两大奖项。 正是凭借先进的AIOps理念和丰富的金融行业实践成果,云智慧“金融行业智能业务运维解决方案”才能在上百套参选方案中脱颖而出,获得金融行业专家一致认可和推荐。中国民生银行北京分行科技部兼数据应用部总经理郭庆对云智慧“金融行业智能业务运维解决方案”作出如下评价:“实现业务系统的可视化、自动化实时监控目标,消费生活,并提供自动化日志分析等功能,利用机器学习和人工智能自动设置比人工更为合理的监控阈值等。” 下面就让我们一起来看看云智慧参评方案的概要内容和相关应用实践案例。 行业背景 如今金融行业掀起了一场数字化变革的浪潮,无论运营方式还是消费场景都产生了巨大变化,传统低效的人工服务模式逐渐被高效的数字化方式所取代。手机银行、电子理财、电子保单、移动查勘等数字业务规模的不断扩大使得金融业IT运维面临软硬件数量激增、应用和架构复杂化、变更频繁、运维数据井喷等困难和挑战。 【数字化应用系统架构示例】 行业痛点 由于IT发展所处的阶段不同,不同金融机构遇到的痛点也有所不同,总结下来主要有几个方面: 缺乏面向业务的端到端应用性能监控,已有监控属于底层监控,缺少业务层面的用户体验及应用性能监控,无法及时有效的感知业务运行健康及性能质量。 缺乏立体化监控体系,当业务系统出现问题时,无法快速定位是网络、服务器、中间件、应用、数据库哪一层次导致的故障。 监控数据孤岛丛生,各控工具产生的数据都孤立存在,无法将各层次的监控数据有效关联应用,故障排查困难,效率低下,无法从全局掌握IT运维的状态。 海量运维数据价值无法充分挖掘,产生大量运维数据,缺乏标准化体系,只能进行简单分析,无法进行深度学习和融合智能分析管理,例如综合业务可视化、根因分析、异常检测、智能告警等。 解决方案 云智慧金融行业智能业务运维解决方案以数据为基础、算法为支撑、场景为导向,结合行业最佳实践进行封装,帮助用户逐步建立数字化运维管理体系: ▪ 通过轻量级、低入侵、松耦合的立体化监控工具集帮助用户采集全栈运维数据; ▪ 通过专业运维数据库组织、存储和管理数据;通过指标体系管理帮助企业打造集中、统一、规范和高效的指标体系; ▪ 通过数字化运维工作台、数字化运维监控中心、智能事件管理等产品落地运维数据在不同场景下的应用。 【面向金融行业的AIOps整体平台架构图】 案例1:一体化大数据运维管理平台 随着业务系统的全面互联网化,金融核心业务应用对网络的依赖程度越来越高。因此,需要一套符合全新业务理念的一体化大数据运维管理平台,对基础设施、网络链路、应用系统性进行统一监控,实现基于业务的端到端应用系统性能监控管理。 【一体化大数据运维管理平台】 通过全球部署的骨干网监测点节点,特别是国内100多个重点城市的监测点,持续监控微信客服等业务场景中区域用户体验问题,以及移动、浏览器用户遇到的页面加载缓慢的问题,及时发现和解决网络性能瓶颈。 【网络链路监控】 通过在移动APP上集成SDK,抓取移动端出现的缓慢、错误、崩溃、卡顿等问题,从发现问题到定位问题只需要2~5分钟时间,大大提升了IT部门解决前端用户体验问题的效率。 通过端到端监控技术,基于唯一的请求ID标识自动串接从用户前端到后端应用代码以及基础设施的整个请求,基于单次请求序列还原问题快照,帮助用户从外到内逐步分析每个环节对应用性能造成影响的问题瓶颈。 【端到端应用监控】 通过在应用服务实例上部署Agent,实现对微服务实例的监控,帮助运维人员更快速、更精确地定位微服务后端的性能问题。 【可视化监控大屏】 通过对网络质量、移动端、浏览器端和应用端的监控,获得了丰富的多源数据指标,通过统一可视化工具将数据进行关联分析并实时展现,为管理决策提供有效数据依据。 案例2:基于大数据和机器学习的智能运维平台建设 某金融机构的监控体系覆盖超过数十万台主机和数千个系统,产生了海量监控数据,运维管理面临更大的挑战。需要基于大数据和机器学习技术构建新一代的智能运维平台,实现运维数据的智能化处理、关联分析、故障根因定位和风险预测。 【智能运维平台建设架构】 利用现有监控资源指标,建设运维工作台,实现复杂业务模型下的异常检测、故障定位、根因分析、决策分析支持; 利用专业运维数据库实现海量运维数据的高效采集和存储、大规模数据离线计算分析; 针对主机、存储、应用系统、业务场景和运维场景,形成产品经理、运维人员、研发人员、ECC值班视图; 通过可视化大屏实时展现业务系统的关键指标,第一时间发现异常,辅助运维人员进行运维决策和自动化处理; 利用异常检测算法对系统问题进行深度分析,通过业务场景的调用链关系以及应用的指标数据,定位到可能引起异常的应用指标,实现根因定位。 方案价值 免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,如内容不当,请联系我们qq980047777及时修正或删除。谢谢! http://chinasyjjw.com |