>>返回主页
中国人民财产保险股份有限公司信息科技部副总经理张鹏飞:中国人保财险上云实践

2020-07-30 10:35

张鹏飞-1.jpg

  各位同仁大家上午好!非常高兴也非常荣幸有机会为大家分享中国人保财险上云实践。

  先介绍一下背景情况。党的十九大以来,中国人保在新的发展理念引领下,结合自身实际,于2018年提出了向高质量发展转型的“3411工程”,其中“4”是四大战略,全面实施数字化战略、创新驱动战略、一体化战略和国际化战略四大战略。其中数字化战略是“3411工程”的核心。大家可以看到这四大战略里,数字化战略、创新驱动和一体化都跟IT相关。中国人保在数字化建设过程中,以IT变革为先导,以客户为中心,以全面优化用户体验为导向,从用户的触点、投保、理赔的保险全旅程,深入应用云计算、大数据、人工智能等新技术,全新规划了新一代的IT架构,富裕“保险+科技+服务”的创新价值,大刀阔斧推进中国人保的云上之旅。经过一年多的大会战和攻坚克难,人保云已初步建成并上线。目前已经形成了南北多活的基础架构格局,承载了新一代核心业务系统稳定运行,多项核心指标达到了行业领先水平。

  先看一下人保新一代IT架构规划。这张图是人保集团新一代IT架构规划,在这里我强调一下,我今天汇报的是人保财险的实践汇报,实际上就是人保集团的云。因为人保财险是主责来建人保集团的云。从IT规划开始,也是集团牵头来做财险主责的,所以我们叫人保集团新一代IT架构规划。整体来说,这个规划包含了“三横四纵”。从上往下看,一是应用架构,应用架构我们会实现前端后台的分离。二是技术架构,我们把多个先进的技术指标,包括数据库,集成到技术架构层面。三是基础架构,云化的基础架构,也就是今天汇报的人保云。还有四大保障体系,一是监控管理,实现新架构从端到端应用运行过程中的监控。二是安全管理。在新架构落地过程中,同步实现安全规划,达到网络安全的合规保障。三是研发运维一体化管理。过程中要实现研发运维的敏捷。四是容灾管理(多活多中心)。

  新架构落地实施是在集团公司的统筹下一体化推进的,新架构转型是一个系统化工程,也是一个很大的挑战。我们在集团下面成立了集团架构办,还专门设立了四个小组,确保架构的遵循,应用架构、技术架构、基础架构、安全架构四个工作小组。在应用架构方面采用了统一访问,由客户接触管理,将前端后台进行分离,引入新技术优化简化流程,建设通用与专属微服务中台。在技术架构方面,引入分布式架构和数据库技术,建立了自主可控的PDF-C标准体系,以及研发运维一体化的研发体系。在基础架构方面和安全架构方面,使用敏稳双态的一体化云服务标准,建设多中心多活架构,建立安全态势感知体系。规划了12个通用中心和4个专属中心,包括47个通用微服务和102个专属微服务。为了确保新架构落地,我们在实施层面还成立了PMO,负责整个项目整体协调和风险的跟进。还引入了第三方监理,确保我们基础架构标准的遵循和质量的保障。

  这是我们人保云总体的框图。人保云是数字化转型的核心,是新架构的最重要最厚实的组成部分。我们前面的规划是“三横四纵”,实际上人保云除了应用架构覆盖在上面以外,所有的“二横四纵”都会在云上面落地。人保云采用业界领先的云服务架构体系,并遵循自主知识产权的PDF-C技术体系标准,构建了基于多中心多活的云服务模式,为新架构应用提供高可用高可靠的弹性基础资源支撑。人保云体系架构包括数据中心,就是传统的基础设施和物理主机物理资源。二是敏捷基础设施,指的是虚拟化以后的基础资源。三是公共技术服务,包括微服务治理,包括数据库以及人工智能OCR五识别、大数据。四是自动化运维监控,实现端到端的监控。五是研发运维一体化。敏捷的研发测试运维实现敏捷管理。六是安全管理。同步落地网络安全相关的要求,实现安全云化。六是多云管理,在集团内实现多个云的统一管理,共有七大板块。

  在推进人保云“两地四中心”建设的过程中,我们也面临着双重压力,既要保障传统稳定运行,又要进行新架构改造。新老架构并存,给系统改造、应用上云、数据同步、新老一体化运维等方面带来不少挑战。用领导的话来比喻,我们好像是在研发飞机的发动机,可信难度之大,风险之高。经过一年多的努力,去年8月阶段性上线了南北双活人保云,南北业务双活经过多次实操演练得到验证,可以秒级实现南北业务的切换。今年我们将继续大力推进人保云“两地四中心”建设,目前我们已经建成了两个中心,还有两个中心是稳态的架构。所以要迁移,我们要将两个中心进行改造,改造成稳态的,最终形成“两地四中心”规划的布局。今年开始还会加大对人保佛山数据中心的云化改造,进一步做大做强人保云。

  花点时间介绍一下我们领先于哪几个点。中国人保在建设人保云的过程中,充分借鉴了业界的先进技术,从中国人保实际出发,大胆开拓创新,高起点规划、高标准建设,使得人保云具有鲜明的先进性,主要有:

  1、支持随需而动、即插即用的资源敏捷交付。人保云利用虚拟化技术将计算、存储以及软件等IT资源形成云化资源池,并通过云管平台,实现资源随需而动、即插即用的按需敏捷交付,支撑业务持续快速发展。我们做了一个统计,相较于传统资源交付,平均交付时间由原来1周缩短到分钟级。其实在稳态的情况下,我们的资源交互时间还是比较保守的,有的时候不止一周,一个月的时间都有。

  2、支持高度自动化的应用敏捷部署和在线投产。人保云依托研发运维一体化平台,实现了全流程灵活可配置、高度自动化、质量内建,支持应用的快速上线和在线投产,应用发布效率相较于传统架构,由原来1-2周缩短为分钟级。我们不但依托研发一体化平台实现了敏捷,而且对质量我们也做了提升,实现了质量内建和刚性管理。

  3、支持智能触发、弹性扩缩的自动化运维。自动化运维是我们非常关注的一点,因为在新的框架微服务下,传统的运维模式肯定是不行的。我们在建设新架构的时候,非常关注自动化运维能力的建设。人保云基于自动化运维平台和容器技术实现了秒级弹性扩缩能力,当面对业务访问高峰时,比如“双十一”、“双十二”可实现秒级扩容,线性提升业务承载能力。我们设定一个阈值,只要CPU和内存达到了阈值,毫秒级通过容器就可以实现资源的扩容。

  4、支持智能引流、异地多活的业务访问无缝切换。人保云采用南北多活的云数据中心架构,南北业务数据实时双向同步,实现了2000公里异地多活。其实这个还是挺难的,因为是个异地多活,在传统架构下做到同城多活就不容易,在新架构下,2000公里异地多活具备分钟级故障接管能力,有效保障业务连续性,提升用户体验。

  前面讲了人保云的几个特点,几个特点都是通过我们的创新实现的。人保云也有几个方面的技术创新:

  1、自主可控的PDF-C技术体系标准。我们自主研发并发布新一代分布式微服务技术体系标准PDF-C,涵盖微服务技术体系标准、多中心多活解决方案以及技术标准、前端开发框架、分布式数据库、分布式数据治理、研发运维一体化、监控体系、安全标准等八大领域,向上可以支撑前中台应用落地,向下可以适配人保云,以云服务的方式提供全套的分布式架构组件服务,为全集团新架构的标准统一和自主可控奠定了基础。  

  2、实现技术领先、行业首创的数据库主主复制。基于开源PostgreSQL数据库逻辑复制相关技术,通过自主研发实现分布式数据库异地实时双向同步,相较于传统数据库单向复制模式,异地实时双向同步技术可保障数据库实时在线,提供数据库级别的异地无缝切换能力,极大提升业务系统连续性,达到行业领先水平。这是我们领导非常重视的,在建设云之初就要保证自主可控,确保人保有一套标准自主可控的体系,实现全集团架构的遵循。

  3、支持复杂场景的全链路灰度配置和多版本运行。人保云提供统一的灰度规则管理功能,创新性的解决复杂的微服务体系下的灰度发布以及多版本同时运行问题,实现快速的全链路灰度规则配置,保障微服务升级时应用的稳定性和前端用户体验的连续性。传统架构是做不到的,在新的架构下可以做到不停机的升级服务。

  4、异地多中心多活体系。异地多中心多活是人保云最重要的特点,为什么?我们做运维的人都很清楚,兜底就是切换,传统架构切换的速度比较慢,在新架构下可以达到秒级切换。这一点很难,我们做了很多创新,我们称之为是创新的集大成者。其涉及的创新点包括:域名智能解析,前台无差异设计、中台单元化设计,主主复制冲突解决方案,微服务多活策略设计,异地数据传输压缩,共享支撑平台无缝切换等。通过体系化的创新,实现了全国业务南北双中心运行,业务无感知的异地多活切换,达到了业界领先的预期设计目标。

  多中心多活体系主要从接入层、应用层和数据层三个方面实现。接入层:通过GSLB+CLB+DNS技术实现跨数据中心业务引流。应用层:应用服务采用无状态容器化部署,均衡分部在南云、北云数据中心,单数据中心故障可智能引流至可用数据中心,应用服务可持续提供服务。数据层:数据库跨数据中心主主复制,南、北数据库均存有全量数据,互为备份,持续提供读写服务。其次,非结构化数据存放在分布式存储中,通过分布式存储的南北异步复制,南、北数据中心内均保存全量数据。这一点确保了我们在切换的时候数据保证是实时一致的。

  前面讲了人保云建设的技术情况,再回到主题,我们建设人保云是要支撑人保的数字化转型。目前我们总结出来四点,从四个方面很好地支撑了中国人保快速的发展。

  1、实现中国人保IT基础架构跨越式发展。南北双活的云环境,实现IT基础架构脱胎换骨式的变革,极大地提升了中国人保的IT基础架构的技术水平和支撑能力,达到了行业领先水平。传统的云架构从支撑能力上不是一个量级的,我自己的感受就是“鸟枪换炮”。

  2、全面支撑新架构应用的改造升级。人保云作为新架构应用的运行支撑,目前已成功承载新架构落地应用中的承保中心、理赔中心、费用中心等专属中心以及客户中心、综拓中心、主数据中心、用户中心、产品中心等通用中心,运行稳定,达到预期效果。

  3、赋能客户线上化和数字化运营能力。在传统集中式架构模式下,线上化应用和业务创新能力受到基础架构能力的制约,难以担负支撑数字化转型的重任。而人保云作为新型基础架构,以其弹性敏捷和海量支撑等能力,极大地解放了生产力,激发了创新活力。譬如:依托云人保云,加大数字化运营力度,稳步提升“中国人保”APP的活跃用户数量,吸引用户通过“中国人保”APP来触达各种保险及金融服务。基于人保云的实时音视频、人脸识别等技术,在各个接触界面上引导客户在线上完成,实现了无接触的在线视频理赔等服务,延伸传统的服务模式,实现直达直通客户、增强黏性。

  4、助力集团一体化战略,建立数字化合作新生态。人保云为全集团提供自主可控、统一共享的云服务,以全集团应用上云为牵引,实现全集团数据共享、全面连接,推动流程重构,支撑集团一体化发展战略。同时,中国人保在落地数字化战略的过程中,以金融科技驱动创新发展,利用人保云的开放共享特性,积极推动业务的场景化和线上化,建设线上运营平台,对接各类合作伙伴,实现渠道无界化、一体化,逐步打造数字化合作新生态。

  人保云建设是中国人保建设数字化“新基建”的重要探索实践,取得了阶段性成果,其上线运行对中国人保实施数字化和一体化战略有着里程碑意义。前期我们做数字化战略转型的时候,非常担心用的架构开始就不顺利的话,对我们的数字化转型将是一个重大的打击。目前看来我们进展的还是比较顺利的,所以人保云确实具有里程碑的意义。面向未来,将继续坚定不移深入贯彻落实 “3411工程”,决战决胜全面数字化转型和一体化战略落地,按照集团的要求规划,我们今年要全部落地新架构转型,应用全部要实现分布式微服务改造,除了个别不太适合进行微服务分布式改造的,最终形成分布式架构。持续深化人保云平台建设,赋能中国人保构建“保险+科技+服务”新商业模式,打造具有卓越价值创造能力的保险金融集团。以上是我的分享,谢谢大家!

0