“快!很快!非常快!” —— 众安保险上云经验谈

avatar 2018年6月27日13:20:07 评论 243

摘要:阿里云服务从开始到现在已经有九年的时间,阿里云和用户一直彼此成就,共同成长,在用户的支持和鞭策下,阿里云服务也不断的在成长,越来越多的企业也通过阿里云激发业务和技术的化学反应。本文将带领大家了解国内最大的互联网保险公司众安保险的上云之路,首先对互联网保险和众安保险进行基本介绍,然后介绍众安保险上云动机以及为什么选择阿里云,同时详细介绍阿里云计算如何满足并保障众安保险的业务场景,最后介绍了众安成立的科技团队目前及未来所做的创新性研究,并如何将这些研究成果赋能到金融行业的伙伴中。

 

 

本场视频观看请戳:https://yunqi.aliyun.com/2018/shanghai/review

PPT下载请戳:https://yq.aliyun.com/articles/602764 

 

宾简介:

梁亮,众安保险应用运维负责人。

 

以下内容根据演宾视频分享以及PPT整理而成。

 

本次的分享主要分为三部分:

一、网+:该部分主要介绍互联网保险和众安保险的基本情况,然后介绍众安保险为什么选择上云以及为什么会选择阿里云。

二、业务: 该部分主要介绍众安保险业务云计算搭建了怎样的服务,怎样满足企业的业务场景。

三、未来:该部分主要介绍众安成立的一系列团队所做的创新性的研究,包括人工智能、区块链、容器化以及大数据等方面的研究,以及如何将这些研究成果落地到保险行业的场景中,并将这些技术赋能到金融行业的伙伴中。

 

一、互联网+保险

 

说到互联网+保险,这几年比较火热。什么叫互联网+保险呢?其实就是利用互联网的一些科技技术,比如现在的大数据、云计算等,重塑保险行业的价值链,将价值链服务化,然后通过互联网的形式展现出来。这也是众安保险的构思。

 

 

众安保险简介

 

众安保险是国内首家获得互联网牌照的保险公司,也是目前国内最大的互联网保险公司,无论从数据量、保单还是销售金额都是全国第一。众安保险目前形成了五大生态圈,在公司内部也是五大事业群,有消费金融、电商、汽车金融等,目前已经链接了超过两百家的线上渠道,所有的保险是通过线上的场景和服务来进行购买和理赔,没有线下的销售门店,这也是众安保险的特点。因此,在公司内部,工程师及技术人员在雇员中占比超过百分之五十,众安科技里超过七成是技术人员,过去三年科技投入分别占当年保费的2.8%、2.8%和6.3%,这说明了它不是一个传统的保险公司,而是一个互联网公司,

 

3063e27d49c580f75c9027fde766db11b21e208e

 

众安保险发展历程

接下来向大家介绍一下众安保险的发展历程。公司是在2013年的9月获批开业,然后11月份正式开业,开业之初为了技术需要,更快地服务于市场,公司选择从商业合作伙伴方购买一些核心的业务系统,系统运行一段时间后,技术团队发现所购买的系统所属的第三方厂商的服务能力和服务要求跟互联网发展的速度不太匹配,因此公司决定自建核心业务系统,自建技术团队,历经五个月的时间,公司于2014年4月上线了无界山的核心业务系统,替换了原有的业务系统。由于公司在保健行业业绩不错,获得了行业认可,也于2015年6月份完成A轮融资,募得人民币57.75亿元。2015年11月份,公司联合平安保险一起发布了保骉车险品牌。经过三年的沉淀和积累,公司想把在保险行业产生的技术沉淀拿出来赋能到行业伙伴中,于2016年11月份正式宣布成立众安科技,除了赋能以外也在做一些前瞻性的研究,比如刚才提到的人工智能和区块链,众安科技在区块链这方面有非常不错的研究和输出,包括开发了自有的区块链平台。2017年9月份公司与港交所上市。

 

4482e91d01af71dcdb72c064ae4956cf8d0fdd43

 

互联网场景下保险系统的挑战

既然是互联网保险公司,那么在互联网场景下保险系统面临哪些挑战呢?

1)  1)业务需求。传统的保险公司每日的保单量可能不会超过一万笔,但是众安保险在上线初期,在业务场景很单一的情况下(当时的主要来源是股东业务,如淘宝运费险),每天的保单量在三百万至五百万件。众安保险的业务需求是小额高频场景,大家都知道运费险是一个单价非常低的保险种类,一般的保险公司不屑于或者不愿意去做这种尝试,因为技术系统要求特别高,难度也比较大;其次是要满足高并发交易,因为每天的数据量比较大,累积之后会是非常巨额的数据量;这就对数据的海量存储提出了较高要求;最后是产品要求快速上线,公司内部因为一些扁平化的结构,有大量的产品经理,每个产品经理会有自己负责的团队,服务于产品经理实现产品的快速输出。大家知道保险产品可能还要涉及到产品的备案、精算以及和财务的一些内部合作,这样的一个过程从需求到设计开发,最快可以两周上线一款保险产品。

2)  2)技术需求。公司有众多的技术团队和各种各样的技术人员,为了快速地交付技术开发产品,需要应对一些大流量(如双十一)下的线上场景的正常服务稳定,需要考虑到弹性架构,产品的快速迭代交付,不同团队之间需要考虑怎么样协作可以更加快速地交付产品。

3)  3)监管要求。虽然众安保险是一家互联网+保险公司,但是本质上还是属于金融行业,由保监进行监管,监管会有很多监管条件需要满足,包括每年大大小小的审计,如IT审计、财务审计和内部审计等。对于平台稳定性,数据安全以及容灾架构的要求非常高。

 

e0c22f488d7cdf60ac5f4ecc3d4a6ff21f3015c3

 

自建还是上云

公司在项目初期包括在给保监会做项目调研的时候,做了一些方案对比,包括传统方式和云计算,从业务的快速扩展、产品周期的缩短以及成本的控制角度来讲,云计算更符合公司的业务场景需求。在价格方面,对于当时的业务场景,云计算的价格只有传统方式的五分之一,这种价格优势对于公司来讲非常有吸引力。除了价格优势,相对于传统方式,云计算具备动态调配、弹性伸缩、产品丰富、即买即用以及服务及时的特点。因此,众安保险选择了云计算,成为国内第一家核心业务上云的公司。

 

555796792d1fb389574f58226758642a54fbb30c

 

为什么选择阿里云?

既然决定上云,怎么去选择云服务提供商呢?在选择过程中调研了国内外的一些知名的云服务提供商,比如阿里云、腾讯云、微软云和亚马逊云,主要从四个方面进行对比:产品功能、方案能力、合规能力和服务能力。通过对比最终选择了阿里云。

1)  1)产品功能:阿里云从2009年就开始提供云服务,产品功能丰富,在产品性也具有很好的经验能力。

2)  2)方案能力:阿里云成立了专门的金融方案技术团队,提供专业的金融云,安全性级别比较高,也提供一站式的解决方案,这是当时选择阿里云的一个重要因素。

3)  3)合规能力:阿里云本身有很多的金融场景,也会和监管进行大量的沟通,也成立了单独的合规团队,可以帮助企业做监管的沟通,包括对项目的整体验收。

4)  4)服务能力:阿里云提供7*24小时全天候服务,也有专有的服务团队和企业对接。

 

5acd2ce79af831213f66657f04bcc49e844bcfbb

 

二、业务云计算现状

 

接下来介绍一下众安保险上云之后通过云计算获得了什么能力以及公司自己构建了什么样的云。

 

下图展示了众安保险目前使用到的云计算产品,从底层的服务器计算与网络到数据库存储,再到大规模计算,再到应用服务和安全管理。大规模计算是众安保险比较重要的一个资产,因为公司有海量的数据,这些海量数据可以用来做数据挖掘,给用户画像,从而建立公司自己的生态。公司会有大量的中间件产品,刚才提到的也有一些异步的解决方案。另外最为关键的是,众安保险使用了阿里云的一些安全产品,特别是在2017年9月份IPO期间,当时会有大量的攻击,阿里云的一些云产品比如云盾会帮助公司做清洗,然后云监控可以提供多种可用性的监控和服务监控等,这些云安全产品对于保证公司的数据安全非常重要。

 

bdb83b566c4b06e84cba3cb2680c80d3e845742a

 

有了上述产品之后,众安保险做了什么呢?下图展示了众安金融云初期的简要架构,也是阿里云推荐的一个解决方案。用户从各种终端开始发起交易请求,访问的是阿里云的防火墙服务,到负载均衡SLB,负载均衡下面是一些ECS应用服务器,中间可能还会用到一些中间件,然后后端通过分库分表最终将数据落地到数据库中。

 

d2c172a7806d6b021599ede130b729cc683f100a

 

无界山用系

下图展示的是前面提到的无界山应用系统架构,它是四年前基于云计算搭建的保险核心业务系统。这套业务系统目前支持海量的数据存储与查询,量级达到上百亿级,2017年的双十一成功支持每秒3.2万笔的处理峰值,当天保单处理量达到三亿笔,所以对于业务系统的要求会非常高。前面也提到,公司新产品上线实际最快是十天,这对于传统保险公司来讲是一件非常难实现的目标。另外,公司的自动化承保率和理赔率超过99%,因为数据量确实是太大了,人工难以完成。应用系统年发布次数超过三万次,根据应用系统不同的业务场景,公司有相应的业务发布系统,比如支持PHP,传统Java war或jar包以及容器化技术。

 

从下图中可以看到,最底层是大数据平台的支持,在此之上是众安保险自己的一些业务模块,如保单、理赔以及再保等,然后对接相应的业务渠道,公司也有自己的开发平台,可以为用户提供标准化的解决方案。

 

c6ad65692bf909b7c44ee9068bb7aa1fa1a682d0

 

 

基于云计算,众安保险历经五个月的时间,很快完成了符合监管要求的传统方式五年才能完成的“两地三中心”的备灾体系。目前可以做到的是单机房故障不影响业务提供,另外双机房故障的恢复时间也非常短,数据库实现的是阿里云自带的主备切换,三十秒内可以完成。

 

b1d810fb14d185565084d50ae10f79fb841f0c45

 

前面提到了每年要实现三万次应用系统的发布和迭代,这是如何实现的呢?首先,公司有大量的人力,目前公司整个工程师体系大约有1500人,每天有大量的项目需要交付、上线、认证。从项目需求开始到开发再到测试和最后的发布,都会有相应的自动化系统支持,下图展示了公司系统项目的整个生命周期。

 

63b1a55b53cd4f01b4596ad7f36d3c06b0a75a46

 

 

除了项目生命周期以外,实现三万次高质量发布还需要自动化运维的保障。

1)开发:从开发阶段开始,目前支持的语言有非常多种,包括Java、Python、NodeJs和Go,工程师能够自由发挥;

2)测试:测试包括单元测试、接口测试、压力测试,因为经常会有一些大促比如双十一。目前提供完整的自动化测试流程来保障应用程序的质量;

4)预发布和正式发布:包括预发布、灰度发布、AB测试和回滚策略,提供完整的发布机制,使得需求上线更加可靠;

5)线上运维:包括自动扩缩容、自动上下线和智能监控,生产环境的系统也有多种方法来保驾护航;

6)异常处理:包括报警、故障台以及自动修复,即使出现故障,也能尽早发现,自动处理。

整个自动化运维底层是基础设施,然后是CMDB以及资源的管控,在此之上是容器化管理平台和一些中间件的平台。

 

827d71f2e4a67f6533ffbdfded69241661b626fc

 

刚才也提到,项目每天要上线大量的产品,那么怎么样提高和确保上线产品的质量呢?众安保险通过工具重新定义了测试的价值,使得测试人员可专注于案例设计,其提供接口测试、移动测试以及Xstress等,另外还提供数据银行来产出数据,因为一个线上的保单无论投保还是理赔都是一个很长的周期,大家可能只需要在手机上点击一个按钮,但中间可能经过的系统要超过十几二十个,所以有大量的数据产出。

 

328e125dd61317c9ba694933dcf1622395f81c55

 

 

下面再介绍一下众安保险使用的中间件平台(下图),公司内部也有自己的中间件团队,底层会自建或使用阿里云的数据或缓存服务,然后会搭建自己的数据路由,数据监控用到开源的分布式系统LZK,另外由于数据量过于庞大,为了快速响应索引和查询,也会部署自己的搜索引擎。通过流计算来进行实时的业务处理,同时也用到异步消息处理和容器的配置中心等。最上层做的是统一授权和一些邮件服务网关。下图(左)包括一些配套的运维支持,如SDK和CMDB等。

 

0dad0c3a1a2831b32565c1ead4fd562df7ab2b3d

 

下图展示的是众安保险自建的DevOps平台,它是提供公司内各类IT系统资源申请的自动化处理平台, 提供各类申请表单和审批工作流。通过简化审批流,对接自动化处理流程。简单来讲,内部人员可以在平台上申请需要的技术资源,包括工程项目的申请、权限的申请,该系统目前为公司节省了大量的人力资源。

 

6fbaa386e2bbff61f1072fd6734b94c26a43aa50

 

众安保险基于云资源提供的一些接口自己做了一些CMDB的平台,除了正常的资源管控、资源购买以及一些正常的应用系统的管理,也丰富了应用代码工程库的管理,还提供了容器初始化的管理以及基础资源的监控,另外众安目前也和阿里财务做一些数据的分销。

3157458e946acfc9c16ed53de246cf161daa436b

 

阿里云服务技术支持为企业提供至尊服务、尊享护航服务以及专属服务团队。

1)企业至尊服务:目前众安可以得到阿里7*24小时的监控服务,在线值班。尤其在大促期间,阿里云服务会对公司项目做容量规划,多次沟通,确保整个业务在大促期间是正常的。同时还提供性能调优、数据库DBA服务以及安全防护。

2)尊享护航服务:阿里云提供专家保障团队、系统容量分析、架构优化以及安全容灾规划等服务。

3)专属服务团队:对于重大项目阿里云提供协同推进服务,促进需求落地,同时提供业务云架构咨询和定期交流反馈服务。

c72a1275045e0eb33c63207a3a725c09ca9b3a2b

 

双十一无论对于阿里还是众安来讲,都是非常重要的节日,在这一天的数据量会出现爆发性的增长,那么怎么样保证这些爆发性的业务能正常满足呢?

1)项目准备阶段:公司内部在该项目阶段前期会做相关的评估,比如和阿里云工作人员合作做业务容量评估,性能压测,阿里云人员会帮助企业做资源的打散,很好地支持并解决了之前2015年、2016年遇到的资源紧张、性能下降的问题。

2)项目进行阶段:阿里云提供专家护航团队、应急响应支持、风险预案应付、大盘监控系统来保障系统的平稳运行。

3)项目完成阶段:进行项目复盘总结,组织过程资产。

 

633081cbf0b82c44bccfdc76dfcb1c2df822b1bb

 

除了和阿里云服务团队的合作,众安在2015年还和阿里云的测试团队以及阿里巴巴的测试团队进行了合作。众安是当时第一个使用云效平台的,使用的是私有云的部署方法,部署在众安保险金融云的账号中。在使用之后,阿里云将这套平台逐渐云化,并提供这套服务给大家。另外,公司也和阿里云的财务团队进行合作,因为众安使用的阿里云虚拟机将近有三千台左右,数据库资源有一百五十台左右,每年的费用是一个非常庞大的金额,金融行业对于监管财务会有很多要求,包括账务分摊,目前公司和阿里云财务在做一些数据的分摊。

1f5ac260de4ae663367bb73c0a0e2bb623dfce40

 

三、未来

之前提到了,众安目前成立了自己的科技团队,在AIOPS方面做了一些研究。其实众安在2015年便开始了一系列的研究,尤其是容器云的研究,目前公司已经有百分之五十的业务是跑在容器上,当时采用的框架是Docker,从2017年开始选择的方案是K8s,现在新的科技的业务已经有百分之七十是在新的平台上运行。除了容器云以外,还有数据农场的研究,通过对数据的清洗、挖掘以及监控,提供更加丰富的数据加工接口出来,众安目前诞生了自己的数据洞察平台,可以支持独立化的部署,为外部的合作伙伴提供一系列的解决方案。另外还有监控及监控可视化体系,众安目前有自己的可视化大屏,用户可以非常简单的拖拽生成一些报表图片。众安目前也在研究自己的安全系统,诞生的一些系统目前在保险行业内部得到了很好的使用。

 

fa8df45d5256d967c171c66e3dff44a33c4e7021

 

最后总结一下众安保险使用阿里云计算的心得,对于众安来讲,上云的体验非常好,因为不用再关心机房在哪里,不用再关心业务到底在哪里;另外不像某些商业软件对于金融行业的企业收费高昂,阿里云支持按需使用和购买,且价格合理;最后值得一提的一点是的使用阿里云计算的感觉是快,很快,非常快!

 

 

本文由云栖志愿小组李杉杉整理

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: