春晚红包是金融云掀开门帘的“一只手”。
你也许记不得谁在今年春晚上唱了什么歌,但你肯定知道“谁”在彼时人气最高,“敬业福”;你肯定不知道拿着手机“咻一咻”了多少次,支付宝却统计出一个总数:3245亿次。
记者了解发现,这个天文数字得益于一套完整的金融级云计算、大数据与移动互联技术平台的强大支撑。春晚红包的背后是支付系统的升级,以及在“灵动”“弹性”的第三代技术架构下,支付宝实现了从互联网金融架构基础上逐步拓展出了能同时全面支持生活互动场景类业务的技术架构体系。
天文数字下的“收”与“放”
据支付宝官方数字,除夕第一轮“咻一咻”历时5分钟,互动次数达677亿次,仅五分钟就超过去年春晚全程的全场互动次数,而且是超后者6倍;到21点10分,前两轮“咻一咻”互动次数合计突破1808亿次,是去年春晚同期的16倍……
在马云练太极拳的雕塑旁,从用户“咻一咻”到最后资金到账的过程,被蚂蚁金服支付事业群技术部研究员倪行军描述出太极“收”与“放”的味道。
每个开奖阶段即为“收”,5分钟之内,6000万个红包花落各家。伴着清脆的一“咻”,每次点击屏幕的请求通过网络被送至“蚂蚁”的数据中心,然后服务器将该任务按照规则,交给不同的业务集群去处理。
在此阶段,技术人员将整个业务系统前置,显示出很好的“弹性”,使红包系统承担起了亿级每秒的请求处理能力,让所有用户的请求都能及时进入红包系统,并实时得到反馈。
几乎在同时,系统启动了第二阶段的任务,“放”。即把6000万个红包资金快速准确地存入中奖客户的支付宝账户内。倪行军说,6000万个红包资金需要在分钟级内到对应的6000万个客户账户,然后再将相应资金准确打入其中,完成这些巨大挑战,全靠基于多年支付金融技术发展沉淀而来的金融云平台的处理能力。
原来,当春晚红包被还原成数字世界的“0”和“1”时,其运行轨迹看起来就非常熟悉了——各种任务最终都转化成对该系统支付能力的考验。
得益于整个金融云在技术架构、设计理念上与传统银行架构的不同,系统不但处理能力可以弹性增长,而且仍保留金融级的高可靠性、准确性要求,整个过程中4场每场6000万个红包发放做到了0差错。
技术碾压出“丝滑”体验
从主持人口播至红包到账,春晚红包团队形容当晚的系统运行“如丝般顺滑”。这种丝滑的前提是,将技术难点统统碾碎。
在海量业务并发的考验下,很多小问题都会升级称大隐患,就更不要说原生的技术难点了。
春晚红包活动完全基于手机客户端,每场活动内容、奖品设置、展现形式、时间要求都有差异,包括如何保证所有人能在约定时间点起开抢红包,都是对“客户端动态控制技术”很大的挑战。为了解决端和云的联合协同,技术人员在方面做了很多定制升级的研发。
大家“咻一咻”过程中要么是点中红包,要么是抽中福卡,要么是页面弹出图片或视频。几亿人同时在移动客户端对资源集中并发访问,技术人员为此开发了专门的“资源加载管理技术”。
每场都有6000万个现金红包以及大量福卡,这些奖品要实现类似于淘宝商品秒杀的库存管理以及类似于铁道部的票源管理,即在接受上百亿的并发访问时不出错,技术人员还开发了专门的“奖品控制系统”。
每秒亿级的任务请求,可谓“业务洪峰”。倪行军介绍,“我们利用历年大促的洪峰预测模型预测可能的链路反应情况,并根据反应利用‘独门秘籍’,对上千系统进行全链路的压力测试,检验、修正系统指标是否符合预测,并在春节期间对上万台服务器资源进行了快速的调配部署。”
在“咻一咻”的同时,我们在页面可以看到一个根据实际中奖情况在实时变化红包减少的倒计数条,数字变化精确到秒精确到个位数。就这样一个数字展示背后是大数据的实时计算能力,是“实时大数据处理技术”。
此外,据了解,除夕夜技术团队把所有可能想的到风险全部列出来,每个风险点都配上了相应的技术预案,“技术预案是以千为单位的”。
“蚂蚁”、“蜂群”、“大象”
准确地说,春晚红包是蚂蚁金融云掀开门帘的“一只手”。门帘那边,是金融创新的新阶段。
技术专家向记者强调,红包其实是在互联网金融场景要求的前提下,加上生活互动类的场景应用的云应用。“跑在金融云上的春晚红包背后是一套轻巧、灵便、弹性十足的分布式技术架构。”倪行军表示。
据介绍,传统金融机构普遍采用集中式架构的IOE系统(IBM的小型机、Oracle数据库、EMC存储设备),而云计算是分布式架构,其最大特点就是扩容方式简单——只需要加机器就可以满足数倍涌入的需求量,且系统本身不受压迫,它可以全自动、标准化操作。
“灵动”与“弹性”是描述其用到最多的形容词。传统金融技术架构的开放性是紧耦合的,而基于云计算的金融技术架构是松耦合,并强调开放、协同的理念。
有一个比喻被用来说明传统架构和“云”的区别:传统集中式的架构犹如一头大象,力大无比但是身上任何一个器官组织的问题都会导致大象生病,系统不可用,并且一头大象的力气增长是有限的;而分布式架构就像一个蜂群,著名互联网先锋凯文凯利在《失控》一书中曾举例,“一个蜂群的行为特征,如果从个体的蜜蜂来看是找不到的。但蜂群的整体行为特征又是从许多个个体而来,比如说蜂群拥有的记忆能力,如果我们用某种杠杆衡量蜂群的记忆能力的话,它要比单个的蜜蜂的记忆能力长很长时间。”并且蜂群的能力不会因为其中几个成员的损失而丧失机能。金融云的架构就比较灵活,当数据量小、运算量少时,投入资源也可以少,数据量增加后也可以方便进行弹性扩展。
目前,保障大家“顺滑”抢红包的蚂蚁金融云上已驻有芝麻信用、天弘基金等不同金融业态的用户。这些上了“云”的金融机构,付出远低于传统金融技术的成本,就能够拥有处理高并发金融交易、海量大数据处理的能力,提升了金融业务创新与风险控制的能力。这些实践也让人看到了云计算与大数据技术服务于金融行业更多的可行性。而这也正是这朵“云”所希望的,在未来能够帮助更多金融机构、中小金融机构,能够让他们从金融转向新金融,让其带来更多的产品和业务创新。