购物车
我的足迹

百度副总裁喊话银行业:ABC时代来临!

加入Vip免费下载 立即下载
百度副总裁喊话银行业:ABC时代来临! 百度公司副总裁、百度云总经理尹世明 各位银行界的专家以及同仁,非常高兴今天来参加这 个会议。去年的12月,当时百度内部有个会议,这个会议 在讲云计算、人工智能、大数据到底会怎么发展?当时在 想一个问题,就是有大量的企业其实是不愿意上云的。有 人说是因为保守,也有人说是因为对于数据丢失的恐惧 ,还有可能是因为对数据的恐惧,对上云之后到底能带来 什么质的变化,能带来业务流程的新变革吗?心存疑虑。 也许能够带来一些服务器资源的节省,但即使节省一半 ,那其实也没多少钱,所以很多人会说为什么要上云。但 是在我们看来,云计算的核心是说它很有可能是一个新的 时代,就是因为云的产生,所以才有了大量的数据,因为 有大量数据的产生才有了今天的人工智能,这三者是三位 一体的。所以说从2016年11月份开始百度提出 ABC(AI人 工智能、Big Data大数据、Cloud Computing云计算)三位 一体,应该是以这样的一种方式去探讨未来的技术架构 ,所以我们提出Cloud2.0 。 今天我们谈这个问题的时候,先来看几个案例,这是 国家开发银行的授信评审的连接数据,大家可以看到很重 要的一点就是引入了外部的数据。百度的爬虫每天对全球 的网页进行抓取,某一个钢铁企业是不是发生了一些问题 ,或者这个钢铁企业可能在一个很偏远的法院里面,已经 被人诉讼了,这是不是个风险信号?这是不是比财务报告 更加直接的一个风险的预警?显然是的。另外一点,开始 有一个集中区域里面有人员在说某一家钢铁或者另外一个 放贷企业的老总的身体状况,或者有人说欠薪怎么办,那 是不是一个风险的预警?这是非常显性的风险的预警,但 这些靠传统的企业内部的数据是无法获取的。这个案例就 是大数据的应用。 什么叫大数据?如果我们定义大数据是企业内部的数 据,它就不叫大数据。今天企业内部的数据量其实是很有 限的,百度每天处理的数据量在100PB量级,这还是去年年 初的一个数据。今年视频一来之后,这个数据可能要成倍 增长。那么大数据的核心是什么,大数据的核心在我们看 来有可能是要开始突破企业的围墙,不能够再以一个企业 作为数据来源维度,应该是要放宽视野,在更大的范畴里 面去寻找数据的来源,所以要突破企业的边界。 那么这里面,我在讲这个架构的过程里面,我首先讲 两个案例,一个案例是我们跟某一个银行合作,在传统的 信用卡申请时,你担心申请人不合规,不合法,之前的算 法是基于规则引擎,大量的程序设计员或者算法设计员设 计一个规则,由这个规则定义申请人是不是合规、合法 ,所以这些人的思想和想法,就限定了这个规则本身只能 达到这个水平。但是,人工智能改变了这个游戏规则,怎 么改变呢?可能是基于一个深度学习的平台,比如 Google的Tensor Flow,百度的PaddlePaddle,以这个进行 训练,然后产生一个能够科学评估并不断根据新数据来进 行自我修正的模型,我们跟这个银行合作,作为一个试验 性的项目,其实训练只花了一个礼拜的时间,模型的成功 概率就达到了90%以上。以往最高也只能达到80%。人工 智能基于对数据的学习和训练,可以帮助你找到基于无穷 变量的一个规则,而以前所有计算的规则是基于一个有限 变量的规则,这是不一样的。 再讲一个实际的案例,我们跟首钢(北京首钢自动化 信息技术有限公司)合作了一个基于计算机视觉的质量检 查,来提高首钢在品控方面的效率和精度。以前是要通过 一个非常昂贵的做法才能去辨别的。首钢给了我们20万张 质检车间的钢材图片,我们在四天之内完成了图片所有特 征的标注,在标注之前,在数据产生价值之前是纯人工的 智能,你要人工去标注它;标注完了之后,对这些数据进 行了学习训练,最终这个模型对瑕疵钢材的识别准确率是 99.8%。以前的我们会预定一些规则,我喜欢把它叫做 pre-define,然后以预定的规则去指导我们的业务,但今 天可能会发生变化,这个pre-define像pre-train,就是预 训练的规则。这个预训练的规则你是不知道其所以然的 ,你只知道它确实管用,而且你只需要了解它管用就可以 了,里面到底什么原因?不知道,也不需要知道。那么意 味着什么?意味着我们要改变一种方法,这种方法就是我 们的规则没有必要靠人为去制定,而规则是要靠学习出来 ,靠训练出来的,这是第二个重大的变化。 那么第三个变化,百信银行今年二月底的时候我们开 始为他做一个系统,我记得当时提的一些要求还是觉得蛮 挑战的。第一就是它一定要坚决地去掉Oracle,全部基于 分布式架构搭建一套基于X86的架构,后来我们实现了,底 层架构是完全基于分布式X86的架构,计算能力是完全可以 灵活扩展的。另外一点,它基于X86和那个分布式系统之后 ,它的成本也就变得非常低。我们在上线的时候做到的 TPS是4800,但其实对于我们来讲,如果它要乘以10倍,做 到五万,对我们来说技术上完全没问题。如果要更多的我 们也可以探讨,因为这个其实计算的算力以及算的方法已 经完全不一样了。  服务的连续性和可靠性,我们正在努力,希望使RTO和 RPO两者都接近于零。但是现在可能还不能完全做到,计算 这个领域也发生了变化,可以看到它整个的架构搭建,底 层是计算虚拟化了,存储虚拟化了,网络也虚拟化了,也 完全符合监管的要求。而且一个海量的数据分析平台可以 完成各种各样大数据的处理。 第三个方面是什么?目前对于算力的理解和计算的理 解应该是不一样的,算力如果乘以10倍之后还是用老方法 做原来的事情,好像是有点儿不太对,对吗?因为你已经 有了本质的提升,但你却还是用老的方法在做所有的事情 。刚才其实我通过三个案例,一个是讲了B,也就是Big Data领域的一些内容,一些变化;一个案例讲了AI,就是通 过数据形成智能;讲了C,Cloud Computing的案例,三个 领域的三个案例。所以三大特征,第一个是数据,我觉得一 定是要打破数据的围墙。对于银行业有各种各样的监管的 要求,这一块还是需要探讨的,但是外面的数据实在是汹 涌澎湃的,怎么去利用它?以传统的架构利用它,还是用 新的架构利用它?我觉得这是个问题。第二个,算法的规 则已经发生变化,我们的规则应该既要涵盖预定义的规则 ,也要涵盖预训练的规则,而预训练的规则将可以打开一 扇完全不同的窗。第三个,就是算力的边界,所以ABC三者 三位一体能有一些新的变化。但是刚才我讲到所有的案例 ,从百度来看根本的变化在哪里?看到有C的变化,有B的 变化,有A的变化,因为计算能力的提升产生了大数据,因 为大数据的提升产生了一个人工智能新的一个时代,更核 心的在哪里?1992年之前是大机的时代,大机的时代是非 常封闭的,1992年之后可以发现整个IT行业迎来一股春风 ,也就是Client Server,客户服务器架构,而客户服务器 架构开始在硬件软件和服务这块进行解耦,你会发现硬件 方面有IBM,也有Unix服务器,也有Dell。软件方面你会发 现ERP方面有SAP、有Oracle,数据库方面有SyBase、 Oracle和MySql。服务方面,你会发现有了埃森哲这种企业 。 Client Server造就了一个时代,这个时代持续到了 2011年,在我个人看来,但随后突然发现这个时代受到了 巨大的挑战,最佳业务实践好像已经不再可以成为最佳了 ,咨询公司的建议好像已经不再可以满足快速发展的需求 了,为什么?因为世界发生变化了。大机时代和客户服务 器时代是是企业级的时代,企业级还可以在里面说,我把 企业这一环节统一起来之后,把企业的数据统一起来之后 ,可以产生巨大的红利。但是今天突然发现一个分布式的 时代来临了,一个区域中心化时代来临了,这个时候你突 然发现,企业就是自建的围墙,如果你在围墙之内去运行 的时候,你有很大的阻力,你的思维打不开,为什么?你 是企业级的,企业级就是很大的问题。传统的挖潜,已经 达到一个相对极致的地方了。传统的企业流程再造已经不 足以去完成企业更大程度的优化了,这个时候要向外挖潜 、向外整合,但是传统的架构限制了我们的数据只能是企 业级的,我们的流程只能是企业级的,我们的做法只能是 企业级的,但是我们坚信ABC的时代来临了。ABC的时代 ,计算这个环节是cloud,基于cloud