都在说大数据时代,数据就是竞争力,互联网金融冲击传统银行业。银行业的人自己怎么看大数据,大数据究竟怎样在传统银行内部发生作用,*听听银行内部的人讲讲他们的工作。
以下是光大银行刘锦淼在“2013云世界大会”上的主题演讲摘要,从架构到应用讲述银行在大数据时代是怎么搭建基础设施以及采用大数据技术:
光大银行自己内部在讲2013年是光大银行的大数据元年,从数据治理、数据架构规划、数据仓库不断的升级扩容、新技术的应用到数据分析、挖掘、相关的技术准备、相关的协助配合,基本上我们已经做好了利用大数据发挥价值的准备,我们想2014年我们会有更多的探索在这方面。
数据服务有三个方面:
一方面,我们是属于全国性商业银行,首先*步就是要面向总行提供专业的数据服务;第二方面要面向分行提供数据服务;最后,面向业务发展的热点,不断提供数据分析报告,利用大数据来找到业务关联,发现业务机会。
举几个例子,*个例子,国内银行很少能实现,这也是我们梦寐以求想做的事情。这是荷兰银行,在他们的网站有一个很简单的图片,也就是说客户来了以后会看到一个广告,比如说车贷。客户看到这个广告以后,想在网站上做个计算,可他误使用的是房贷计算器。银行实时看到用户在使用房贷计算器,会自动把这个用户看到的页面广告变成房贷广告。这个房贷广告只有这一个客户能看到,其他的所有客户看到的还是刚才的车贷广告。
这说明了什么呢?说明这家银行在它的网银门户上做实时营销。分析客户在他网上银行的点击记录,对非金融性交易的数据进行实时分析以后做的针对式的营销。这是荷兰银行做得很有意思的地方,现在国内很少有银行能做到实时营销。
光大银行近期在发展社区银行,也运用到大数据分析技术,我们会拿到很多外部的数据,包括像58同城数据、大众点评数据、搜房网的数据,还有一些社区规划的数据,包括对社区银行经营模式的定位,以及差异化对社区银行资源配置等等。
下一个例子是新浪微博的舆情监控分析。对于互联网这种数据的查取,包括用中文语义进行关联性的分析,现在很多公司都在做,光大银行先做一些探索。分析了一下现在光大银行银行在舆情上的数据,发现理财需求还是最重要的,这是光大的特点。
另外,针对客户情感的变化,去做一些营销。还可以分地区,不同的地区、不同的互联网用户的特点是不一样的。
怎么用好大数据?我们有这么一个描述,从初步探索到大数据的尝试使用,到最终我们要部署应用使用,这里面包括很多步骤,包括组织、包括大数据的获取,包括我们怎么用大数据,在哪些领域去分析,包括我们讲的客户营销领域都会用到,最终我们会用成熟的大数据应用,包括我们大数据的一些相关的管理制度去规范大数据的使用。
从数据架构的角度来讲,我们可能需要突破原有的数据应用架构来做,包括现在的数据要求更快,刚才讲到了要求到T+0了,现在我们做到的基本上都是T+1。
从架构的设计目标上来讲,我们需要满足多样化的数据服务需求,从单一的平台过渡到多元化的结构,最终我们要具备更广泛多样化的数据处理要求。这需要银行有开放心态,跟更多的厂商交流合作,把架构真正的应用做出来。
最后是一个新技术的应用,也就是Hadoop。虽然很多人都在讲Hadoop不代表大数据,但是Hadoop是大数据的一个非常重要的应用架构。现在银行基本上是有对于大数据处理的架构,包括我们现在有的Oracle的一体机等等,横向扩展性都是有局限的,但是对Hadoop来讲,横向扩展性非常强,成本非常低。所以,Hadoop未来是非常有竞争力的。
光大银行对于Hadoop来讲做了一个什么样的尝试呢?因为银行都有历史数据,我们从1999年系统大集中以后,十几年的数据一直是在非在线的状态,会有很多的历史查证的要求,包括客户、监管机构、检察机关,都会来我行进行历史数据查证。这种查证的效率是非常低的,怎么样解决查证的高效支持呢?就是Hadoop。
把历史数据查询功能架到Hadoop的基础上,其实最重要的是我们真正用了这种开放Hadoop的架构技术做一个银行非常传统的业务,这当然是我们现在看到的银行敢不敢把Hadoop用在业务上的创新尝试,我们现在用得还蛮不错,我想后面我们会有更多的领域去尝试Hadoop的技术。最后这是盘活线下资产、盘活数据价值的方法。