旗下微信矩阵:

无隐私时代,数据库公司的500亿估值从何而来

与国外相比,中国数据库行业的起步要晚了20多年,但现在可能是发展势头最旺盛的时候。
2022-07-18 16:03 · 微信公众号:有数DataVision 李康平

2008年,中国联通收到了外国数据库企业甲骨文(Oracle)的一纸罚款通知。

按照数据库行业的商业模式,客户不仅需要购买产品,每年还需要交大概20%的服务费。不过,中国联通嫌服务费太贵就没理会。于是,甲骨文要求联通缴纳6000万元的罚款。

中国联通,作为国家副部级单位,一般机构可没有敢与之叫板的勇气。但面对甲骨文,不仅乖乖交了罚款,还继续购买了它的产品。

和芯片、操作系统一样,中国在数据库行业上长期被外国卡脖子。

甲骨文使用单位下至广州部分农商行,上至中国邮政和中国移动这种巨无霸。2021年,花费1.45亿美元采购甲骨文数据库时,中国邮政的公告中透露出了一些无奈:“当前多个核心生产系统使用Oracle数据库进行数据存储和处理,无法替换”。

数据对国家的重要不言自明,中国也一直在摸索数据库的国产替代。在过去20多年的时间里,形成了四个初具规模的国产品牌。

它们分别是:人民大学负责的人大金仓,南开大学牵头的南大通用,浙江大学布局的神舟通用,以及本文主角,由华中科技大学教授冯玉才一手带大的达梦数据。该公司拟在科创板上市,它的估值达到了500亿。

招股书显示,达梦数据2019-2021年营收分别为3亿,4.5亿,7.4亿,净利润为8374万,1.44亿,4.38亿,盈利水平较高,其中公司主营业务毛利率三年分别高达80.32%、90.27%和 90.60%。

通过精读招股书,文章分为三个主题:

1.数据库是做什么的?

2.达梦数据的经营质量如何?

3.国产数据库的前景怎么样?

01

基础设施

数据在我们的生活中无处不在,从早上刷健康码到中午点外卖,再到晚上刷短视频或者购物,种种行为都会在联网设备中生成数据。

世界经济论坛的一篇文章估计,到2020年全世界的数据量达到44ZB(1ZB=10亿TB),相当于可观测宇宙中星星数量的40倍[4]。据估计,人们每天会发5亿条推特,2940亿封邮件,并进行50亿次搜索。

数据库,就是存储和管理数据的软硬件,更多的时候特指软件。在数据“ZB”时代,其重要性不言而喻。

需要数据库的行业主要集中在金融,交通,政府,电信,制造这五个领域。具体而言,在金融方面就是各种用户的储蓄信息,交通一般为上下高速收费数据处理,政府方面对我们影响*的就是健康码的数据,电信通讯数据包括各种短信,制造就包括供应商管理等。

《碟中谍5》中,阿汤哥跳进水中数据中心进而黑掉保安系统的片段,看上去科幻,实际上一点不夸张。就连水下数据库在现实中也能找到原型——2015年,微软就在水下部署了一个水下数据中心。

从1960年代至今,数据库的发展可以分为三代。

*代数据库是最原始的数据库,术语上称作“前关系数据库”。它的特点是查找过程僵硬而繁琐,需要一级一级按顺序查询,无法跳跃。

打个比方,就像是在没有手机的年代,找一个人,需要先从黄页上找到他所在的公司,再拨打公司的电话,告知这个人所在的部门,最后才能联系到本人。

第二代关系型数据库,一个重要的突破便是不再需要按部就班数据传导,而可以直接查询数据。就好像进入了手机时代,找一个人,可以绕过单位,直接拨个人手机号就行了。

第二代相比*代解决了查询方便的问题,第三代的升级主要体现在分布形式更分散,以及安全的提升。

为了防止数据丢失风险,数据库需要备份,分散存储。这样散开的数据库就形成了一个个数据中心,这也成为了第三代数据库,比如前文提到微软的水下数据中心,又比如苹果在贵州的数据中心,一方面是满足苹果中国用户的需求,但更多是为了考虑国家安全。

现在还出现了云形式,即数据库在大企业服务器上运行即可,再将结果反馈至小企业,其中代表就是三个云:华为云,腾讯云,阿里云,这三朵云在国内云市场市占率达到60%以上。

但在数据库领域,国内起步很晚。1980年,当冯玉才开始摸索代码的时候,与他同龄的拉里·埃里森(Larry Ellison)研发出了甲骨文关系数据库2.0版本,并卖给了美国军方。

因为数据库研发门槛高,需要不断注入资本和技术,国内企业长期依托的是外国品牌,如甲骨文、IBM和微软。Mysql由于是完全开源免费也得到相关高校,中小企业的青睐。目前国内数据库市场主要被外资占据,光一个甲骨文市占率就超过四分之一。

但数据库作为数据存储工具,其中部分客户比如通信、政府还涉及国家安全,特别是棱镜门与俄乌战争爆发甲骨文切断服务事件爆发之后,政府方更加注重数据库的安全性。

所以,最初由国外企业主导的数据库行业最终必然走向国产化。

02

国产替代

和许多能体现国家意志的项目一样,国产数据库的起源可以追溯到一项国家政策:863计划。

计划的名字(国家高技术研究发展计划)就体现出了对技术的重视。考虑到数据库囊括了技术和安全两方面,它自然被提高到了国家战略。

事实上,在计划发布之前,冯玉才凭借《智能数据库》一文申请的国家自然科学资金获得批准。当时,一个项目通常只有两三千的研究经费,而冯玉才的数据项目获得了三万元经费[5]。

从文章开头提到的四家国产数据库的名字中不难发现,它们都是由政府主导、高校牵头开发的。华中科技大学被点名后,具体工作就落到了冯玉才教授肩上,然后这项计划一做就是36年。

2000年前后,冯玉才教授就带着研究所的一批骨干组建了武汉华工达梦数据库有限公司,这就是达梦数据的前身。目前达梦数据已经是国内一流的数据库公司。IPO时,冯玉才教授已经78岁高龄。

达梦数据的主营业务包括三类:相关软件产品(卖标准化量产的软件)、问题解决方案(卖定制的软件方案),以及后续的运营维护。

其中最主要的就是卖软件产品,2021年收入占比为86.57%,其次为解决方案,占比为11.43%,而运维服务较低仅为2%。

达梦数据2019-2021年营收分别为3亿,4.5亿,7.4亿,净利润为8374万,1.44亿,4.38亿,盈利水平较高。

这是软件行业特殊性与财务会计准则共同导致的。毕竟软件在研发完成后就没有成本了,2021年毛利率高达90.6%也情有可原。

而达梦的客户也非常有意思,客户群一般是大中型企业特别是国企,党政事业单位等等。2021年的大客户是中建信息,湖北省司法厅,中国电子科技集团(中电科),2020年的大客户是湖北省公安厅,中国软件,2019年还有黄石市公安局,基本上都有浓厚的国家色彩。

一言以蔽之,达梦所在的数据库行业,是一个由国家主导的“金饭碗”,不太需要参与市场竞争。

第二代国外数据库在国内长期占据主导地位,先发优势是一个重要原因。不是国内企业不愿意用国产数据库,而是担心数据迁移中出现偏差、丢失、甚至换了个储存地以后不知道怎么调用也是可能的。

使用时间越长,数据库护城河就越宽越深,就像用惯IOS系统的人*不会习惯用安卓。中国邮政“续费”甲骨文,便是一种证明。

不过,按照冯玉才的说法,达梦数据库深度兼容甲骨文数据库,2小时就能完成切换替代。随着行业数据有意识地往国产数据库转移,国产数据库份额提升只是时间问题。

03

弯道超车

三代数据库,创新并不是渐进式的,每一代之间并不存在严格的技术积累。这就自然引出了弯道超车的机会。

1963年,通用电气公司开发出世界上*个数据库管理系统(DBMS),而另一边美国启动阿波罗登月计划则直接逼迫了数据库发展,北美航空公司开发出GUAM,经过IBM改造成了*代商品化层次DBMS。

之后,IBM的研究人员发表了一篇题为《大型共享数据库数据的关系模型》论文,为关系型数据奠定了理论基础。但*的受益者并不是IBM。甲骨文创始人拉里·埃里森看到论文后,觉得这个东西以后肯定会有市场,于是自己搭伙开始自主研发并于1978年完成了Oracle *个版本。

两代数据库之间的技术并非循序渐渐。正如前文所说,第二代直接绕开了*代“按部就班找人”的难题。甲骨文顺势超过IBM,成为了第二代数据库的霸主。

随着数据在移动互联网时代数据的爆炸,对数据库要求越来越高。新的技术开始萌芽:2008年开始,数据库出现了一种分布式架构,数据被分布储存在网络上各个节点,各个节点分开运作,而且单个节点失灵不会使整个系统宕机,也保证数据库的安全稳定性。

这种数据库架构模式是如今数据库发展的方向。第三次技术革命也逐渐被国内企业重视开始研发推广自己的数据库。

目前,第三代国产数据库的发展有三类:一类背靠企业,比如阿里巴巴,华为,中兴等积累了足够的技术与资本也开始自主研发。一类完全依靠资本。另一类则背靠政府。

背靠阿里巴巴的Oceanbase一直被用于双11促销活动,处理海量的订单,在早期双11会出现淘宝APP无响应的情况,但现在这种情况比较少见。而华为旗下的数据库品牌更多,openGauss,GaussDB,逐渐在国产数据库中占据主流地位。

至于纯粹的技术+资本形式发展,平凯公司的数据库TIDB目前是国内*的数据库,而平凯公司背后是华创资本、纪源资本、经纬中国、复星集团等老牌投资者。

政府支持的数据库很多都是为了替代甲骨文,微软等国外数据库。达梦数据,人大金仓开始接替不那么核心的数据服务。

04

尾声

与国外相比,中国数据库行业的起步要晚了20多年,但现在可能是发展势头最旺盛的时候。

政策端,出于国家安全的考虑,国产替代势在必行。技术端,第三代带来了弯道超车的机会。举例来说,银行选择国产数据库的原因之一,是技术层面的分布式改造。分布式也是阿里、腾讯、华为、等新兴数据库相比甲骨文的优势所在。

人才端是与国外相比最薄弱的环节。甲骨文曾在中国裁员1600研发人员,其裁员规模是达梦全公司研发人员的五倍。不过,各个数据库公司和高校都推出了人才培养的计划。

等到数据库在各行各业普及,安全和规范提升之后,可能就不会出现前脚把子女送上留学的飞机,还没到家就接到“绑架电话”的情况了。

【本文由投资界合作伙伴微信公众号:有数DataVision授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。