旗下微信矩阵:
首页 产业 ai 正文

中国AI第 一城,北京没有对手

这预示着一种可能:只要积累足够多的高质量中文数据,国内企业完全有能力做出顶尖的中文大模型。
2023-07-22 11:20 · 微信公众号:华商韬略 志泽

美团创始人王兴有个理论:“如果你想创业,赶紧来北京,这样你的创业就成功了三分之一。”

他的理由是,创业要看天时地利人和,而北京独占两席。

论天时,北京有*的创业氛围,论人和,北京有最多的工程师人才。如今,在最火的人工智能赛道,北京又正在夯实中国“AI*城”。

对于“AI*城”的雄心与地位,北京从未掩饰。在国内人工智能产业中,北京早就到了一枝独秀的境界。

首先是人才。

截至去年10月,北京拥有超过60%的人工智能领域核心人才,背靠这个超大人才池,北京拥有了*的人工智能论文发表量。

有了人才,就有了产业规模。

全国范围内,获批建设新一代人工智能开放创新平台的企业一共有24家,其中10家,总部就在北京;人工智能专利授权数全球前100名的机构,其中又有30家,总部也在北京。

有规模的产业孕育了一系列成果,而且是落到实处的成果。

大模型领域,北京拥有全球*的智能模型和中文单体模型,分别是智源的“悟道2.0”,和百度的“文心”大模型。

在亦庄,可以打到没有司机的出租车,无人驾驶技术背后,则站着百度、小马智行等科技企业,推着北京的无人出行服务,进入商业化实验阶段。

在街头,还可能看到身高不及成年人的无人快递车、无人零售车,这些遥控指挥、招手即停的车辆,背后是美团、京东和新石器。

在网上就医,可以把症状发给数字中医大模型,智谱华章与北京中医药大学东方医院联合开发的数字中医大模型,会用海量医学数据的“经验”帮你开药、答疑。

去医院看病,AI会用语音识别能力帮助医生录入病例,节约每个患者40%的问诊时间。这个医疗“山海”大模型由云知声和北京友谊医院共同开发。

人才、规模、落地的领域、案例、成果,让北京的人工智能产业有一个显著特点:要素齐全,生态繁盛。

而这个特点,还在变得越来越强:

今年5月,北京发布了一个通用人工智能产业创新伙伴计划,目的就是整合上下游进行协同联动。在伙伴名单中,算力伙伴有阿里云、模型伙伴有百度、投资伙伴有IDG资本……覆盖了北京市算力、数据、模型、应用和投资领域的*企业和机构。

想要整合这样一套“全明星”级别的阵容,其他城市,难度要大得多。

而最近落幕的中关村重大成果发布会,更是让北京的AI产业星光更盛。在会上,北京发布了两项人工智能的关键政策:《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》、《北京市促进通用人工智能创新发展的若干措施》。

政策覆盖的内容不少,从算力建设、到数据训练基地建设,再到大模型探索……

而真正的核心目标只有一个——到2025年,人工智能核心产业规模达到3000亿元,辐射产业规模超过1万亿元。

2016,是全球公认的人工智能元年。

这一年,Google的人工智能程序AlphaGo,击败了韩国围棋*选手李世石,AI凭借强大的深度学习能力,颠覆了主流社会对于人工智能的认知。

在中国,2015年5月发布的《中国制造2025》规划,也明确将人工智能上升到国家战略高度。

在这个全力冲刺人工智能的关键节点上,北京发挥了不可替代的作用。

从产业规律看,无论互联网还是人工智能,都有共同的特性:技术高度密集。

越是规模集中的人工智能产业带,规模红利也就越强,这恰恰正是北京的优势。

北京拥有全国最多的985和211院校,在海归精英群体的主导下,凭借庞大的人才资源,从PC互联网到移动互联网时代,北京始终牢牢掌控着霸主宝座。

因此在海淀中关村,互联网产业带积累了最集中的人才、技术、资金和创新能力,而人工智能与互联网行业有紧密的承接关系,这成为了北京人工智能产业带的起步基础。

例如,AI的三大基础能力是数据、算法和算力。互联网企业拥有最庞大的用户行为数据,也热衷建设自己的算力设施。

2009年,为了支撑双十一购物节的天量访问诉求,阿里巴巴开始构建自己的云计算技术。

为了借力北京市的创新优势,阿里巴巴在2016年启动“杭州+北京”双中心战略,阿里云也正式在北京落地。马云表态,北京总部将成为阿里巴巴电商以外的互联网服务大本营。截至去年,阿里云已经成为全国市场份额占比36%的庞然大物。

同样将云业务引入北京扎根的,还有从深圳赶来的腾讯和华为。

而在数据基建的基础上,一大批算力、算法企业便有了施展空间。如寒武纪开发了全球*具备深度学习能力的处理器芯片,数据堂等企业在计算机视觉、语音识别能力上大展手脚。

总部位于海淀西二旗的百度,更是北京AI企业的*代言人。

在老牌互联网企业里,百度以技术立身著称。随着移动互联网时代到来,百度选择重新定位战略重心,主动寻找新的增长场景。

AI,就是百度祭出的一张王牌。

早在2013年,百度就成立了深度学习研究院。整个2014年,百度的AI研发投入已经远超Google。李彦宏对百度AI下定决心:“我不在乎华尔街怎么看,我一定要把这事做成。”

大众最为熟知的故事,是在2017年7月的“百度AI开发者大会”上,百度首席运营官陆奇喊出,百度将“All in AI”,让百度AI将成为一个巨大的技术平台,每个开发者都将从百度受益。

全力以赴的代价,同样高昂。

从2016年到2021年,百度的研发费用率从16%提升至20%。而它也带来了丰厚的回报,百度建立起了一个强大的自研AI技术体系。

2022年,百度中国专利申请量超过4000件,授权量超过2700件,两项数据均连续五年位列*位。

这是一个范围深远的技术生态。

在芯片层,百度昆仑已经实现两代通用AI芯片的量产;在框架层,百度开发了国内*自研产业级深度学习平台飞桨;大模型文心一言则成为全球*的中文单体模型。而在自动驾驶领域,百度已经拥有1193项高级别自动驾驶专利族数,位居全球*位。

截至今年1月底,百度旗下的萝卜快跑累计拿下了超过200万个无人驾驶出行订单,用户量还在持续攀升。在百度的规划中,到2025年,百度无人驾驶出租车将在全球展开大规模商业化运营。

顶着巨大的研发风险,死死咬住行业前沿,十年研发无人问,一朝成名天下知。这不仅是百度一家,也是整个北京AI产业的缩影。

在人工智能的赛道上,北京很可能等不了身后的兄弟城市了。

IDC发布的《2022-2023 中国人工智能计算力发展评估报告》显示,从投资规模、政策力度、项目进展、技术成熟度、劳动供给等多维度考察,北京、杭州、深圳已经稳居中国人工智能城市的前三甲。北京从2019年开始连续霸榜,看不到对手。

大数据平台AMiner则从创新维度,用论文、学者、机构和国际合作几个角度,衡量了全球城市的人工智能创新指数,其中,北京得分是96.46分,位居全球第二位,遥遥*国内上海、杭州、深圳等城市。

近日两大人工智能政策的颁布,则意味着北京正在进一步补强短板,全力提速。

按照规划,北京将在2025年形成一整套完善的人工智能产业生态,有海量的前沿基础理论,有开源的自研AI平台,有加强投入的基础算力,也有政务、医疗、金融、交通等多领域的应用落地。在整个规划中,未来将有5到10个人工智能独角兽在北京诞生。

AI产业的一个特性是,一旦规模形成,强者愈强的效应就会出现。这意味着,从AI基建到AI应用,北京将让人工智能的训练成本更低,算法训练更快。在这个基础上,AI技术将以每年落地10个以上重点商业化场景的速度加速推进,在大量行业建立起*优势。

根据科技部发布的《中国人工智能大模型地图研究报告》显示,当前我国10亿级参数的大模型共计79个,其中北京独占38个。在大模型学者指数、模型开源数量和影响力等指标上,均为全国首位。

这其中,就有百度文心、京东言犀、阿里通义、360智脑、网易玉言等一系列大模型“百模斗艳”。

其中,百度跑在了行业前列。今年6月,李彦宏在公开演讲中透露,百度文心大模型已经迭代至3.5版本,较上一版本的训练速度提升2倍,推理速度提升17倍,模型效果累计提升超过50%。

在决定大模型能力的要素中,算法很重要,但更重要的是数据和算力。ChatGPT在中文能力上的短板,一个重要原因恰恰是因为缺少中文语料的训练。

这预示着一种可能:只要积累足够多的高质量中文数据,国内企业完全有能力做出*的中文大模型。

这也是此次北京市按下人工智能提速键的深意——全力建设高质量数据供给,加强基础算力建设,为抢占大模型高地保驾护航。

作为当今中国大模型实力最强、产品最活跃的城市,北京已经成为了名副其实的“中国AI*城”。

而随着北京的进一步发力,整座城市的算力、数据、人才活力的激发,在未来,“世界AI*城”,会不会成为它的新名字?

参考资料

[1]《全球未来时期创新创业的风口》王兴

[2]《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》

[3]《北京市促进通用人工智能创新发展的若干措施》

[4]《2022年北京人工智能产业发展白皮书》北京市经济和信息化局

[5]《2022-2023 中国人工智能计算力发展评估报告》IDC

[6]《北京市首批行业大模型典型应用案例》北京市科委、中关村管委会

[7]《2022年中国云服务市场报告》Canalys

[8]《李彦宏(百度与智能时代的畅想)》韩啸

[9]《2022年自动驾驶和智能交通专利全景分析报告》Questel

[10]《2023年全球人工智能*创新力城市榜单》AMiner

[10]《中国人工智能大模型地图研究报告》科技部

【本文由投资界合作伙伴微信公众号:华商韬略授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。