1950年, 图灵在其论文《计算机器与智能》(Computing Machinery and Intelligence)的开头抛出了一个启蒙式问题:机器能思考吗?
受限于当时计算机只能执行指令而无法存储指令,计算成本又极其昂贵,相关的验证工作无法展开,但即便如此,人们对机器智能的探索始终不曾停歇。
1956年夏,麦卡锡和明斯基等科学家在美国达特茅斯学院开会研讨“如何让机器模拟人类并自我改进”,会上首度提出了“人工智能”这一概念。
此后数十年里,人工智能的发展历经起伏跌宕,如今正奔向新的蓬勃发展期,如果你看过今年的世界人工智能大会,你会发现我此言不虚。
官方数据显示,今年展区面积超过5.2万平方米,500多家参展企业逾1500项展品参展,创下了历史最高记录。这里面,近百个大模型和全网热议的“18金刚”人形机器人也集中亮相。
绝非往年可比的盛大阵容,使线下参观人数突破30万,达到去年的1.6倍。如果让硅基君来形容,本届大会令人目不暇接的非大模型和机器人莫属,最直观的感受便是AI又催生了一批新势力后浪,各个赛道热闹非凡。
大模型继续占着主场位置,应用场景从教育学习、政务办公,到工业生产,几乎渗透进了人们生活的方方面面。除BAT 、华为、商汤科技,百川智能、智谱AI、阶跃星辰、Minimax、第四范式等行业玩家悉数到场。
机器人是另一个重磅看点,在展出的二十余款人形机器人中,“18金刚”矩阵无疑收获了来自线上线下的无数粉丝,这里面包含了钛虎、傅利叶、达闼、开普勒等公司开发的产品。
特斯拉第二代Optimus也漂洋过海来到现场,虽然依旧被封印在玻璃橱窗里,但围观群众络绎不绝。另外,云深处、宇树、逐际动力等公司带来的机器狗大秀绝活,同样让展台里三层外三层被围得水泄不通。
本届大会不得不提的是自动驾驶,前往分会场的沿途,小马智行、商汤绝影、赛可智能等自动驾驶公司免费开放了无人驾驶体验活动。今年小马智行、毫末智行等虽然没有设置展台,但自动驾驶领域的热度不减分毫。
遍地都是大模型,但大家都有自己的性格
有人说,ChatGPT的发布代表着“一个斯普特尼克时刻”,中国大模型公司必须加倍努力才能追齐落后的差距,而事实证明,这些公司已经铆足了劲,准备创造下一个GPT时代。
人狠话不多的商汤科技率先发布了对标GPT-4o的日日新SenseNova 5.5,这是国内*具备流式原生多模态交互能力的大模型,“流式生成”指可以实时输入输出,进而快速生成数据。
日日新5.5基于6000亿参数规模,综合性能较5.0提升30%,还一并推出了“所见即所得”模型日日新5o。
硅基君的感受是,和日日新5o对话可以秒回《恋与制作人》,他可以帮你分析Ootd,甚至为你总结某页读物内容,现场观众也说得直白,“声音太好听,可以直接拿来读睡前故事。”
“AI新六小龙”中的百川智能、MiniMax、智谱AI、阶跃星辰也都来到现场。其中,百川智能展示了内测版医疗应用——AI健康顾问,依托通用医疗增强大模型,通过人机对话,就能获得咨询意见,让寻医看病更加便捷。
王小川创立新公司前便一直关注医疗领域,2021年搜狗并购至腾讯后曾发表公开信称,往后20年将致力于生命科学和大众健康,但百川的业务不止于此,博泰第三代骁龙座舱平台就借助百川的产品,打造出了综合性大模型博泰精灵,支持角色扮演,还能闲聊打发时间。
瞄准二次元的MiniMax这次把展台做成了粉色调,这应该是除Bilibili外的*一家展商。今年1月,MiniMax推出了基于混合专家模型(MoE)架构的千亿参数大语言模型abab 6 ,4月发布海螺AI,并接入abab 6.5。据悉,MiniMax将在下个月发布AI视频生成产品,通过海螺AI小程序就能直接体验。
智谱AI此次发布了第4代CodeGeeX代码大模型CodeGeeX4-ALL-9B,基于1月推出的基座大模型GLM-4,第4代CodeGeeX大幅增强了代码生成能力。
智谱AI CEO张鹏认为,过去AI泛用性不够且成本太高,大模型带来了一个新机遇,把原来一个底座投入很大但收益很小的结构,变成了一个倒金字塔结构。不过就像业内人士所言,垂域大模型才是应用落地的基座,认清这一点,大模型的生意方可持续。
阶跃星辰首发了三款Step系列通用大模型产品,包括Step-2 万亿参数语言大模型、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。会上,阶跃星辰还与上海电影结合《葫芦兄弟》IP进行了视频生成能力的演示。
AI视频生成已经成为大厂扎堆的细分赛道,国内市场商汤刚刚发布了Vimi,支持一分钟视频生成,快手有可灵,其支持的AIGC短剧《山海奇镜之劈波斩浪》也即将上线。
除了这些,大模型对普通人来说最直接的使用无疑是学习和工作,这是猿辅导和金山办公深耕的垂类领域。
猿辅导展示了其自研大模型为支撑的教育产品“全家桶”,包括飞象星球、猿编程、小猿学练机、海豚AI学,以及两款AI教育出海产品CheckMath、LeapMath。
而这一展台,扎堆出现学生在老师的带领下参观的奇景。
以飞象教育大模型为例,将作业拍照提交给大模型后,AI会分析出作业内容,并根据答题情况,判断出其中可能存在的错误,然后循序渐进引导,帮助学生获取答案。
现场飞象星球自研的“AI习作伙伴”也首次公开亮相,这是飞象自研大模型支持的最新应用。
金山办公则发布了WPSAI2.0,是基于大语言模型的人工智能办公助手,此次更新包含WPS AI办公助手、WPS AI政务版等应用,金山还一并推出了政务办公模型1.0,开卷办公赛道,不知道钉钉看到后慌不慌。
在大模型这块,大厂更是卷到飞起。人气颇高的华为云盘古大模型,除了赋能工业、建筑、气象等领域,还能应用在自动驾驶行业。
通过可控时空生成技术,结合场景视频生成、BEV视频生成、自动驾驶仿真库和路网信息,可大规模生成和实际场景几乎一致的驾驶视频数据。对自动驾驶模型训练而言,有效的数据弥足珍贵。
但在各家的宣发口径中,大模型本身早已不再是C位,谈论更多的往往是在其之下延展而出的应用场景。
比Optimus更炸场的,是这些国产机器人
黄仁勋在ITF World 2023半导体大会上曾说,人工智能的下一波浪潮要看具身智能。相比上届人工智能大会,本届的机器人展品规模明显增加,尤其人形机器人几乎成了馆内热门景点。
特斯拉Optimus二代较上一代行走速度提升了30%,目前可以握鸡蛋也可以搬箱子,当然这只是官方说法。不过不久前,Optimus已经开始进厂打工,借助视觉神经网络和FSD芯片,可以模仿工人进行简单的电池分拣。
马斯克的目标是,明年在特斯拉工厂中部署超过1000个Optimus,*可以确定的是,大家不会都去拣电池。
达阀带来了人形双足机器人XR4,也可以叫“七仙女”小紫,身高1.68米,手可以拿鸡蛋,也可以烤面包、烫衣服,甚至能拎起10公斤重物。当天达阀高调宣布,XR4限量预售100台,每台39.9万元起。
达阀服务机器人Cloud Ginger排成三行,更是随着《少年》一歌跳起了舞,驻足观看的人也不在少数。
Cloud Ginger (左)和XR4(右)
开普勒先行者系列凭借扎眼的黄色迅速出圈,该系列分为K1、S1、D1三个型号,基于听觉传感器和红外双目摄像头进行感知。目前,先行者系列除了主板等少数零部件需要外采,其余都已实现国产化,预计会在今年下半年步入量产。
傅利叶*全尺寸人形机器人GR-1基于BEV+Transformer+OCC方案,通过6颗RGB摄像头采集到的数据,可以形成全局感知并规划路径。说白了,GR-1把时下*的自动驾驶方案拿到了机器人领域。
这款人形机器人自去年发布以来,已经量产超过百台,现场进行动态展示时,引来了不少观众围观拍照。
钛虎机器人此次发布了全新二代人形机器人T170A实体“瑶光”和“墨翟”,两者身高皆为1.7米,采用钛虎自主研发的轻量化关节模组,自重仅48公斤,单手负载却足足有5公斤。
国家地方共建人形机器人创新中心(简称“人形机器人”)发布了国内*全尺寸人形机器人开源公版机“青龙”。而乐聚旗下的“夸父”搭载华为盘古具身智能大模型,已于去年面向公开市场发售。
钛虎的瑶光(左)人形机器人的青龙(中)乐聚的夸父
要说动态展示哪家强,还得看宇树科技的通用人形机器人Unitree H1,身高约1.8米,体重约47公斤,可以原地后空翻,不过现场硅基君只看到H1和观众打招呼握手,甚至直接表演起科目三,大秀舞技。
此外,智元、中电科、天链机器人、星动纪元、星海图等公司也都带来了人形机器人产品。
而要说硅基君印象最深刻的,莫过于当街卖艺的机器狗群体,比如宇树的机器狗可以翻跟斗,可以倒立行走,还给现场观众拜了个早年。
云深处的绝影X30甚至在场馆内当起了矿泉水搬运工,间隙表演了一段上下楼梯。要知道,每一个台阶对机器狗来说都是挑战,既要找准落脚点,又要保持住身体平衡,现场看下来整体表现较为突出。
行业不乏观点认为,人形机器人是具身智能落地的最理想形态,不过现阶段无论哪一种,提升感知与交互能力都是产品升级进化的重中之重。对普通消费者来说,一个能负担得起的价格亦是机器人/狗规模落地的关键。
即便没有展台,大家依然爱着自动驾驶
如果按照中国工程院院士张亚勤说的,无人驾驶L4+将是具身智能的**应用,那么无人驾驶便不能不提。今年虽然少了一些自动驾驶公司的身影,但属于这个细分领域的热闹依然随处可见。
西井科技全球首发了智能物流机器人Well-Bot,通过多传感器融合感知并内嵌AI大模型,可以实现货物的精准识别、定位以及自主导航规划。
其旗下Qomolo智能驾驶系列产品之一的Q-Truck无人驾驶商用车则展出了换电版本。去年,首批Q-Truck落地英国菲利斯杜港,打响了出海欧洲的*枪,前不久,换电板Q-Truck正式入驻赛力斯汽车智慧工厂打工。
易控智驾发布了露天矿无人驾驶运输解决方案“著山2.0”,引入BEV+Transformer+OCC技术架构,使无人矿车的感知规划能力再进一步。相比上一代,2.0可覆盖煤矿、石灰石矿、金属矿等露天矿山全场景工况需求。
九识科技亮相的Z8、Z10,是其推出的*载重、最长续航的L4级低速无人城配产品,主要应用于矿区、工业物流及其他长距离运输场景。要说的是,车长超过4米的Z10,*载重约1.5吨,售价只有八万多。
商汤绝影现场展示了自动驾驶大模型DriveAGI,同时发布了行业*车载生成式交互界面“随心界面”(FlexInterface)、“随意操控”(AgentFlow)等车载AI 应用。
商汤绝影自动驾驶小巴也在无人驾驶体验活动区亮相,因为道路太过拥挤,硅基君没能上车体验,不过目前商汤绝影已在临港提供自动驾驶小巴服务,通过“临港出行”小程序就可预约。
在体验区内,还有毫末智行的末端物流自动配送车小魔驼HD05、小马智行第六代Robotaxi以及上汽赛可智能等无人驾驶产品。
毫末智行HD05是一款C级末端物流自动配送车,拥有单格口大货箱,可用于快递配送等中长途场景需求。
赛可智能无人驾驶车辆采用了其自主研发的最新一代技术架构,基于异构冗余的软硬件系统方案,大幅提升了行车的安全性。过去三年多时间里,赛可智能已经完成三代L4自动驾驶技术的开发与落地。
小马智行在2022年推出了第六代L4自动驾驶软硬件系统,2023年开始投放国内一线城市,此次大会搭载其第六代软硬件系统的雷克萨斯RX ,肩负起了带领观众体验的重任。
值得一提的是,两家公司在此次大会期间获得了上海首批无驾驶人智能网联汽车示范应用许可证,也就是说,未来在上海浦东205公里的测试路线上,消费者可以通过相关软件预约到一辆完全没有驾驶员的Robotaxi。
本届大会设有展台的还有蔚来、极越、奕行智能等公司。蔚来设置了12项全栈技术展区,全面呈现芯片和车载智能硬件、整车全域操作系统、智能驾驶、智能座舱等关键技术领域的技术成果。
极越带着极越01和即将上市发布的纯电轿车极越07一同亮相,CEO夏一平在大会期间针对特斯拉FSD即将入华表示,极越有信心做得更好,面对国内道路上的电动两轮车、横穿马路的行人以及其他不规范行为,极越有着长期积累,可以说更懂中国道路。
而前不久,小鹏智驾负责人李力耘也指出,相比美国,中国路况确实复杂很多,国内三亿多的小电驴可能会成为FSD入华的“头疼难点”之一。相比之下,国产NOA方案已经打磨多时,就待和FSD坐下交流了。
今年的世界人工智能大会有一个重要议题:全球治理。人工智能的发展已经走到关键十字路口,尤其生成式人工智能带来的挑战前所未有,比如从AI换脸到造脸,在社会层面引发的风险可能成倍增加。
图灵奖得主、中国科学院院士姚期智指出,人工智能的风险体现在三个方面:一是网络风险不断延伸和扩大;二是没有意识到的社会风险,比如当AI非常强大,颠覆现有的社会结构是可能发生的情况;三是生存或者存在风险,就像蒸汽机被发明出来的时候,也有人产生过类似的担忧。
与会专家认为,人工智能要在安全的基础上谋求发展,换言之要控制好AI,但又不能阻断它的发展。
而目前人工智能治理面临的挑战不一而足,包括人工智能的发展速度远快于监管制度的制定速度、没有一个监管机构能够单独管理好人工智能牵涉的各个方面;国际格局变化使人工智能监管变得*复杂。
除了建立国际交流和防控体系、加强多边对话机制,国内对AI安全的投入远远落后于对AI性能的投入,因而未来整个行业需要共同探索二者系统性平衡的对策。