黄仁勋才是真正的“AI*”。
美国当地时间5月30日,英伟达股价上涨,市值一度达到万亿美元,晋升美股“万亿俱乐部”,那一天,美股市场仅有苹果、微软、谷歌、亚马逊、英伟达这五家公司市值超万亿,英伟达也成为*家由华人创办的“万亿俱乐部”成员。
但仅仅过了一天,英伟达的股价就下跌4%,市值跌破万亿。但这“万亿市值一日游”的行情,并不妨碍英伟达创始人黄仁勋成为2023年财富增加最多的科技富豪之一。
从游戏到“挖矿”再到元宇宙,从深度学习AI到自动驾驶再到现在风头正劲的生成式AI,黄仁勋每一次都踩在了风口上,成为了永远在赚钱的“卖水人”。无论科技圈玩什么新花样,都离不开他卖的GPU、计算卡,无论硅谷大厂们换了多少任CEO,他还是英伟达的话事人,无论身价多少亿,他还是万年不变穿着皮衣。
他被尊称“老黄”、“黄教主”,这位祖籍浙江青田,出生于中国台湾,成长于美国的科技大佬,最近心情不错,上周他先是被目击独自在台北街头逛夜市、吃麻花,后又前往台北大学出席毕业典礼,在演讲中,他说,“AI为我们带来了巨大的机遇,反应敏捷的企业将利用AI技术提升竞争力,而未能善用AI的企业将面临衰退。”
没人会忽视他的告诫,如今他是全世界互联网公司、创业者们最想见到的人,包括中国的科技大厂、创业者们。
这不,他就要来了。据媒体报道,黄仁勋将于6月前往中国,会见腾讯、字节跳动等企业高管,还将走访理想汽车、比亚迪等。报道称,黄仁勋尚未最终敲定计划,行程细节仍可能有变。
前段时间,有投资界人士对《最话》说,“王兴、张一鸣现在不怎么管具体业务了,都在研究人工智能。”他们应该会有兴趣想跟黄仁勋聊一聊,而黄仁勋也会有兴趣多做几单生意。
01
“我们正处于AI的iphone时刻。”
3月21日,在英伟达2023 GTC会议上,黄仁勋用一句极其有感染力的描述向全世界强调生成式AI的重要性,更是在强调GPU在这轮浪潮中的光明前景。
对英伟达来说,2022年大多数时间是不堪回首的。
宅家经济带来的红利消散,消费电子市场迅速萎缩。特别是游戏市场出现了明显低迷,消费者愿意在游戏上耗费的时长显著缩短,就连资深游戏玩家们都抱着“等一等,价更低”的心态不愿意多花钱购买高配置显卡。
游戏玩家的需求波动并非是重创,虚拟货币价格“跳水”才是真正的伤害。
性能良好的显卡虽然可以带来更为流畅的游戏体验,但本质上还是娱乐消费品。对币圈人士来说,显卡是带来暴利的生产工具,消费意愿完全不是一个量级。早年间,一块性能较好的CPU就可以挖到币,后来必须用GPU才能抢到币。
新冠疫情爆发后,虚拟货币价格水涨船高。
英伟达明知道大量被标识为游戏业务的显卡流向了“矿场”,但是看在币圈溢价囤货让公司赚的盆满钵满,老黄在很长时间和币圈保持着暧昧态度,甚至推出了专用于以太坊的加密货币开采处理器CMP。
面对美国证券交易委员会指控英伟达没有正确披露加密货币挖矿对游戏业务影响,英伟达不假思索地支付550万美元达成和解。
然而,进入到2022年虚拟币政策监管越发严格,虚拟币价格出现崩盘式下跌,“矿场”对显卡的需求也跟着崩了,甚至要靠出售二手显卡回收成本。
2023财年第二财季。英伟达拿出了一份与预期收入相差14亿美元的雪崩财报,舆论届也颇有痛打落水狗的架势,嘲笑老黄“背叛”了让他起家的玩家们。2022年,英伟达市值从年初的6950亿美元一度暴跌至不足3350亿美元,缩水超过50%。
直到2022年11月,ChatGPT 3.5的横空出世扭转了形势。
生成式AI并非什么新鲜产物,早在数年前,中国的互联网大厂就用AI生成快讯,以至于当ChatGPT 3.5在海外引起热议时,仍有大厂人士怀疑它是否只是个噱头。
但ChatGPT很快就显示出它与数年前的技术完全不是同一量级的能力,短短三个月内收获1亿用户,创下行业奇迹。
ChatGPT在算法上有翻天覆地的变化,而在底层算力上就更是不可同日而语,AI大模型的推理和训练高度依赖GPU芯片,ChatGPT 3.5模型正是在搭载约1万个英伟达A100芯片的计算系统上训练而来。
随着用户数增长,为进一步满足服务器需求,OpenAI使用的英伟达GPU数量已经增加到2.5万个。据第三方机构推测,这一数字很快会增长到3.5万。
大模型的东风使得刚刚在“矿场”折戟的英伟达,再次站上了一个更有前景的风口。
02
短短六个月时间,全世界的科技行业都陷入了生成式AI的狂热之中。
第三方数据显示,2022年第四季度英伟达占据了全球独立GPU 市场85%的份额。GPU产品线加上CUDA通用并行计算平台,使得英伟达可以从产品本身和通用性上筑起壁垒,短期内同行业竞争对手无法与之相比,畅享行业爆发期的红利。
年初,黄仁勋就信心满满地预计英伟达来自AI平台的收入将大幅增长。他称:“计算机行业正在同时经历两个转变——加速计算和生成式AI。随着公司竞相将生成式AI应用到每个产品、服务和业务流程中,价值一万亿美元的全球数据中心基础设施将从通用计算过渡到加速计算。”
时隔两年,“缺芯”再次在全球各地上演。马斯克都发推调侃:“似乎每个人、每条狗都在购买GPU……”
尤其在中国,受限于美国的出口禁令,自去年9月起A100和H100两款英伟达的*双精度浮点数矢量运算芯片只能在地下市场销量流通,虽然一些大厂之前就购买了不少A100芯片或者用性能略低的H800芯片替代,但这波AI创业浪潮仍使得A100芯片的需求猛增,供需失衡下地下市场有限的A100芯片价格暴涨,曾有人士向《最话》报价每块A100芯片价格高达115万元。
高性能运算芯片需求大增挽救了英伟达的业绩。5月25日,英伟达发布2024财年*财季财报称,本季度营收71.92亿美元,虽然同比下降13%;但净利润为20.43亿美元,同比增长26%。其中,游戏业务营收22.4亿美元,下降38%;专业可视化业务营收2.95亿美元,下降53%;汽车业务营收为2.96亿美元,同比增长114%;最重要的是,数据中心业务营收达到42.8亿美元,同比增长14%,创下历史新高。
也许是市场热度让英伟达充满信心,它预计2024财年第二财季该公司的营收将达到110亿美元,这份远超分析师预期的业绩展望让英伟达市值冲向了新的高点。
“我们正在重新发明计算机,加速计算和人工智能标志着计算正在被重新定义。”
5月29日,黄仁勋在台北电脑展COMPUTEX 2023发布了系列新品,包括大内存生成式AI超级计算平台DGX GH200,可加速生成式AI设计的Grace Hopper超级芯片GH200已全面投产以及推出全新加速以太网平台Spectrum-X等。
其中DGX GH200将支持万亿参数AI大模型训练,拥有144TB的共享内存,比2020年推出的DGX A100扩容近500倍,更易训练大语言模型、深度学习推荐系统。
DGX GH200的推出会不会让A100地下市场价格雪崩,还不得而知,但国内的科技大厂、科研院所肯定想买到。毕竟这场生成式AI军备竞赛已经白热化,自百度率先推出文心一言大模型后,阿里云推出了通义千问大模型,6月1日聚焦音视频内容的AI新品“通义听悟”正式上线。根据中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》,目前中国10亿参数规模以上的大模型已发布79个。
这些大模型无疑都需要高性能的运算芯片。
目前,全球约有4万家大公司和1.5万家初创公司在使用英伟达的技术。黄仁勋称,谷歌云、Meta和微软预计会在年底成为首批使用DGX GH200的公司,这会是未来超大规模生成式AI基础设施的底座。
美国的科技大厂能顺畅买到A100,年底就能用上DGX GH200,对于中国科技大厂来说是巨大压力。生成式AI三要素:算法、数据、算力,如果说*个可以“借鉴”开源算法,第二个自有,那么第三个无疑就得靠英伟达。此时,英伟达在这个市场上是最*的供应商,甚至可以说是*供应商。
生成式AI的广泛应用彻底拓宽了市场对英伟达潜力的认知,也让黄仁勋的影响力如日中天,哪怕是科技巨头也得向他低头。据知情人士透露,即便是早就布局的微软,目标也并非更换芯片厂家,而是在合作中争取更大的话语权。
即使强如微软都要低头,中国科技大厂的CEO们想排队约见黄仁勋就不足为奇了。
当然,黄仁勋是企业家,多卖货多撑市值才是王道。君不见美国政府禁售A00,他就搞出H800卖给中国厂商,性能不足数量来凑。如果DGX GH200也被禁售,黄仁勋也会想办法绕道,毕竟好不容易的近万亿市值,需要实打实的销量来兑现。
而中国已经是英伟达最重要的市场之一,并且潜力巨大。巨大的市场使得中国涌现了不少GPU领域的创业公司,虽然规模尚小实力尚弱,但黄仁勋并没有掉以轻心,在中国台湾台北国际电脑展期间的一场媒体圆桌会议上,黄仁勋说,“我们自己必须跑得非常快,中国目前投入到芯片领域的资源数量非常庞大,我们不能低估它。”
要遏制市场竞争对手的*办法就是想办法抢占市场先机,黄仁勋当然希望能在中国市场销售,所以才会对美国政府喊话,“如果我们被剥夺了中国市场,我们是没有应急措施的,(世界上)没有另一个中国,只有一个中国。”
03
年初《最话》曾跟科技行业朋友调侃,“如果你买不到英伟达的芯片,可以买它的股票。”
2017年,英伟达市值首次突破千亿美元;2020年,英伟达首次超过英特尔成为市值最高的芯片制造商;2023年,进入“万亿俱乐部”。虽然随着风口变化,英伟达的股价有起伏,甚至腰斩和跌入谷底,但长期跟踪它的人们会意识到黄仁勋和英伟达的成功绝非是因为运气与时运。
所有的风口红利也不会是从天而降的,只会留给早有准备的人。一次或许可以归结为运气,次次能碰上那就*不是运气。
黄仁勋总结英伟达的文化是:做独特的事情,做独特的贡献。
1993年,成长于电子游戏兴起潮流下的黄仁勋选择把GPU作为自己的创业方向,他相信游戏行业在未来的前景,他想要为之打造更合适的芯片产品。在PC时代,游戏是显卡最重要的需求大户,那时候A卡、N卡孰强孰弱是游戏玩家们打口水仗的话题。
可以说,正是游戏特别是3D大作对高性能显卡的需求,带动了英伟达等芯片企业的崛起和发展,奠定了技术基础。而当时,游戏在中国被视为“电子海洛因”,游戏主机早早就被禁掉。
在游戏领域打开局面,有充足利润,使得英伟达能加大研发投入,对图形运算、加速运算等技术的理解不断深入,2007年,英伟达推出了CUDA GPU加速计算技术,当时英伟达希望CUDA成为一个程式设计模型,在科学运算、物理模拟到图像处理方面都能提升应用程式的效能。但由于CUDA的成本非常高,用户切换技术模式的难度大,是的英伟达的利润遭受巨大的打击,市值一度跌到10亿美元上下。
顶着股东的压力,英伟达持续投入CUDA的研发和推广,终于CT重建、分子动力学、粒子物理学、流体动力学和图像处理等应用程序开始大量出现,英伟达的开发人员撰写算法,并加快了芯片运算速度。
到2012年,AI研究人员探索了CUDA,AlexNet神经网络在GPU GTX 580上进行了训练,开启AI的大爆炸。
此时,英伟达在加速计算技术上的积累和理解力,已经是其他芯片大厂所难以望其项背的了。黄仁勋的坚持,让GPU从CPU的“配角”,一跃成为迎领技术潮流的“主角”。
当然,黄仁勋也有失败的时候。5月27日,黄仁勋一改标志性的黑皮衣装扮,身着一身学位袍在台大毕业典礼演讲时说,“学会放弃,是迈向成功的核心关键。”
他举的例子就是英伟达做出艰难决定,放弃移动芯片市场。当时,正是智能手机大爆发的时候,英伟达推出了智能手机芯片Tegra 4,黄仁勋对Tegra 4寄予厚望,看作是英伟达向移动市场转型的关键,当时发展迅速的小米将Tegra 4用于小米3手机其中的一个版本。为了卖芯片,黄仁勋专程来中国与雷军同台宣传这款手机,结果由于不兼容、发热等种种原因,无论是小米3手机还是Tegra 4都惨遭失败。
英伟达在智能手机芯片市场出局,CUDA尚未大放异彩,那是黄仁勋艰难的时候。但正如他所说,“放弃获得了回报,我们创造了一个新的市场——机器人技术,拥有神经网路处理器和运行AI算法的安全架构。”
没有人是先知,但“天下武功,唯快不破”,能快,是因为“内功深厚”。几十年来,摩尔定律几乎是电子行业遵从的法则。黄仁勋却依旧觉得不够快,他的“黄氏定律”直接要求产品每6个月升级一次,功能翻一番。英伟达能做到这点,就是源于多年深厚的技术积累和对技术路线的理解。
这容不得机会主义,在半导体世界里,持续理解技术、投资技术才是*有效的策略。在加速运算领域,英伟达已经*英特尔。
“加速运算系统及AI已经到来,摩尔定律的基础动能已结束。”近两年,黄仁勋在公开场合毫不客气地表示“摩尔定律”已死,多核处理器、AI芯片、专用集成电路(ASIC)都可以提升芯片吞吐量性能,并不需要死磕单个核心的计算性能。
英特尔CEO基辛格数次反驳黄仁勋观点,并坚持在单个芯片上塞入更多晶体管的技术路线。英特尔在桌面、服务器级CPU上仍具有强大技术实力,但是在处理深度学习任务上,原来的“配角”GPU正在逆袭。从资本市场给两家公司的定价来看,显然在投资者看来:英特尔是过去,英伟达是未来。
随着生成式AI的热潮不断升温,之前元宇宙概念似乎已是明日黄花。但或许,某一天,生成式AI会和元宇宙奇妙结合在一起也不一定,宛如游戏的需求点开了GPU的科技树,长出了自动驾驶、AI。
得益于图形运算,人们在虚拟世界里能模拟现实世界,而未来用生成式AI批量迅速生成“我的世界”,也并不是不可能,可能即使现在人们还是低估了世界所需GPU数量和算力。
对于未来的理解,黄仁勋显然要高出不少科技大佬,他再来中国,已经不是十年前吆喝卖手机芯片的“销售”,倒更像兜售未来的“导师”,无论是忙着做大模型的科技大厂还是新能源车企的老板,应该都想听听他怎么说,以及想带点DGX GH200回去。