旗下微信矩阵:

解读大模型价格战:着急的大厂

大厂的「降价」当前还有很多的限定条件,真要用起来成本或许并没有宣传的那么低;在开发者依然会考虑性能的当下,给创业公司依然留下了生存空间;
2024-05-27 07:57 · 极客公园 FP 研究中心

自 5 月 6 日 DeepSeek 提出降价、实现百万 Tokens 输入 1 元开始,字节、智谱、阿里、百度、讯飞、腾讯等也先后加入到降价浪潮中。到 5 月 22 日,ERNIE Speed、ERNIE Lite、讯飞星火 Lite、混元-lite 模型等均已实现限定条件下免费。

国内大模型厂商,尤其是以云厂商为代表的模型公司,掀起的降价潮,已经超越了在行业内产生影响,更引发了大众层面的关注。百度指数上「大模型」关键词在近两周也有大幅提升。

激进的云厂商的意图路人皆知:通过降低试用成本,吸引大量试用型开发者;通过模型成本降低,加强云及其他产品的售卖。这背后的一个重要原因则是:大模型层面的竞争激烈,但目前各家差距并不明显,没有谁能一骑绝尘、遥遥*,降低成本很可能是一个*的业务策略及竞争策略。

与市场主流预期不同,模型层创业公司现阶段还暂未恐慌:

大厂的「降价」当前还有很多的限定条件,真要用起来成本或许并没有宣传的那么低;在开发者依然会考虑性能的当下,给创业公司依然留下了生存空间;

大厂的「降价」宣传加强了市场教育,利好全行业,有厂商告诉 Founder Park 研究中心,近期常规的(非刻意因为降价预付)充值、续费率还略有增长);

有模型厂商的公司高管认为,大厂开源的都是小模型,当用户量增加时,可能要花费更多精力优化小模型,反而创业公司有可能能有机会优化大参数模型,同时大厂的降价或有可能吸引一部分灰产,很可能需要花精力应对灰产。

但不管对于大厂还是模型层创业公司而言,降低 Token 成本都是未来大势所趋。便宜的模型、繁荣的开发者生态、*方应用都是这场「百模大战」接下来竞争关键。

01

大厂没有讲明的点:

降价后成本可能依然很贵

Founder Park 研究中心与行业交流,获知的信息,得出的结论更偏向于:对开发者来说当前的降价更像是「试用装」,适合要试用大模型的客群,对行业的直接影响并不大。

这主要是因为:

*,当前部分厂商的「降价」中没有提 TPM(每分钟处理内容量)、RPM(每分钟请求数)两个限定条件。随着这两个重要数值的增加,其成本也会提升。

第二,部分模型「降价」重点降低了输入端的 Token 价格,输出端降价低于输入。

第三,此前很多国内大模型都会在注册时赠送部分 Token,或者在中小开发者的应用快速起量时给与 Token 支持,基本接近「免费」或者「低价」。

在「降价潮」的两周内,整个市场的舆论也经历了几个阶段:


    Token 成本因为算法迭代大幅压低后的行业关注;

    Token 成本因为商业策略大幅降低后的大众关注;

    大规模降价引发了行业就大厂是否真降价的反思与讨论,如高 TPM、RPM 下的实际成本讨论;

    大厂模型大规模降价后引发的投资圈反思,如独立模型层创业者是否还有机会,大厂逼迫模型层公司不得不做应用成为自己*的客户;

    降价能不能解决大模型商业模式的反思。


整体来看,这次降价潮中,大众层面吃瓜降价热点,但很多开发者反应相对平淡。这主要是因为:

*,实际部分应用场景中,开发者调用的仍主要是 OpenAI 的接口。其他模型则根据场景不同各有优劣。

第二,在早期量不大的情况下,开发者更在意的是切换模型是否会影响产品效果,是否会存在业务风险。

第三,很多潜在开发者或者潜在客户还处于找 TPM、PMF 的阶段,面临「找不到使用场景」、「不知道怎么用」等现实难题。

02

大厂谈「免费」,

创业者怎么办?

从 Founder Park 近期与行业交流的信息来看,当前模型层创业公司暂未产生媒体宣传中的恐慌。

多家创业公司的从业者告诉 Founder Park,大厂的「降价」、「免费」宣传加强了市场教育,利好全行业。

更为重要的意义是,这也给了应用侧行业信心,未来的 Token 成本一定是「便宜到可以忽略不计」的,会变成行业的基础设施,可以在这样的前提背景下解决真实问题、关键问题。

但对于独立的模型厂商来说,市场竞争会牵引行业在这个点上饱和攻击,最终让 Token 成本趋近于免费。接下来的竞争策略都是不得不思考的问题。这其中既包括业务模式的思考,也包括通过技术手段降低成本。

首先,如果模型本身可能很难收到钱,独立的模型厂商就不得不自研应用,考虑靠应用收回部分成本。大厂的模型降价潮奠定了未来模型本身可能不一定能赚钱的基调,模型厂商就不得不思考这一转变。Founder Park 近期与一些关注 AGI 的投资人交流,对方也表达了类似的观点。

从资本的视角来看,模型层公司自己研发应用一直很重要。但以往,主要是因为要对外传达自己是自己模型的*客户,既可以平摊一部分成本,又可以不断优化模型,才能打造自身模型的重要特色,并对类似客户形成吸引力。这与云厂商的发展策略类似。

这样的思考主要来自上一阶段的产业实践。比如,在大模型公司内部,他们往往有一套更有针对性的评测基准。一位知名大模型公司的产品负责人表示,这套内部的评测基准,需要非常漫长的调试才能成型,它实际上是一家大模型公司最核心的资产,为自己模型的训练和迭代提供方向。而这样的「资产」建立,也往往需要自有应用的支持和配合。

但当下,考虑到未来的降价潮、免费可能性,自研应用的战略意义也会进一步加强。

当前,大模型还是技术驱动,比拼性能,还处于「智能能力决定下限,决定是否可以普及」的阶段。随着开发者发现免费的模型只能解决「试用」场景时,最终还是会回归到性能的比拼,选择更有利于业务的模型。只有不断提升模型智能能力,才有机会活在牌桌上。

对于创业公司来说,专注在用技术的方式,去不断优化成本,不断从 infra 到模型训练和调优,再到交互的每个环节里,优化效率,才有可能在竞争中取得优势。这一点,字节旗下的豆包、火山云也提到了,火山引擎总裁谭待认为,「豆包模型的超低定价,来源于我们有信心用技术手段优化成本,而不是补贴或是打价格战争夺市场份额。」

其次,宣传层面,Founder Park 了解到,一些创业公司也在思考「免费」以外的宣传亮点,以获得更多用户。

成本不是当前客户*关注的重点。比如,傅盛提出「降价对企业用户影响有限。企业用户需要 AI 应用,更关心数据安全。现在开源小参数大模型加应用套件,可以满足绝大多数的企业需求了」。

03

降价是大势所趋,

未来 token 会便宜到忽略不计

虽然此次对云厂商真实降价力度存在争议,但可以预见,模型降价是大势所趋。放到更长线的产业周期里,未来 Token 的价格可能便宜到忽略不计。

首先,现实主义的原因是模型厂商「竞争策略」的需要。

短期来看,大模型厂商之间的差距并不明显。在没有杀手锏、护城河的情况下,低价就有可能是吸引客户的重要策略。

此前我们在《》一文中已经提到,大模型今天可以在模型的「能力范围内」做很多业务,但是成本非常高。比如,当前大模型的智商其实可以达到高中生水平,就可以做很多服务于幼儿、儿童的场景;比如大模型的幻觉能力,可以在一定场景中演变为创意能力,可以在创意行业应用。但是这些场景还很难在用户端收到足够多的钱,因此,过去一年中,很多做出有一定影响力产品的开发者都表达了「烧不起 Token」。

其次,基于摩尔定律,大模型属于 IT 技术,理论上成本也会不断降低。今天,大厂则是通过商业行为,加速了降价。

投资机构拾象在 2024 年初曾做过一个总结,「模型训练的成本在过去 18 个月已经降了 4- 5 倍,模型推理的成本在过去 18 个月降了 10 倍左右」。基于此,他们提出了「新时代摩尔定律」:每 1-2 年模型水平就能提升一到两代,模型训练成本每 18 个月就会降低至原来的 1/4、推理成本每 18 个月降低至是原来的 1/10,未来模型推理成本做到今天 1% 这件事是非常可预期的。

事实上,自去年市场上出现开源模型以来,整个市场的模型训练及模型调用成本也在大幅下滑,私有部署从最早的几千万元降到了几十万元量级,同样性能的模型成本至少低了不止一个数量级。

再次,只有 Token 成本足够低,才有可能促进大模型生态的繁荣,进而使得产业链上的公司都是赚钱的。

虽然每一代技术出现时,大家都会研究「先有鸡还是先有蛋」的问题,但历史多次证明,「只有看见才能相信」。摩尔定律之下,每个人都会保有成本降低的预期,但实际上只有看到性能的上限和可以做的事情开发者才有可能入场。

在上篇文章《》的《要「便宜的可以忽略不计」》的章节里,我们也提到:在 AGI 领域,如果有一种「智能聚合网络效应」,那么这种加强版网络效应就意味着,用户数量的增长能够带来系统整体价值的提升。在这样的背景下,免费模式理论上有可能成为一种有效的市场策略。在 AGI 领域中,如果免费模式有助于企业快速做大规模,进而有可能做大营收和利润,那么这种模式的可行性在很大程度上依赖于大模型推理的成本降低。大模型推理所需的 Token 是 AI 系统运作的基础,其成本直接影响到企业的运营费用和盈利能力。

为了确保免费模式或者低价模式的可行性,我们需要一个前提条件:未来大模型推理时的 Token 要便宜到忽略不计。为了生态的繁荣,最终也会倒逼上游降低成本。

当下,开发者毫无疑问的会成为稀缺资源,成为模型厂商争相抢夺的对象。有网友调侃,可能很快模型厂商就要给开发者发补贴了。

Founder Park 近期的访谈中,也有创业者表达出了对于大厂的顾虑,集中体现在对于大厂盗用创意与数据的担忧。考虑到今天的应用普遍都还「太轻」,这一顾虑或并不成立。

但当 Token 有可能便宜到忽略不计,未来的商业模式的规划或许更值得思考。很可能依据公司自身实力,未来的商业策略演变为两种完全不同的路径:一是服务于客户,向用户免费,依然走「大事业」路线,靠免费做大规模并谋求大 GMV 或者大流量;一是服务于用户,直接面向用户收费,实现更高的利润率。

而对于行业来说,更重要的因素或许还是,大模型的商业模式该如何走通

与其他软件行业相比,大模型的 ROI 在当下还很难算回来。一名有美国资本背景的投资人表示,在他看来,当前大模型公司的收入其实不能看做「ARR」,反而更应该看作实验性质的一次性收入,这笔收入很可能在 6 个月后因为新的模型出现而重新进行开发。

贾扬清在高山书院硅谷站「高山夜话」活动中也提到过类似的观点,「大模型对比传统软件,可以创造营收的时间太短」。开发完 Windows,可能在接下来的 5-10 年当中持续迭代、收回成本。但大模型每次训练过一个模型之后,下一次还是要从零开始重新训练,需要持续追加投入,但模型的迭代速度又很快,中间能够赚钱的时间窗口很可能是一年左右,甚至更短。

【本文由投资界合作伙伴极客公园授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。