36氪获悉,微软(MSFT.US)于美东时间2月7日(北京时间2月8日)宣布推出由OpenAI提供技术支持的最新版Bing(中文名“必应”)搜索引擎和Edge浏览器。新版Bing运行在比ChatGPT更先进的OpenAI语言模型上,但并不是之前坊间相传的GPT4模型。这次,主要有两个功能上的升级。
一是Bing搜索上的“问答搜索”功能,它被直接嵌入搜索引擎中。新版Edge浏览器添加了该版本的Bing,可以聊天、编写文本、汇总网页并以对话方式响应查询,改变了以往的搜索模式——以往是关键词适配,现在是新版Bing将搜罗整个网络的结果,从中找出并总结正在寻找的答案。
二是用户在Bing上可以随时随地切换到人工智能聊天模式,直接让人工智能回答问题,几乎可以询问任何内容,而机器人会在几秒钟内发送回复。
新版Edge浏览器添加了该版本的Bing,一个简单的快捷方式可以访问两个新功能,以聊天、编写文本、汇总网页并以对话方式响应查询。
来源:微软Edge聊天界面
而恰巧在2月7日,谷歌母公司Alphabet首席执行官桑达尔·皮查伊在一篇博客文章中表示,谷歌正在开放一项名为Bard的对话式人工智能服务项目。据皮查伊所述,这一工具软件将于今日提供给一组“值得信赖的测试者”,并在未来几周内公开发布。他还表示,谷歌计划在其搜索引擎增加人工智能功能。
而谷歌刚刚预告完,第二天微软就抢先推出搜索引擎智能对话产品,似乎是在于谷歌针锋相对。
据悉,谷歌的搜索引擎几乎占据了90%的市场份额,并且在很长一段时间内处于垄断地位。微软和OpenAI此举,不仅仅是想要在商业层面获得搜索引擎份额这么简单,或许甚至将打破多年来搜索引擎的固定形态,将重塑软件形态。
随着ChatGPT成为人尽皆知的“爆款”,微软或许成为*赢家:从投资角度,在收回投资之前,微软将获得OpenAI 75%的利润分成,之后微软将持有OpenAI 49%的股份,OpenAI一旦开始盈利,在返还First close partners(FCP)后,75%的盈利将回报给微软;从商业竞争角度,微软此次和Bing联动,或将改变互联网商业格局。
而微软或许早早就在准备这一天到来,2019年3月,成立四年后的OpenAI 设立OpenAI LP,从非盈利公司转型为有限盈利公司,并紧接着在7月宣布了微软的10亿美元注资。此外,OpenAI 同年还获得了来自Khosla Ventures、Reid Hoffman Foundation、Matthew Brown Companies的投资。
在2023年微软确认追加数十亿美元投资前,OpenAI 已完成六次融资。GPT-3、DALL·E 2图像生成器、ChatGPT这三个关键产出正是在OpenAI完成组织变革和一系列吸金动作后陆续推出的。
而当我们把视线收回到2019年,微软*次给OpenAI 10亿美元时,或许并没有想到自己将成为*赢家。
在2019年3月,Sam Altman接管OpenAI LP,改变了OpenAI的融资策略,而这一时间节点和事件,也成为微软和OpenAI的缘分起源。
凭借自身对AI行业的独特理解,以及从业多年对科技创投圈兴奋点的把控,Sam Altman显然向硅谷*讲述了他所认为的OpenAI的高估值故事,并在组织变革的关键时点成功将微软拉入局中,为这一估值故事背书。
如今看来,资金投入仅是微软和OpenAI合作的*层;微软押注OpenAI也绝非谋求未来利润回报这么简单。
一方面,OpenAI亟需算力投入和商业化背书。为拉动微软入局,Sam Altman做了不少努力。在接管OpenAI LP后,Altman多次飞往西雅图与微软CEO Satya Nadella进行交谈。
对OpenAI来说,来自微软的钱,以及以算力形式得到的“投资”,是通向AI之路的刚需。
钱和所有AI技术的关系都是必要不充分条件:钱不一定能砸出AI突破性进展,但是没钱一定做不出来对AI研发企业而言,无论是NLP模型的开发和训练,以及后续AI服务提供所需担负的算力成本和运营成本,还是需要向*科研人员支付的薪酬都是高昂的。
OpenAI又选择了一条更烧钱的技术路径——通过增加数据量、提高算力来提升模型性能。仅2022年,OpenAI就花费了约5.44亿美元,而收入仅为3600 万美元。
另一方面,微软也需要OpenAI。微软2015年推出Tay聊天机器人24小时就匆匆下线后,微软十分受挫,在AI技术商业化应用方面日渐式微,在基础研究层面也尚无具备广泛影响力的产出。而AI能力,尤其是大模型AI,对于每一个大厂来说都是防御性质的刚需领域,缺席意味着掉队。微软自然不甘直接放弃,亟需借助外力寻求技术突破,以重获AI竞争力。
2019年微软首次注资OpenAI后,双方开始在微软的Azure云计算服务上合作开发人工智能超级计算技术。同时,OpenAI逐渐将云计算服务从谷歌云迁移到Azure。有报道指出,OpenAI每年在微软云服务上模型训练花费约为7000万美元,构成了微软向OpenAI投资的重要部分。
有了微软云的加持,OpenAI码算力的能力和底气日渐增长,*个突破性成果GPT-3随之于2020年问世。而正是因为GPT-3的出现,又加剧了OpenAI对微软算力和资金的依赖:以GPT-3为例,2020年,大型语言模型GPT-3的发布使OpenAI在AIGC领域初露头角。聊天机器人ChatGPT正是在此模型基础上构建的。相较于2019年2月发布的GPT-2,GPT-3的模型能力得到了显著提升,易用性、安全性有了明显改进,在文案写作和总结、翻译、对话等任务中的表现都更加优异。也正因此,GPT-3成为了OpenAI*开放商用测试的语言模型。GPT-3和GPT-2的*区别在于模型规模更大——GPT-2拥有15亿参数,GPT-3则拥有1750亿参数,模型训练使用的数据量高达0.4万亿token。然而,和模型规模、训练数据量一样增长的,是GPT-3的模型训练成本。有数据显示,GPT-3的单次训练成本高达460万美元。
也是在2020年,微软买断了GPT-3基础技术的*许可,并获得了技术集成的优先授权,将GPT-3用于Office、搜索引擎Bing和设计应用程序Microsoft design等产品中,以优化现有工具,改进产品功能。
2021年微软再次投资,双方合作关系正式进入第二阶段,从合作探索期进入蜜月期。一方面,作为OpenAI的*云提供商,在Azure中集中部署OpenAI开发的GPT、DALLE、Codex等各类工具。这也形成了OpenAI最早的收入来源——通过Azure向企业提供付费API和AI工具。
与此同时,拥有OpenAI新技术商业化授权,微软开始将OpenAI工具与自有产品进行深度集成,并推出相应产品。例如,2021年6月基于Codex,微软联合OpenAI、GitHub 推出了AI代码补全工具GitHub Copilot。该产品于次年6月正式上线,以月付费10 美元或年付费100美元的形式提供服务。
2022年,微软开始通过Edge浏览器和Bing搜索引擎在部分国家和地区提供基于AI图像生成工具DALLE开发的Image creator新功能。同年10月,微软宣布将推出视觉设计工具Microsoft designer。
2023年初,微软对OpenAI的第三次出手,彻底拉开了AI军备竞赛的帷幕,也标志着OpenAI新技术商业化进入了新的阶段。
而在北京时间2月8日微软宣布将ChatGPT整合进其搜索引擎,则是向全世界官宣结盟。
但商业化问题依旧值得思考。市场或许是有的,但是微软如何以及能否借此增加用户粘性,以实现更高的搜索引擎市场份额,目前还尚不得知。
一是由于ChatGPT尚不支持获取实时数据,因此回答缺乏时效性,新版的Bing应该也尚无此特征;二是由于搜索引擎作为一款常用工具,相比于功能的多样化,信息的准确度可能更加重要。这也是有观点认为ChatGPT对Google搜索引擎业务的影响并不大的主要原因。
另外,新功能的接入给微软带来的收益能否覆盖云计算成本的增加也值得推敲。这个问题的答案不仅关乎OpenAI的高估值故事是否能够站得住脚,也是OpenAI和微软能否真正引发搜索引擎革命的关键。
已有数据来看,OpenAI的商业化之路或许并不轻松。据Fortune报道,有消息称OpenAI 2022年收入仅约 3500 万美元,目前仍处于严重亏损状态,但OpenAI预计其将于2023年、2024 年分别实现2亿美元、10 亿美元营收。
近期OpenAI和微软一系列“加强绑定”或是OpenAI 对商业化的逐步尝试。
从现有结果来看,通过指数级增长的计算资源投入,来实现技术持续改进,以量变推动质变,这一以快制胜的路径是OpenAI在这一阶段作出的正确选择。
对微软而言,不管OpenAI未来是否会在达成承诺的投资回报后拿回经营主动权,至少目前看来,微软已经靠“借力打力”在AI领域扳回一城。