最近两个多月,刺猬公社(ID:ciweigongshe)前往上海、杭州、成都、广州等城市拜访了多家公司。一个惊人的事实是,几乎所有公司——不论是做游戏的,还是做直播电商、新消费、教育培训、健身、播客、长短视频的——都在讨论一个共同话题:
以Chat GPT为代表的AIGC,会如何闯入并改变我们所在的行业?取代我的工作,还是给产业带来新的机会?
这个问题,Chat GPT暂时还回答不了。它可能组织一段逻辑通顺的语言,但想要获得更多新知,乃至找寻AIGC创业的参考,还得把目光放在大厂之外的AIGC创新者们。
在AI生成设计、AI生成虚拟人、AI生成音乐和对话式AI等四个AIGC创业的主流领域,刺猬公社对话了四家不同赛道的创业公司。相比Open AI等国内外大厂,我们能看到他们走出了一条完全不一样的道路:
从某种程度上讲,这些AIGC创新者所展现出的产品、商业和公司组织特质,甚至是“反传统互联网”的。
不问出处,都在人工智能创业
2023年2月,一份叫《ChatGPT团队背景研究报告》的文章在AIGC创业圈、投资圈和媒体圈盛传。研究团队针对ChatGPT项目做出贡献的87个成员进行了背景研究,其中,团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。他们的显著特征是“年纪很轻”“背景豪华”“聚焦技术”“积累深厚”“崇尚创业”和“华人抢眼”。
在以上这些特征中,名校背景以及技术实力夺人眼球,但更重要的是,对于这些人才来说,走前人未走过的路、开拓一个全新领域,是他们最重要的追求之一。这也鲜明的体现在了刺猬公社拜访的四家AIGC创业公司身上,尽管AI浪潮在2022年才正式开始,但这些公司创立的时间要早得多,在AIGC概念尚不清晰的时代,他们就已经开始了努力。
只不过那时的AI创业,没有如今的喝彩与关注。
时间拨回2016年,伴随VR浪潮的起伏,成维忠和创业团队把目光瞄准虚拟人赛道,于是,专攻虚拟人动作和表情生成技术的中科深智诞生了。但在动捕技术与动作表情库剪辑占主流的虚拟人市场,由深层次AI算法驱动虚拟人技术,并没有引起市场足够的重视。成维忠告诉我们,直到现在,国内外市场中使用这项技术的公司也并不多。
这也让公司的早期融资面临着不小的问题。在研发虚拟人驱动技术的过程中,中科深智也采用过动作捕捉与动作表情库剪辑,但成维忠始终认为,这些都不是虚拟人的原生技术,AI算法驱动才是未来最正确的道路。直到创业四年后,公司迎来了*笔融资,从2020年中到2021年末,中科深智获得了三轮融资,AI道路得以持续。
2022年是个变局,在此之前,AIGC不能算是虚拟人生成领域的*解,但大模型技术的发展成熟正在改变一切。在此基础上,中科深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想,虚拟人生成技术将会突飞猛进。几年内,AI将能完成动画电影级别的制作,80%以上的动画产品都可以利用AI生成,未来电影工业或许将会发生一场AI革命。
整个行业在“飞跃”,对于几年前的国内AI创业人们来说,这是难以想象的。
同样是2016年,还在清华读博的刘晓光加入了清华大学的一个专攻AI音乐的兴趣小组,这便是新音乐产业公司DeepMusic的前身。DeepMusic最早的目标是帮助音乐爱好者更高效率地创作音乐。但在当时的团队内部,已经萌生了AI基于人的交互生成音乐内容的想法,其实已经很“AIGC”了。
2018年,在刘晓光的带领下,DeepMusic从一个兴趣小组变成了一家科技公司,并拿到了清华系基金和音乐人李健的投资。用AI帮助音乐人创作,乃至AI自主创作音乐,成为了DeepMusic的目标。让刘晓光印象最深刻的是两年之后的2020年,全民K歌找到了他们,希望能够在平台内开发“一键remix”的功能,将已有的音乐伴奏进行风格化改编。
“他们提出的诉求是,一个月做出5万首左右的伴奏。一般来说,一个20人的音乐人团队需要两年左右才能完成。”刘晓光回忆,尽管DeepMusic的AI生成技术已经相对成熟,但并没有产品化,“这个要求是我们产能的10倍。”
这是DeepMusic*次大规模地应用自己的技术,在建立起了一个流水线化的生产流程后,一个月,他们最终完成了任务,5万首伴奏的通过率达到99%。与中科深智一样,DeepMusic的AI技术同样是应用在企业端的,早期的AIGC创业公司与传统的互联网公司不同,他们不追求直接触达C端,而是以输出技术的方式加持B端,这不仅关于技术能力的发展,更是由市场需求决定的。
直到2022年AI作画兴起,AIGC才真正开始走进C端市场,而DeepMusic一类的创业公司,则在B端更高要求的应用中,不断推进技术的发展。2022年,DeepMusic已经成为了国内头部的AI音乐公司,不仅拥有“配乐猫”“口袋音乐”等创作产品,还与QQ音乐等头部音乐平台展开合作,推出了多个AI音乐系统。
伴随时间的推移,在国内,真正面向更广阔用户,人们触手可及的AI产品也开始出现。计算美学旗下的画宇宙平台正是其中之一。
“从很早开始,我们就觉得人工智能加设计肯定是未来。”计算美学联合创始人赵哲析告诉刺猬公社,在营销场景不断增加的情况下,国内设计人才与设计力仍旧存在短板。想要解决长久以来的供求不平衡,必然需要新技术带来新变革。2020年12月,赵哲析和几个同学一起创办了计算美学,专攻AI设计领域。
他们*拿出了一款AI生成logo的产品,之后的2022年1月,进阶产品“图宇宙”正式推出,可以在AI技术的加持下实时生成海报。在当时的国内市场,AI生成海报的产品仅计算美学一家,2021年末,计算美学也获得了高瓴创投的数千万融资,新的产品也被提上日程。
不同于大多数AI作画平台,计算美学从一开始的目标就是希望利用AI赋能专业设计,2023年初,他们搭建起一个专业级别的智能设计平台——“画宇宙”,能够实现“无限画板”“实时编辑”,在AI的交互和可控方面更进一步。
值得关注的是,无论是计算美学和DeepMusic,他们的创业团队都有着深厚的名校背景。DeepMusic脱胎于清华大学的兴趣小组,核心成员基本都来自清华大学。计算美学同样有着类似的基因,据联合创始人赵哲析的介绍,计算美学的设计团队基本都来自清华大学美术学院,技术方面的成员则基本都来自清华和北大。
国内*高校背景、年轻的研发团队,他们依靠着自身的学术圈层聚集在一起,共同步入了一个未来风口之中。
而在对谈中,几位公司的创始人都提到了团队的一大特点,那就是团队的稳定。“对于很多算法工程师来说,做AIGC不一样,需要很深度的团队协作,在人工智能的团队里,长期投入才能看到成果。”成维忠告诉刺猬公社,AI创业并不简单,无论是研发技术还是产品,都需要长时间的投入。因此,相比于人员变动频繁的互联网行业来说,AI创业公司的技术团队非常稳固,创业几年过去,团队中最早的一批成员仍旧是中流砥柱。
“我们的核心算法团队从来没有变过。”秘塔科技联合创始人、首席运营官王益为告诉刺猬公社,他的另一个身份被更多人熟知:B站知名UP主“王一快”。
在AI创业之前,王一快是一名律师,2018年,他和几位NLP领域的技术专家一起成立了秘塔科技,最早从AI翻译服务切入,并逐步推出文本校对、改写润色等功能服务。秘塔科技是国内较早利用大语言模型技术推动AIGC内容的公司,“我们的技术路线,从2019年开始做写作猫就已经决定了。”
“2018年左右,我们都认为AI理解上下文语境是非常困难的,当时基本都是单轮问答,甚至单轮问答里面也不能设置太长的条件。”依靠对自身语言模型的不断的深度学习训练,2021年末,秘塔科技已经能够实现AI的多轮对话。
2023年,ChatGPT席卷全球;3月,秘塔科技推出了自研AI文本生成产品“对话写作猫”,算得上国内*批“中文ChatGPT产品”。在实际的体验中,对话写作猫已经能进行流畅的中文连续对话,并且在法律内容领域展现出了一定的优势。
向对话写作猫提问弱智吧问题
但差距仍然存在,“我们现在这个百亿级别参数的训练量还没有跑完,这更像是个Demo。”不过王一快对于未来信心满满。“我们还有很多办法让多轮对话去变得更加智能,可以期待,在半年之内能够达到跟ChatGPT持平的效果。”
在与四家公司的对谈中,我们能够勾勒出中国AI创业人的大体样貌:他们来自各行各业,基本都非常年轻、拥有名校背景、与此同时关注垂直领域,并拥有足够稳固的团队。跟许多互联网公司不同,他们不在意营销与流量,在AI这个全新的世界里,技术就是王道,而新浪潮的来临,则为他们带来了新的机会与新的挑战。
总的来说,不论AI生成设计、AI生成虚拟人,还是AI生成音乐、对话式AI,这些和大洋彼岸的Open AI、Google和Midjourney们处在同一赛道的中国AI创业者们,都想发挥自己的优势,努力向前奔跑。
中国AI创新者,不想“大干快上”
“我们想用对话写作猫给大家看一下,不是只有巨头才能干好,其实用少一点的资源、小一点点的模型,也能输出一个非常好的效果。”王一快说。
在访谈中,王一快常常把训练模型的过程比作“一个庞大而精细的工程”。它不是可控核聚变那样的颠覆性创新,但AI创新者们需要做的,是在资源有限的条件下,去完成这个可能有着海量细节的工程,为用户呈现出*的体验。那些“没钱干不了大模型”“百亿规模的模型就是不行”的声音,王一快并不认同。
以对话写作猫为例,其模型的成本、规模比ChatGPT低了一个数量级,但依然属于大语言模型,同样可以完成效果近似的中文对话。王一快透露,这是因为对话写作猫的模型参数规模更小,但做了更精细化的调优工作。“Open AI和某组织差不多,无限的弹药量——堆算力、扔数据,打出一个比较好的效果;我们创业公司没有那么多钱,用非常有限的资源,只能这么打。”
即便效果可能并不是100分,但对于中国的AIGC创新者来说,有和无的问题更为重要。“我们一定是先拿一个60分的产品出来用着,然后在骂声和叫好声中成长,慢慢地走到80分。”王一快说。
除了低成本和“小步快跑”,将创业方向放到互联网大厂尚未涉足的细分领域,也是很多AI创新者们的选择。
“我们在2018年前后判断,因为大厂的数据最多、资本集中,歌词生成这种自然语言的问题一定是大厂去做的。”而一般的算法工程,很难理解伴奏该怎么变、乐器该怎么弹、旋律该怎么写这类“小众”问题,这就是DeepMusic要去解决的。
在生成音乐的技术路线上,DeepMusic用的是“符号生成音乐”的路径,而不是音频的直接生成。也就是说,让AI检测中音频中的音乐知识,把音乐拆解成各种各样的模态符号,再利用符号去生产音乐。 “当符号描述出来以后,一个音乐人已经知道这些符号该怎么去配所有的乐器了。”
这样一来,生成所需技术的复杂度比大模型小很多,但通过符号生成,也可以通过自己的路径达到一个较好的音乐效果。
刘晓光表示,DeepMusic相当重视AI在专业用户中的应用,比如,他们希望让AI辅助音乐生产者的工作,真正嵌入音乐的生产流程里面。
在AI生成的过程中,可控是最难的。比如,当我们生成一段10秒的音乐时,想控制这段的音乐第二秒是什么样的非常困难。而如果不能实现可控,AI也就没办法被音乐生产者真正用上。此外,想要嵌入音乐人的工作流,还要做出一个音乐工作站——苹果系统里的“库乐队”,就是一个简易版的音乐工作站。DeepMusic同样花费了很多技术精力,做出了一个音乐工作站,支持词、曲、编、录、混的AI生成,并且用一个音乐引擎把这些模态结合起来。
与大厂在技术路线上的差异,体现在更多AIGC的细分赛道。CEO成维忠向我们对比了Open AI等大厂和中科深智的区别:
大厂们一般走从大语言模型到文生图再到文字生成视频、动画的技术路径,从生成图片到让图片动起来,“顺理成章”,这种动画、视频被业内称为“帧视频”,本质上是2D技术;
中科深智的技术则更类似3D,能够直接生成3D的动作表情数据,而这些数据本身是看不到的。它绕过了文字生成图片的环节,在渲染引擎的支持下,可以直接给出3D效果的虚拟形象。
而“3D”能带来的好处是,在视频质量和实时生成上有较大优势,能够满足专业内容和人机交互的需要。在元宇宙中也能更加适配3D立体环境,成为元宇宙的基础设施。
“我们自己的定位首先是个技术公司,不是应用公司。”成维忠向我们强调,“我们的核心是搞定生成式AI。”对于业内流行的动作库、表情库、动作捕捉等技术去驱动虚拟人,中科深智从2022年上半年起就逐渐用AI生成,替换用模型库来创造虚拟人的方式。
这不意味着AI创新公司和大厂之间是对立的,也不乏两者合作的案例。比如中科深智,就和英伟达、Unity等公司合作;计算美学,和百度文心大模型以调用接口的方式进行合作。这可以让AI创新公司们“站上巨人的肩膀”,将更多资源用在自己的竞争优势上。
计算美学的一大优势在于打通了各种AI技术之间的壁垒,可以在AI生成的过程中做消除、擦除,也可以做扩展延伸,还可以根据文字进行调优。
在众多文生图产品中,常常需要用户像“抽盲盒”一样,生成好多次才能想要得到一张满意的图片,无法干预生成的过程。 “我们一直强调AIGC的能力要可控”,赵哲析说,“越可控,效果越好,越能为客户产生价值。”
“我们应用层更多的是以需求为导向去做创新”。赵哲析告诉刺猬公社,AI产业可以分为三层——基础层,也就是阿里云、腾讯云、华为云等云计算厂商,他们负责提供算力;模型层,以百度文心、Open AI等大模型厂商为代表;而计算美学处于第三层——应用层,在以上底层能力的基础上,开发创新性的应用产品,而不是做前期投入较高的基础性研究。
商业化:AI、G、C,该走哪条路?
在AIGC的商业化上,追赶Google和Open AI的中国AI创业者们常常被诟病的,不是商业化太慢了,而是太早就赶着去做商业化。
有人举例子说,百度度秘(小度前身)刚学会基本对话就做了小度AI、阿里达摩院对话机器人刚能说话就转向阿里小蜜客服机器人、无人驾驶刚学会低速行驶和认障碍物就搞无人车配送,认为“国内的AI一出生就接受生存教育,未成年就走出家门去赚钱。”
先不论这种声音是否片面,但它道出了国内AIGC创业的一个困境:要在何时、以何种方式走向市场,与千行百业发生联系?
“作为一个实际的从业者,抱怨或者指责没有意义。”对于“国内AI商业化是否操之过急”的问题,王一快认为各个国家有不同的国情,AI产业的发展模式也不会相同。只有顺应潮流,满足大家对AI发展的期待。
“你不早点让它落地,这事就做不起来。”他说,特别是在国内,“用户和企业都是非常实际的,谁效果好、谁能快速地给我带来直接的收益,我就用谁的,而不是迷信大厂。”
除了对于“何时搞商业化”的讨论,AIGC商业化的焦点还集中在以下两个维度:
一是AIGC商业化的方向,是靠AI赚钱,还是靠AI生产出的内容?
二是要做To B,还是To C?
先看*个问题。对于“AIGC”这四个字母,刘晓光将之拆分为AI、G和C,其中AI意味着内容生产的形式,G代表内容生产的过程,C就是生产出来的内容。
AI的意义,在于让生产变得更快、更便宜。内容本来就可以不依靠AI生产出来,但AI的参与,能让投入产出比小于1的事情大于1,让它变得商业价值。从这个角度看,AI的商业化核心,在于解决To B的问题。
相对来说,G和C更加偏向To C,就是“做一个AI,让用户能够生产出可消费的内容”。而这种模式和20年前互联网“羊毛出在猪身上狗买单”的商业模式没有本质区别,都是通过产品吸引用户停留,然后在用户时长的基础上卖广告。
“现在没有流量红利了,所以这种模式可能并不是现在应该优先尝试的方向。”刘晓光说,“做一个更好的内容生产工具,让人生产出可消费内容,然后聚集起来做一个平台,这件事可能很困难。”
比如DeepMusic的产品“口袋乐队”,在没怎么投流的状态下仍能留存不少忠实用户,但刘晓光不认为在此基础上做个内容社区是个好选择。相比无数渴望实现从工具到社区跨越的互联网从业者,这种思路显得颇为不同。
DeepMusic AI生成的音乐集
在UGC时代,内容就已经迎来了大爆发,到了AIGC时代,内容生产的成本又低了几个量级,C的供给越发远大于求。比如音乐,2022年中国生产了大约300万首音乐,而人们会去听的,只有几千首。在流量红利消失之时,只有那些具有消费潜力的内容——那些用户愿意去看、愿意去听的——才有价值。
既然AI内容社区和AI内容本身的商业化困难重重,那么,什么才是AIGC商业化的希望所在?
“C可能并不是下一个爆发点。”刘晓光说,“G可能是下一个内容生产的爆发点。”
他进一步解释,过去可能有人对一件事感兴趣,但被一些复杂的学习门槛卡在外面;现在,由于AI的参与,不用学习也可以参与制作,摆脱知识的局限,并在其中找到心流体验、感受有趣的生产过程。最终,人们可以利用AI工具去完成艺术探索,实现AIGC对UGC的反哺。“我们实际上是在做AI音乐制作人,把音乐生产各个环节里的辅助工具给到用户,让AI告诉你怎么去做音乐。”
至于做To B还是To C,受制于国内用户付费习惯的限制,面向To B客户做标准化产品,是AIGC创业中的主流选择。“做技术的公司一旦开始个性化定制,规模效应就出不来。我们公司成立以来,只要是做都是以标准化产品为主。”成维忠说,目前主要收入来自于SaaS服务,即使有定制的需求,也只提供虚拟人底层能力的定制,其他的定制工作都是交给其他合作伙伴集成商完成的。
“一定是要做标品的。”王一快也表示,在To B的业务中以标准化产品为主,向用户提供大模型的API接口。“如果做模型的定制,目前看来耗费的人力、提供的服务还是非常重的,可能只会按照大的行业去进行调优。”
赵哲析也认为,“AIGC商业化更多的机会还是在To B上面。”To C更多的只是围绕流量做用户转化,但尝鲜用户的多是一次性行为,深入使用和付费意愿也相对较低。因此,计算美学从一开始做产品就是定位在面向To B行业。
想要在To C上做商业化,也不是完全没有空间,只不过机会可能不在国内。成维忠透露,他们想要在海外布局一个可以由文字生成3D动画的产品,以订阅制方式做商业化,不再区分To B还是To C。
不过,对于AIGC创业者们来说,一切其实都在变化,远未来到定局。赵哲析告诉我们, 他的工作时间里7成是在解决现有的需求,3成要在做探索。“最懂AIGC的应该是我们这些从业者,不能指望着你的客户去你提需求提得特别精准。”
这种工作逻辑有点像调查和实验:提出假设、论证假设,修改假设再去论证假设,最后把它变为真正能落地的东西。“创业最怕剃头挑子一头热,你以为解决了一个天大的需求,找到目标客户一问人家说不需要。”赵哲析说,“我们是很务实的。
AI的未来,人机交互革命?
商业化、供需、应用,在一系列行业面对的实际问题之下,AI创业者们脚踏实地,但也把目光投向了未来。
在与四位创始人的对谈中,几乎每位都提到了“人机交互”,在他们看来,AIGC不仅是生成内容的变革,更在于人机交互形式的革新,这也是他们能在浪潮来临前入局AIGC创业的深层原因。
“最早我们与计算机交互可能是纸上打孔,之后是DOS系统的代码,随后是利用鼠标和键盘与计算机交互,再到如今用手指点屏幕,下一步,很可能就是利用语音直接与机器进行交互。”在刘晓光看来,未来可能会出现基于自然语言交互的操作系统,对于偏向内容型的服务行业,会有一个新的入口可以去占领。
“我们希望音乐能够被更多感官所感受,实现更游戏化的音乐欣赏过程以及娱乐过程。”在做音乐AIGC的过程中,DeepMusic一直希望把音乐变成一种“不只通过耳朵摄入的内容”,用声音的模态和图像、视频的模态结合起来,生成多模态的内容,为用户提供一种新的服务形式。
这并不是一种“空中楼阁”式的设想,在刘晓光的认知里,AIGC将开拓更多元的交互场景与内容消费方式。“一些小公司没有能力去做大模型,那是大资本集中去做的事。但在应用上,AIGC可以做到许多新的服务形式,并且找到新的入口去占领。”
刘晓光特别看好教育和游戏领域的“强人机交互”属性,“用户在付费的时候都会有一个心理钱包的问题,比如说为了一个工具、一个视频平台付费,意愿可能没那么强,但为了游戏可能会花很多钱。”因此,AIGC*波成功的商业化,很可能发生在游戏化或者教育化的应用上。
计算美学同样是在人机交互协作的理念下,才开发出了画宇宙这样的工具类AI产品,他们考虑到的则是未来内容生产模式的变化。
“人机协作方式利用AI把设计变得可量化,帮助设计师的生产。”交互也体现在了产品的设计上,“画宇宙”让AI作图不仅是人输入指令、AI生产作品那么简单,而且利用智能工具总结梳理素材,并进行实时修改与编辑,真正实现人机的共创,“这是以往产品形态做不到的”。
这并非是一厢情愿的构想,在2023年,AIGC及大语言模型技术已经在改变内容生产的模式,“人机交互”的革新也正在发生。3月16日,微软的Copilot正式发布,其将大型语言模型的能力嵌入到Microsoft 365应用程序中,在Word、Excel、PowerPoint、Outlook等产品中都有应用。
我们能够清晰的看到生产与工作的方式在被改变,无论是根据用户需求生成文档、PPT,还是协助用户分析数据,制定计划、编写讲稿,借由AI强大的理解能力,人机交互变得更加有效,大量的生产力将被解放。
这或许将不亚于从DOS系统打孔输入指令到鼠标键盘交互的变革。AIGC的发展不仅是AI智能提升这么简单,更重要的是其能更好的整合数据资源,实现高效率的指令触达,并且这种提升是指数级的,人与机器、算力的关系将被重构。
“我们最近在梳理一个新的领域,NUI,也就是自然用户界面。”同样的,在中科深智的构想中,AIGC的发展将催动下一代操作系统的诞生。过往的功能菜单将会被自然语言对话取代,想要实现交互,只要最简单的对话与动作就能实现。
成维忠还将人机交互革新扩展开来。他提到了元宇宙概念,作为把沉浸式体验作为核心研发方向的公司,中科深智一开始就把AI算法驱动虚拟人视为通往真正元宇宙的入口。
他认为,在视觉技术、XR技术的发展之下,元宇宙的场景、物品都能得到不错的解决方案,目前相关技术也已经较为成熟,但在元宇宙中“人”则是最难点。无论是虚拟空间的NPC,还是现实人类的虚拟化身,都需要更好的交互体验,而AIGC则是最重要的解决方案。
“元宇宙它本身其实是更加社交属性的,在虚拟化的社区里,人和人之间的交流就变得非常的重要,没有非常好的Ai的技术,实际上就做不到真正的千人千面,所有人的动作表情都一样。”AI则能成为解决实时交互问题的核心技术,在成维忠的眼中,AIGC的发展成熟更能够催动真正元宇宙的来临。
对于元宇宙行业来说,ChatGPT及大语言模型为代表的AI生产力或许并非取代者,而能够带来真正的加持。在过去的元宇宙设想中,高效率的数字资产生产与有效的社交交互是虚拟世界的*痛点之一,而在AI技术的加持下,无论是场景、道具生成,还是虚拟人驱动,或许都将迎来新的机会。
在未来,3D内容创作者或许也可以将AIGC技术应用于创作中。不同于以前的费力建模,伴随AIGC的发展,输入prompt、或者“口述”,场景与人物、道具就能直接生成,同样也能加持人们的虚拟体验。据悉,世界*的“元宇宙”平台Roblox正在构建一个AIGC平台,希望发展通过语音、文本或基于触摸的手势,取代鼠标和键盘移动,即可实现傻瓜式创建的便利工具,通过AIGC将其平台上5880万用户打造成为创作者。AIGC正在真实的改变这些新兴的行业。
说回国内的AIGC创业者们。在这场人机交互革命之中,微软、谷歌、OpenAI等大厂所做的,就是依赖大模型产品搭建新一代操作系统的基础设施,正如百度CEO李彦宏在近期的访谈中所说,不会再出现一个OpenAI,没必要重复造轮子,在技术底层、大模型技术领域,在客观条件之下,国内AIGC创业公司或许已经失去机会,但在应用层,一切都还刚刚开始。
大厂们忙着搞“基础设施”,而我们所关注到的这些AIGC创业公司们,则在各个垂直领域深扎下去,依靠他们掌握的技术及产品,或许能够成为这个未来操作系统的组成部分,也就是一个个具体的“功能”。这也是属于他们的天地。
尾声
在刺猬公社遇见的AIGC创业者中,始终有着一个疑问,AI产业的春天真的到了吗?
而产业大爆发的卡点,恰恰是AIGC技术本身。
成维忠举了AI生成虚拟人方面的例子——现在能生成双人的交互,多人交互还做不到。只有进一步突破技术障碍,才能未来在游戏、动画等领域大规模应用。刘晓光表示DeepMusic希望做些“增量”,在AI技术的支持下,让更多人参与到音乐的生产过程中,“真正让内容生产者,用AI工具做自己想做的事。”
至于商业化的难点,“我认为没啥难点。”成维忠说,“因为技术还没到,所以能啃下的市场还是很少。挖空心思地‘想出一个市场’去规避掉技术问题,我觉得没必要。”未来,做AIGC还是要拼技术赚钱。
因此,此时此刻正处于聚光灯下、浪尖之上的AIGC创业者们,也要做“时间的朋友”。
“等风口过去了之后,才真正进入落地的场景。”王一快说,“就像我们当初讨论5G一样,等到现在都不讨论这件事了,说明它已经成了一个基础设施,大家真正能用上了。”
(本文头图由计算美学产品“画宇宙”AI生成)