中国AIGC创新，一场「逆互联网」式创业

一是AIGC商业化的方向，是靠AI赚钱，还是靠AI生产出的内容？二是要做To B，还是To C？

刺猬公社

2023-04-14 07:34 刺猬公社

+ 关注

最近两个多月，刺猬公社（ID：ciweigongshe）前往上海、杭州、成都、广州等城市拜访了多家公司。一个惊人的事实是，几乎所有公司——不论是做游戏的，还是做直播电商、新消费、教育培训、健身、播客、长短视频的——都在讨论一个共同话题：

以Chat GPT为代表的AIGC，会如何闯入并改变我们所在的行业？取代我的工作，还是给产业带来新的机会？

这个问题，Chat GPT暂时还回答不了。它可能组织一段逻辑通顺的语言，但想要获得更多新知，乃至找寻AIGC创业的参考，还得把目光放在大厂之外的AIGC创新者们。

在AI生成设计、AI生成虚拟人、AI生成音乐和对话式AI等四个AIGC创业的主流领域，刺猬公社对话了四家不同赛道的创业公司。相比Open AI等国内外大厂，我们能看到他们走出了一条完全不一样的道路：

从某种程度上讲，这些AIGC创新者所展现出的产品、商业和公司组织特质，甚至是“反传统互联网”的。

不问出处，都在人工智能创业

2023年2月，一份叫《ChatGPT团队背景研究报告》的文章在AIGC创业圈、投资圈和媒体圈盛传。研究团队针对ChatGPT项目做出贡献的87个成员进行了背景研究，其中，团队成员绝大多数拥有名校学历，且具有全球知名企业工作经历。他们的显著特征是“年纪很轻”“背景豪华”“聚焦技术”“积累深厚”“崇尚创业”和“华人抢眼”。

在以上这些特征中，名校背景以及技术实力夺人眼球，但更重要的是，对于这些人才来说，走前人未走过的路、开拓一个全新领域，是他们最重要的追求之一。这也鲜明的体现在了刺猬公社拜访的四家AIGC创业公司身上，尽管AI浪潮在2022年才正式开始，但这些公司创立的时间要早得多，在AIGC概念尚不清晰的时代，他们就已经开始了努力。

只不过那时的AI创业，没有如今的喝彩与关注。

时间拨回2016年，伴随VR浪潮的起伏，成维忠和创业团队把目光瞄准虚拟人赛道，于是，专攻虚拟人动作和表情生成技术的中科深智诞生了。但在动捕技术与动作表情库剪辑占主流的虚拟人市场，由深层次AI算法驱动虚拟人技术，并没有引起市场足够的重视。成维忠告诉我们，直到现在，国内外市场中使用这项技术的公司也并不多。

这也让公司的早期融资面临着不小的问题。在研发虚拟人驱动技术的过程中，中科深智也采用过动作捕捉与动作表情库剪辑，但成维忠始终认为，这些都不是虚拟人的原生技术，AI算法驱动才是未来最正确的道路。直到创业四年后，公司迎来了*笔融资，从2020年中到2021年末，中科深智获得了三轮融资，AI道路得以持续。

2022年是个变局，在此之前，AIGC不能算是虚拟人生成领域的*解，但大模型技术的发展成熟正在改变一切。在此基础上，中科深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想，虚拟人生成技术将会突飞猛进。几年内，AI将能完成动画电影级别的制作，80%以上的动画产品都可以利用AI生成，未来电影工业或许将会发生一场AI革命。

整个行业在“飞跃”，对于几年前的国内AI创业人们来说，这是难以想象的。

同样是2016年，还在清华读博的刘晓光加入了清华大学的一个专攻AI音乐的兴趣小组，这便是新音乐产业公司DeepMusic的前身。DeepMusic最早的目标是帮助音乐爱好者更高效率地创作音乐。但在当时的团队内部，已经萌生了AI基于人的交互生成音乐内容的想法，其实已经很“AIGC”了。

2018年，在刘晓光的带领下，DeepMusic从一个兴趣小组变成了一家科技公司，并拿到了清华系基金和音乐人李健的投资。用AI帮助音乐人创作，乃至AI自主创作音乐，成为了DeepMusic的目标。让刘晓光印象最深刻的是两年之后的2020年，全民K歌找到了他们，希望能够在平台内开发“一键remix”的功能，将已有的音乐伴奏进行风格化改编。

“他们提出的诉求是，一个月做出5万首左右的伴奏。一般来说，一个20人的音乐人团队需要两年左右才能完成。”刘晓光回忆，尽管DeepMusic的AI生成技术已经相对成熟，但并没有产品化，“这个要求是我们产能的10倍。”

这是DeepMusic*次大规模地应用自己的技术，在建立起了一个流水线化的生产流程后，一个月，他们最终完成了任务，5万首伴奏的通过率达到99%。与中科深智一样，DeepMusic的AI技术同样是应用在企业端的，早期的AIGC创业公司与传统的互联网公司不同，他们不追求直接触达C端，而是以输出技术的方式加持B端，这不仅关于技术能力的发展，更是由市场需求决定的。

直到2022年AI作画兴起，AIGC才真正开始走进C端市场，而DeepMusic一类的创业公司，则在B端更高要求的应用中，不断推进技术的发展。2022年，DeepMusic已经成为了国内头部的AI音乐公司，不仅拥有“配乐猫”“口袋音乐”等创作产品，还与QQ音乐等头部音乐平台展开合作，推出了多个AI音乐系统。

伴随时间的推移，在国内，真正面向更广阔用户，人们触手可及的AI产品也开始出现。计算美学旗下的画宇宙平台正是其中之一。

“从很早开始，我们就觉得人工智能加设计肯定是未来。”计算美学联合创始人赵哲析告诉刺猬公社，在营销场景不断增加的情况下，国内设计人才与设计力仍旧存在短板。想要解决长久以来的供求不平衡，必然需要新技术带来新变革。2020年12月，赵哲析和几个同学一起创办了计算美学，专攻AI设计领域。

他们*拿出了一款AI生成logo的产品，之后的2022年1月，进阶产品“图宇宙”正式推出，可以在AI技术的加持下实时生成海报。在当时的国内市场，AI生成海报的产品仅计算美学一家，2021年末，计算美学也获得了高瓴创投的数千万融资，新的产品也被提上日程。

不同于大多数AI作画平台，计算美学从一开始的目标就是希望利用AI赋能专业设计，2023年初，他们搭建起一个专业级别的智能设计平台——“画宇宙”，能够实现“无限画板”“实时编辑”，在AI的交互和可控方面更进一步。

值得关注的是，无论是计算美学和DeepMusic，他们的创业团队都有着深厚的名校背景。DeepMusic脱胎于清华大学的兴趣小组，核心成员基本都来自清华大学。计算美学同样有着类似的基因，据联合创始人赵哲析的介绍，计算美学的设计团队基本都来自清华大学美术学院，技术方面的成员则基本都来自清华和北大。

国内*高校背景、年轻的研发团队，他们依靠着自身的学术圈层聚集在一起，共同步入了一个未来风口之中。

而在对谈中，几位公司的创始人都提到了团队的一大特点，那就是团队的稳定。“对于很多算法工程师来说，做AIGC不一样，需要很深度的团队协作，在人工智能的团队里，长期投入才能看到成果。”成维忠告诉刺猬公社，AI创业并不简单，无论是研发技术还是产品，都需要长时间的投入。因此，相比于人员变动频繁的互联网行业来说，AI创业公司的技术团队非常稳固，创业几年过去，团队中最早的一批成员仍旧是中流砥柱。

“我们的核心算法团队从来没有变过。”秘塔科技联合创始人、首席运营官王益为告诉刺猬公社，他的另一个身份被更多人熟知：B站知名UP主“王一快”。

在AI创业之前，王一快是一名律师，2018年，他和几位NLP领域的技术专家一起成立了秘塔科技，最早从AI翻译服务切入，并逐步推出文本校对、改写润色等功能服务。秘塔科技是国内较早利用大语言模型技术推动AIGC内容的公司，“我们的技术路线，从2019年开始做写作猫就已经决定了。”

“2018年左右，我们都认为AI理解上下文语境是非常困难的，当时基本都是单轮问答，甚至单轮问答里面也不能设置太长的条件。”依靠对自身语言模型的不断的深度学习训练，2021年末，秘塔科技已经能够实现AI的多轮对话。

2023年，ChatGPT席卷全球；3月，秘塔科技推出了自研AI文本生成产品“对话写作猫”，算得上国内*批“中文ChatGPT产品”。在实际的体验中，对话写作猫已经能进行流畅的中文连续对话，并且在法律内容领域展现出了一定的优势。

向对话写作猫提问弱智吧问题

但差距仍然存在，“我们现在这个百亿级别参数的训练量还没有跑完，这更像是个Demo。”不过王一快对于未来信心满满。“我们还有很多办法让多轮对话去变得更加智能，可以期待，在半年之内能够达到跟ChatGPT持平的效果。”

在与四家公司的对谈中，我们能够勾勒出中国AI创业人的大体样貌：他们来自各行各业，基本都非常年轻、拥有名校背景、与此同时关注垂直领域，并拥有足够稳固的团队。跟许多互联网公司不同，他们不在意营销与流量，在AI这个全新的世界里，技术就是王道，而新浪潮的来临，则为他们带来了新的机会与新的挑战。

总的来说，不论AI生成设计、AI生成虚拟人，还是AI生成音乐、对话式AI，这些和大洋彼岸的Open AI、Google和Midjourney们处在同一赛道的中国AI创业者们，都想发挥自己的优势，努力向前奔跑。

中国AI创新者，不想“大干快上”

“我们想用对话写作猫给大家看一下，不是只有巨头才能干好，其实用少一点的资源、小一点点的模型，也能输出一个非常好的效果。”王一快说。

在访谈中，王一快常常把训练模型的过程比作“一个庞大而精细的工程”。它不是可控核聚变那样的颠覆性创新，但AI创新者们需要做的，是在资源有限的条件下，去完成这个可能有着海量细节的工程，为用户呈现出*的体验。那些“没钱干不了大模型”“百亿规模的模型就是不行”的声音，王一快并不认同。

以对话写作猫为例，其模型的成本、规模比ChatGPT低了一个数量级，但依然属于大语言模型，同样可以完成效果近似的中文对话。王一快透露，这是因为对话写作猫的模型参数规模更小，但做了更精细化的调优工作。“Open AI和某组织差不多，无限的弹药量——堆算力、扔数据，打出一个比较好的效果；我们创业公司没有那么多钱，用非常有限的资源，只能这么打。”

即便效果可能并不是100分，但对于中国的AIGC创新者来说，有和无的问题更为重要。“我们一定是先拿一个60分的产品出来用着，然后在骂声和叫好声中成长，慢慢地走到80分。”王一快说。

除了低成本和“小步快跑”，将创业方向放到互联网大厂尚未涉足的细分领域，也是很多AI创新者们的选择。

“我们在2018年前后判断，因为大厂的数据最多、资本集中，歌词生成这种自然语言的问题一定是大厂去做的。”而一般的算法工程，很难理解伴奏该怎么变、乐器该怎么弹、旋律该怎么写这类“小众”问题，这就是DeepMusic要去解决的。

在生成音乐的技术路线上，DeepMusic用的是“符号生成音乐”的路径，而不是音频的直接生成。也就是说，让AI检测中音频中的音乐知识，把音乐拆解成各种各样的模态符号，再利用符号去生产音乐。 “当符号描述出来以后，一个音乐人已经知道这些符号该怎么去配所有的乐器了。”

这样一来，生成所需技术的复杂度比大模型小很多，但通过符号生成，也可以通过自己的路径达到一个较好的音乐效果。

刘晓光表示，DeepMusic相当重视AI在专业用户中的应用，比如，他们希望让AI辅助音乐生产者的工作，真正嵌入音乐的生产流程里面。

在AI生成的过程中，可控是最难的。比如，当我们生成一段10秒的音乐时，想控制这段的音乐第二秒是什么样的非常困难。而如果不能实现可控，AI也就没办法被音乐生产者真正用上。此外，想要嵌入音乐人的工作流，还要做出一个音乐工作站——苹果系统里的“库乐队”，就是一个简易版的音乐工作站。DeepMusic同样花费了很多技术精力，做出了一个音乐工作站，支持词、曲、编、录、混的AI生成，并且用一个音乐引擎把这些模态结合起来。

与大厂在技术路线上的差异，体现在更多AIGC的细分赛道。CEO成维忠向我们对比了Open AI等大厂和中科深智的区别：

大厂们一般走从大语言模型到文生图再到文字生成视频、动画的技术路径，从生成图片到让图片动起来，“顺理成章”，这种动画、视频被业内称为“帧视频”，本质上是2D技术；

中科深智的技术则更类似3D，能够直接生成3D的动作表情数据，而这些数据本身是看不到的。它绕过了文字生成图片的环节，在渲染引擎的支持下，可以直接给出3D效果的虚拟形象。

而“3D”能带来的好处是，在视频质量和实时生成上有较大优势，能够满足专业内容和人机交互的需要。在元宇宙中也能更加适配3D立体环境，成为元宇宙的基础设施。

“我们自己的定位首先是个技术公司，不是应用公司。”成维忠向我们强调，“我们的核心是搞定生成式AI。”对于业内流行的动作库、表情库、动作捕捉等技术去驱动虚拟人，中科深智从2022年上半年起就逐渐用AI生成，替换用模型库来创造虚拟人的方式。

这不意味着AI创新公司和大厂之间是对立的，也不乏两者合作的案例。比如中科深智，就和英伟达、Unity等公司合作；计算美学，和百度文心大模型以调用接口的方式进行合作。这可以让AI创新公司们“站上巨人的肩膀”，将更多资源用在自己的竞争优势上。

计算美学的一大优势在于打通了各种AI技术之间的壁垒，可以在AI生成的过程中做消除、擦除，也可以做扩展延伸，还可以根据文字进行调优。

在众多文生图产品中，常常需要用户像“抽盲盒”一样，生成好多次才能想要得到一张满意的图片，无法干预生成的过程。 “我们一直强调AIGC的能力要可控”，赵哲析说，“越可控，效果越好，越能为客户产生价值。”

“我们应用层更多的是以需求为导向去做创新”。赵哲析告诉刺猬公社，AI产业可以分为三层——基础层，也就是阿里云、腾讯云、华为云等云计算厂商，他们负责提供算力；模型层，以百度文心、Open AI等大模型厂商为代表；而计算美学处于第三层——应用层，在以上底层能力的基础上，开发创新性的应用产品，而不是做前期投入较高的基础性研究。

商业化：AI、G、C，该走哪条路？

在AIGC的商业化上，追赶Google和Open AI的中国AI创业者们常常被诟病的，不是商业化太慢了，而是太早就赶着去做商业化。

有人举例子说，百度度秘（小度前身）刚学会基本对话就做了小度AI、阿里达摩院对话机器人刚能说话就转向阿里小蜜客服机器人、无人驾驶刚学会低速行驶和认障碍物就搞无人车配送，认为“国内的AI一出生就接受生存教育，未成年就走出家门去赚钱。”

先不论这种声音是否片面，但它道出了国内AIGC创业的一个困境：要在何时、以何种方式走向市场，与千行百业发生联系？

“作为一个实际的从业者，抱怨或者指责没有意义。”对于“国内AI商业化是否操之过急”的问题，王一快认为各个国家有不同的国情，AI产业的发展模式也不会相同。只有顺应潮流，满足大家对AI发展的期待。

“你不早点让它落地，这事就做不起来。”他说，特别是在国内，“用户和企业都是非常实际的，谁效果好、谁能快速地给我带来直接的收益，我就用谁的，而不是迷信大厂。”

除了对于“何时搞商业化”的讨论，AIGC商业化的焦点还集中在以下两个维度：

一是AIGC商业化的方向，是靠AI赚钱，还是靠AI生产出的内容？

二是要做To B，还是To C？

先看*个问题。对于“AIGC”这四个字母，刘晓光将之拆分为AI、G和C，其中AI意味着内容生产的形式，G代表内容生产的过程，C就是生产出来的内容。

AI的意义，在于让生产变得更快、更便宜。内容本来就可以不依靠AI生产出来，但AI的参与，能让投入产出比小于1的事情大于1，让它变得商业价值。从这个角度看，AI的商业化核心，在于解决To B的问题。

相对来说，G和C更加偏向To C，就是“做一个AI，让用户能够生产出可消费的内容”。而这种模式和20年前互联网“羊毛出在猪身上狗买单”的商业模式没有本质区别，都是通过产品吸引用户停留，然后在用户时长的基础上卖广告。

“现在没有流量红利了，所以这种模式可能并不是现在应该优先尝试的方向。”刘晓光说，“做一个更好的内容生产工具，让人生产出可消费内容，然后聚集起来做一个平台，这件事可能很困难。”

比如DeepMusic的产品“口袋乐队”，在没怎么投流的状态下仍能留存不少忠实用户，但刘晓光不认为在此基础上做个内容社区是个好选择。相比无数渴望实现从工具到社区跨越的互联网从业者，这种思路显得颇为不同。

DeepMusic AI生成的音乐集

在UGC时代，内容就已经迎来了大爆发，到了AIGC时代，内容生产的成本又低了几个量级，C的供给越发远大于求。比如音乐，2022年中国生产了大约300万首音乐，而人们会去听的，只有几千首。在流量红利消失之时，只有那些具有消费潜力的内容——那些用户愿意去看、愿意去听的——才有价值。

既然AI内容社区和AI内容本身的商业化困难重重，那么，什么才是AIGC商业化的希望所在？

“C可能并不是下一个爆发点。”刘晓光说，“G可能是下一个内容生产的爆发点。”

他进一步解释，过去可能有人对一件事感兴趣，但被一些复杂的学习门槛卡在外面；现在，由于AI的参与，不用学习也可以参与制作，摆脱知识的局限，并在其中找到心流体验、感受有趣的生产过程。最终，人们可以利用AI工具去完成艺术探索，实现AIGC对UGC的反哺。“我们实际上是在做AI音乐制作人，把音乐生产各个环节里的辅助工具给到用户，让AI告诉你怎么去做音乐。”

至于做To B还是To C，受制于国内用户付费习惯的限制，面向To B客户做标准化产品，是AIGC创业中的主流选择。“做技术的公司一旦开始个性化定制，规模效应就出不来。我们公司成立以来，只要是做都是以标准化产品为主。”成维忠说，目前主要收入来自于SaaS服务，即使有定制的需求，也只提供虚拟人底层能力的定制，其他的定制工作都是交给其他合作伙伴集成商完成的。

“一定是要做标品的。”王一快也表示，在To B的业务中以标准化产品为主，向用户提供大模型的API接口。“如果做模型的定制，目前看来耗费的人力、提供的服务还是非常重的，可能只会按照大的行业去进行调优。”

赵哲析也认为，“AIGC商业化更多的机会还是在To B上面。”To C更多的只是围绕流量做用户转化，但尝鲜用户的多是一次性行为，深入使用和付费意愿也相对较低。因此，计算美学从一开始做产品就是定位在面向To B行业。

想要在To C上做商业化，也不是完全没有空间，只不过机会可能不在国内。成维忠透露，他们想要在海外布局一个可以由文字生成3D动画的产品，以订阅制方式做商业化，不再区分To B还是To C。

不过，对于AIGC创业者们来说，一切其实都在变化，远未来到定局。赵哲析告诉我们，他的工作时间里7成是在解决现有的需求，3成要在做探索。“最懂AIGC的应该是我们这些从业者，不能指望着你的客户去你提需求提得特别精准。”

这种工作逻辑有点像调查和实验：提出假设、论证假设，修改假设再去论证假设，最后把它变为真正能落地的东西。“创业最怕剃头挑子一头热，你以为解决了一个天大的需求，找到目标客户一问人家说不需要。”赵哲析说，“我们是很务实的。

AI的未来，人机交互革命？

商业化、供需、应用，在一系列行业面对的实际问题之下，AI创业者们脚踏实地，但也把目光投向了未来。

在与四位创始人的对谈中，几乎每位都提到了“人机交互”，在他们看来，AIGC不仅是生成内容的变革，更在于人机交互形式的革新，这也是他们能在浪潮来临前入局AIGC创业的深层原因。

“最早我们与计算机交互可能是纸上打孔，之后是DOS系统的代码，随后是利用鼠标和键盘与计算机交互，再到如今用手指点屏幕，下一步，很可能就是利用语音直接与机器进行交互。”在刘晓光看来，未来可能会出现基于自然语言交互的操作系统，对于偏向内容型的服务行业，会有一个新的入口可以去占领。

“我们希望音乐能够被更多感官所感受，实现更游戏化的音乐欣赏过程以及娱乐过程。”在做音乐AIGC的过程中，DeepMusic一直希望把音乐变成一种“不只通过耳朵摄入的内容”，用声音的模态和图像、视频的模态结合起来，生成多模态的内容，为用户提供一种新的服务形式。

这并不是一种“空中楼阁”式的设想，在刘晓光的认知里，AIGC将开拓更多元的交互场景与内容消费方式。“一些小公司没有能力去做大模型，那是大资本集中去做的事。但在应用上，AIGC可以做到许多新的服务形式，并且找到新的入口去占领。”

刘晓光特别看好教育和游戏领域的“强人机交互”属性，“用户在付费的时候都会有一个心理钱包的问题，比如说为了一个工具、一个视频平台付费，意愿可能没那么强，但为了游戏可能会花很多钱。”因此，AIGC*波成功的商业化，很可能发生在游戏化或者教育化的应用上。

计算美学同样是在人机交互协作的理念下，才开发出了画宇宙这样的工具类AI产品，他们考虑到的则是未来内容生产模式的变化。

“人机协作方式利用AI把设计变得可量化，帮助设计师的生产。”交互也体现在了产品的设计上，“画宇宙”让AI作图不仅是人输入指令、AI生产作品那么简单，而且利用智能工具总结梳理素材，并进行实时修改与编辑，真正实现人机的共创，“这是以往产品形态做不到的”。

这并非是一厢情愿的构想，在2023年，AIGC及大语言模型技术已经在改变内容生产的模式，“人机交互”的革新也正在发生。3月16日，微软的Copilot正式发布，其将大型语言模型的能力嵌入到Microsoft 365应用程序中，在Word、Excel、PowerPoint、Outlook等产品中都有应用。

我们能够清晰的看到生产与工作的方式在被改变，无论是根据用户需求生成文档、PPT，还是协助用户分析数据，制定计划、编写讲稿，借由AI强大的理解能力，人机交互变得更加有效，大量的生产力将被解放。

这或许将不亚于从DOS系统打孔输入指令到鼠标键盘交互的变革。AIGC的发展不仅是AI智能提升这么简单，更重要的是其能更好的整合数据资源，实现高效率的指令触达，并且这种提升是指数级的，人与机器、算力的关系将被重构。

“我们最近在梳理一个新的领域，NUI，也就是自然用户界面。”同样的，在中科深智的构想中，AIGC的发展将催动下一代操作系统的诞生。过往的功能菜单将会被自然语言对话取代，想要实现交互，只要最简单的对话与动作就能实现。

成维忠还将人机交互革新扩展开来。他提到了元宇宙概念，作为把沉浸式体验作为核心研发方向的公司，中科深智一开始就把AI算法驱动虚拟人视为通往真正元宇宙的入口。

他认为，在视觉技术、XR技术的发展之下，元宇宙的场景、物品都能得到不错的解决方案，目前相关技术也已经较为成熟，但在元宇宙中“人”则是最难点。无论是虚拟空间的NPC，还是现实人类的虚拟化身，都需要更好的交互体验，而AIGC则是最重要的解决方案。

“元宇宙它本身其实是更加社交属性的，在虚拟化的社区里，人和人之间的交流就变得非常的重要，没有非常好的Ai的技术，实际上就做不到真正的千人千面，所有人的动作表情都一样。”AI则能成为解决实时交互问题的核心技术，在成维忠的眼中，AIGC的发展成熟更能够催动真正元宇宙的来临。

对于元宇宙行业来说，ChatGPT及大语言模型为代表的AI生产力或许并非取代者，而能够带来真正的加持。在过去的元宇宙设想中，高效率的数字资产生产与有效的社交交互是虚拟世界的*痛点之一，而在AI技术的加持下，无论是场景、道具生成，还是虚拟人驱动，或许都将迎来新的机会。

在未来，3D内容创作者或许也可以将AIGC技术应用于创作中。不同于以前的费力建模，伴随AIGC的发展，输入prompt、或者“口述”，场景与人物、道具就能直接生成，同样也能加持人们的虚拟体验。据悉，世界*的“元宇宙”平台Roblox正在构建一个AIGC平台，希望发展通过语音、文本或基于触摸的手势，取代鼠标和键盘移动，即可实现傻瓜式创建的便利工具，通过AIGC将其平台上5880万用户打造成为创作者。AIGC正在真实的改变这些新兴的行业。

说回国内的AIGC创业者们。在这场人机交互革命之中，微软、谷歌、OpenAI等大厂所做的，就是依赖大模型产品搭建新一代操作系统的基础设施，正如百度CEO李彦宏在近期的访谈中所说，不会再出现一个OpenAI，没必要重复造轮子，在技术底层、大模型技术领域，在客观条件之下，国内AIGC创业公司或许已经失去机会，但在应用层，一切都还刚刚开始。

大厂们忙着搞“基础设施”，而我们所关注到的这些AIGC创业公司们，则在各个垂直领域深扎下去，依靠他们掌握的技术及产品，或许能够成为这个未来操作系统的组成部分，也就是一个个具体的“功能”。这也是属于他们的天地。

尾声

在刺猬公社遇见的AIGC创业者中，始终有着一个疑问，AI产业的春天真的到了吗？

而产业大爆发的卡点，恰恰是AIGC技术本身。

成维忠举了AI生成虚拟人方面的例子——现在能生成双人的交互，多人交互还做不到。只有进一步突破技术障碍，才能未来在游戏、动画等领域大规模应用。刘晓光表示DeepMusic希望做些“增量”，在AI技术的支持下，让更多人参与到音乐的生产过程中，“真正让内容生产者，用AI工具做自己想做的事。”

至于商业化的难点，“我认为没啥难点。”成维忠说，“因为技术还没到，所以能啃下的市场还是很少。挖空心思地‘想出一个市场’去规避掉技术问题，我觉得没必要。”未来，做AIGC还是要拼技术赚钱。

因此，此时此刻正处于聚光灯下、浪尖之上的AIGC创业者们，也要做“时间的朋友”。

“等风口过去了之后，才真正进入落地的场景。”王一快说，“就像我们当初讨论5G一样，等到现在都不讨论这件事了，说明它已经成了一个基础设施，大家真正能用上了。”

（本文头图由计算美学产品“画宇宙”AI生成）

打开投资界APP 阅读全文

【本文由投资界合作伙伴刺猬公社授权发布，本平台仅提供信息存储服务。】如有任何疑问题，请联系（editor@zero2ipo.com.cn）投资界处理。