近期,在阿里巴巴举办的2022 U设计周(UDesign Week)上,蓝驰创投投资合伙人石建平(Jimmy Shi)受邀成为Uwin设计产业加速器导师,发表主题为《人工智能、云计算,设计数字化升级的新推力》的演讲,与消费、设计艺术、企业服务和科技领域的项目分享产业创新与数字化见解。本文整理自Jimmy在活动上的发言内容。
设计行业是一个人力密集型行业。设计公司、建筑设计院里都是人山人海;到游戏设计的工作室去,也能看到很多人在做各种重复性工作。虽然有一部分是创意工作,但工作中还是有很多“体力活”。
从产品实体设计到数字世界的设计,整个行业对于人才的需求越来越多,要求也越来越高,但人才短缺非常严重。
Forrester Research表示:“我们预计全球设计行业规模达1620亿美元,且多种设计软件今年将增长 20% 以上……各类企业都在改革或重新设计数字资产,客户需求的激增意味着需要更多设计师,但人才队伍扩张并没有跟上。”
但好消息是,AI正在改变设计的工作方式。不止是设计,随着AI供给端创新涌现,很多工作的流程都将发生变化。
01.
底层技术:大模型与算力齐飞
先从底层技术的变化趋势说起。
首先是AI模型。AI预训练大模型最近一两年变化非常大,OpenAI、DeepMind、Meta等公司在模型创新以及大模型的训练上投入了非常大的资源,对行业具有很强的推动作用。
一些值得关注的深度学习模型包括:
Transformer:一旦开始训练,Transformer中的每个元素都可以连接或关注任意其他元素,而不是像传统的模型那样从局部到整体的构建(如在语言模型中,先组合临近的单词)。Transformer很快成为专注于分析和预测文本的单词识别等应用程序的引领者。
Attention:通过信息加权融合的方式,目的是获取更好的特征表达——将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。Attention机制很像人类看图片的逻辑,即,不会看清图片的全部内容,而是将注意力集中在图片的焦点上。
MoE:混合专家模型,利用集体智慧做决策,最终的解决结果是多个“专家”的概率加权。
Pathways:由Google提出,在过去的模型中,需要对所有的单元一起训练。Pathway可以根据所需的功能,可以多任务、多状态,针对某些单元训练,小单元之间的信息共享,计算量大幅下降,成本也相应低很多。
GPT3:功能强大的语言模型,GPT3直接给模型输入一些例子,通过这些例子改变模型的内部状态,生成所需要的答案。OpenAI基于GPT-3发布了DALL·E。
Diffusion:OpenAI的DALL·E 2、谷歌的Imagen背后都是这个模型,省却了提取特征值的步骤,生成的图片质量比GAN更佳。
DALL·E 2的设计大作:骑着马的宇航员。另外,DALL·E 2现在可以根据自然语言字幕对现有图像进行编辑,可以在考虑阴影、反射和纹理的同时添加和删除元素
还有一个很大的创新,是从单模态到多模态智能的变化。传统的算法专注于从一个单一的数据源训练其模型,而多模态智能可以将多种感官进行融合,可以从语言生成图片,从中文生成英文,或从文本同时生成语音和视频。这时候,AI就更贴近“人类做事”的方式。
多模态人工智能为计算器提供更接近于人类感知的场景
然后是更强的算力。没有算力,一切都是空中楼阁。Google、英伟达等都发布了再刷算力新高的芯片。
不论是中国还是美国,GPU市场都在爆发性增长。中国GPU市场CAGR在30%,预计5年后将达300亿美元。国内很多做GPU芯片的创业公司都看好这个趋势。
02.
机会:用AI创造价值的时代已到来
这些技术带来了什么影响?
很直观的是,消费品、媒体广告、软件产品数字化交互、元宇宙、制造业(汽车/3C/交通,要知道制造业是*的设计赛道)、建筑,以及娱乐、影视、游戏等行业,都从基础设施层面被革新了。
目前看到的很多AI创业项目,都非常注重于“效率提升”,但现在AI可以做的事情更多了,其实会提供更多价值创造的部分,给内容创作和设计带来更多冲击与想象空间。
比如,说一段话就能生成相关的创意图片,这对发掘创意将非常有帮助;未来AI设计成本也能大幅下降,现在的算力成本太高,延迟也很久,渲染要超过10分钟,这是不可接受的,未来的交互将是秒级别的;还有用AI生成千人千面的文案、小说、散文等等。
一些具体的机会包括:
1. 开源大模型
事实上,包括Google、Meta等在内的大公司提供的开源大模型都是“旧版本”,很多大模型并不提供接口,因此这个领域会出现一些创业机会,开发更多高质量、开放的大模型,构建开源大模型生态。国外已经出现的一些公司包括stability.ai、EleutherAI等。
2. 设计工具普惠化
设计软件渗透到各行各业、各种场景,非常好用、平民化、SaaS化,让门槛大幅降低。
协同设计能力将是标配。设计永远不是单个人的工作,特别是在企业内部,设计的工作可能会牵涉到多个角色,这些环节要协同起来,而不是流水线的模式,后者的方式一定会失败的。
不论是设计,还是生产、制造、开发,协作之下,人们可以创造出更有价值的产品。
如蓝驰早期投资的项目「即时设计」,填补了国产专业设计软件市场空白,在专业UI设计功能上,已经兼具完善的Sketch基础功能和Figma高阶功能,并支持多人实时在线编辑,可以实现直播级同步。
即时设计界面
另一个蓝驰早期项目「唐吉诃德」,是一家运用AI设计技术的商业数字整装提供商,能把房子设计成为“五星级品质”。他们将人力和物力自动化,应对家装和工装中的交付时间不准、工人成本高,或工艺水平不一致等问题。
3. 富应用(Rich Application)
未来的SaaS或Browser会越来越向富应用趋势发展,此前,Rich-Client Experience的交付会受限于DOM和JavaScript的能力。
新的技术,如Web Assembly可以更加轻型、高效地支持浏览器和服务器端的应用部署,或者更前沿的Web GPU,可以将GPU能力释放给web端,从而更好地支持3D呈现。
4. 3D+AR – 增强世界的真实交互设计
3D模型是真正能与虚拟世界进行互动的。3D结构化数据是实现真实世界数字化的基础,但是这种数据历史沉淀非常少。因此,怎么生成3D数据是非常有挑战性的问题。
有些做法是,用几十个摄像头生成一个3D模型,这个门槛非常高,可以做高端制造,但如果希望能数字化高效产生3D数据,这种模式是不可持续的。我们相信,未来有更好、更方便、更平民化的技术可以生成更好的3D数据。
5. 云端渲染
云计算与基础设施快速发展,可以支持更多的设备,拥有“无限大”渲染能力,为全终端类型覆盖提供了实现的可能。
6.“数字全真世界的仿真”(photorealistic)
目前游戏中的相关探索非常多,做出来的东西就像真实物理世界一样,包括数字人、皮肤、物理动作、材料体感模拟等等。
03.
未来:“唯快不破”的世界演进新范式
未来的世界是一个数实融合的全真物联网世界。全真物联网将覆盖从创作、设计、生产到运营、售后服务、营销等所有环节。
技术的创新结合应用的场景能带来螺旋式的迭代,在未来,公司的核心竞争力将体现在如何高效迭代:数字世界与物理世界实时交互,物理世界实时反馈数字世界,在物理世界中实体演进,在数字世界中快速迭代、优化。这将是世界演进新范式。
迭代效率“唯快不破”,而效率必将要依靠数据+AI+science驱动。比如,特斯拉的自动驾驶迭代速度很快,就是因为它有很强的自学习能力。
最后,回到大家经常说的“内卷”,内卷其实就是稀缺,稀缺的心理就是很紧张。
我们可以去观察、寻找传统行业可以被技术赋能的环节,当思路开阔时,大家就不会对着一个方向“恶性竞争”。
比起内卷,创业公司要互相合作,否则还没有“走出门”,就把自己卷死了。合作形成更好的利益共同体、去解决客户的问题,才能在面对大公司时取得一些机会。
我们不妨换一种角度:以乐观的态度,认为这个世界是充裕的。如果有这个信念,就可以做很差异化的竞争,不去参与同质化内卷,而是去实现不同的价值。