终于,苹果在人工智能上有了大动作。
北京时间6月11日凌晨1点,一场将近2小时的主题演讲,揭开苹果2024年全球开发者大会(WWDC)的帷幕。
在花了一个小时介绍最新头显系统Vision OS2、最新电脑/平板/手机三端操作系统等诸多更新后,由CEO蒂姆·库克(Tim Cook)宣布了重磅消息:苹果推出“苹果智能(Apple Intelligence)”。
苹果智能是一个整合概念,其中包含多种AI功能,如写作工具Writing Tools、emoji表情生成工具Genmoji、图片工具(文生图或图片修改)Image Playground。这些工具又深度融入苹果的原生软件中,如在邮件APP中可以调用Writing Tools润色文本,在信息APP iMessage中可以调用文生图功能生成图片发给好友等。
最最最令人振奋的是,苹果用户的老朋友Siri,终于迎来了新版本,连图标和唤起后的显示效果都大变样。新Siri不仅依托了自然语言模型,使得对话更自然和灵活,更是可以跨应用为用户执行各种各样的操作,有望摆脱“计时器助手”的黑历史。
值得一提的是,此前苹果与OpenAI沟通合作的消息这次也得到了证实。Siri将与GPT-4o版本的ChatGPT协同,在需要时经由用户同意调用ChatGPT回答问题,该功能免费。对此,OpenAI的CEO山姆·奥特曼(Sam Altman)回应:“很高兴今年晚些时候可以将ChatGPT整合进苹果的设备中!”
Siri联合创始人达格·基特劳斯(Dag Kittlaus)激动地连发数条X信息(前Twitter),大赞“以前就酷,现在更酷”。
苹果智能将登录三端操作系统(iOS 18、iPadOS 18、MacOS 15),过往带有M1芯片或A17Pro芯片的设备也可以支持。苹果还宣布将开放App Intents API,Image Playground API,这意味着软件开发者可以轻松引入苹果智能,无需自己开发便可以拥有AI功能。
可以说,在推出苹果智能的同时,库克就想好了如何利用其生态使得效果*化。
然而,在2024WWDC主题演讲之后,苹果的股价却不升反降。当日苹果股价收盘跌1.91%,与此同时英伟达、谷歌、亚马逊、Meta均上涨。
今年的WWDC,有喜无惊,缺少一些领头羊般的震撼。距离ChatGPT发布已经过去超过一年半,其间全球掀起AI浪潮,巨头纷纷加入AI军备赛,初创公司如雨后春笋般冒头。在苹果的专长领域,“AI手机”也早已成为手机厂商追逐的风口,其*的竞争对手三星也已发布主打AI的手机产品。
苹果终于上AI,关键词却不在AI,而在“终于”。
01
先来看看“苹果智能”到底是个什么样的存在。
苹果一直避免使用“人工智能(Artificial Intelligence)”一词,去年WWDC苹果也有人工智能相关更新,但均以“机器学习”替代。这次WWDC,苹果依然延续了这种“精神洁癖”,将其人工智能称为“苹果智能”。
对于苹果智能,苹果强调了几个关键词:强大、直观、融合、个性化、隐私。
从单独的AI功能来说,苹果智能没有什么新故事。
被重点介绍的语言和图像生成功能,我们已经在各类AI身上见了很多。如生成文本,修改润色文本和总结文本等,以及文生图、改图等。
但苹果的一大努力是,将苹果智能的各种功能深度集成在软件当中。
用户可以在邮件、Safari浏览器、Note笔记、Pages文档、Keynote幻灯片等软件中,随时调用Writing Tools。
同时,语言理解能力使得苹果智能可以智能化管理通知信息,识别优先级高的通知突出展示。
对于图像功能,用户可以在iMessage信息、Notes笔记、Freeform无边记、Keynote幻灯片、Pages文档等软件中,依照需求生成图像。如在使用iMessage祝妈妈母亲节快乐,用户可以调用图像功能直接生成一张超人妈妈的图画,如果相册中有标记妈妈的照片,生成的图片也会是妈妈的样子。
或者在Freeform无边记中写手账,画了一幅建筑物的草图,用户也可以调用图像功能,依照草图生成一张更精美的图。不过,苹果智能生成图片的风格目前还比较局限,只能从素描、插画和动画三种风格中选择。
在“备忘录”和“电话”应用中,用户可以录制、转录和总结音频。通话结束后,苹果智能会生成重点摘要。在通话时启动录音,参与者会自动收到通知。
最值得关注的是苹果智能跨应用的代理执行能力,也就是可以代替用户执行跨应用相对复杂的操作。
用户可以直接要求“打开Joz上周分享给我的文件”,或者“展示我、妈妈和Olivia的所有照片”“播放我老婆那天给我发的播客”。据苹果介绍,苹果智能可以为用户执行的操作有数百种,包括但不限于调转摄像头、把这张照片调暖一些、把这个笔记移动到某某文件夹、把这个文件重命名为XXX等等。(没错,苹果智能可以识别和分析屏幕显示的内容。)
也就是说,苹果智能可以依照用户所处的情境,结合用户的个人信息,跨应用地进行一系列操作。再加上iOS 18、iPadOS 18、MacOS 15三端覆盖,以及API开放以便第三方应用进行支持,苹果智能的渗透力拉满。
02
苹果智能的基础之上,Siri也迎来了重大更新。毕竟用户要进行跨应用的操作,指令下达还是需要有个语音助手的。
新Siri新外形,苹果给Siri换上了新的图标,唤醒之后也不再是之前的动态小球,而是围绕在屏幕一圈的彩色光带,未来感十足。
更自然、更切题、更个人,是苹果为Siri总结的三个“华点”。
没有被Siri逼疯过,都不好意思称自己是苹果用户。你让它计时三十分钟,它听成三分钟,你问它明天的天气,它一本正经地播报今天的天气。话还没说完,停顿稍微长一秒,它已经回答了,话说到一半打了磕巴,它就听不懂了……
很明显,苹果也明白Siri曾经有多“不自然”“不切题”。苹果宣布,和新Siri说话,不用再小心翼翼了!用户可以说到一半纠正自己的口误,可以停顿,可以接着前一个问题继续问,新Siri都可以搞定。
比如刚问完“明天西湖天气怎么样”,等Siri回答完,还可以接着要求“创建一个明天早晨9点去那儿玩的事项”,Siri就知道你指的地点是西湖。
用户也可以在设备底部双击唤起Siri并进行文本输入,以便在不便说话时使用它。不过苹果在演讲中展示的例子就很一般了:文本输入要求Siri创建早晨7点的闹钟。既然都拿起手机打字了,和自己设置一个闹钟貌似也没什么区别。
除此之外,苹果还专门提到了Siri的“产品说明书”能力,不管在设备操作中有什么疑问,都可以直接问Siri。甚至是在用户不记得某个功能的名称时,也可以用描述询问Siri,如询问Siri:“我如何今天写一条信息但是明天再发出去?”Siri就会给出详细的步骤。
作为苹果智能的一部分,屏幕读取识别在Siri身上也发挥作用。比如当用户和别人在发信息,对方发来了他的地址,用户就可以直接唤起Siri并要求“把这个地址添加到通讯录页面里去”,该地址就会被添加到对方通讯录页面的地址栏中。
有了上述能力,再加上苹果智能跨应用执行操作的能力,Siri能做的事情就很多了。一个综合的示例是,你对着Siri说:“给我看看今年3月我在北京故宫穿着粉色外套的照片”,你选中一张照片后可以要求Siri“把色调调暖一些”,紧接着还可以拜托Siri“把这张照片放在《2024旅行》那个备忘录里”,Siri就会照做。
有如此深入个人设备的智能助手,苹果自然要交代一下隐私问题。
苹果在演讲中表示,很多功能都是在设备上直接运行的,但是当用户请求更复杂的操作或信息时,苹果智能会自动将请求转到云端。苹果称,公司正在使用所谓的“私有云计算”处理复杂的请求,但是苹果永远不会在其服务器上存储或访问用户的数据。苹果还强调,公司将让独立的专家检查在其服务器上运行的代码,以“验证隐私”。
最后,苹果还明确了和OpenAI的合作。苹果并未表示苹果智能或者新Siri本身由OpenAI的模型驱动,实际上,对于苹果智能背后的模型是什么,在本次演讲中并未讲明。
新Siri将和基于GPT-4o的ChatGPT进行协同。具体的实现方式是,用户向Siri发出请求后,Siri会判断是否能自行解决,如果觉得ChatGPT更适合作答,便会在征求用户的同意之后,调用ChatGPT。
在Siri之外,ChatGPT也与苹果智能进行更广泛的融合。比如在Writing Tools中,如果点击“撰写”,则会调用ChatGPT的服务,此时在指令框中可以看到OpenAI的图标。
苹果表示,在苹果智能中使用ChatGPT是免费的,但用户如果有付费订阅的ChatGPT账号,也可以与苹果智能进行绑定。
同时,苹果也留了一个悬念,称未来也有可能为苹果智能接入更多的AI模型。
03
被称为“苹果春晚”的WWDC,曾经是苹果一年一度惊艳世人的“王炸发布会”。
世界上*台具有图形界面的个人电脑Lisa、苹果*代电脑操作系统Max OS X、初代iPhone操作系统iPhone OS,都经由WWDC亮相。也是在WWDC上,苹果宣布拥抱英特尔,又宣布抛弃英特尔、发布基于Arm架构的自研芯片M1,宣布苹果应用商店的上线,开启苹果软件生态大繁荣的时代。
然而,苹果已经很久没有震撼世界。
分析师郭明錤在本次WWDC前做出预测,称iOS 18发布后,苹果将不再被视为AI行业的落后者。这是一个乐观预测,但当苹果的乐观未来成为了“不再落后”,也许正说明其正在迈入一个新时代。
在本次WWDC之前,《华尔街日报》发布报道《苹果是怎么在AI竞赛中落后的》,其中引用了Siri联合创始人基特劳斯的话,称:“Siri是苹果最后一次在某件事上*。”基特劳斯随后在X上回应:“实际上,我说 Apple Watch 是苹果最后一项‘率先’征服新市场的创新。”苹果发布Siri是在2011年,发布Apple Watch是在2016年,说起来距今都已经很遥远了。
ChatGPT发布距今已经一年半,其间Meta的开源大模型已经多次更新,并且在社交平台Instagram等发布Meta AI,还将Meta AI带入智能眼镜中;谷歌发布了ChatGPT竞品Bard,在今年宣布迭代搜索引擎,引入AI摘要等功能。就连埃隆·马斯克(Elon Musk)都摩拳擦掌,新成立了人工智能公司xAI,发大模型、融资,忙得不亦乐乎。
苹果智能的到来,对苹果来说无疑是好事,但这更像是一种补足,而非创新。实际上,整场2024WWDC的主题演讲,都像是一场查漏补缺。
比如iOS18中的个性化屏幕功能,允许用户将图标放置在名目的任意位置,以及“隐私模式”,都是安卓用户早已习惯的操作。可以将手机屏幕投放在电脑桌面的“镜像”功能,则早已在一些厂商那里实现,被称作“智慧互联”。
最有代表性的,要数iPadOS终于引入原生计算器,苹果用户等这一天已经十几年。更不必说iPhone的桌面图标终于可以自由摆放,而不会自动紧挨着排列,这一天苹果用户等的时间更久。
苹果智能之于苹果,也更像是救火。
据苹果最近的一份季度财报,2024财年第二季度,苹果总营收同比下降4%,其中大中华区营收下降8%,净利润也同比下降2%。iPhone收入同比下降10%。
在全球市场,iPhone出货量表现不乐观。据TechInsights,苹果今年一季度全球出货量同比下降11%,市场份额下降3%。
在中国市场,据Counterpoint,苹果今年*季度销量同比下降19.1%。而TechInsights对市场份额的估计显示,今年一季度,苹果已经跌出中国智能手机市占率前五名。
苹果的焦虑已经摆在桌面上,对于中国市场尤甚。库克一年内三次访华之外,在今年618购物节期间,苹果不仅参加了主流电商的大促活动,而且降价幅度很大,iPhone15系列产品降价幅度甚至可以达到2350元。
接下来,救火的苹果智能至少面临两大卡点:
一是是否足以吸引用户换新机。苹果智能需要M1或A17Pro及以上芯片的支持,目前在售支持苹果智能的最“低端”设备也需要是iPhone 15 Pro。
二是是否可以顺利进入中国市场。此前库克来华时,《华尔街日报》曾称苹果与百度协商,希望百度的文心大模型可以为国行版新款iPhone提供AI功能。目前尚未有更进一步的消息。