在 WWDC 2024 上预告的新版 Siri,迄今仍未发布。甚至有消息称,可能会延期到今年的 iOS 19 版本中才会正式发布。
苹果 Siri 部门高级总监 Robby Walker 对此的说法是,「但这也只是一个目标,并不意味着那时就会发布」。
换言之,关于新版 Siri 发布时间,最新的答案是:苹果自己也不知道。
背后到底发生了什么?为何苹果在 AI 战略上进度这么缓慢,已经落后在其他手机品牌之后?
科技媒体「The Information」近期发布了一篇关于苹果新版 Siri 延期发布内幕的评论文章,直指苹果 Siri 项目推迟发布背后隐藏的诸多问题。
模型技术路线摇摆、内部团队冲突、高层犹豫不决等,Siri AI 的失败,可以说是完整体现了一个公司面对新技术的「大公司病」。
文章基于 The Information 的文章编译,略有调整。
TLDR:
- 从大小模型协作到构建统一的大型语言模型的技术路线摇摆:Siri 团队曾考虑同时开发一个小型语言模型「Mini Mouse」和一个大型语言模型「Mighty Mouse」,通过设备-云协同的方式来处理任务。后 Siri 项目的管理层又改变了技术方向,计划通过构建一个统一的大型语言模型来支持所有功能,即 Siri 所有的功能都在云端运行。
- Siri 在公司内部作为「烫手山芋」不断转手,管理层混乱:Siri 项目长期以来一直被视为一项「烫手山芋」,在公司内部不断转移归属管理权,但重组未能给 Siri 性能带来实质性的改善。由软件工程主管 Craig Federighi 和 AI 负责人 John Giannandrea 所领导的两个团队之间冲突不断。
- 不能使用外部AI模型与优先采用最佳 AI 技术,内部态度不一:管理层在 2023 年明确告知工程师,最终交付的产品中不能使用外部公司的模型,仅可用于内部基准测试和对比。在 Craig Federighi 接手 Siri 项目后,Federighi 让 Siri 的机器学习工程师优先采用最优的 AI 技术,意味着在苹果的软件产品中会使用来自其他公司的开源模型,而不是全部使用苹果自研的模型。
- 「激进」展示新版 Siri 功能,演示涉嫌造假:据一位前苹果员工透露,Siri 团队的成员对苹果在年度开发者大会演示的新版 Siri 功能很意外,因为他们此前从未见过这些展示能力的可用版本,唯一在测试设备上实际可用的新功能,是当用户唤醒 Siri 时,iPhone 屏幕边缘出现的彩色动态光带。这种做法与苹果以往的惯例做法存在差异。苹果通常只会在发布会上展示已经能够在测试设备上稳定运行、且经过市场团队审核、确保能按时发布的功能和产品。

- 高浓度的主流模型(如 DeepSeek 等)开发交流;
- 资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;
-
好用、有趣的产品/案例,Founder Park 会主动做宣传。
01
云端结合,还是一个云端模型
都还没想好
去年 6 月,苹果在年度开发者大会(WWDC)上,向外界展示了 iPhone 语音助手 Siri 的 AI 新功能。但在 Demo 展示后的几个月时间内,苹果的 Siri 团队始终无法就 AI 新功能背后的基础技术达成一致。
据一位知情的前 Apple 员工透露,Siri 团队曾考虑同时开发一个小型语言模型「Mini Mouse」和一个大型语言模型「Mighty Mouse」。「Mini Mouse」运行在用户的 iPhone 手机上,处理订定闹钟等简单任务,「Mighty Mouse」则运行在云端,处理更为复杂的操作,例如帮助用户在 Uber 订车、赶赴下一场会议等。
随后,Siri 项目的管理层又改变了技术方案,计划通过构建一个统一的大型语言模型来支持所有功能,意味着 Siri 所有的功能都将在云端运行,与此前苹果计划将 Siri 的大部分功能迁移至本地(on device)来提升用户数据的隐私保护的做法相悖。此后,Siri 团队又进行了多次技术方案调整,管理层关于技术方案的摇摆不定使得 Siri 项目的员工感到沮丧,也因此导致部分员工离职。Siri 项目的种种变动使得公司原计划于今年发布 Siri AI 新功能变得更加不确定性。
Siri 团队在关键技术方向上的摇摆,是公司宣布将 Siri 新功能将延期至 2026 年的重要原因之一。据四位知情人士透露,公司内部告知员工,Siri 项目将不再由 AI 负责人 John Giannandrea 及其日常业务主管 Robby Walker 负责。
据三位知情人士透露,Siri 项目将由软件工程主管 Craig Federighi 接手,原 Vision Pro 混合现实设备开发负责人 Mike Rockwell 将接手 Walker 之前的工作。
Siri 新功能的延期对苹果在人工智能领域的进展影响颇大,在去年 6 月的开发者大会上,苹果曾向投资者表示,公司已经为语音助手 Siri 及其他功能的升级制定了清晰的 AI 策略。但从长期来看,Siri 因其较慢的迭代更新速度而受到外界质疑。同时,随着 OpenAI 的 ChatGPT 和其他 AI 产品的爆发式出现,外界的关注与质疑的声音进一步加剧。
如何在人工智能领域取得突破,可能是苹果目前面临的最关键挑战之一,也将直接影响 iPhone 及其他产品能否持续保持其技术领先的地位。
苹果在 AI 领域的部分困境,一部分可能来自其长期坚持的价值观。例如,苹果对于用户隐私数据的重视与保护,使得其在获取用于模型训练的大规模数据方面,以及在设备端验证 AI 功能效果方面,都存在着明显的限制。
此外,苹果内部人员在性格和管理风格方面的冲突,也是苹果面临困境的一大重要原因。据多位曾参与 AI、软件工程相关工作的员工表示,公司在 AI 项目执行方面的问题,主要来源于领导者的管理不善。超过六位曾在 Giannandrea 领导的 AI 与机器学习(AI/ML)团队工作的前员工透露,Walker 缺乏远见以及不愿承担设计未来语音助手风险,这是问题的关键之一。
在苹果内部,其 AI 团队曾因其宽松的氛围和执行能力的不足,被戏称为「AIMLess」(暗指 AI/ML 团队无目标,Aimless)。
而 Craig Federighi 自 2012 年以来所领导的软件工程团队则与 AI 团队的负面形象形成了鲜明对比。软件工程团队
凭借其在 Apple 操作系统及消息、照片、邮件等应用上的高效执行能力,在公司内部积累了良好的声誉。
据多位苹果前员工表示,Siri 项目长期以来一直被视为一项「烫手山芋」,在公司内部不断在不同团队之间转移归属管理权,包括由苹果服务业务负责人 Eddy Cue 和软件工程主管 Craig Federighi 领导的团队,但这些重组变化未能给 Siri 性能带来实质性的改善。
目前,Siri 项目再次由 Craig Federighi 接手。部分前员工表示,鉴于 AI 团队此前糟糕的历史表现,变动早就应该发生。
值得注意的是,由 Craig Federighi 带领的软件工程团队拥有自己的机器学习团队,且在 AI 方面涉及的业务范围不断加大,曾多次与由 Giannandrea 带领的原 AI 团队产生冲突。Craig Federighi 的团队曾负责开发了由苹果推出的多项 AI 功能,即 Apple Intelligence。
苹果公司的发言人对此拒绝置评。
Siri 项目长期混乱,
技术方向摇摆、管理层冲突
实际上,Siri 项目所面临的挑战,远早于此次暴露的技术方向摇摆与管理层混乱的情况。
2018 年,Giannandrea 从谷歌加入苹果,担任新成立的 AI 团队负责人一职,Giannandrea 的此次跳槽被行业内广泛认为是苹果在 AI 人才引进方面的一次重大动作。当时,苹果的部分高管认为 Giannandrea 可能会更倾向于领导苹果的自动驾驶汽车项目(该项目随后被搁置),但据知情人士透露,Giannandrea 对语音助手 Siri 展现出了特别的兴趣。
2011 年,语言助手 Siri 随 iPhone 推出,但到了 2018 年,Siri 的发展已明显停滞,无法有效回答常识性问题,对第三方应用的支持也极为有限。
甚至在 Giannandrea 接手 Siri 项目之前,Siri 团队内部的成员就已感觉自己在公司内部的地位较低。据多位知情的前苹果员工表示,Siri 工程师对软件工程团队在 iOS 更新中的主导地位感到不满,因为软件工程团队并未优先考虑修复 Siri 的问题。而软件工程团队则认为,Siri 团队在支持来自 Craig Federighi 团队推出的新功能方面,跟进速度过慢。
Giannandrea 曾在与他人沟通时表示,可以通过借鉴谷歌在构建 AI 语音助手方面的经验来改进 Siri。据一位与他有过交流的人士透露,他认为,只需要获取正确的训练数据,同时提升从互联网数据中抓取信息的能力,就能解决 Siri 不善于回答常识问题的短板。

从左到右依次为:Tim Cook、John Giannandrea、Craig Federighi
Giannandrea 的行事风格较为独特,与公司其他多数性格强势、要求严苛的高管不同,与他共事的人普遍形容 Giannandrea 的性格更为沉稳、安静且避免对抗的情况。
Giannandrea 经常向员工分享他对机器学习的看法,认为机器学习技术能为产品带来渐进式的提升,最终带来明显的效果提升,他将这一理念称为「爬坡(hill climbing)」。此外,他过去还曾对聊天机器人(chatbot)持保留态度,Giannandrea 在 ChatGPT 发布前后向同事表示,他不认为聊天机器人产品能为用户带来太多价值。
在 Giannandrea 加入苹果之后,曾有同事建议他调整 Siri 的管理层人员,但据 AI 团队的前员工透露,他并未采纳这一建议。
除了 Giannandrea,在 Siri 团队内部常受到批评或质疑的高管是 Walker。Walker 2013 年加入苹果,在 2022 年底开始负责 Siri 的日常运营工作。针对 Walker 的质疑主要围绕在 Walker 缺乏在 Siri 上大胆尝试以及全面革新的意愿,而是更多关注对 Siri 整体性能改善作用不大的指标等方面。
例如,一名苹果前工程师表示,Walker 经常因将 Siri 响应时间减少几个百分点等相对微小的改进而满意。此外,Walker 还曾花费超过两年时间,移除 Siri 唤醒词中的「Hey」,将其简化为直接唤醒 Siri。
此外,据一位知情人士透露,去年 Walker 曾否决了工程师团队提出利用大型语言模型来改进 Siri 情绪识别和情感回应能力的提案,Walker 更希望专注于下一版本 Siri 的发布,而不是将更多的资源投入到该项目中。
不过,在未获得 Walker 知情和批准的情况下,该项目的工程师绕过了他,继续与软件工程团队的安全与位置部门合作推进相关功能。
AI团队引起不满
由 Federighi 领导的软件工程团队与由 Giannandrea 领导的 AI 团队之间的关系日益紧张,甚至是高度不协作。
两位管理者在管理风格上的差异极为明显。Federighi 的风格以严厉和高要求著称,而 Giannandrea 则相对温和。在其共同参与的会议中,Federighi 经常会向同事提出大量问题,而 Giannandrea 更倾向于倾听。据曾参与相关会议的人员透露,二者风格的差异在会议沟通中尤为明显。
此外,软件工程团队的部分成员对AI团队员工的更高薪资和更快晋升的情况心存不满,以及对 AI 团队部分工程师能够享受更长假期,或在周五提前离开的情况感到不满,因为软件工程团队的工作节奏和强度相对更高。
今年年初,两个团队间的不信任进一步加剧。据悉,AI 团队的「二把手」领导曾要求工程师们对双方合作开发的项目进行详尽的文档记录,以防项目失败后,软件工程团队将责任推给 AI 团队。
此外,Craig Federighi 在组建自己的机器学习团队「Intelligent Systems」时,也进一步加剧了两个团队间的紧张关系。Intelligent Systems 由 Federighi 的重要副手 Sebastien Marineau-Mes 负责,团队规模达数百人。
Intelligent Systems 团队自研模型,并开发了多个 Demo 演示,包括用户如何通过语音指令控制应用程序等,且在研发过程中往往不需要 Siri 团队的支持,因此加剧了双方的矛盾。据两位知情人士透露,在苹果的一次内部演示中,Intelligent Systems 团队成员展示了一张幻灯片,画面上是两座山撞击并最终变平的动画效果,一些员工认为是对 Giannandrea 所推崇的「爬坡(hill climbing)」理念的暗讽。
此前,约在 2022 年,Intelligent Systems 团队开始与 Walker 及 Vision Pro 项目负责人 Rockwell 合作,启动代号为「Link」的项目,但据四位知情的前苹果员工透露,该项目最终进展不顺。「Link」项目旨在为 XR 头显设备 Vision Pro 及计划推出的 AR 眼镜开发语音控制功能,用户可以通过语音指令操作应用和完成任务。
据参加三方会议的工程师表示,Rockwell 和 Marineau-Mes 对 Walker 的不满态度在会议中表现得极为明显,两人经常表达对 Siri 团队在 Vision Pro 项目支持方面进展缓慢的失望。
例如,Rockwell 希望 Vision Pro 用户能够通过 Siri 在网页间导航、调整窗口大小,甚至支持两个处于虚拟空间中的用户共同通过 Siri 进行交互,以便一起规划旅行。但 Siri 团队的部分成员对实现这些目标的可行性持怀疑态度。据知情人士透露,最终,Rockwell 设想的许多 Vision Pro Siri 功能均因 Siri 团队未能实现而被大幅削减。
不想用第三方模型,
自研又不给力
2022 年 11 月,OpenAI 发布了 ChatGPT,在科技行业内及市场上均引发了强烈反响。然而,据多位当时在团队工作的前苹果工程师表示,在由 Giannandrea 领导的 AI 团队内部,高层管理者并未对此表现出足够的紧迫感。
相比之下,由 Federighi 领导的软件工程团队的反应明显不同。多位前苹果员工表示,Intelligent Systems 团队的高层管理者迅速开始在内部分享关于大型语言模型的研究论文,并讨论如何将该技术应用到 iPhone 上,从而改善产品体验。
随着 Intelligent Systems 团队成员向 Federighi 展示了多项 AI 技术的演示,团队内部对于大模型技术的热情进一步高涨。这些演示基于 OpenAI 的模型,主要为 AI 如何理解用户手机屏幕上的内容,让语音交互变得更加自然,同时提升用户在应用操作中的对话式体验。
据多位前苹果员工透露,AI 团队和软件工程团队的管理者随后在争夺基于大型语言模型构建新功能的主导权,软件工程团队最终凭借强大的交付执行能力,占据主导地位。
尽管苹果公司在功能开发中使用了 OpenAI 的模型进行测试,但苹果的管理层在 2023 年明确告知工程师,最终交付的产品中不能使用外部公司的模型,仅可用于内部基准测试和对比。
因此,研发出能够与 OpenAI 所竞争的大模型,成为 Giannandrea 团队的责任。然而,据多位在 2023 年和 2024 年曾使用过这些模型的前 Apple 员工透露,苹果自研的大模型在效果上远不及 OpenAI。
WWDC 的演示是「假」的
最终,去年 6 月,苹果宣布了一整套基于 AI 的新功能,即 Apple Intelligence,包括写作和图像生成工具、照片编辑与邮件处理等功能,以及语音助手 Siri 的多项升级。此外,苹果也改变了此前对外部 AI 模型的排斥态度,宣布与 OpenAI 合作,允许 ChatGPT 作为 Siri 的扩展,来回答苹果自有模型无法处理的问题或执行相关任务。
在去年 6 月举办的年度开发者大会上的现场演示中,一位苹果高管询问 Siri 她母亲的航班何时抵达,Siri 读取了其邮件和实时航班数据,同时提供了最新的到达时间。随后,她又让 Siri 提醒自己午餐的安排,Siri 从 iPhone 的消息记录中提取出相关细节,规划了从机场到餐厅的路线。
然而,据一位前苹果员工透露,Siri 团队的成员对这场演示很意外,因为他们此前从未见过这些展示能力的可用版本,唯一在测试设备上实际可用的新功能,是当用户唤醒 Siri 时,iPhone 屏幕边缘出现的彩色动态光带。
这种做法显然与苹果以往的惯例做法存在差异。苹果通常只会在发布会上展示已经能够在测试设备上稳定运行、且经过市场团队审核、确保能按时发布的功能和产品。

图:苹果 2024 WWDC 上对于 Siri 新功能的演示
但在演示过后,苹果股价在随后的两天内上涨了超过 10%,市场反应趋于积极,对苹果 AI 发展计划看好。
据多位前苹果员工表示,他们对 Federighi 和 Rockwell 能够改善 Siri AI 能力的持谨慎乐观态度,因为两人相比于 Giannandrea 和 Walker,更倾向于深入项目细节,而不是完全依赖下属管理。
例如,Federighi 往往比负责具体工作的初级工程师更了解项目的技术细节。Rockwell 自 2015 年加入苹果公司以来,被内部视为一位具有远见的领导者,擅长在遵循公司文化的同时,为项目带来新的思路。
此外,Federighi 也已经开始着手推进 Siri 项目的迭代。据一位知情人士透露,与以往的态度不同,Federighi 让 Siri 的机器学习工程师优先采用最优的 AI 技术,意味着在苹果的软件产品中会使用来自其他公司的开源模型,而不是全部使用苹果自研的模型。
(文:Founder Park)