软件与服务专题报告:苹果发布APPLE INTELLIGENCE智能助手 异构芯片或成AI算力新方向
苹果发布Apple Intelligence智能助手
苹果发布了基础模型AFM,为底层操作系统赋能。在2024 年的全球开发者大会上,苹果推出了个人智能助理Apple Intelligence。Apple Intelligence 包含了多个功能强大的生成模型,可以快速、高效地处理用户日常任务,并能即时适应用户当前的活动。Apple Intelligence 可以实现撰写和润色文本、优先处理和总结通知、为与家人朋友的对话创建有趣的图片等功能,以及采取应用内操作以简化跨应用交互。Apple Intelligence 将被搭载于IOS18、IOS18 ipad 以及MacOS18 操作系统上。目前Apple Intelligence 搭载于iOS 18.1 Beta 版上,仅限注册开发者试用,订阅价格为99 美金一年;普通用户仍需要排队等待。
Apple Intelligence 由AFM 基础模型赋能
AFM 基础模型主要包含了端侧模型和云端模型两个部分。其中端侧模型专为端侧应用的特定场景所设计,只能处理语言相关的单模态任务,可以本地化搭载于iphone、ipad、Mac 等设备上,模型包含30 亿参数量。云端模型为私有云应用场景所设计,具备多模态能力,有更高的泛化能力,可应对更加通用的任务。这两个基础模型是苹果创建的生成式模型家族中的一部分,除了上述两个模型,Apple Intelligence 还包含了一个编码模型和一个扩散模型。编码模型基于AFM 语言模型,用于为Xcode 注入智能功能;扩散模型帮助用户以视觉方式表达自己,比如在Messages 应用中使用。
AFM 云端模型性能追及GPT-3.5,略逊于GPT-4。在模型性能评估阶段,苹果设计了1393 个任务,将AFM 模型与其他主流模型的性能进行了对比。对比结果显示,AFM 云端模型性能超越Mixtral-8x22 混合专家模型、GPT-3.5 等模型,略逊于GPT-4 和LLaMA-3-70B 模型;在端侧模型方面,AFM 端侧模型性能接近市场主流端侧模型。人类测评结果显示,AFM 端侧模型性能超越Gemma-7B、Phi-3-mini、Mistral-7B、Gemma-2B 等主流模型,略逊于LLaMA-3-8B模型;结果证明了AFM 端侧模型的优异性能,有望在iPhone、iPad 等设备上发挥较高实用性。
异构芯片或成AI 算力发展新方向
在算力层面,AFM 模型由谷歌TPU 算力芯片提供支持。谷歌为本次训练提供了算力支持,云端的AFM-server 模型由8192 个TPU V4 算力芯片训练得到,在训练阶段,苹果把8192 芯片分成8 组,每组1024 个芯片相互串联形成一个基本单位,各组之间保持平行关系,训练数据与迭代仅在组内完成;端侧的AFM-on-device 模型由2048 个TPU V5p 算力芯片训练得到。
谷歌TPU 性能追及英伟达旗舰算力芯片。TPU(Tensor Processing Unit),是一种专为处理张量运算而设计的ASIC 芯片。TPU 通过脉动阵列机制实现高效运算。与GPU 相比,TPU 不需要再频繁地访问内存,减少了与存储器的交互次数,从而大幅度提高了计算效率。因此,TPU的有效算力利用率相比于GPU 更高;GPU 的算力利用率通常为20%-40%,而TPU 的算力利用率往往超过50%。
风险提示
1、AI 技术推进不及预期;
2、下游应用需求不及预期。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: