计算机行业周报:安卓首款3NMAI芯片天玑9400发布 零一万物正式对外发布新旗舰模型

宝幼琛 2024-10-21 14:34:22
机构研报 2024-10-21 14:34:22 阅读

  算力:算力租赁价格平稳,安卓首款3nm AI 芯片天玑9400 发布

      安卓首款3nm、PC 级Arm V9 架构、第八代NPU——天玑9400 正式发布,比上一代生成式AI 芯片天玑9300,其AI 能力更上一层,成为苏黎世ETHZ 移动SoC AI 性能榜单之首。具体提升如下:

      1)天玑9400 首次实现了端侧DiT 架构支持,无需联网就能在手机上体验Sora 同款架构视频生成。还有业界首发的端侧LoRA 训练,可以高效离线训练专属于自己的LoRA 生图模型,同时保证隐私不泄露。

      2)大模型方面,天玑9400 能够运行的模型窗口文本长度提升到了32K,是天玑9300 的8 倍。同时还支持端侧运行多模态大模型,并以50 Tokens 每秒的超高速度超越了前SOTA。

      3)综合AI 性能方面,天玑9400 以6773 分的成绩领跑了苏黎世ETHZ移动SoC 榜单,是天玑9300 的1.4 倍。

      4)从整体上看,天玑9400 采用台积电第二代3nm 制程,相较上一代单核性能提升35%,多核性能提升28%,同性能功耗降低40%,AI 应用:零一万物正式对外发布新旗舰模型——Yi-Lightning

      零一万物正式对外发布新旗舰模型——Yi-Lightning(闪电)。在大模型竞技场(Chatbot Arena)上,Yi-Lightning 性能直冲总榜单并列第6,数学分榜并列第3,代码等其它分榜也名列前茅。总成绩几乎与马斯克最新xAI 大模型Grok-2-08-13 持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet 等顶流。在中文子榜单上,Yi-Lightning 超越了 xAI 发布的 Grok-2-08-13、智谱发布的GLM-4-Plus 等国内外优质模型,与 o1-mini 等模型并列排名世界第二。

      Yi-Lightning 采用MoE 混合专家模型架构。底层技术上, Yi-Lightning 在以下方面进行了提升。

      优化混合注意力机制,只在模型的部分层次中将传统的全注意力(FullAttention)替换为滑动窗口注意力(Sliding Window Attention)。

      由此以来,模型在保证处理长序列数据高性能表现的同时,还能大大降低推理成本。Yi-Lightning 还引入了跨层注意力( Cross-LayerAttention, CLA),允许模型在不同的层次之间共享键(Key)和值(Value)头,减少对存储需求。这使得Yi-Lightning 能在不同层次之间更有效地共享信息。总的来说,KV cache 缩小了2-4 倍,同时将计  算的复杂度从O(L)降至O(L)。"

      动态Top-P 路由机制。Yi-Lightning 可以根据任务的难度动态自动选择最合适的专家网络组合——训练过程中会激活所有专家网络,使模型能学习到所有专家知识;而推理阶段,根据任务的难度,模型会选择性激活更匹配的专家网络。

      多阶段训练。团队将整个训练分为两块,一块做好以后就把它固定起来,然后在这个固定的模型上再做后段训练。训练前期,更注重数据多样性,使得Yi-Lightning 尽可能学习不同的知识;训练后期更重内容更丰富、知识性更强的数据。同时团队还在不同阶段采用不同的batchsize 和LR schedule 保证训练速度和稳定性。

      谈起和国外头部大模型的差距,李开复博士表示这次Yi-Lightning 的排名证明了国产大模型跟硅谷最顶尖模型的差距缩小到了五个月。去跟追上美国最顶尖的模型,缩短时间差非常困难,要付出很大的努力和有独特的打法。在国内不少公司都在努力,“模基共建”则是零一万物自己摸索的独特路径。

      AI 融资动向: Abridge/Terray Therapeutics 分别获2.5 亿美元/1.2 亿美元融资

      本期AI 初创公司的融资中,Abridge/Terray Therapeutics 融资额位居前二,分别获2.5 亿美元/1.2 亿美元融资。Abridge 的平台可通过移动应用程序访问,医生在每次预约前激活该应用,软件即可记录对话、转录并自动生成医疗记录。虽然这一过程并非完全自动化,医生仍需检查草稿的准确性并进行必要编辑,但Abridge 提供了一项名为链接证据的功能,将每个AI 生成的句子与相应的笔录摘录链接起来,从而简化了错误发现的过程。Terray 一直致力于通过规模实验和生成式AI,提高小分子药物发现和开发的速度和成功率。依托其专有实验平台,Terray 构建了全球最大的化学数据集之一。目前Terray 已定量测量了超过50 亿次靶标-配体相互作用,该数据集仍在每年翻倍增长。Terray的数据优势赋予其潜在best-in-class 的AI 能力,可识别并优化解决复杂问题的新型小分子。Terray 将这一专长应用于专注于免疫疾病的内部管线,同时在与BMS 和Calico 的合作中,针对更多具有挑战性的靶点开展研发。

      投资建议

      一方面,国产ai 大模型有望迎来新机遇,10 月17 日,微软宣布将于10 月21 日停止在中国大陆的个人Azure OpenAI 服务。OpenAI 停止服务后,多家国内大型企业,如阿里巴巴、百度与汇量科技迅速推出了针对这一市场变动的应对措施,力求吸引迁移流失客户,昆仑万维与讯飞等公司表明OpenAI 用户的迁移需求在短时间内显著增加。另一方面,台积电Q3 财报全面超预期提振市场信心,在截至9 月30 日的季度中,台积电营收录得7596.9 亿新台币(235 亿美元),较上年同期增长了39%(以美元计增长了36%),超过了市场预期的7421.66 亿元新台币,智能手机和人工智能对3nm 和5nm 技术的强劲需求支撑了其业务。

      我们继续看好AI 软硬件机会,近期优先关注铜缆高速连接板块。建议  关注以AI 为核心的龙头厂商科大讯飞(002230.SZ)、有望迎来需求爆发的AI 应用金桥信息(603918.SH)、高速通信连接器业务或显著受益于 GB200 放量的鼎通科技(688668.SH)。

      风险提示

      1)AI 底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。