AI+专题系列点评(二十一):ETA发布LLAMA3.1:开源AI领域的新进展

吴鸣远 2024-08-19 20:42:25
机构研报 2024-08-19 20:42:25 阅读

事项:

    2024 年7 月23 日,Meta 推出了Llama 3.1,包含8B、70B 和405B 三个版本,其中405B 拥有4050 亿参数,是目前最大、最强的开源模型之一,性能上超越了现有的顶级AI 模型。405B 支持128K tokens 的上下文窗口,能够处理复杂任务和对话,支持多语言输入输出,尤其擅长解决复杂数学问题和即时内容生成。这些特性使Llama 3.1 在多种场景中更灵活强大。此次发布标志着Meta在开源AI 生态系统的进展,并挑战了GPT-4 等封闭模型,体现了Meta 对推动开源AI 的承诺。

    评论:

    开源权重和代码,允许微调和蒸馏:Meta 提供了Llama 3.1 的92 页技术报告,记录了模型的创建过程和技术细节。模型的权重和代码开源,允许商用。开发者可利用这些资源生成合成数据,对模型进行微调和蒸馏,以适应特定的小型任务,满足不同的应用需求。

    支持多语言窗口,处理复杂任务对话:Llama 3.1 支持8 种语言,上下文窗口增加到128K tokens,使其更擅长处理复杂任务和多语言对话。在测试中,Llama3.1 405B 版本的表现接近GPT-4 和Claude 3.5,尤其适合需要高效信息检索的AI 应用,能够在处理长短文本时保持高质量和安全性。

    推理增强,解决数学问题和生成内容突出:405B 模型增强了推理能力,尤其在复杂数学问题和即时内容生成方面表现突出。通过优化工具使用和函数调用,Llama 3.1 能高效处理多步骤任务并生成高质量内容,提升了其实际应用中的适用性。

    推动AI 智能化,展现行业领军潜力:Llama 3.1 已经广泛应用于多个领域,如云服务、医疗、金融和教育,通过与AWS、Google、微软Azure 等公司的合作,推动了各行业的智能化进程。其开源策略使其具备了广泛的应用潜力,增强了市场竞争力,进一步巩固了Meta 在AI 领域的领军地位。

    投资建议:AI 大模型本质应落脚垂类应用,国内大模型正快速追赶美国先进水平,中文大模型的突破有望为下游AI 应用注入新的活力,看好AI+应用产品力与商业化落地进程。建议关注以下标的:AI+应用侧:1)安全:永信至诚、深信服;2)办公:金山办公、福昕软件;3)法律:金桥信息、华宇软件、通达海;4)医疗:润达医疗;5)教育:佳发教育、欧玛软件、新开普;6)金融:同花顺、新致软件;7)邮箱:彩讯股份;8)传媒:掌阅科技、华策影视;9)数据:海天瑞声;10)电商:焦点科技;11)OA:致远互联、泛微网络;12)ERP:用友网络、金蝶国际。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。

    风险提示: 商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。