AI系列跟踪(54):OPENAI揭秘「草莓」AI META多模态新技术重磅落地
事件描述
OpenAI 计划最早在今年秋天推出代号为「草莓」的新人工智能,该人工智能旨在改进即将推出的「Orion(猎户座)」,以帮助OpenAI 减少模型生成的错误数量,提高答案的准确性。Meta最近发布了融合Transformer 和Diffusion 的训练能够生成文本和图像模型的统一方法Transfusion,该方法有望用于训练真正的多模态模型。此外,8 月24 日,Meta 推出了一款专为理解人类视觉任务而设计的AI 视觉模型:Sapiens,该模型能够提供高保真度的视觉输出。
事件评论
OpenAI 计划推出代号为「草莓」的新人工智能。1)AI 大模型技术更新推动演算能力提高。「草莓」具备解决以前从未见过的数学问题的能力,这是当今的聊天机器人所无法准确做到的。给予长时间演算时,「草莓」还能够回答用户更主观的问题,适用于对时间不太敏感的用例。2)训练数据生成能力增强。「草莓」旨在改进即将推出的「Orion(猎户座)」,可以帮助 OpenAI 克服获取足够高质量数据的限制,以便利用现实世界的数据训练新模型,并帮助OpenAI 减少模型生成的错误数量,提高答案的准确性。「草莓」的推理能力有望被整合进ChatGPT,同时,该技术还将对未来能够完成多步骤任务的智能体产品产生深远影响。
Meta 多模态模型训练方法取得新进展,全新视觉模型性能出色。1)高性能图像与文本生成能力。Transfusion 能够生成与相似规模的扩散模型相媲美的高质量图像,而且,它同时也保持了强大的文本生成能力。在GenEval 基准上,Transfusion 模型优于DALL-E 2和SDXL 等其他流行模型,且在文本基准上达到了Llama 1 级别的性能水平。该方法使用前景十分广阔,有望用于训练真正的多模态模型。2)Sapiens 优化视觉任务。Meta 推出的全新视觉模型Sapiens 对二维姿势预估、身体部位分割、深度估计和表面法线预测四大关键视觉认为进行了优化,在多种场景均有用武之地。3)泛化能力卓越,用户使用便利。Sapiens 模型易于针对个别任务进行调整,面对真实世界数据时表现出卓越的泛化能力。即便是在标注数据稀缺或完全使用合成数据的情况下,Sapiens 依然拥有出色的性能。此外,该模型易用性强,为具有不同训练设置偏好的用户提供了多样化的安装路径选择。
AI 技术关卡持续突破,用户体验逐步提升。OpenAI 和Meta 等头部企业对AI 技术的突破以及应用拓展将会带领全行业技术创新和用户体验的提升,AI 行业拥有广阔的发展前景。AI 技术及应用领域持续突破,建议持续关注AI 在视觉成像和内容创作等各领域的商业化落地。
风险提示
1、AI 技术发展不及预期风险;
2、内容监管风险。
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: