阿里巴巴发布新一代端到端多模态旗舰模型Qwen2.5-Omni

证券之星 2025-03-27 09:24:54

2025-03-27 09:24:54 阅读

阿里巴巴发布了新一代端到端多模态旗舰模型Qwen2.5-Omni，号称具备全方位多模态感知能力，看听说写样样精通。

采用全新的Thinker-Talker双核架构，Thinker模块负责处理多模态输入并生成语义表征和文本内容，Talker模块则负责将这些信息转化为流畅的语音输出。这种架构实现了端到端的统一，支持实时音视频交互和流畅的语音生成。

能够无缝处理文本、图像、音频和视频等多种输入形式，并同时生成文本和语音输出。支持分块输入和即时输出，实现真正的实时交互。

已在Hugging Face、ModelScope、DashScope和GitHub等平台开源，方便开发者体验和使用。

相比现有方案，语音生成的自然度和稳定性更高。在音频能力上优于同等规模的Qwen2-Audio，与Qwen2.5-VL-7B保持同等水平。在语音指令理解方面表现出色，效果可媲美文本输入。

新一代旗舰

声明：

风险提示：以上内容仅来自互联网，文中内容或观点仅作为原作者或者原网站的观点，不代表本站的任何立场，不构成与本站相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性，对此本站不做任何保证和承诺。

本站认真尊重知识产权及您的合法权益，如发现本站内容或相关标识侵犯了您的权益，请您与我们联系删除。

阿里巴巴发布新一代端到端多模态旗舰模型Qwen2.5-Omni

推荐文章：

三年半亏超23亿，如祺出行上市后股价缩水7成，Robotaxi盈利待考

高溢价、低补偿、商誉激增，嘉必优斥资8.3亿收购欧易生物为哪般？

高管密集离职余波未消，国投证券再爆人员流失，“老将”率固收团队集体“跳槽”

中国联通：收入承压，净利润“含金量”不足，资费不明乱象仍存

微粒贷“双重困局”：假冒APP屡禁不止，高投诉率拖累品牌形象

浪莎股份3·15风波背后：陷入代工依赖与中低端产品困局，连续13年毛利率不足20%

湖南裕能上市后业绩一退再退，定增募资额缩水仍陷停滞

金桥信息：业绩预亏下，“低门槛”激励计划惹争议，募投项目患“拖延症”

理想汽车：低价车成顶梁柱，以价换量利润“失守”，智驾+纯电胜算几何？

酒鬼酒业绩“滑铁卢”：归母净利润三年暴跌98%，高端化战略受阻，渠道信心如何挽回？

金龙鱼：预计各板块业务今年会比去年有所进步

富时中国A50指数期货盘初微幅下跌

国内期货主力合约开盘多数上涨

双林股份：行星滚柱丝杠产品完成样品研发并处于客户验证阶段

中国民航代表团访问德国

【热点掘金】电力改革持续深化，多地加快推进虚拟电厂建设，后续支持政策有望陆续出台

南钢股份：携手合作伙伴研发了综合性知识引擎DeepIron

阿里巴巴发布新一代端到端多模态旗舰模型Qwen2.5-Omni

OpenAI接近敲定由软银牵头的400亿美元融资

鲁西化工：近期化工产品价格涨跌不一有机硅、甲酸等涨价后保持稳定

两市融资余额增加6.57亿元融资客中止连续3日净卖出