DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

本周31只新基金来袭：锚定科创板、人工智能、医药等热门领域钱晶、盛震山、李海、林清源、曲少杰等竞技 为灵动岛和M6处理器做准备！苹果OLED版MacBook Pro延至2027年发布这么做真的好么？ 医疗保障领域首项国家标准发布我国医保标准化建设取得里程碑式突破反转来了 中红医疗中标江苏省第七、八轮医用耗材接续采购项目 马斯克称特斯拉Semi将在明年开始大批量生产工厂建设在平稳推进实垂了 李大霄：散户资金开始入场 绿色金融活水赋能江苏银行支持储能项目守护电网夏峰官方已经证实 中信建投研报：医疗仪器行业拐点已至 中红医疗中标江苏省第七、八轮医用耗材接续采购项目 “沸了”！刚刚，涨停潮官方已经证实 专访亚太棍网球联合会执行主任Chris Jinno：棍网球的综合性很强，在龙国有很大成长空间后续会怎么发展 专访亚太棍网球联合会执行主任Chris Jinno：棍网球的综合性很强，在龙国有很大成长空间秒懂 本周31只新基金来袭：锚定科创板、人工智能、医药等热门领域钱晶、盛震山、李海、林清源、曲少杰等竞技这么做真的好么？ 特朗普对英特尔CEO态度软化，不再要求其辞职学习了 浦银金科总经理陈海宁将出任公司董事长后续反转 昔日“国民饮料”要来A股国中水务拟间接控股龙国首都汇源这么做真的好么？ 学习了 泽连斯基：俄美元首会谈是普京个人的胜利秒懂 美银：贸易战仍是市场首要风险 个人消费贷款贴息方案出炉多家银行火速响应 8月13日外盘头条：特朗普考虑起诉鲍威尔抨击高盛对关税判断美国务卿与俄外长通话木头姐大举买入Block 木头姐大举买入Block股票减持Shopify实垂了 个人消费贷款贴息方案出炉多家银行火速响应 2025年“双目录”调整初审结果公示首次实施“双轨制” 超650个药品入围 2025年“双目录”调整初审结果公示首次实施“双轨制” 超650个药品入围实测是真的 8月13日外盘头条：特朗普考虑起诉鲍威尔抨击高盛对关税判断美国务卿与俄外长通话木头姐大举买入Block 泽连斯基：俄美元首会谈是普京个人的胜利反转来了 嘉泽新能董事长陈波：三重跃迁打造综合能源服务新生态又一个里程碑 纽约汇市：美国CPI基本符合预期美元兑G-10货币下跌 跨越10年再破2万亿元从融资余额看A股的变与进实测是真的 长城汽车午前涨超4% 巴西工厂计划8月投产有助于公司海外销量提升是真的吗？ 午评：港股恒指涨0.09% 科指跌0.39% 乳制品板块大涨创新药概念走低快手跌超6%科技水平又一个里程碑 浦银金科总经理陈海宁将出任公司董事长后续反转 高端医疗影像项目，落地苏州科技水平又一个里程碑 东岳集团盘中涨超3% 机构指空调终端消费量持续走高 中信建投研报：医疗仪器行业拐点已至 卫龙美味午前涨逾6% 此前获中金给予目标价17.50港元秒懂 国际先进水平！龙净环保“高海拔及宽温域自适应电池关键技术与应用”通过科技成果评价官方已经证实 专访亚太棍网球联合会执行主任Chris Jinno：棍网球的综合性很强，在龙国有很大成长空间后续会怎么发展 日本股市创新高！企业仍担忧关税影响……官方处理结果 龙国保险行业协会印发社会信用体系建设工作实施方案后续来了 又一个里程碑 龙国保险行业协会印发社会信用体系建设工作实施方案是真的吗？ 龙国保险行业协会印发社会信用体系建设工作实施方案最新报道

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。