3月6日凌晨3点,阿里巴巴发布并开源全新的推理模子通义千问QwQ-32B。阿里巴巴称kaiyun体育,这是一款领有320亿参数的模子,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1比好意思。
据悉,QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力,并与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比拟。
在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B确认与DeepSeek-R1迥殊,远胜于o1-mini及接洽尺寸的R1蒸馏模子。
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等冷落的提醒苦守能力IFEval评测集、由加州大学伯克利分校等冷落的评估准确调用函数或器用方面的BFCL测试中,千问QwQ-32B的得分均卓绝了DeepSeek- R1。
官方先容称,这一效果凸显了坚定化学习运用于经过大范围预考验的庞杂基础模子的有用性。此外,阿里团队还在推理模子中集成了与Agent关连的能力,使其大致在使用器用的同期进行批判性想考,并凭证环境反映调治推理历程。
除了性能上的大幅进步,QwQ-32B的另外一个亮点是大幅裁汰了部署使用资本,开辟者和企业不错在败坏级硬件上纵脱将其部署到腹地修复中。
而已显露,从2023年于今,阿里通义团队已开源200多款模子,包含假话语模子千问Qwen及视觉生成模子万相Wan等两大基模系列,销亡从0.5B到110B等参数,好意思满了全模态、全尺寸大模子的开源。
开源社区Hugging Face此前的榜单显露,开源仅6天的阿里万相大模子已反超DeepSeek-R1,登顶模子热榜、模子空间榜两大榜单,成为近期大家开源社区最受宽待的大模子。凭证最新数据,万相2.1(Wan2.1)在Hugging Face及魔搭社区的总下载量已超百万,在Github的Star数超6k。
在通义千问最新推理模子发布并开源后,阿里巴巴股价应声大涨。隔夜好意思股收盘涨8.61%,报收141.03好意思元。搁置发稿,阿里巴巴港股涨超7%。本年以来,阿里巴巴股价累计涨幅已近70%。
新闻荐读突发!一架载152东谈主波音飞机,升起几分钟后发动机爆炸
◆着手:界面新闻
◆裁剪:陈想灵
◆二审:赵鹏云
◆三审:刘波
点和
握续照拂
↓↓↓kaiyun体育
]article_adlist-->