通义千问开源320亿参数模型，已实现7款大语言模型全开源

AIIAW • 2024-04-12 14:45 • 业界 • 阅读 289

4月7日消息，阿里云通义千问开源320亿参数模型Qwen1.5-32B，可最大限度兼顾性能、效率和内存占用的平衡，为企业和开发者提供更高性价比的模型选择。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。

通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本，其中，几款小尺寸模型可便捷地在端侧部署，720亿参数模型则拥有业界领先的性能，多次登上HuggingFace等模型榜单。此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡，例如，相比14B模型，32B在智能体场景下能力更强；相比72B，32B的推理成本更低。通义千问团队希望32B开源模型能为下游应用提供更好的解决方案。

基础能力方面，通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异，性能接近通义千问720亿参数模型，远超其他300亿级参数模型。

Chat模型方面，Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分，与Qwen1.5-72B-Chat之间的差距相对较小。

多语言能力方面，通义千问团队选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言，在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

本站部分文章来自互联网，文章版权归原作者所有。如有疑问请联系QQ：3164780！

赞 (0)

AIIAW本站编辑

0

炬芯科技ATS3031荣获”2024年度中国IC设计成就奖”

上一篇 2024-04-12 11:52

守护绿色生态，加强应灾能力，2024年“米粉公益月”正式启动

下一篇 2024-04-15 16:26

业界

腾讯云发布三款云原生新品持续加码云原生布局

57100

AIIAW
2022-11-03
业界

新型冠状病毒感染肺炎疫情带来的影响，让苹果也坐不住了！

1.7K00

AIIAW
2020-02-19
业界

新华社评价坚果投影：与生俱来具备大湾区的创新精神和发展速度

46500

AIIAW
2022-08-20
业界

数字中国建设峰会召开，360叶健：“上山下海扶助小微”护航数字中国

54300

AIIAW
2023-05-31
业界

OceanBase数据库大赛，人民大学的参赛队伍夺冠，赢得20万奖金！

1.1K00

AIIAW
2022-05-13
业界

360安全卫士极速版推出新一代体验清理Pro版全面满足四大清理场景

63500

AIIAW
2023-06-03
业界

蚂蚁集团蒋国飞详解数字科技业务：聚焦技术突破推动分布式商业繁荣

82100

AIIAW
2022-11-04
业界

蔚来换电站突发大火、现场浓烟滚滚；王慧文辞去美团职务离岗就医，疑现抑郁类症状

49900

AIIAW
2023-07-18
业界

2023深圳高交会IT展盛况：AI技术成焦点，创新产品引领风潮

36900

仙游乐客
2024-01-30
业界

增速第一！腾讯云引领中国AI工业质检市场，助力制造业数字化转型

31400

AIIAW
2023-11-28
业界

一审败诉！蔚来车名侵权奥迪被德国判罚；ASML称仍可向中国销售DUV光刻机

83411

AIIAW
2023-03-27
业界

薪火相传，照亮联通助力亚运新征程

33600

仙游乐客
2023-11-28