阿里千问3登顶全球最强开源模型 性能与成本双重突破

阿里巴巴于4月29日凌晨开源了新一代通义千问模型Qwen3,简称千问3。该模型参数量仅为DeepSeek-R1的三分之一,成本显著降低,性能却全面超越R1、OpenAI-o1等全球顶尖模型,成为目前最强的开源模型之一。千问3是国内首个“混合推理模型”,能够将快速和深度思考集成到同一模型中,对简单需求可以迅速给出答案,而面对复杂问题时则能进行多步骤深入分析,从而大大节省了算力消耗。

千问3采用了混合专家(MoE)架构,总参数量为235B,激活仅需22B。其预训练数据量达到36T,并在后训练阶段经过多轮强化学习,实现了非思考模式与思考模式之间的无缝整合。千问3在多个方面表现出色,包括推理能力、指令遵循、工具调用以及多语言支持等,均达到了国产及全球开源模型的新高度。例如,在AIME25奥数水平测试中,千问3获得了81.5分的成绩,刷新了开源记录;在LiveCodeBench代码能力评测中,得分超过70分,甚至超过了Grok3的表现;而在ArenaHard的人类偏好对齐评估中,以95.6分超越了OpenAI-o1及DeepSeek-R1。值得注意的是,尽管性能大幅提升,但千问3的部署成本却大幅下降,只需4张H20即可完成满血版部署,显存占用仅为性能相近模型的三分之一。

文章来源于网络。发布者:财华网,转转请注明出处:https://www.leiduan.cn/11916.html

(0)
财华网的头像财华网
上一篇 2025年4月29日 上午11:53
下一篇 2025年4月29日 下午5:00

相关推荐

  • 中美关税战开始 普通人生活会有什么影响?全球贸易链断裂引发生活剧变

    2025年4月2日,特朗普政府宣布对中国输美商品加征34%的“对等关税”,叠加此前20%的税率,部分商品综合税率高达54%。中国同步反制,对美国全品类进口商品加征34%的关税。这场被称为“关税世界大战”的冲突已从国家战略博弈下沉为普通人的生存挑战。当贸易战的硝烟弥漫全球,各国人民的生活正经历剧变。 全球贸易链断裂导致了从超市货架到工厂车间的蝴蝶效应。在美国,…

    2025年4月6日
    2100
  • 曝许家印拒绝披露资产详情 清盘过程或更复杂

    4月29日,据资本市场消息,中国恒大清盘人透露,恒大董事长许家印计划拒绝披露其资产详情,这可能使恒大清盘偿还债权人的过程变得更加复杂。 在香港高等法院举行的听证会上,清盘人的代表律师表示,许家印在4月23日向法庭提交的回应中表达了这一意图,而许家印的律师并未对此提出反驳。许家印控制着中国恒大近60%的股份,因此理清与其相关的资产对于清盘至关重要。 清盘人主张…

    2025年4月30日
    300
  • 乒乓球突尼斯赛落幕!国乒0冠张本美和夺2金,小勒布伦男单称王 国乒小将表现不佳

    乒乓球突尼斯赛落幕!国乒0冠张本美和夺2金,小勒布伦男单称王 国乒小将表现不佳!北京时间4月28日凌晨,乒乓球WTT突尼斯常规赛结束。国乒在五项比赛中仅获得一个亚军,而日本队则斩获了两金三银。具体结果如下:男单冠军为法国的小勒布伦,亚军是丹麦的林德;女单冠军是日本的张本美和,亚军是早田希娜;男双冠军为德国的杜达/贝尔特斯迈尔,亚军是中国的李和宸/伍毅菲;女双…

    2025年4月28日
    700
  • 会计靠偷再来1包奖券侵占180万货款 职务侵占被判3年

    会计靠偷再来1包奖券侵占180万货款 职务侵占被判3年!江苏常州一家食品销售公司的会计汤某,因沉迷网络游戏导致开销巨大,利用职务之便侵占公司财产达180万元。该公司主要经营槟榔生意,从上游企业进货后销售给超市,并采用“再来一包”的兑奖券政策。消费者中奖后,超市凭券向公司提货,公司再将回收的奖券寄给上游厂家抵扣货款。 汤某不仅管理公司财务,还负责订货和清点兑奖…

    2025年4月21日
    700
  • 巴特勒咖啡店给勇士员工设置折扣价 特别优惠引发热议

    巴特勒回到了他在迈阿密开的咖啡店。他还给勇士工作人员提供了特别优惠,如果他们是勇士员工,只需支付30美元就能买到一杯咖啡。 此前有报道提到,在园区内,巴特勒曾以20美元一杯的价格向球员们出售咖啡。但由于许多球员没有零钱,价格最终涨到了100美元一杯。

    2025年3月24日
    1300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信