阿里千问3登顶全球最强开源模型 性能与成本双重突破

阿里巴巴于4月29日凌晨开源了新一代通义千问模型Qwen3,简称千问3。该模型参数量仅为DeepSeek-R1的三分之一,成本显著降低,性能却全面超越R1、OpenAI-o1等全球顶尖模型,成为目前最强的开源模型之一。千问3是国内首个“混合推理模型”,能够将快速和深度思考集成到同一模型中,对简单需求可以迅速给出答案,而面对复杂问题时则能进行多步骤深入分析,从而大大节省了算力消耗。

千问3采用了混合专家(MoE)架构,总参数量为235B,激活仅需22B。其预训练数据量达到36T,并在后训练阶段经过多轮强化学习,实现了非思考模式与思考模式之间的无缝整合。千问3在多个方面表现出色,包括推理能力、指令遵循、工具调用以及多语言支持等,均达到了国产及全球开源模型的新高度。例如,在AIME25奥数水平测试中,千问3获得了81.5分的成绩,刷新了开源记录;在LiveCodeBench代码能力评测中,得分超过70分,甚至超过了Grok3的表现;而在ArenaHard的人类偏好对齐评估中,以95.6分超越了OpenAI-o1及DeepSeek-R1。值得注意的是,尽管性能大幅提升,但千问3的部署成本却大幅下降,只需4张H20即可完成满血版部署,显存占用仅为性能相近模型的三分之一。

文章来源于网络。发布者:财华网,转转请注明出处:https://www.leiduan.cn/11916.html

(0)
财华网的头像财华网
上一篇 2025年4月29日 上午11:53
下一篇 2025年4月29日 下午5:00

相关推荐

  • 新赛季乒超共有10名外协选手 外援阵容豪华引关注

    新赛季乒超共有10名外协选手 外援阵容豪华引关注。北京时间6月3日,乒超联赛各队大名单揭晓,十大外援加盟,其中包括日本队的四名选手,孙颖莎和王曼昱将迎来新的挑战。 本次乒超联赛参赛名单正式公布,男队有9个俱乐部,女队有6个俱乐部。其中一些名字引起了广泛关注,包括大量外援的加入。十大外援将参加比赛,日本队的张本美和、平野美宇、木原美悠和松岛辉空,中国台北的林昀…

    2025年6月4日
    700
  • 山西太原丰景佳园小区爆炸 1死21伤救援进行中

    4月30日13时许,山西省太原市小店区丰景佳园小区发生爆炸。明火扑灭后,消防救援人员立即进入楼内开展逐户搜索搜救工作。此次爆炸造成1人死亡,21人受伤,其中6人重伤、15人轻伤,重伤人员生命体征基本平稳,另有2人失联。 现场已成立救援指挥部,正在开展救援、伤员救治和人员安置等工作,爆炸原因正在调查中。 事故发生时,现场产生大量浓烟,周边建筑的玻璃被震碎。相关…

    2025年5月1日
    1700
  • 张卫平:步行者本有机会战胜雷霆 末节追分四连失误导致希望破灭 篮板与进攻双重失守

    步行者溃败之因:篮板与进攻的双重失守 里克·卡莱尔在赛后分析了步行者队第四场第四节输给雷霆队的原因,主要归结于篮板球失控和进攻端哑火。比赛中的篮板球如同棋局中的关键棋子,但在这场比赛中,步行者防线混乱不堪。每当雷霆球员发起冲击,篮球似乎总是被推向对方怀抱,步行者只能望尘莫及。这种局面不仅让对手获得二次进攻机会,也严重打击了球队士气。 进攻端的问题则像是迷失方…

    2025年6月17日
    900
  • 男子为见交友软件上的女友求助电视台,网恋背后的“黑手”曝光

    男子为见交友软件上的女友求助电视台。 也是说话很温柔 各方面看着还是那么一回事 实际她是这种诱惑 就是把我诱惑住了 天赐的“良缘” 58岁的管逸(化名),离异多年,在河南新密一家煤矿公司工作。2024年6月的一天,他‌下载并注册‌了一款交友软件,‌该软件‌推荐了许多年龄相仿的女性,他也由此结识了同样离异多年的55岁的丽娜。 丽娜对管逸嘘寒问暖‌,‌情意绵绵,…

    2025年3月25日
    2400
  • 北京明天最高气温24℃,后天最高气温26℃ 昼夜温差大注意调节着装

    4月4日08时到4月5日08时,南郊观象台最高气温22.7℃,最低气温8.3℃。预计今天气温与昨天相仿,最高气温在22℃左右。温度适中,加上连续多日的北风把京城的天空吹得湛蓝透亮,阳光下让人倍感心情舒畅。只是不时有六七级阵风搅扰,傍晚前后会逐渐减弱。 今天傍晚晴间多云,北转南风3级左右转1、2级,气温22~18℃。明天早晨晴间多云,偏北风1、2级,气温9~1…

    2025年4月5日
    2000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信