最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一

旅游 2026-01-14 06:19:12 1

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!

豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。

来自SuperCLUE

汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。

SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。

本文地址:http://panjin.ruanwenhui.com/html/42f599952.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

山海交响入馔来 新鲁菜地标摘得金梧桐大奖

匠岭荣获“上海品牌”认证 领跑票税数字化赛道

穿越“灰犀牛”! 品饮汇即将举行2026我国饮品产业大会

“安橙”甜蜜上市,容声“寻鲜之旅”打造从田间到舌尖的价值共享链

每月17日「一同开星日」来袭 星巴克持久升级会员星式生存感受

全友家居案例丨7个实用橱柜策划,照着装想翻车都难!

互动乐趣破“框”而出!HarmonyOS 6互动卡片让你的桌面“活”起来

全友家居案例丨7个实用橱柜策划,照着装想翻车都难!

友情链接