就在今天,Code Arena最新榜单出炉! Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。 排在它前面的,只剩Claude Opus 4.7和Opus 4.6。
Code Arena放榜:阿里千问3.7编程能力超越GPT,编程,阿里巴巴,code,arena,max ...
AIbase 报道5月26日,全球权威编程榜单 Code Arena 最新放榜,阿里巴巴 Qwen3.7-Max 以1541分强势登上全球第二,仅次于 Claude 系列模型,成为国产大模型在编程领域的新标杆。这一成绩超越了包括 GPT-5.5、Gemini3.5Flash 等多款前沿模型,标志着中国 AI 在 Agentic Coding 和长时程任务上的重大突破。 根据最新 Code Aren ...
5月26日凌晨,全球权威三方编程榜单Code ...
IT之家5 月 26 日消息,全球权威三方编程榜单 Code Arena 昨日(5 月 25 日)更新榜单,阿里旗舰模型 Qwen3.7-Max 得分 1541 分,仅次于 Claude 系列,在大模型厂商中排名全球第二。 IT之家查询公开资料,Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型(LLM)能力评估榜单之一。 该榜单不测试学术化的选择题,而是评估模型在生成、调 ...
全球人工智能领域权威编程评测榜单Code Arena近日迎来重要更新,阿里自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。根据最新公布的排名,该模型在编程能力评估中位列第四,仅落后于Claude系列三款模型,在大模型厂商中稳居全球第二,展现出强劲的技术实力。 作为人工智能领域最具公信力的编程能力评估平台之一,Code ...
全球人工智能领域权威评测平台Code Arena近日公布最新榜单,阿里巴巴自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。该模型在编程能力专项评估中位列第四,紧随Claude系列三款模型之后,在大模型厂商中排名第二,展现出强劲的技术实力。 Code ...
据阿里云公众号消息,今天(5月26日),第三方大模型盲测平台LMArena旗下编程榜单Code Arena更新排名,阿里最新旗舰模型Qwen3.7-Max得分1541,在大模型厂商中位列全球第二,也是唯一突破1540分的中国模型。 Code Arena是当前最具影响力的AI编程能力评测榜单之一。与传统代码基准测试不同,Code Arena由开发者出题,要求模型从零生成完整的、可交互的Web应用程序 ...
全球人工智能领域权威编程能力评估榜单Code Arena近日迎来重要更新。在这份被视为行业风向标的榜单中,阿里最新推出的旗舰模型Qwen3.7-Max以1541分的成绩跻身全球前列,仅落后于Claude系列模型,在大模型厂商中稳居第二把交椅。 与传统学术测试不同,Code ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果