4月25日消息,AI模型竞技场Arena AI最新发布的代码能力排行榜显示,DeepSeek-V4 Pro(Thinking)以1456分位列开源模型第三,较前代DeepSeek-V3.2(Thinking)的1368分实现大幅提升,排名从第12位跃升至第3位。

榜单前三甲由国产模型包揽。智谱AI的GLM-5.1以1534分居首,月之暗面的Kimi-K2.6以1529分紧随其后,两者领先优势明显。
DeepSeek-V4 Pro作为推理增强版本,成功跻身第一梯队。
榜单中GLM系列表现强势,GLM-4.7以1440分位列第4,GLM-5以1435分排名第5,智谱AI在前五中占据三席。
月之暗面除Kimi-K2.6外,Kimi-K2.5(Thinking)以1430分位列第6,Kimi-K2.5 Instant以1408分排名第8。
MiniMax的M2.7以1416分位列第7,M2.1以1392分排名第9,M2.5以1384分位列第11,三家国产厂商在榜单前15中占据主导地位。
阿里Qwen-3.5系列三个版本分别位列第10、13、15位。
本文来自转载AI普瑞斯 ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

