距离春节前夕GLM-5.0发布仅一个多月,智谱昨晚突然推出其升级版本——GLM-5.1,并已面向全部GLM Coding Plan用户(含Lite、Pro与Max三档)正式开放。
本次更新仍聚焦于AI代码能力的深度强化。据官方公布的评测数据,GLM-5.0在自有基准测试中得分为35.4分,而GLM-5.1大幅提升至45.3分,增幅超过28%,接近30%。这一成绩使其与当前全球公认的最强编码大模型Claude Opus 4.6(得分47.9分)差距缩小至仅2.6分——不足3分的差距,表明二者在编程能力上已处于高度接近的水平。
值得注意的是,性能逼近国际顶尖水平的同时,GLM-5.1在成本端展现出显著优势。作为目前综合能力最强但也价格最高的大模型之一,Claude Opus 4.6被许多开发者称为“用不起”的模型;相比之下,GLM系列大模型的调用费用仅为前者的几分之一,性价比优势突出。
当然,编程能力的最终价值不仅体现在评测分数上,更取决于真实开发场景中的稳定性、理解深度与工程适配性。从实际应用角度看,国产大模型仍有一定提升空间:一方面,Claude系列长期深耕代码领域,积累了海量高质量、多范式、跨语言的训练数据;另一方面,其背后支撑的算力规模与持续迭代节奏,目前仍领先于多数国产模型。因此,如何在保持成本优势的基础上,进一步夯实数据质量、优化推理体验、拓展生态工具链,将是GLM后续演进的关键方向。


文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected])
相关阅读
近期热点
最新资讯