本报讯 (记者 张伟)7月28日晚,北京智谱华章科技股份有限公司(以下简称“智谱AI”)发布新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现融合与技术突破,综合测试性能已跻身全球领先行列。
这款新模型的发布,表明AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,该模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。用户使用该模型时仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。
在性能评估中,GLM-4.5的表现展示出其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。
美国消费者新闻与商业频道(CNBC)近日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。”路透社也在报道中提出,作为中国“AI 六小虎”之一的智谱,自今年6月被OpenAI“点名”后便备受关注。另一家美国知名科技媒体VentureBeat也在文章中指出:“GLM-4.5的发布,为企业团队提供了一个可行的高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”
发布不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。美国科技网站Techi认为,中国AI发展正清晰呈现“易获取”趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。”
此外,这款大模型还有一大亮点是,它是首款原生融合模型——首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。
大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一款能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成上述所有不同的能力。
业界认为,大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。