近日,中文语言理解领域权威测评基准SuperCLUE发布第二期手机GUI Agent(离线)测评报告,中兴通讯自主研发的Nebula-GUI-V2凭借92.27的高分强势登顶总榜。Nebul-GUI是中兴通讯星云大模型家族的一员,主要用于各类GUI界面自主操作,在UI元素定位与指令执行两大核心能力上表现突出,以绝对优势领跑行业,彰显了中兴通讯在AI智能交互领域的深厚技术积淀与创新实力。

SuperCLUE本次测评在首期基础上全面升级,新增"智慧办公""生活健康"等实用场景,并引入20步左右跨应用困难题,从多维度、全场景精准衡量手机端离线智能交互水平。本次共有国内外12个代表性智能体产品参与角逐,测评结果的权威性和参考价值也因此得到进一步提升,为行业提供了更为清晰的发展标杆。
在核心能力测评中,中兴Nebula-GUI-V2展现出均衡且卓越的综合实力。其中,在UI元素定位环节以98.40分的高分刷新纪录,展现出对屏幕目标元素的精准识别与定位能力;指令执行环节同样表现亮眼,以88.18分位列第一,在视频娱乐、音乐播放、交通导航、健康管理、办公协作等九大核心场景中均取得优异成绩,其中健康管理场景得分高达94.00分,办公协作场景89.10分,充分体现了产品对用户多样化需求的深度适配。

尤为值得关注的是,Nebula-GUI-V2在跨应用复杂任务中表现突出,凭借高效的指令理解能力和精准的操作执行逻辑,顺利攻克各类高难度场景任务,其任务完成度、动作类型准确率及动作细节匹配率均处于行业顶尖水平。这一成果背后,是中兴通讯在人工智能、计算机视觉、自然语言处理等领域的持续技术投入与创新突破,通过优化模型架构与算法逻辑,实现了智能交互体验的跨越式提升。

GUI Agent作为手机端聚合服务的AI“超级入口”,正成为行业竞争的新焦点。它凭借重塑流量分发格局的潜力,不仅催生千亿级市场机遇,更吸引诸多头部科技企业纷纷布局。此次登顶SuperCLUE测评,是中兴通讯AI技术创新成果的又一重要体现。随着智能终端交互需求的不断升级,中兴通讯将继续以用户需求为中心,持续迭代优化产品能力,为全球用户提供更智能、更便捷、更高效的交互体验,助力AI技术走进千家万户。
(责任编辑:康玲华)
运营商财经(官方微信公众号yyscjrd)—— 主流财经网站,一家全面覆盖科技、金融、证券、汽车、房产、食品、医药、日化、酒业及其他各种消费品网站。


