2025年06月23日
第A13版:信息技术

百度发布行业首个全模态系统

  本报讯  (记者 孙立彬)  6月10日,在百度AI Day开放日上,百度网盘、百度文库联合发布行业首个全模态输入、处理、输出系统,并推出行业首个“拍存管一体”的AI相机。

  该系统能够实现全模态输入、处理和输出‌。其中,在输入端,百度文库、百度网盘拥有文字、语音、图片、视频等全模态、全格式输入能力。在处理端,百度文库、百度网盘联合推出的内容操作系统“沧舟OS”,拥有对用户海量公私域内容、记忆库的全场景、全链路处理能力,通过中枢系统实现智能体(Agent)之间的数据互通和智能调度。在输出端,百度文库、网盘已被数亿用户验证的数百项Agent,可以灵活匹配各种任务需要,最终实现全模态、全格式内容的端到端输出。

  作为全模态输入重要能力,AI相机已在百度网盘应用程序(APP)上线。同时,AI相机也已接入百度文库APP。百度文库、百度网盘将相机和相册融为一体,为用户提供存储、搜索、扫描、修图、管理、打印等图像内容“一站”式服务,实现“即拍即存”和图像智能管理。

  同时,百度文库、百度网盘的AI相机率先实现了生活、学习、工作全场景覆盖。在生活场景上,用户可以用AI相机进行人像直修和存储;可以“拍摄万物”,AI将自动识别并推荐知识百科;还能将简单画作生成创意涂鸦,举办线上画展。在学习场景上,用户可以“拍完就学”,轻松使用拍照解题、错题举一反三、试卷去手写等能力,并将内容直接存储网盘。在工作场景上,AI相机提供文件、票据的智能扫描、拍照翻译、图片转表格等能力,将纸质文件扫描成电子版,并实现文件格式的自由转换。

  活动现场,百度文库还宣布多智能体协作能力“GenFlow超能搭子”全新升级为2.0版本,将于不久后全面上线。“GenFlow超能搭子”2.0体现了百度文库的全模态处理、输出能力,使其成为率先实现全场景满足、全链路覆盖的多智能体协作应用。目前,“GenFlow超能搭子”在任务完成用时、交付内容丰富度、信息检索范围、内容编辑能力上处于行业领先地位。

  目前,百度文库、百度网盘在AI内容创作、内容消费、个人知识库等领域已达行业领先水平,正在践行大模型行业从“深度思考”走向“深度交付”的新趋势,并成为“聪明又能干”的超级生产力。截至目前,百度文库AI原生应用或AI插件月活跃用户(AI MAU)已达9700万,拥有14亿专业内容资源;在最新发布的AI产品榜上,百度网盘应用程序月活跃用户(APP MAU)超1.5亿,位列应用榜国内总榜第一。

2025-06-23 6 6 中国高新技术产业导报 content_152408.html 1 <p>百度发布行业首个全模态系统</p> /enpproperty-->