2024年05月13日
第A3版:热点

数据安全如何“护航”创新发展

  ▶ 本报记者  李洋

  在2024中关村论坛年会数据安全治理与发展论坛上,新加坡资讯通信媒体发展局局长柳俊泓表示,预计全球今年将产生147泽字节(计算机存储容量单位)的数据,这相当于每个“地球人”捧着大约150部iPhone的数据量。

  柳俊泓认为,数据被共享、被重复使用的次数越多,它创造的价值就越大,“更重要的是,数据正在以前所未有的速度跨境流动。”

  海量产业数据

  对数据安全治理提出更高要求

  4月28日,中国汽车工业协会、国家计算机网络应急技术处理协调中心发布《关于汽车数据处理4项安全要求检测情况的通报(第一批)》。比亚迪、理想、蔚来、合众(哪吒)、特斯拉、路特斯6家新能源车企旗下76款车型通过合规要求检测。

  据悉,中国汽车工业协会等机构的检测重点关注以下4个方面:车外人脸信息等匿名化处理、默认不收集座舱数据、座舱数据车内处理以及处理个人信息的显著告知。这些方面均涉及到用户隐私和数据安全的核心问题。

  伴随着车路云一体化深入发展,多源海量产业数据呈现敏感、交织存储、流动性大等特点,对数据安全治理提出更高要求。记者从中关村论坛上获悉,以北京经济技术开发区为核心,北京市自设立全球首个车路云一体化高级别自动驾驶示范区以来,累计接入360余个智能路口,入网车辆超800辆,六大类超200种数据项累计接入超5.1PB(1PB为千万亿字节)。通过将海内外数据治理先进经验与自身实际相结合,该示范区已构建六大类41子类数据体系,实现了对超600TB(1TB为万亿字节)结构化数据、4.5PB非结构化数据的全面掌握与分析。

  如此量级的庞大数据安全治理,在人工智能迅猛发展背景下尤为重要。然而,汽车产业数据只是海量数据冰山的一角。

  平衡安全保护

  与创新发展二者关系

  如何在数据安全保护和创新发展之间取得平衡?柳俊泓谈道,事实上,大多数国家和地区数据安全治理顶层设计的核心都有着相似的处理方式:首先,用户授权同意是使用个人数据的重要环节;第二,建立数据机制,明确不可用的领域;第三,顶层设计应该考虑数据可用领域占大多数;第四,要建立协调机制,通过标准合同条款进行协调,有助于实现一定程度上的全球一致性。

  为支撑《数据安全法》《个人信息保护法》的落地实施,2022年国家市场监管总局和国家互联网办公室先后联合发布公告,决定开展数据安全管理认证和个人信息保护认证工作,鼓励网络运营者、个人信息处理者通过认证方式规范数据处理活动,加强数据安全和个人信息保护。

  “认证实施过程实际上是网络运营者实现对自身数据处理活动的综合体检,对优化数据安全管理和个人信息保护工作发挥着重要作用。”中国网络安全审查认证和市场监管大数据中心党委书记、主任陈建良表示,自2022年以来,中国网络安全审查认证和市场监管大数据中心收到近200家网络运营者的数据安全管理认证申请意向、近100家网络运营者的个人信息保护认证申请意向,目前已发放数据安全管理认证书19张,发放个人信息保护认证书5张。

  “达到这‘六个不’的效果,才能使得数据安全治理达到有效的目标。”中国工程院院士沈昌祥认为,首先让进攻者“进不去”,进去后“拿不到”数据,即使进攻者拿到数据也因数据被加密而“看不懂”,并且相关系统带有自动免疫功能,让进攻者“改不了”数据。同时,需要保障设备“瘫不了”,能在发现故障后及时采取措施确保稳定运行,最后是确保行为可追溯“赖不掉”。

  香港工程科学院院士、香港科技大学首席副校长郭毅可认为,区块链技术是一种具有前景的解决方案,可增强数据安全。他表示,区块链透明和不可更改的特性确保了数据的完整性,降低了未经授权的修改和数据篡改的风险,基于区块链的解决方案,在金融、医疗和供应链管理等行业中具有重要价值。

  郭毅可表示,为防止未经授权的访问和数据泄露,相关组织必须采取严格的安全措施,通过数据匿名化技术、用户同意和隐私设计原则以及实施数据分类、访问控制和加密方法,保护知识产权和防治未经授权数据的披露。

  生成式人工智能时代

  探索AI治理新范式

  “数据是人工智能服务的核心,我们看到的一些新服务、新解决方案,都是由传统人工智能和生成式人工智能创造出来,我们需要对数据建立信任、对AI建立信任。”柳俊泓说。

  欧洲科学院院士、清华大学人工智能研究院常务副院长孙茂松表示,人工智能特别是生成式人工智能,是发展新质生产力的一个重要引擎,但同时也存在一些不安全的因素,比如幻觉现象,在使用过程中会发生各种问题等。因此,治理是必须的。

  今年3月29日,北京人工智能数据训练基地正式启用,并配备建立了监管沙盒机制,向大模型企业的模型训练提供强大算力+海量数据+监管合规的完整训练要素,这是全国首例人工智能领域监管沙盒。北京人工智能数据训练基地监管沙盒机制建立后,4月19日,人工智能大模型训练营第一期正式启动。同方知网、希尔贝壳、北京车网等14家数据企业,及稀宇极智、中科闻歌、网智天元等3家模型企业,共计17家企业成为首批入盒试点企业,训练营一期引入近20个人工智能大模型高质量数据集,数据总量逾7000GB,覆盖多模态语料,涉及近10个领域的应用场景。

  同时,孙茂松也表示,生成式人工智能并不是只会给治理带来问题,其实它的出现为安全治理提供了一种新的更有效的手段。比如现在数据里面有很多隐私问题,可以用生成式人工智能生成符合真实情况的数据,同时规避隐私,显示出了它的威力。没有生成式人工智能,还做不到这一条。

2024-05-13 1 1 高新科技导报 content_53948.html 1 数据安全如何“护航”创新发展 /enpproperty-->