自1988年由麻省理工学院的学者启动了全面数据质量管理计划(TDQM)以来,随着大数据技术的迅猛发展,企业内数据量急剧上升,数据治理的内涵也在不断地变化和丰富。2021年,随着以大模型为代表的生成式人工智能技术席卷全球,对人类的生产和生活都带来了革命性的变化,人工智能的发展从以模型为中心转变为了以数据为中心。以数据为中心的人工智能理论认为,好的人工智能需要高质量、大规模和多样性的数据。但在实践过程中,数据科学家们往往会遇到数据安全与隐私泄露、内容输出偏见与歧视以及数据“高量低质”的问题。如果放任这些问题不加管制,将会阻碍人工智能技术的进一步发展,甚至会危害个人、企业甚至国家的安全。
为了应对这些挑战,开发出更负责任、更可控的人工智能应用,面向人工智能的数据治理(DG4AI,Data Governance for ArtificialIntelligence)概念应运而生。
当前,DG4AI的需求极其迫切,其研究与实践还处于起步阶段,概念和实践方法论尚未形成。为凝聚共识、开宗明义,大数据技术标准推进委员会(CCSATC601)组织大型银行、通信运营商、头部互联网公司共同编写《面向人工智能的数据治理(DG4AI)实践指南
(1.0)》,旨在推动DG4AI理念的广泛应用。本指南第一章从数据治理的发展、面向人工智能的数据治理定义、治理主要阶段以及价值等明确人工智能数据治理的概念。第二章从治理的方法和技术对DG4AI的重点工作进行说明。第三章提出了一种DG4AI的数据治理步骤,为业界抛砖引玉,提供参考。最后在第四章提出了展望。在附录中我们以美国为主要研究对象,对比了中美在DG4AI在国家战略、法律类法规以及标准建设上的现状。
本指南在细节和深度上仍有较大提升空间,希望业界更多的专家能够不吝赐教,提出宝贵的修改意见。工作组将持续不断地完善这一指南,对我国DG4AI这一研究领域尽绵薄之力。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)