数据作为基础性、战略性资源的地位已在社会形成共识,然而,数据作为生产要素发挥作用,数据要素化仍是一个国际难题,无论在制度还是技术方面,都处于探索阶段。
近几年来,为充分释放数据要素价值,发挥好数据在数字经济发展中的基础性和支撑性作用,中国电子先后联合清华大学、中国经济体制改革研究会成立数据治理工程联合研究院、数据要素市场化配置综合改革研究院,围绕机制体制改革、数据新型基础设施、数据产业培育等方面开展专项攻关,率先取得数据要素跨学科研究实质性突破,在国内首次提出以“数据元件”和“数据金库”为核心产品的数据安全与数据要素化工程总体方案,为城市数据治理工作提供理论参考和实践指引。

在11月18日举办的中国电子云峰会上,中国系统正式发布数据安全与数据要素化工程系列产品,工程系统系列产品包括数据金库(数据金柜、数据金库管理系统)和数据要素加工交易中心(数据要素操作系统、数据要素业务平台、数据要素支撑系统)。

其中,数据要素操作系统是全球首个数据要素操作系统,是链接数据要素化生态产业链的核心能力平台。该系列产品具备了融合创新、安全可控、先进高效、可信流通的产品优势,下一步将以系列产品体系为基础,落实四项基础制度,在全国多地以制度、市场、技术三位一体的工程路径落地实践。
数据要素化的难点与解决之道
中国系统周崇毅告诉记者,数据进行要素化,需要经过资源化、资产化、资本化。安全、产权不清晰、定价难等是目前数据要素化的难点。
具体来看,要实现数据要素化,数据产权问题无法绕开,所以数据要素化第一个必须破解的就是产权,第二个是流通交易。原来点对点的流通模式成本高、监管难,原始数据的场内交易活力不足,导致各方普遍感到束手无策。第三个是收益分配,数据作为一种生产要素,如何参与劳动、生产、销售各个环节的分配,最后就是安全治理,我们知道数据安全形势越来越严峻,安全问题必须引起重视。
企业的数据利用更多是资源化,而且数据的使用不应局限于企业内部,应该对外应用,这样外面的数据能够流入到企业形成整个社会的数据要素的循环。流通与安全两方面的问题并非孤立存在,而是混杂交织在一起,中国系统的解决方案就是为了解决安全和流通的问题。
中国系统国丽解释说,在实现数据要素化过程中,落地制度要求,技术能力是必不可少的。通过数据金库和数据元件破解数据安全和规模化流通的零和困境,数据安全与数据要素化工程系统是包含系列软硬件产品的一体化工程系统,不是单一产品。
原始数据的安全与流通之间的矛盾无法调和,数据要素市场化要实现原始数据和数据应用的“解耦”,通过数据元件在数据资源和数据应用之间构建一个“中间态”,实现数据资源化利用到数据要素化配置的转变,构建基于数据元件的要素流通体系。
数据金库则是实现关键数据的安全存储和计算。在数据金库内实现数据资源的安全存储,并在数据金库内将数据资源加工成数据元件,以数据元件的形态在数据要素市场上进行流通,切实保障了数据安全。
国丽表示,数据要素想要安全合规的流通,就需要解决流通交易中的种种问题,打造一个安全可靠、权属明晰的流通闭环。通过将原始数据加工成数据元件,具备了安全属性和价值属性,把信息的人格权与数据的财产权,以及数据主体对数据的所有权和持有主体对数据的用益权分离,并在数据资源、数据元件和数据产品三阶段分别进行确权和定价,实现数据从资源化到要素化的转变,促进数据规模化的流通交易。
加速落地 成果喜人
自从贵阳成立了第一个数据交易所后,全国相继成立了20余家数据交易所。但是,现有交易平台大多是各地自行设立,缺乏国家层面的统筹,有些城市数据交易所不止一家,存在重复建设和数据割据现象,已有数据所的交易量却少之又少。
所以,加快制定统一的数据流通交易制度和规则,对数据产品分门别类,积极拓展交易规模。
目前,中国系统在武汉、德阳、江门和大理等地进行了落地试点,在社会治理、行业数据空间、民生保障等场景进行了广泛的探索。其中,德阳试点落实了数据确权、流通交易、收益分配和安全治理的四项基础制度。
德阳部署了数据金库和数据要素操作系统的两套系统,入库2.5亿条数据,开发了248个数据元件,支撑了10个数据产品应用;引入7家数据资源提供商形成了数据资源市场,8家数据元件开发商形成了数据元件市场,培育了52家数据产品开发商形成数据产品市场;引入了7家数据(经纪人)公司、2家数据合规咨询机构、3家数据资产评估机构。
其中,中国系统在德阳试点中扮演了总设计师和运营商、产品服务提供商的角色。从德阳试点情况来看,制度体系是基础,有了制度保障,数据企业能够放心地交出数据参与流通;技术创新是核心,定义了数据元件以后,数据流通问题得到了化解;市场分类是关键,将要素市场、产品市场和资源市场进行了合理的分类、合理的界定;工程路径是亮点,不仅仅是创新,更多的是落实,更多的是实践。
展望未来,数据要素市场化配制改革将迎来快速发展的机遇,数据安全与数据要素化工程系列产品为政府、组织和企业开展数据交易、生产和应用等提供了落地支撑。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。