深化开发利用,让高质量数据“动”起来
——2025中国国际数字经济博览会探新之一
10月17日,观众在2025中国国际数字经济博览会展区参观。河北日报记者 史晟全摄
机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日,在2025中国国际数字经济博览会上,一批数据要素领域的前沿技术成果集中亮相,勾勒出数据产业蓬勃发展的新图景。
数据是点燃数字时代的“新石油”。有研究显示,数据流动量每增加10%,将带动GDP增长0.2%。
“数据在流通中才能释放价值。”本届博览会上,多位与会专家表示,筑牢数字基础设施基石,深化数据资源开发利用,推动数据要素“供得出、流得动、用得好、保安全”,更好赋能数字经济高质量发展。
让高质量数据“动”起来,首先得解决“数据从哪里来”的问题。
数据资源是加快数据要素市场化配置的核心基础。我省系统推进数据归集、登记、治理、开发与授权运营全链条工作,构建起全国最大的公共数据资源池。截至目前,我省常态化归集数据达8700亿条,为人工智能应用提供丰富的语料资源。
海量原始数据需要经过“炼化”形成高质量数据集,才能助力大模型精准学习、提升性能。如何激活数据资源,在本届博览会上可以找到先行先试的探索。
在数字产业生态馆,河钢数字技术股份有限公司带来了基于威赛博大数据中心的数据资产管理平台。这背后是河钢数字建立的高质量行业数据集。
“比如,石钢公司依托河钢数字自研大数据中心,采集炼钢、热轧、轧后、质检、计量、设备、营销等业务的上亿条数据,建立了石钢工业大数据分析平台。”河钢数字售前工程师王启凡介绍,该平台不仅可以查询电炉炼钢、连铸、加热炉等全流程数据,还能及时发现生产过程异常,有效分析生产质量关键要素。
10月17日,观众在2025中国国际数字经济博览会展区参观秦皇岛“数智能枢”沙盘。河北日报记者 史晟全摄
推动行业高质量数据集加速汇聚共享,为人工智能产业提供充足“养分”。我省聚焦人工智能+钢铁、化工、汽车等产业领域,对接指导河钢数字、敬业集团、长城汽车等企业,建成转炉炼钢生产数据集、智能驾驶数据集等654个高质量行业数据集,推动垂直大模型、智能体落地应用。
让高质量数据“动”起来,关键是畅通数据流通“高速公路”。
当前,数据要素的流通多是点对点,效率低、成本高,安全可控性差。应用新技术,构建可确保数据安全可信流通的基础设施——可信数据空间,是保障企业敢用数、会用数、用好数的重要载体。
如何理解可信数据空间?“好比高速公路,有收费站、摄像头和管理机制等,在确保汽车安全上路的同时还能跑得快,可信数据空间就相当于能让数据规模化流通的‘高速公路’。”在可信数据展区,中国矿产资源集团大数据有限公司首席技术官赵鑫龙认为,可信数据空间本质在于为数据的生成、流通、共享和使用提供一个可控、可管、可计量的安全可信环境。
国家数据局7月16日公布了首批可信数据空间创新发展试点名单。我省雄安集团数城公司城市可信数据空间、中矿数据矿产资源行业可信数据空间和中国星网空天(通导感)可信数据空间分别入选城市、行业和企业类试点。
河北是钢铁和港口大省,钢铁产量、港口铁矿石运输量在全国占比较大。中矿数据矿产资源行业可信数据空间聚焦铁、铜、锂等关键矿产,围绕探、产、供、储、销全链条统筹衔接和高效协同,建设统一的数据基础设施,为产业链协同和价值释放提供稳定可靠的“快车道”。
一条产业链涵盖相关上下游数百家企业,产线、工艺、研发等数据都是各家企业的“宝贝”资产,企业凭什么愿意共享?
赵鑫龙说,通过区块链、隐私计算等技术,可信数据空间数据不出域,可用不可见。数据实质上并没有被集中收集起来,还在各家企业域内,但通过可信数据空间,企业可以实现数据资源供需高效对接,达到价值共创的效果。
我省紧密服务企业、产业、城市发展需求,今年遴选出15个可信数据空间省级试点,计划通过两年培育期,形成一批可复制、可推广的实践案例,为数据安全有序流通提供有力支撑。
10月17日,观众在2025中国国际数字经济博览会企业可信数据空间参观。河北日报记者 史晟全摄
算力为数据深加工提供关键能力。在本届博览会上,从上游算力芯片、云计算等创新技术的研发,到中游服务器、网络设备等算力中枢的构建,再到下游数据中心、算力服务的汇聚,众多参展企业共同组成了一个完整的算力产业链。
《2025综合算力指数》显示,河北省综合算力指数连续2年排名全国第一。截至6月底,我省在用标准机架162万架,智算规模达到113.3EFLOPS(EFLOPS是指每秒百亿亿次浮点运算次数),新一代智算、算电协同、公共智算等新型算力和供给模式不断涌现。
让高质量数据“动”起来,就要推动数据资源向数据资产转变。
在秦皇岛市大数据有限公司展位,总经理杜峰忙着解答参观者的咨询。他们开发的“能址星图”数据产品已在河北省公共资源交易中心挂牌上架,被22家新能源企业购买,合同金额达2650万元。
针对新能源项目申报中“数据公信力不足、选址论证薄弱”两大核心痛点,该公司深度融合秦皇岛市土地、地理、林草、气象等新能源普查数据,并引入水电水利规划设计总院设计的风机、光伏选址点坐标数据,构建出多维度选址模型。
登录“能址星图”平台,这里整齐排列的一个个数据集,就像网购平台上的一件件商品。企业购买某数据后,就可以使用该区域的数据。系统还能依托后台进行多维分析,推荐出新能源项目落地的精准点位,项目选址规划的时间缩短60%以上。
数据,这个虚拟资源,正激活越来越多的实体资源。就像传统市场中有零售商、批发商、贸易商等分工明确的主体,数据市场也需要专业主体加入,研发出更多的数据产品和服务,赋能各行业发展。
我省创新公共数据资源授权运营体制机制,打通数据交易全流程,并确立“整体授权开发、依场景授权使用”综合模式,建成登记、授权、交易平台。目前,全省已完成25单公共数据产品交易,交易收益达2690.4万元。
看不见的数据,释放着看得见、摸得着的重要价值。深化数据开发利用,河北正积极拥抱这片潜力无限的新蓝海。(河北日报记者 贾楠 宋平)