11月28日,2025数据要素发展大会在“中国数谷”核心区举行。会上发布了杭州国家语料库首批高质量数据集建设先行先试“揭榜挂帅”名单等成果,以数据生态建设与“人工智能+”行动驱动产业智能升级。
杭州国家语料库旨在汇聚高质量数据集,为大模型训练提供易获取、高质量、规模化、低成本的语料资源。首批50个高质量数据集建设先行先试“揭榜挂帅”名单覆盖医疗健康、工业制造、商贸流通、具身智能、金融服务、现代农业等14个新兴产业领域。
杭州通过“揭榜挂帅”机制,旨在通过政策引导、资源倾斜、场景开放和认证支持,激励先行挂帅企业结合应用场景,推进数据集的合法合规建设和应用,在采集标准化、标注规范化、应用场景化、资源价值化等方面打造具有杭州辨识度的标杆案例。“语料库是未来大模型变得更聪明、更智能的关键因素之一。”在杭州安恒信息技术股份有限公司CTO刘博看来,语料涉及知识产权、行业资源和法律、金融等方方面面,“中国数谷”深化“数据—算力—模型”一体布局,全力支撑杭州国家语料库建设,也是通过国家数据基础设施赋能产业发展,让高质量的语料应用到人工智能领域。
得益于数据产业、人工智能的快速发展,高新区(滨江)经济发展持续呈现稳进向好态势,今年1至9月,全区GDP增长6.7%,数字经济核心产业增加值增长11.6%,占GDP比重达到70.0%。作为“中国数谷”核心区,高新区(滨江)始终把数据作为发展新质生产力的关键要素,积极探索数据要素市场化配置改革,加快数字经济与实体经济融合发展。去年10月,高新区(滨江)在2024数据要素发展大会上,率先发布“三数一链”框架体系及“改革沙盒”最新改革成果,时隔一年,该区首创的“三数一链+”框架体系在国家层面完成互联互通验证,海洋资源环境行业可信数据空间入选国家数据局试点,并在今年第四届全球数贸会上发布。
值得一提的是,“中国数谷”还制定出台《数商企业评定标准》,迭代数据要素发展专项政策,目前已集聚数据企业2000余家。
大会当日还举办了首批基石、星火、星海数商企业授牌及颁奖仪式,“数据基础设施领航行动计划” 启动仪式,“中国数谷”数据要素流通合规中心、合规委员会共建签约仪式。
接下来,杭州高新区(滨江)将在数据要素、数据产业、数据生态建设上持续深化,推进“三数一链+”框架体系迭代升级和“改革沙盒”实践落地,大力实施“人工智能+”行动,推出更多应用场景,充分发挥“中国数谷”一号孵化加速器、数据产业专项基金作用,加快建成制度先行、产业高端、服务优质的“中国数谷”核心区。
政协要闻