在电影《疯狂电脑城》里,有一座由代码和数据流构成的“电路城”。高楼是算法的样子,街巷是数据的通道。
现实中的“数据之城”长什么样?
昨天,上城区举行数据产业高地推进大会暨火山引擎合作签约仪式,专门聊了聊这座城怎么建。
“数据之城”有不同建法。
被称为“全球算力心脏”的美国北弗吉尼亚,专注建底层算力设施;北京主要在AI技术和政策创新上发力。而上城的思路是:先把数据的基础设施建好,具体来说,是打造杭州高端数据标注基地。
第一次工业革命时,棉花是原料,珍妮纺纱机是生产设备。到了数字时代,数据就像“棉花”,高质量数据集就像“纺纱机”。火山引擎浙苏皖区域负责人陈虔炜介绍:他们开发的智能标注工具,集成了AI辅助能力,能把标注效率提升60%以上,准确率达到98%。
数据标注,说白了就是给数据打上标签,教人工智能“认东西”。比如用在自动驾驶上,就要告诉人工智能:哪个是行人,哪个是车,哪个是交通标识。
过去,这些工作主要靠人工完成。现在用上AI辅助,效率高了,能产出的高质量数据集也更多了。
当天揭牌的杭州高端数据标注基地,将根据火山引擎豆包大模型等产品的迭代需求,量身定制数据标注服务。陈虔炜说,结合火山引擎的“Coding plan”和上城区的算力、模型补贴,相当于用更低的价格,为上城区企业的模型训练和应用开发提供更好的技术。
目前,上城已集聚超过4000家数据企业。今后,基地要做三件事:高质量数据加工、数据技术创新、产业人才培育。上城区数据资源局党组成员、副局长娄莹说,基地将推动数据赋能具身智能、金融、医疗等重点领域,同时鼓励龙头企业把数据、算力、算法等资源开放给中小企业,慢慢形成一条“数据标注—技术研发—产业应用”的完整链条。
应届生最高补15万元
“数据之城”有了建设方向,还要有“加油包”。
会上,上城区发布了一套赋能数据产业的服务包,实打实的4份“大礼包”。
1.帮企业找市场
好技术最怕接不到第一笔订单。过去,上城区已发布126个应用场景,推动60个项目落地。这次又新释放了20个区内场景和10个市级场景。
2.帮企业减负担
升级版的“数十二条”政策,条条是真金白银——研发端,算力和模型补贴最高2000万元,模型备案成功再补100万元;要素端,支持数据流通、语料采购、场景建设,最高补贴300万元;人才端,领军人才安家最高补贴600万元,博士后留区最高100万元,优秀应届生也有最高15万元的生活补贴;落地时,还有每年最高1000万元、最长三年的租金支持。
3.帮企业提效能
把前沿技术从“奢侈品”变成“日用品”。上城区整合了一个“装备库”:Coze智能体帮你搭应用,TRAE开发环境帮你智能编码,ArkClaw数字员工能全天在线干活,Coding plan可以随时切换主流编码模型。
4.帮企业融资金
量身定制的“上城·创享贷”,启动期企业最高可贷50万元,成长期企业最高500万元,纯信用,手机上就能操作。还有“算力分期”,可以按最优方案分期支付,减轻研发时的现金流压力。
政协要闻