青岛市公共数据运营场景
日期:2024-04-22
来源: 山东省大数据局
浏览: 次
以数字赋能高质量发展,智慧的因子正渗透到城市的角角落落、方方面面。近年来,山东以应用场景为牵引,全域推进新型智慧城市建设,赋能城市数字化治理,构筑全民畅享的数字生活新图景。
今天为大家带来的智慧应用场景——青岛市公共数据运营场景申报单位:青岛市大数据发展管理局落地情况:青岛市大数据发展管理局,青岛市公共数据运营平台项目1.0版本于2022年12月16日正式发布上线,2.0版本于2023年8月16日发布上线,已落地并投入正常使用。
一、研发背景
面对传统业务增长乏力的问题,越来越多的企业寄希望于通过数据赋能开辟新的业务路径,启动企业的第二增长曲线。例如,传统商业银行希望利用地方、行业特色数据,开发针对特定群体的金融产品;药械企业希望利用患者就诊信息,指导药物、医疗器械的研发。企业以合法合规方式获取充足的数据,是开展上述数据业务的先导条件。政府机关和公共事务职能组织在履行职责或者提供公共服务过程中产生、收集了大量的企业和个人数据,涵盖企业生产经营、个人工作生活的方方面面,这些数据被称为公共数据。此类数据的覆盖度高、收集过程合法合规,具有极高的应用潜力。尽管如此,受制于数据的隐私性、敏感性以及原始数据不出域的要求,传统的数据开放方式对此类数据的应用捉襟见肘,其合法合规性也频遭质疑。政府和社会亟需一种全新的数据流通模式。在这一需求下,公共数据授权运营应运而生。2022年底发布的“数据二十条”也明确了隐私数据“原始数据不出域、数据可用不可见”的使用要求。为实现公共数据向产业赋能,以模型、核验等产品形式向社会提供公共数据服务,建设公共数据授权运营平台,搭建安全可信的数据流通渠道,成为一项亟待完成的重要任务。
二、创新安全性
应用创新构建存证可追溯的应用链,对数据全生命周期存证记录、不可篡改,保障数据安全性、真实性;构建可伸缩的核心链,兼容其他链上数据信息,保障链上数据互联互通。通过隐私计算技术打造“可用不可见”的数据开发利用模式,数据通过数据沙箱以白盒模式将测试数据载入提供模型部署环境,以黑盒模式将真实数据载入生产环境,数据与用户彼此隔离,既能避免数据外泄,又能满足数商对数据模型的构建所需。
建设全国首个数据资产价值与收益分配评价模型,打造业内创新数据资产价值评价模型,从数据质量、数据应用、数据变现、数据收益分配等4大维度15项指标,为数据资源进行数据价值评价,保障数据资产价值的公允性。
三、技术运用
安全沙箱技术安全沙箱可以提供一个独立的虚拟操作环境,将一个程序放入沙箱运行,这样它所创建、修改、删除的所有文件和注册表都会被虚拟化重定向。也就是说,所有操作都是虚拟的,真实的文件和注册表不会被改动,同时程序在沙箱中的一切操作行为都可以被记录。公共数据运营平台使用安全沙箱技术可以保证数据的可用不可见,确保数据不会泄露,同时也可以实现全流程的监管。大数据处理技术针对公共数据运营平台所涉及到的大数据处理的需求,本次将利用分布式大数据架构进行处理,实现海量的结构化、半结构化、非结构化数据分布式存储与计算。对大数据处理中的存储问题,采用了分布式存储、分布式数据库系统,提高了读写速度,并扩大了存储容量;本次的大数据架构具备高容错特性,使得系统整体可靠性得到提升;可以部署在低廉的计算机集群中,降低投入成本;同时具备灵活的横向扩展能力,使其可以按需配置。区块链技术区块链技术将数据存储在区块中,各区块链接形成一个链条。只要不能掌控全部数据节点的一半以上,就无法肆意操控修改网络数据,这使区块链本身变得相对安全,避免了主观人为地变更链条和区块中的信息。公共数据运营平台使用区块链技术对数据进行记录和追溯。
四、应用安全
以公共数据运营平台为依托,打造涵盖数据安全保障体系、数据安全可控环境、数据库自主可控等内容的全业务链数据安全体系,包括人员安全管理、数据安全组织管理、数据安全技术管理、数据安全操作环境、数据安全事件应急处置等。人员安全管理:采用三级管理方式,包括操作、审计和管理人员;设立数据安全员,专职负责数据安全;操作权限按角色分级管理,对操作人员进行认证、授权和访问控制,并设置A/B角。数据安全组织管理:数据安全管理工作实行统一组织、分级管理方式,建立自上而下的覆盖决策、管理、执行、监督四个层面的数据安全组织架构。数据安全技术管理:搭建数据安全运营平台,包括数据安全管理、数据安全防护、数据安全运维、数据安全监测和数据安全态势感知。数据安全操作环境:打造专属安全屋。在安全屋内,使用专用安全终端接入金宏网对公共数据进行操作,确保“原始数据不出域”,安全屋配备24小时无死角监控,门禁权限由数据安全员管控,一次一审批,在安全屋内操作时需保持双人在场。搭建数据安全沙箱。数据沙箱主要包括沙箱环境申请、数据传输隔离、环境分配、数据加载、监控管理等功能,结合数据申请流程,将其模型程序通过平台上传至安全沙箱,利用样例数据进行模型调试,确保原始数据“可用不可见”。数据安全事件应急响应:建立数据安全事件应急组织架构,明确人员职责,定义数据安全事件级别,应急响应处理和上报流程;使用国产数据库系统保证产品供应链安全,支持国产硬件体系及不同CPU架构的服务器。
五、数据应用
公共数据运营平台已治理数据目录5199项,数据项26923个,数据量2.13亿余条,数据资源覆盖20个领域。
1.国家税务总局青岛市税务局11项税务数据410万余条。
2.市财政局采购中标类数据2.6万余条。
3.市大数据局10项信用类数据500万余条。
4.市市场监督管理局企业工商数据22项2800万余条。
5.市人社局社保相关数据4项2050万余条。
6.市行政审批局工商变更、项目中标结果数据722万余条。
7.青岛海关出入境企业信用评价数据7条。
8.市工信局软件企业奖励信息6条。
9.市交通局A级物流企业申报信息53条。
10.市科学技术局高新科技企业数据4项1.39万余条。
11.市农业农村局相关龙头企业数据308条。
12.市水务局居民用水数据5项230万余条。
13.市统计局经济统计指标数据8项3万余条。
14.市委组织部享受政府补贴企业数据680条。
15.市中院失信被执行人数据3481条。
16.市住房公积金中心单位公积金数据3项486万余条。
17.此外还利用到民政局婚姻接口,公安局户籍、车辆接口,自规局不动产登记接口,中院立案裁判等接口类信息资源。市公共数据运营平台医疗专区从市一体化平台申请使用2个部门数据资源,共10项,7656万余条。
1.青岛市卫生健康委员会4项2559万条
2.城阳区卫生健康委员会6项1929万条平台根据工商信息、经营许可、经营资质、纳税信息等维度对公共数据进行全新梳理,方便数商、金融机构高效查询、申请使用。目前,已归集治理青岛市200余万个市场主体公共数据,梳理出227个企业类数据项、34个医疗类数据项。后期平台将根据业务场景需求,不断新增、完善数据目录。
六、效益分析
社会效益:本项目建设有利于开展公共数据运营,能够提供数据汇聚融合的运营平台,通过跨地区、跨部门、跨群体的数据流通,消除数据壁垒,帮助政府以及相关需求方挖掘数据价值,推动各行各业依托公共数据运营平台创新商业模式。可以大大提升青岛市数据要素流通的信息化水平,实现公共数据资源的深度利用,实现数据要素流通运营的科学性、服务的高效性,减少因信息化水平不足、管理滞后而造成的数据要素市场发展迟缓问题。有利于构建以数据要素服务链、供应链为核心的全生态数据要素生态圈,能够使数据要素成为推动经济高质量发展的核心引擎,充分释放数据要素的潜在价值。
经济效益:通过建设青岛市公共数据运营平台,聚焦各种形式的成果产出与转化,不仅能够提升青岛市公共数据运营的管理能力,推动数据流通应用,赋能行业发展,改善经济发展环境,还能够进一步优化和规范数据要素运营程序,加强行政效能和要素市场拓展能力,提升商品接入开发、运营活动、运营监管的效率。利用公共数据运营平台,可以激励各行业开展产业、应用、政策等各方面的探索和实践,引导国内外大数据领域产业、资金、技术、人才等资源集聚青岛,构建形成政产学研用多方联动、协调发展的大数据产业生态体系,推动青岛市数据要素市场的繁荣发展。