“数据要素×”典型案例
5月24日,国家数据局会同生态环境部、交通运输部、金融监管总局、中国科学院、中国气象局、国家文物局、国家中医药局等相关部门在第七届数字中国建设峰会上发布第一批20个“数据要素×”典型案例,通过示范引领,激励多方主体积极参与,释放数据要素价值。
本篇文章,海南国际知识产权交易所整理国家数据局发布的“数据要素×”典型案例第11-20个案例,涵盖科技创新、医疗健康、气象服务、城市治理、应急管理、绿色低碳等领域,以飨读者。
典型案例之十一 | 图书出版数据融合创新应用推动产业转型升级
作为文化产业的重要组成部分,出版业高质量发展既是顺应信息化时代发展的需要,也有助于满足人民群众的多样化需求。当前,传统出版行业存在多元化市场需求难以捕捉、数据利用分析能力不足等问题,武汉理工数字传播工程有限公司通过整合出版图书产业链上下游不同渠道的数据资源,打造了智能化数据平台,助力出版单位以数据洞察更好把握市场趋势和用户需求,推动出版业数字化转型与创新发展。
一是推动图书出版数据融合汇聚。平台通过整合中国国家版本馆图书数据、1.7亿会员读者数据、全国各省新华集团的线下销售数据,以及京东、天猫、抖音等线上平台的销售数据,构建了包含标签、发行渠道、读者评价、线上数字化服务使用偏好等丰富信息的数据资源库。二是强化数据质量管理。应用全国统一的出版图书数据标准,制定精细化的实施规范,确保数据格式、结构和质量统一。做好清洗、验证、加密及访问控制等精细化数据治理,确保数据准确、可靠和安全。三是开发数据产品与服务。对平台图书数据进行深度挖掘和融合分析,为出版单位提供选题策划、读者偏好、市场风向、竞品分析等数据服务。依托平台丰富的图书出版数据资源,开发人工智能(AI)大模型,推出了首个AI阅读服务数字人等数据产品,拓展图书出版数据应用场景和价值空间。
图 出版图书数据平台界面
自2014年成立以来,公司为300多家出版单位提供了覆盖知识策划、整合、发行、服务等全链条的1300多款应用与产品,帮助出版单位在文化产品的选题、策划等方面明显提高了效率和准确性,引导出版企业为社会提供更多更符合大众需求的优质文化产品,累计为出版行业创造了近150亿元实际收入。同时,平台紧跟社会文化需求风向,不仅提高了经济效益,也繁荣了文化市场。
典型案例之十二 | 医疗数据智能化分析辅助提升基层诊疗水平
基层医疗卫生体系是守护亿万人民群众身体健康的“第一道防线”,事关每个人的生活质量。但基层医疗机构往往面临人才不足、医生队伍不稳定、资源供给有限等问题,难以完全满足广大群众对医疗服务的需求。为提升基层医疗服务水平,讯飞医疗科技股份有限公司通过对海量医疗数据的收集和分析,构建医疗AI大模型,为基层诊疗提供智能化辅助,促进基层医疗服务提质增效。
图1 场景流程图
一是汇聚高质量数据资源训练模型。与中华医学会杂志社、开放医疗与健康联盟等权威机构合作,汇聚公开脱敏数据,构建涵盖疾病知识、症状体征、检验检查、药物信息、临床路径、诊疗规范及指南等内容的数据资源库,训练形成智慧医疗AI模型。二是推进医疗数据与“问、诊、治”场景深度结合。模型与行业信息平台和医院信息系统对接,以“数据不出本地局域网”方式汇聚分析患者病历数据及历史健康信息数据。实现在医生问诊过程中,根据问诊逻辑提示病情问诊;在诊断过程中,对患者病历数据进行智能化分析和判断,协助医生对病情进行合理诊断;在医生下处方和检查检验时,及时给出常见用药和常见检查检验建议,并将异常诊断结果数据及时报送医疗主管部门复核。截至目前,该系统已在全国506个县区的近5.3万个基层医疗机构应用,服务6万余名基层医生,累计提供7.7亿次AI辅诊建议,规范病历2.9亿次。经该系统提醒而修正诊断的有价值病历超139万例,累计识别不合理处方数6200万,AI辅助诊断合理率提升至95%(重点地区97%),覆盖疾病数量超1680种。
图2 统一标准、规范的数据采集处理流程
典型案例之十三 | 高质量药物数据集提高新药研发质效
提升创新药自主研发能力关乎国家生物医药产业转型升级,也与国家生物安全自主可控、国民生命健康紧密相连。高质量药物数据在新药研发的过程中至关重要,目前国内药物数据来自不同细分领域的学术数据库,存在流通不畅、资源分散和标准不统一等问题。北京市计算中心有限公司通过多渠道、合规收集海量药物研发关键数据,建立专业的新药研发数据集,进行智能化分析和数据挖掘,有效降低新药研发周期,赋能上百个新药研发项目。
一是多渠道收集药物研发数据。通过公开数据库下载、文献信息整理、公开渠道购买等多种方式,收集药物相关的分子结构、理化性质和靶点信息等药物研发关键数据,并通过计算机辅助和人工校验确保数据质量可靠,为科研人员提供了较强的数据支持,明显提高药物研发的准确性、可靠性和实用性。
二是建立高质量新药研发数据集。对汇聚数据进行统一处理,形成能够支撑药物数据研发的高质量数据集,该数据集包括小分子、多肽和蛋白靶点数据,其中小分子和多肽信息400余万条(几乎覆盖当前全部药物数据领域),潜在的药物活性位点超过11万个。
三是智能化分析和挖掘数据。基于人工智能算法对药物数据集进行数据挖掘和药物特征提取,形成疾病相关的药物有效特征,为新疾病靶点预测和对应药物研发提供准确、个性化、智能化分析服务。目前已与全国30余家高校和科研院所开展合作,利用高质量药物数据集和智能服务开展的新药研发项目100余项,人工智能预测靶点超1万余个,基本覆盖了已知疾病。
图 与北京某高校合作,针对已知药物的靶标确认展开研究
典型案例之十四 | “一网统管”风险防控与应急指挥体系——以高质量数据要素推动应急管理能力提升
应急管理担负保护人民群众生命财产安全和维护社会稳定的重要使命。先进的技术支持是实施好应急预防和救援处置的有效保障。当前,应急管理领域存在数据共享融合深度不足,对安全生产、自然灾害防治和突发事件处置支撑力度有限等问题。广东省应急管理厅全面整合气象、水利、林业等跨部门监测数据以及危化、矿山等企业物联感知数据,构建个性化的应急场景智能算法,打造共建、共治、共创、共享的应急管理信息化新模式,推进跨层级、跨地域、跨系统、跨部门、跨业务协同治理,切实提升应急管理业务综合实战能力。
一是加快数据汇聚融合,夯实数据支撑基础。梳理完善应急管理部门公共数据资源目录和数据需求目录,加快推动数据资源汇聚共享,已成功接入27个外部厅局以及14个应急厅内部机构,涵盖1171类业务数据,总量高达36.1亿条,提供1372类数据服务,有效促进了数据要素在跨部门、跨系统、跨平台间的顺畅流通。
二是构建应急智能算法,为业务场景提供精准支持。面向应急管理行业监测预警、监督管理、辅助决策和指挥调度等业务需求,结合人口、电力、工程机械、化工商品价格等指数以及各类监测预警、巡查上报、预测分析数据,构建数据模型开展智能辅助分析,有效提高应急管理部门预测、预警、预知能力和及时处置、科学救援等数据智能辅助决策能力。2023年,广东省通过实时监测台风路径、渔船坐标、水位监测数据等重要信息,有效应对了30轮强降雨和6次台风,未发生群死群伤和重要工程损毁事件。
图 广东省应急管理厅大数据治理平台
典型案例之十五 | 强化大数据应用 构建数字应急体系
应急管理是国家治理体系和治理能力的重要组成部分,担负保护人民群众生命财产安全和维护社会稳定的重要使命。应急管理涉及地质、森林、海洋、河流等业务场景众多,对打通部门间数据共享,推动实现各场景业务高效协同具有迫切需求。福建省电子政务建设运营有限公司通过打通数据间壁垒,汇聚部、省、市三级应急基础信息资源,搭建数字应急综合应用平台,实现多种灾害预警,强化全链条监管,为全省“数字应急”体系建设提供有力支撑。
一是高效汇聚应急数据。实现与应急管理部、各地市应急平台的纵向贯通,与省级气象、水利、地质等20多个行业厅局的39个关联业务系统横向链接,汇聚约59.8亿条气象预报、应急物资、救援队伍等应急基础数据及89万条部级、2.41亿条省级危险化学品、工贸、矿山等企业基础信息数据。
二是数据赋能监测预警。接入危化品、非煤矿山、森林防火、海上安全等重点领域1.4万条感知数据和2.2万路视频监控,依托风险评估模型、AI视频分析等技术,自动发布预警信息(如图1所示),实现安全生产隐患的主动监测,推动应急管理“以治为主”向“以防为主”转变。2023年以来,全省消除各类传感器异常报警约19万次,处置各类安全事故550余起,事故死亡人数下降11%。
图1 监测预警平台
三是推进一体化监管执法。结合企业画像数据治理模型,动态建立全省监管对象台账库,将5.1万家危化品、烟花爆竹、矿山、工贸等企业纳入管理平台,通过构建安全生产指数,实现精准监管、靶向治理(如图2所示)。
图2 监管执法平台
四是高效协同应急指挥救援。汇聚全省多部门、跨层级3万多条救援相关数据,提升各部门在应急救援场景下的协同作战能力。基于应急联动小程序等方式快速调度队伍、装备等,实时掌握救援进展动态,做到快速响应、高效协同、扁平化指挥调度(如图3所示)。
图3 救援指挥平台
典型案例之十六 | 跨部门气象数据共享 助力地质灾害分级预警体系建设
精准及时的地质灾害气象风险预警是保障人民生命安全的“防护堤”,实践表明“预警早一秒,风险少一分”。地质灾害和气象风险往往相互交织,通过对气象与地质数据的深度融合应用,可以显著提升风险预警的实时性、精确度与实用性,进而有效增强防灾减灾的能力。四川省修复防治院联合四川省气象台通过共搭平台,实现地质、气象等数据的协同效应,用数据的“油”点亮防灾减灾的“灯”。
一是推动气象数据实时汇聚共享。建立地质灾害气象数据共享平台,实时采集共享全省4000余处气象站点降水实况、逐小时天气预报、雷达卫星多源融合资料等气象数据及7000余处地灾专业监测雨量站点数据,并打通气象、自然资源、水利、应急等部门数据,为全省的气象预报、灾害预警以及相关决策支持提供了更为坚实的数据基础。
二是实现灾害精准分析预测。四川省修复防治院通过搭建可自主适配本地化的气象预测模型,为全省21个市(州)、175个地灾易发县提供“6小时、3小时、1小时”短期预测信息,使区域内地质灾害气象预测更加精细化、具有针对性(如图1所示)。2022年以来,在气象、地质等数据大量精确汇聚支撑下,短临预测信息有效性显著提升,精准性高达55.6%。
图1 省市县分级制作地质灾害气象风险预警产品
三是实现灾害及时预警预防。通过电视、网站、自媒体等渠道发布和短信点对点通知的方式,同步将地质灾害气象风险预警信息及时发送到有关部门单位和人民群众,实现预警信息数据有效传达共享(如图2所示)。2022年以来,有效支撑全省范围发布地质灾害气象风险预警共5839次,实现成功避险123起,避免2400余人可能的因灾伤亡。
图2 地质灾害气象风险预警体系
典型案例之十七 | “气象保险增值服务”赋能风电设施建设运营减损增效
在全球气候变暖背景下,我国极端天气事件增多增强,统筹发展和安全对防范气象灾害提出了更高要求。精准气象预测借助大数据、AI算法等现代科技技术,可对具体区域和场景的气象变化做出系统性监测和预判,从而有针对性地提升气象预测对生命财产的保驾护航能力。台州市气象局、人保台州分公司、浙能集团三方合作探索“买保险送气象服务”模式,为风电企业提供定制化气象预测,助力企业预防灾害、顺利施工、高效运营。
一是创新“气象保险增值服务”合作模式。风电企业仅需支付商业保险费用,即可享受由保险公司采购、气象部门提供的实时风向、风速、雨量、温度、能见度等气象数据服务,改变了原来需要分别向气象部门和保险公司定制气象服务和工程保险的常规流程。
二是实现气象数据产品与项目运营管理有机融合。将天气预报产品、气象模型接入业主方现有的智慧工地平台,实现当致灾气象要素发生异常时,通过电话、短信方式对指定位置进行告警。同时,通过建立风功率预报、灾害风险等模型(如图所示),实现3天内的天气预报,为电力调度、工程推进提供决策建议。
三是探索数据利益分配模式。该模式形成了保险公司降经营风险、风电企业降本增效、气象服务中心获取更多研究场景和经费的多方共赢局面。2023年,在专业化的气象数据服务下,某海上风电项目未出现灾害理赔情况,为保险公司节约了大量理赔成本。同时,该项目在当年额外增加了45天的作业窗口期,工期提前1个月完成。
图 短期风电预测流程
典型案例之十八 | 跨层级数据贯通提升基层治理现代化水平
基层治理是服务群众的最前沿,也是群众感知基层治理效能和公共服务温度的“神经末梢”。但基层治理往往面临人员少、任务多、资源不足等现实问题,为解决基层政务服务重复工作多、数字化程度低等问题,烟台市大数据中心建设市县乡村四级联动、上下贯通的镇街综合数据平台,通过智能报表、智能台账等有效减少基层重复摸排、重复报表工作,推动数据赋能公共服务,为基层减负和基层治理现代化提供了有力支撑。
一是打造全量汇聚、多级联动、上下贯通的数据应用体系。通过建设镇街综合数据平台,整合了市、县、乡、村四级共15大类、177子类、1300多万条数据,实现了基层基础数据“应归尽归”。同时,建立数据返还机制,针对基层共性数据需求定期返还,累计返还166类国家级、省级和市级数据,实现基层所需数据“应返尽返”。在数字底座基础上,通过智能报表、智能台账等方式,实现报表自由定制、数据自动复用、结果实时统计,有效减少基层数据重复填报和手工筛查,减轻了基层“指尖上”的负担,基层表格缩减率达34%、填报缩减率超过52% 。
二是赋能基层数据应用场景,推进公共服务普惠化。综合数据平台聚焦民生保障、乡村振兴、补贴发放等重点领域,推进256个基层业务上网运行。在赋能补贴发放方面,设立社会救助、社会福利、计生奖扶等3大类、13小类补贴认证事项,通过跨部门数据共享和融合比对,主动发现老年补助发放、残疾人补助发放和农村奖扶发放人员,协助基层进行低保人员、特困人员、残疾人等相关补贴的认证工作,有效助力提升补贴发放精准性、高效性。
图 基层数据热力图
典型案例之十九 | 推动数据要素创新应用 助力新能源发展及消纳
能源是保障行业发展的“粮食”。大力发展新能源是缓解我国传统能源对外依赖性高、碳排放强度大等问题的关键解决方案。但风电光伏等新能源受自然条件影响,发电量具有随机性、波动性等特点,随着新能源并网增加,带来的系统运行稳定性问题和弃风弃光问题也日益突出。国网新疆电力有限公司通过汇聚分析新能源项目审批、场站运行、气象等数据,建立新能源功率预测及消纳能力分析模型,为新能源项目建设、并网运行、动态消纳等提供科学决策依据。
一是推动新能源数据汇聚融合。打破各平台数据壁垒,获取多源监测分析数据指标260项,汇聚807家新能源场站的8497万条光伏运行数据和5.7亿条风电运行数据;获取沙尘、寒潮、大风等5种非平稳转折性气象环境数据,沙漠、盆地、戈壁、荒漠及其交叠的10种特殊地形地貌下的9534万余条云图数据。
二是开展新能源数据的建模分析应用。构建新能源多维分析框架和全景可视化场景,聚焦新能源运行和消纳环节,应用机器学习等技术测算不同技术路径下的新能源消纳量和利用率提升情况,提前预测可能发生的并网风险,提供消纳措施选取建议,辅助开展各项措施应用后评估。明显提高新能源发电上网的监测准确性,其中,风电短期预测精度提高4.3%,光伏短期预测精度提高2.2%。明显减少弃风弃电现象,增加新能源上网电量31.9亿千瓦时,相当于克拉玛依地区全年用电量。
三是开展新能源数据的共享定制服务。基于能源大数据统一门户,对外提供多元定制化数据共享服务,为800余家新能源企业提供一键式新能源并网信息跟踪查询,为政府部门提供实时动态的新能源发展全场景数据服务和分析报告,实现新能源场站的提前规划、全景监测、智能分析、消纳预测和风险管控,在保障电力系统安全稳定运行的前提下提高新能源应用效率。通过大数据智能化管控,优化并缩短并网流程15项,提升并网效率30%,节约新能源发电项目建设和运营成本,加速了新能源项目在新疆落地发展,为“双碳”目标实现和能源安全贡献力量。
图1 新能源功率预测系统
图2 新能源消纳-运行视角
典型案例之二十 | 贯通多层级多行业生态环境数据 提升蓝藻治理水平
湖泊是地表水资源的重要载体,与人类生产生活息息相关,对水资源安全保障、生态服务功能、防汛抗旱等都具有重要作用。水体富营养化会导致藻类迅速繁殖、水体溶解氧气量下降、水质恶化,造成水生生物大量死亡,严重危害人体健康。巢湖蓝藻治理经历了长达30余年的艰难历程,投入大量人力和资金成本,仍长期面临防控战线长、人力成本高、监测监控手段不足、分析预警能力不强等问题。合肥市生态环境局以提高巢湖蓝藻监测预警能力为核心,整合跨层级、跨领域、跨部门、跨平台蓝藻治理相关数据,构建水文水质、水动力、藻类生长等智能模型,精准预测蓝藻发生情况,提前介入管控,使巢湖流域生态得到系统性改善。推动了当地生态环境改善和文娱产业发展,打造了“绿水青山就是金山银山”的实践案例。
一是打通数据壁垒,实现多源数据汇聚。建立地表水自动监测网络,贯通生态环境部、安徽省、合肥市等跨层级的环境、气象、城建、水利、渔政等多个行业涉水数据,共接入国控点23个、省控点11个、市控点46个,汇聚共享卫星遥感、视频监控等各类数据达11亿条,构建水环境数据库(如图1所示)。通过多源数据汇聚融合,实现以“数”治藻,改变了监测靠人、巡查靠走的传统工作模式,大幅降低了蓝藻治理成本,有效提高了治理成效。
图1 数据汇聚机制
二是创新构建模型,实现藻情精准预测。基于巢湖流域水文水质、湖体水质、藻类、气象、光照、水温等多元数据,综合运用大数据、人工智能、地理信息等数字技术,创新构建巢湖流域水文水质模型、三维水动力模型、藻类生长动力学模型等模型库,精准预测蓝藻生长态势,实现藻情“早”预报(如图2所示)。
图2 巢湖水质模拟预测
三是推进模型应用,赋能治理科学决策。建设巢湖防控全景驾驶舱,每日整理形成蓝藻日报,实时发布藻情预测预警信息,为精准调度蓝藻治理提供决策支持,推进污染点源、线源、面源、内源“四源同治”,实现巢湖“慧”治藻。巢湖水质由2015年的劣V类转变为2023年稳定保持Ⅳ类,创1979年有监测记录以来最好水平。蓝藻从大面积爆发、异味强烈转变为连续3年蓝藻无聚集、无异味,巢湖流域生态得到系统性改善。