|
大数据治理实践:从可用到管用的业务赋能之路 课程背景: 2020年,大数据被正式列为新型 生产要素,标志着大数据产业发展的新大幕正式开启。“十四五”期间,随着人工智能在各类应用场景中的加速落地,行业对数据的质量、规模与时效性要求日益明确,数据供给的空间约束也愈发紧迫;市场对大数据技术创新与应用落地的呼声空前高涨;各领域对大数据的需求更是日益旺盛且呈现出多元化、精细化的特征。 同时,我们也看到了当前大数据技术发展存在滞后性,相关研究与实践多半停留在理论探讨和技术方案构想层面,未能真正实现规模化的落地应用;这一现状严重制约了大数据技术与各应用领域的深入融合。究其原因,主要是对大数据与数据要素的价值认知不足、数据治理体系不完善,加之跨领域的数据共享机制缺失,使得大数据技术难以转化为实际的产业效能。 本课程精准拆解数据价值转化的全链路,清晰搭建起“数据-大数据-数据挖掘-AI & 智慧化”的逻辑关联与演进体系。课程以“大数据是什么、当前差什么、到底为什么、应该做什么、最终靠什么”为核心导向,跳出传统理论讲授的框架,创新构建出极具可操作性的“6方法”、“5工具”、“1流程”和“6制度”,从方法论到实操工具形成闭环,为大数据从技术概念转化为实际业务效能、实现智慧化应用落地提供了全方位的路径保障与实操支撑。 课程收益: 1. 系统理解大数据的核心内涵,厘清实现大数据能力的关键要素与实施路径。 2.掌握可落地的数据治理方法,切实推动治理工作在组织内有效落地。 3.基于数据治理各阶段的实际需求,合理选择并配置相应工具功能,提升治理效率与协同水平。 4.学习如何围绕真实业务需求开展数据治理,确保治理成果紧密支撑业务目标与决策需要。 5.构建数据持续积累与利用的闭环机制,保障大数据资产的可持续积累与高效复用。 课程时间:2天,6小时/天 课程对象:政府机关、企事业单位、院校及科研院所的高层决策者、业务管理者、业务人员、技术管理者、技术人员、产品设计、开发、服务、销售人员等 课程方式:讲师讲授+举例分析+学习思考+小组讨论+数据治理实操 课程大纲 第一讲:大数据认知与价值定位——从概念到具象的转变 导引思考:通过生活实例,说明大数据的存在和必要性。 一、大数据的提出 1. 大数据的时间线 2. 大数据的空间线(国内、国外) 二、大数据在我国的发展历程 第一阶段:概念提出 第二阶段:战略深化 第三阶段:远景规划 三、大数据的发展现状 1. 应用方面:描述性多、决策性少 2. 治理方面:以点代面,以偏盖全 3. 技术方面:技术能力跟不上理论发展 四、大数据的发展趋势 1. 应用方面:向预测性和决策性方面发展 2. 治理方面:系统化治理(方法步骤+工具要求+流程落地+制度保障) 3. 技术方面:技术能力不断满足大数据的质量、规模、时效需求 五、大数据的认知乱象 1. 数据多=大数据 2. 数据共享=数据治理 3. 数据仓库=大数据 4. Hadoop、Spark、Flink=大数据 5. 喊一万次“大数据”=大数据 六、全面认识大数据 1. 大数据的“4V+1V”本质 ——海量、高速、多样、真实、价值 2. 大数据是什么 1)“大”:种类多、体量大、格式杂、来源广 2)“数”:量化表现 3)“据”:对象特征的依据 案例:寓言故事——媒婆说媒,对象定义不清的大数据启发。 3. 大数据的目标 1)能用:保证准确,注重时效 2)敢用:拿的安全,用的放心 3)好用:获取便捷,共享方便 4)管用:业务导向,价值驱动 案例:集团信息化部门计划做全集团应用的智慧化升级,面对已有的数据资源,应该确定的成果目标。 4. 怎样实现目标 1)统一标准:让数据的质量“高”起来 2)一数一源:让数据资源“转”起来 3)工具化操作:让数据共享和管理“容易”起来 4)体系化治理:让数据的价值“发挥” 出来 5. 实现目标依靠什么 ——方法、工具、流程、制度四位一体支撑 互动讨论:工作生活中您认为哪些算得上大数据?为什么? 第二讲:数据治理核心方法——“梳汇存算优名”六步法 一、数据梳理 1. 已有数据资源的梳理 2. 拟建数据资源的梳理 二、数据汇聚 1. 按技术维度进行汇聚 1)库表类 2)多媒体类 3)空间类 2. 注意数据更新时效 三、数据存储 1. 面向数据形式存储:存储速度快 2. 面向业务相关存储:关联查询快 四、指标计算 1. 指标统计 2. 指标运算 案例:以水利行业的水情、雨情业务指标的统计、计算进行说明。 五、数据优化 1. 数据核对,补全数据 2. 去掉重复,扩充属性 六、数据命名 1. 规则编码:惟一性、有效性 2. 科学命名:直观性、全面性 案例:以空间数据的命名为例,进行说明。 互动讨论:所在团队是否涉及数据治理?如何做的? 第三讲:数据治理关键工具——五大核心工具应用 思考:将数据治理过程拆解,对应相应工具功能。 一、数据汇聚工具需具备的核心功能 1. 兼容异构数据类型 2. 适应多元数据源头 3. 灵活丰富汇聚方式 4. 可视化交互 二、数据开发工具需具备的核心功能 1. 适应不同开发方式 2. 可视化交互 三、数据质量工具需具备的核心功能 1. 质量规则配置管理 2. 数据扫描监控 3. 问题定位修改 4. 可视化交互 四、数据维护工具需具备的核心功能 1. 数据资产分级 2. 数据资产分类 3. 可视化交互 五、数据运营工具需具备的核心功能 1. 数据资产目录 2. 数据访问申请 3. 数据访问授权 4. 审批管理 5. 可视化交互 六、大数据能力形成的重要指标 互动讨论:是否接触过数据治理工具?如有,请谈谈使用感想。 第四讲:大数据治理落地流程——四步闭环操作法 一、问题导向,业务梳理 1.建立“场景~对象”关系 2.建立“业务~对象”关系 案例:以防洪业务为例,将业务梳理清楚,输出业务概化图。 二、四维分析,确定边界 1. 全覆盖 2. 全天候 3. 全要素 4. 全周期 案例:以智慧城市“交通路况管控”业务为例,进行四维分析,输出四维分析表。 三、需求分析,输出清单 1.按场景划分一级数据 2. 按业务划分二级数据 3. 按主体划分三级数据 4. 按客体划分四级数据 5.按格式划分五级数据 6. 按流程串起各级数据 案例:以医疗行业“患者诊疗”业务为例,确认数据需求,输出数据清单。 四、逆向分析,建立关联 1. 统计关联 2. 计算关联 3. 分析关联 4. 决策关联 5. 可视化关联 案例:以制造业“生产质量管控”业务为例,进行数据关联,输出数据关联清单。 实操:选择一项业务,进行数据治理实操分享 现场输出:1份业务概化图、1套四维分析表、1张数据清单、1组数据关联。 第五讲:大数据治理保障体系——六大核心制度构建 一、组织与职责保障 1. 数据治理决策层 2. 治理执行层 3. 业务协同层 4. 责任划分机制 二、流程与操作保障 1. 全生命周期流程规范 2. 跨部门协同流程 3. 特殊场景专项流程 三、监督与审计保障 1. 合规审计机制 1)内部审计 2)外部审计 2. 数据安全监督 四、考核与问责保障 1. 考核指标体系 2. 问责机制 3. 正向激励 五、资源与能力保障 1. 人力保障 2. 财力保障 3. 技术能力保障 互动分享:选择一项制度,并建立针对性条款,进行分享。
|