DAMA数据管理知识体系(第11章 数据仓库和商务智能)

  • 课本内容
    • 11.1 引言
      • 概要
        • 数据仓库被公认为企业数据管理的核心
        • 语境关系图
          • 图11-1 语境关系图:数据仓库和商务智能
      • 业务驱动因素
        • 运营支持职能
        • 合规需求
        • 商务智能活动
      • 目标和原则
        • 目标
          • 一个组织建设数据仓库的目标通常有: 1)支持商务智能活动。 2)赋能商业分析和高效决策。 3)基于数据洞察寻找创新方法。
        • 指导原则
          • 聚焦业务目标
          • 以终为始
          • 全局性的思考和设计,局部性的行动和建设
          • 总结并持续优化,而不是一开始就这样做
          • 提升透明度和自助服务
          • 与数据仓库一起建立元数据
          • 协同
          • 不要千篇一律
      • 基本概念
        • 数据仓库
          • 数据集市是数据仓库中数据子集的副本
        • 数据仓库建设
          • 数据仓库建设指的是数据仓库中数据的抽取、清洗、转换、控制、 加载等操作过程
        • 数据仓库建设的方法
          • Inmon和Kimball遵循的核心理念
            • 1)数据仓库存储的数据来自其他系统。 2)存储行为包括以提升数据价值的方式整合数据。 3)数据仓库便于数据被访问和分析使用。 4)组织建设数据仓库,因为他们需要让授权的利益相关方访问到可靠的、集成的数据。 5)数据仓库数据建设有很多目的,涵盖工作流支持、运营管理和预测分析。
          • 企业信息工厂(CIF)
            • 概念:面向主题的、整合的、随时间变化的、包含汇总和明细的、稳定的历史数据集合
            • 与业务系统不同点
              • 面向主题的
              • 整合的,数据仓库中的数据是统一的、内聚的
              • 随时间变化的
              • 稳定的
              • 聚合数据和明细数据
              • 历史的
            • 组成部分
              • 应用程序
              • 数据暂存区
              • 集成和转换
              • 操作型数据存储(ODS)
                • 操作型数据存储是业务数据的集成数据库。数据可能直接来源于应用系统,也可能来自其他数据库。
              • 数据集市
                • 数据集市为后续的数据分析提供数据。这里说的数据通常是数据仓库的子集,用于支持特定分析或特定种类的消费者。例如,数据集市可以聚合数据,以支持更快的分析
              • 操作型数据集市
                • 操作型数据集市是专注于运营决策支持的数据集市。它直接从操作型数据存储而不是从数据仓库获取数据,具有与操作型数据存储相同的特性
              • 数据仓库
                • 数据从应用程序系统和操作型数据 存储流入数据仓库,然后流到数据集市,这种流动通常只是单向的。
              • 运营报告
              • 参考数据、主数据和外部数据
              • 企业信息工厂(CIF)
                • 1)目标从业务功能的执行转向数据分析。2)系统最终用户从一线业务人员变成企业决策者。3)系统使用从固定操作转向即席查询。4)响应时间的要求不再重要(战略决策分析比例行操作需要花更多的时间)。5)每个操作、查询或流程涉及更多数据
            • 数据仓库和数据集市的数据与应用程序中的数据不同
              • 1)数据的组织形式是按主题域而不是按功能需要。2)数据是整合的数据,而不是“孤立”的烟囱数据。3)数据是随时间变化的系列数据,而非仅当前时间的值。4)数据在数据仓库中的延迟比在应用程序中高。5)数据仓库中提供的历史数据比应用程序中提供的历史数据多。
          • 多维数据仓库( Kimball)
            • 多维模型通常称为星型模型,由事实表(包含有关业务流程的定量 数据,如销售数据)和维度表(存储与事实表数据相关的描述性属性, 为数据消费者解答关于事实表的问题,如这个季度产品X卖了多少)组成。
            • 组成部分
              • 业务源系统
              • 数据暂存区域
              • 数据展示区域
              • 数据访问区域
          • 数据仓库架构组件
            • 源系统
            • 数据集成
            • 数据存储区域
              • 暂存区
              • 参考数据和主数据一致性维度
              • 中央数据仓库
              • 操作型数据存储(ODS)
                • 不同于数仓的ODS层
              • 数据集市
              • 数据立方体(Cubes)
                • 存在三种经典的支持在线分析处理系统(OLAP)实现方法:基于关系数据库的、基于多维数据库的及混合型存储结构的
            • 数据仓库/商务智能和大数据概念架构
    • 11.2 活动
      • 理解需求
        • 在收集数据仓库/商务智能项目的需求时,首先,要考虑业务目标和业务战略,确定业务领域并框定范围;然后,确定并对相关的业务人员进行访谈,了解他们想做些什么和这么做的原因,记录他们当下关心的具体问题和想要询问的数据,以及他们如何区分和分类重要信息。在可能的情况下,界定并书面记录关键的性能指标和计算口径。这些信息可以揭示业务规则,为数据质量自动化奠定基础。 将需求进行分类并排出优先级,与生产上线相关的排在前面,将与数据仓库相关的和那些可以等的排在后面。寻找并快速启动那些简单且有价值的项目,以便在项目初始发布阶段就能获得产出。数据仓库/商务智能项目需求描述应该包括业务领域及其范围内流程的完整业务背景
      • 定义和维护数据仓库/商务智能架构
      • 开发数据仓库和数据集市
        • 三条并存的构建轨迹
          • 1)数据。支持业务分析所必需的数据。
          • 2)技术。支持数据存储和迁移的后端系统及流程。
          • 3)商务智能工具。数据消费者从已部署的数据产品中获得有意义的数据洞察所必需的应用套件。
        • 将源映射到目标
          • 映射工作最困难的部分都是确定多个系统中数据元素之间的链 接有效性或等效性,考虑将多个计费或订单管理系统的数据合并到一个数据仓库中的工作,可能包含等效数据的表和字段用的不是相同的名字 或结构
        • 修正和转换数据
          • 强化数据修正或清理活动的执行标准,并纠正和增强各个数据元素 的域值。对于涉及重要历史数据的初始加载过程,数据修正工作尤为必 要。
          • 乐观加载策略可以包括创建维度记录以容纳事实数据,这样的过程 必须考虑如何更新和处理这些记录。悲观加载策略应该考虑一个事实数 据的回收区域,该区域不能与相应的维度键关联。这些记录需要适当的 通知、告警和报表,以确保它们被跟踪,并在以后重新加载。实际处理 的时候应考虑首先加载回收区的记录,然后处理新到达的内容。
        • 监控和调优商务智能活动和性能
          • 商务智能监控和调优的最佳实践是定义和显示一组面向客户满意度 的指标,
          • 透明度和可见性是推动数据仓库/商务智能监控的关键原则。
      • 加载数据仓库
        • 加载方法还必须解决数据质量处理过程、执行转换的时间、延迟到达的维度和数据拒绝等问题。
      • 实施商务智能产品组合
      • 维护数据产品
        • 发布管理
          • 发布管理对增量的开发过程至关重要,增加新功能,增强生产部 署,并确保为已部署的资产提供定期维护。这个过程将使数据仓库保持 是最新的、清洁的,并以最佳状态运行。
            • 图11-5 发布流程示例
        • 管理数据产品开发生命周期
        • 监控和调优加载过程
          • 使用数据库调优技术,包括分区、备份调优和恢复策略调整。数据归档是数据仓库构建中的一个难题。
        • 监控和调优商务智能活动和性能
          • 透明度和可见性是推动数据仓库/商务智能监控的关键原则。
    • 11.3 工具
      • 元数据存储库
        • 数据字典和术语
          • 数据字典是支撑数据仓库使用的必需组件。
          • 数据字典的内容直接来自逻辑数据模型。在建模过程中,应要求建模人员采用严格的定义管理方法,以规划高质量的元数据。
        • 数据和数据模型的血缘关系
          • 记录的数据血缘关系有很多用途
            • 1)调查数据问题的根本原因。 2)对系统变更或数据问题进行影响分析。 3)根据数据来源确定数据的可靠性
      • 数据集成工具
        • 考虑系统管理的如下功能
          • 1)过程审计、控制、重启和调度。 2)在执行时有选择地提取数据元素并将其传递给下游系统进行审计的能力。 3)控制哪些操作可以执行或不能执行,并重新启动那些失败或中止的进程
      • 商务智能工具的类型
        • 运营报表
          • 运营报表指的是业务用户直接从交易系统、应用程序或数据仓库生成报表。
        • 业务绩效管理(BPM)
          • 绩效管理是一套集成的组织流程和应用程序,旨在优化业务战略的执行。应用程序包括预算、规划和财务合并。
        • 描述性的自助分析
        • 运营分析应用
          • OLAP操作包括切片和切块、向下钻取、向上钻取、向上卷积和透视
          • 三种经典的OLAP分析方法
            • 关系型联机分析处理(ROLAP)
            • 多维矩阵型联机分析处理(MOLAP)
            • 混合型联机分析处理(HOLAP)
    • 11.4 方法
      • 驱动需求的原型
        • 对数据进行剖析(Profiling)有助于原型设计,并降低与非预期数 据相关的风险。
      • 自助式商务智能
      • 可查询的审计数据
        • 为了维系数据血缘关系,所有的结构和流程都应该能够创建和存储审计信息,并能够进行细粒度的跟踪和报告。
    • 11.5 实施指南
      • 就绪评估/风险评估
        • 1)明确数据敏感性和安全性约束。 2)选择工具。 3)保障资源安全。 4)创建抽取过程以评估和接收源数据。
      • 版本路线图
      • 配置管理
      • 组织和文化变革
    • 11.6 数据仓库和商务智能治理
      • 概要
        • 治理流程应该降低风险,而不是减少任务的执行。
        • 最关键的功能是那些管理业务运营的发现或改进区域,以及确保数据仓库本身质量稳定的功能
      • 业务接受度
        • 预先还要考虑一些非常重要的架构子组件及其支持活动,具体如下:
          • 概念数据模型。组织的核心信息是什么?关键的业务概念是什么?它们是如何相互关联的?
          • 数据质量反馈循环。
          • 端到端元数据。
          • 端到端可验证数据血缘
      • 客户/用户满意度
      • 服务水平协议
        • 响应时间、数据保留和可用性要求在不同业务需求类别及其各自的支持系统(如ODS、数据仓库和数据集市)之间存在很大差异
      • 报表策略
        • 报表策略必须解决如下问题
          • 安全访问
          • 描述用户交互、报告、检查或查看其数据的访问机制
          • 用户社区类型和使用它的适当工具
          • 报表摘要、详细信息、例外情况以及频率、时间、分布和存储格式的本质
          • 通过图形化输出发挥可视化功能的潜力
          • 及时性和性能之间的权衡
      • 度量指标
        • 使用指标
          • 数据仓库中使用的度量指标通常包括注册用户数、连接用户数或并发用户数。
        • 主题域覆盖率
        • 响应时间和性能指标
  • 考察分值&知识点
    • 考察分值
      • 10分

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1557964.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

易图讯军用VR三维电子沙盘系统

深圳易图讯军用VR三维电子沙盘系统是一种集成了虚拟现实(VR)技术、三维建模技术、大数据分析、实时动态更新以及高度安全可靠的综合性军事指挥平台。该系统通过高精度三维模型真实再现战场环境,为指挥员提供沉浸式体验和交互操作的可能性&…

数据结构与算法——Java实现 31.阻塞队列

—— 24.10.8 一、问题提出 目前队列存在的问题 1.很多场景要求分离生产者、消费者两个角色、它们需要由不同的线程来担当,而之前的实现根本没有考虑线程安全问题 2.poll方法,队列为空,那么在之前的实现里会返回null,如果就是硬…

构建MySQL健康检查Web应用

构建MySQL健康检查Web应用 在这里将探讨如何将MySQL健康检查功能转换为一个功能完整的Web应用。这个应用允许用户通过简单的Web界面执行MySQL健康检查,并查看详细的结果。我们将逐步介绍代码实现、改进过程以及如何设置和运行这个应用。 1. MySQL健康检查类 首先…

codetop标签双指针题目大全解析(二),双指针刷穿地心!!!!!

复习比学习更重要,如果忘了就跟没学是一样的 1.和为k的子数组2.统计[优美子数组]3.区间列表的交集4.将x减到0的最小操作5.替换子串得到平衡字符串6.划分字母区间7.分隔链表8.通过删除字母匹配到字典里最长单词9.寻找目标值-二维数组10.至多包含两个不同字符的最长子…

麒麟系统串口配置篇

麒麟系统串口配置篇 1.配置串口驱动(编译/动态加载串口) 解压文件夹,然后在解压后的文件夹所在目录,右键选择打开终端,依次执行以下命令: 以麒麟系统下的CH341串口驱动为例,解压CH341SER_LINUX.zip sudo…

2024_10_8 系统进展

改进位置 发现是label_api里藏了我需要改进的东西 settings.py 数据库 我这边电脑上使用的是windows 192 vue.config.js 陈家强是这样设置的 module.exports {publicPath: process.env.NODE_ENV production? /: /,assetsDir: static,// css: {// extract: false// },…

【C++ 11】for 基于范围的循环

文章目录 【 1. 基本用法 】【 2. for 新格式的应用 】2.1 for 遍历字符串2.2 for 遍历列表2.3 for 遍历的同时修改元素 问题背景 C 11标准之前(C 98/03 标准),如果要用 for 循环语句遍历一个数组或者容器,只能套用如下结构&#…

“我养你啊“英语怎么说?别说成I raise you!成人学英语到蓝天广场附近

“我养你啊”这句经典台词出自周星驰自导自演的电影《喜剧之王》。在这部电影中,周星驰饰演的尹天仇对张柏芝饰演的柳飘飘说出了这句深情而动人的台词。这句台词出现在柳飘飘即将离去之时,尹天仇鼓起勇气,用它作为对柳飘飘个人困境的承诺&…

VIP与MPIO,备胎管理谁更强

我爱上班,风雨无阻 大家每天去上班,不可能只有一条路线 可以地铁、也可以开车或公交 万一地铁停运或车子限行,至少还有其他线路选择 企业级存储也是如此 关键业务的存储访问一般有多条路径 网络或单个存储设备故障后 访问路径会自动切换…

集合框架05:List接口使用、List实现类、ArrayList使用

视频链接:13.11 ArrayList使用_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1zD4y1Q7Fw?p11&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5 1.List接口使用代码举例 package com.yundait.Demo01;import java.util.ArrayList; import java.util.List;pu…

轻松掌握IP代理服务器设置方法,网络冲浪更自如

在数字化时代,互联网就像是一片浩瀚的海洋,而IP代理服务器就如同我们在这片海洋中航行的指南针。通过使用代理IP,我们可以更方便地访问全球网络资源,提升网络安全性。本文将为您详细介绍IP代理服务器的设置方法,让您在…

指针——指针数组、数组指针

&#xff08;一&#xff09;指针数组 1、本质&#xff1a;指针数组的本质任然是数组 2、基本格式&#xff1a;int* arr[5] 3、应用&#xff1a;如尝试使用指针来模拟二维数组 先来看代码 #include<stdio.h> //指针数组——模拟实现二维数组 int main() {int a[5] {…

本科毕业论文不会写怎么办,论文查重显示80%多

如果本科毕业论文不会写且查重显示 80% 多&#xff0c;可以从以下几个方面着手解决&#xff1a; 一、调整心态&#xff0c;正视问题 首先&#xff0c;不要惊慌和焦虑。高重复率并不意味着无法挽救&#xff0c;要相信自己有能力解决这个问题。把它看作是一个学习和提升的机会&a…

Matlab实现海鸥优化算法优化回声状态网络模型 (SOA-ESN)(附源码)

目录 1.内容介绍 2部分代码 3.实验结果 4.内容获取 1内容介绍 海鸥优化算法&#xff08;Seagull Optimization Algorithm, SOA&#xff09;是一种受海鸥觅食和飞行行为启发的群体智能优化算法。SOA通过模拟海鸥在空中搜寻食物、聚集和分散的行为模式&#xff0c;来探索和开发…

Leecode刷题之路第13天之罗马数字转整数

题目出处 13-罗马数字转整数-题目出处 题目描述 个人解法 思路&#xff1a; todo 代码示例&#xff1a;&#xff08;Java&#xff09; todo复杂度分析 todo 官方解法 13-罗马数字转整数-官方解法 方法1&#xff1a;模拟 思路&#xff1a; 代码示例&#xff1a;&#xff0…

ctf.bugku - game1

题目来源&#xff1a; game1 - Bugku CTF 访问页面&#xff0c;让玩游戏 得到100分&#xff0c;没拿到flag 查看页面源码&#xff0c; GET请求带有 score、IP、sign 三个参数&#xff0c;最后的flag 应该跟分数有关&#xff1b; 给了score一个99999分数&#xff0c; sign 为 …

dotnet7==windows ZIP方式安装和web demo和打包

下载ZIP Download .NET 7.0 (Linux, macOS, and Windows) 解压 创建项目 mkdir MyWebApp cd MyWebApp "C:\Users\90816\Downloads\dotnet-sdk-7.0.317-win-x64\dotnet.exe" new webapp -n MyWebApp 运行项目 "C:\Users\90816\Downloads\dotnet-sdk-7.0.317-…

同城O2O系统源码与跑腿配送平台的架构设计与开发方案详解

今天&#xff0c;笔者将与您一同深入探讨同城O2O系统的源码及跑腿配送平台的架构设计与开发方案&#xff0c;助力开发者和企业在这一领域的实践与探索。 一、O2O系统概述 在同城O2O模式中&#xff0c;用户可以通过手机应用或网页平台下单&#xff0c;而配送员则根据订单信息迅…

QT 优化登录框

作业 优化登录框&#xff1a; 当用户点击取消按钮&#xff0c;弹出问题对话框&#xff0c;询问是否要确定退出登录&#xff0c;并提供两个按钮&#xff0c;yes|No&#xff0c;如果用户点击的Yes&#xff0c;则关闭对话框&#xff0c;如果用户点击的No&#xff0c;则继续登录 …

信息安全——应急响应

应急响应部分 1、提交攻击者的IP地址 简单过一遍apache日志&#xff0c;less /var/log/apache2/access.log.1 很明显的可以发现大量的扫描流量&#xff0c;如下&#xff1a; 大量的并发连接&#xff0c;且访问资源均返回404&#xff0c;且UA不正常&#xff0c;从这里可以得…