数据治理006-数据标准的管理

元数据的分类和标准有哪些?

一、元数据的分类

元数据可以根据其描述的对象和属性不同,被分为不同的类型。以下是几种常见的元数据分类方法:
基于数据的类型:根据数据的类型,元数据可以被分为结构化元数据、非结构化元数据、半结构化元数据等。
基于数据的来源:根据数据的来源,元数据可以被分为内部元数据和外部元数据。内部元数据来自于组织内部的业务系统和数据仓库,而外部元数据则来自于外部的数据源,如政府公开数据、第三方数据等。
基于元数据的应用场景:根据元数据的应用场景,元数据可以被分为电子商务元数据、社交媒体元数据、金融服务元数据等。

二、元数据的标准

为了更好地管理和控制元数据,需要建立统一的元数据标准。元数据标准化的目的是为了实现不同系统之间的数据共享和互操作,提高数据处理效率和质量。以下是几种常见的元数据标准:
ISO/IEC 11179:ISO/IEC 11179是一种国际标准的元数据规范,它定义了元数据的概念、属性、关系和规则。ISO/IEC 11179包括三个部分:元数据的规范、元数据的注册和元数据的交换。
Dublin Core:Dublin Core是一种用于描述网络资源的元数据标准,它包括15个核心元素,如标题、描述、创作者、发布日期等。Dublin Core被广泛应用于数字图书馆、数字遗产、数字出版等领域。
EDIMA:EDIMA是一种用于电子数据交换的元数据标准,它定义了电子单据的结构和内容。EDIMA包括三个部分:EDI对象模型、EDI元数据规范和EDI报文规范。
JSON LD:JSON LD是一种用于描述网络资源的轻量级元数据标准,它可以将JSON格式的数据映射为RDF格式的数据。JSON LD被广泛应用于语义网、知识图谱等领域。

总之,元数据的分类和标准是元数据管理的重要基础。通过对元数据进行分类和标准化,可以更好地描述和理解数据的属性、特征和关系,促进不同系统之间的数据共享和互操作,提高数据处理效率和质量。
同时,为了更好地管理和控制元数据,还需要引入元数据管理平台。元数据管理平台可以帮助组织统一管理元数据,包括元数据的采集、清洗、存储、查询、分析和可视化等。通过元数据管理平台,可以更好地保证元数据的准确性、完整性和一致性,提高数据处理的质量和效率。

数据标准的管理

2024年全国数据工作会议,国家数据局局长刘烈宏表示,将建立健全国家数据标准化体制机制,研究成立全国数据标准化技术委员会,统筹指导我国数据标准化工作,加快研究制定一批数据领域国家和行业标准。

将加强标准引领,印发国家数据标准体系建设指南,指导发布数据要素流通标准化白皮书。

数据标准是企业在提升数据质量过程中不可或缺的要素。

数据标准涉及对数据的命名、定义、结构和取值的规范,为数据的内外部使用和交换提供一致性和准确性的保障。

数据标准的定义

数据标准的权威定义可以参考一些国际标准组织和权威机构的定义,以下是两个常用的权威定义

1、ISO/IEC 11179

ISO/IEC 11179 是一个关于元数据注册的国际标准。根据该标准,数据标准被定义为:

“数据标准是关于数据的内容、格式和结构的规则和指南,用于确保数据的一致性、准确性和完整性。”

2、DAMA(数据管理协会)定义

DAMA是一个权威的数据管理专业组织,根据 DAMA 数据管理知识体系(DAMA-DMBOK),数据标准被定义为:

“数据标准是用于定义、管理和控制数据的一致性和质量的规范、指南和规则。这些标准包括数据定义、数据格式、数据命名和数据编码等方面。”

在这里插入图片描述

数据标准的维度分类

数据标准的构成维度涵盖标识、定义、关系、表示和附加等类别。
在这里插入图片描述

数据标准的重要性

数据标准统一了数据的命名、定义和格式,使数据更加规范和实用。

增强数据的一致性和准确性:数据标准化确保了数据在不同系统和应用中的一致性,减少了由于数据歧义导致的错误。
促进数据的共享和交换:通过标准化的数据格式和定义,数据可以在不同部门和系统之间无缝流动,提高数据利用率。
提高数据管理效率:标准化的数据管理使数据的维护和更新更加高效,降低了管理成本。
增强数据的安全性和合规性:数据标准包括对数据敏感性和版本控制的管理,确保数据在使用和保护方面符合相关法规和政策。
统一基础数据:便于业务数据的汇总、报送、分析应用。

数据标准建立的要求

制度保障先行:应在制度中明确各个角色以及定义相应的分工界面,固化管理流程,为制定数据标准、管理数据标准提供指导性意见。
归口部门发挥牵头作用:归口管理部门需积极发挥带头作用,推动和监督标准管理流程的执行。通过激励和问责考核体系,推进数据标准工作的制定与执行落地。
自上而下、自下而上:制定过程中一方面需要自下而上梳理信息系统中的数据情况,同时也需要自上而下定义数据主题、细化分类,两者结合才能实现全面整体的数据视图,形成有效的数据规范要求。
实际需求为根本:需要明确以需求为根本,根据业务实际个性化的制定数据标准,避免造成难以落地的情况。

ISO/IEC 11179元数据注册标准

提供了用于定义元数据注册的框架,旨在基于数据的精确定义,从数据元素开始,实现元数据驱动的数据交换。(尝试着在网上找11179这套标准的详细内容,没有找到)

元数据项类型:在对元数据进行管理维护时,则存在被管理的元数据项。一般常见管理的元数据项分为分类模式、概念域、数据元概念、数据元、值域、表示类型等。在GB/T 18391 / ISO/IEC 11179中规定了列出部分元管理项的类型(见图1),同时也支持以附件类型进行添加和扩展。
在这里插入图片描述
元数据模型:用来描述元数据的模型通常称为元模型,改为:是指人们对描述元数据以及元数据之间关系理解的表达,也称为概念模型。如在进行数据元的管理维护时,通用使用GB/T18391 / ISO/IEC 11179中推荐的数据元的元数据模型(见图2)。该模型由概念层和表示层两部分组成,概念层包括数据元概念类和概念域类,都表示概念;表示层包括数据元类、值域类,都表示数据值的容器。
在这里插入图片描述

什么是数据元?

在GB/T 18391(ISO/IEC 11179)中,有一组属性规定其定义、标识、表示和允许值的数据单元,也称为数据元素。在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元,同时可理解为数据的基本单元。一个数据元由数据元概念和表示组成。

数据元概念:数据概念是能以一个数据元的形式表示的概念,其描述与任何特定表示法无关。一个数据元概念由以下两部分组成:
a. 对象类:可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合;
b. 特性:一个对象类所有成员所共有的特性,

表示:由值域、数据类型、计量单位(如何需要)、表示类型(可选)组成。
在这里插入图片描述

我国卫生信息元数据相关标准

我国卫生信息领域的元数据相关标准也都是在参考GB/T 18391 / ISO/IEC 11179《信息技术 元数据注册系统》的基础之上,结合卫生信息领域的元数据特性进行针对性扩展。目前已发布的元数据项类型有:数据元、值域、数据集、统计指标。

1、数据元

我国卫生信息数据元目录标准17个部分,包括1份总则和16份不同类别的数据元内容。已发布的数据元相关标准清单如下:
在这里插入图片描述
该标准规范中,将数据元的允许值分为可枚举和不可枚举两种类型:

可枚举值域:由允许值列表规定的值域,每个允许值的值和值含义成对表示,分为可选值较少的、可选值较多的两种。
a. 可选值较少的(如3个或以下):在数据元属性中直接列举;
b. 可选值较多的(如3个以上):在数据元属性中写出所引用的值域代码,若为外部标准,则注明标准号;
不可枚举值域:由描述规范的值域,且在数据元属性中准确描述该值域的允许值;

2、值域代码

我国卫生信息数据元值域代码标准分为17个部分,包括1份总则、1份标识规则和15份不同类别的值域代码内容。已发布的值域代码相关标准清单如下:
在这里插入图片描述

3、数据集

我国卫生信息领域中,为了满足各业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合,即基本数据集。

目前,我国卫生信息基本数据集分为基本信息、卫生服务、卫生管理、卫生综合四大类,其中卫生服务又分为儿童保健、妇女保健、疾病控制、疾病管理、医疗服务五小类;每个分类下包括多个数据集,如卫生综合分类下包括1份居民健康档案基本数据集和17份电子病历基本数据集。已发布的基本数据集相关标准清单如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
我国卫生信息卫生统计指标标准分为9个部分,包括1份总则和8份不同类别的卫生统计指标内容。已发布的统计指标相关标准清单如下:
在这里插入图片描述

引用:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1553325.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试——Python和UnitTest框架

文章目录 一、软件测试1.测试计划和测试方案1.测试计划(管理类型文档)2.测试方案(技术型文档) 2.非功能测试设计3.测试报告1.核心内容 4.处理测试过程中出现不可复现的bug 二、Python1.常用语法1.切片2.字符串查找方法:find()3.字符串替换方法:replace()…

构建应用层(TCP)自定义协议:深入理解序列化与反序列化技术

🍑个人主页:Jupiter. 🚀 所属专栏:Linux从入门到进阶 欢迎大家点赞收藏评论😊 目录 网络版计算器序列化 和 反序列化重新理解 read、write、recv、send 和 tcp 为什么支持全双工自定义协议期望的报文格式 模板方法模式…

开源大数据框架-Ambari+Bigtop如何写metainfo.xml文件

1.如何一键编译?一键安装?你没看错。 👉👉👉 https://gitee.com/tt-bigdata/ambari-env 你以为跟你闹着玩?人狠话不多🙍‍♂️🙍‍♂️🙍‍♂️,直接上图&a…

国庆普及模拟2总结

目录 题目链接: 官方题解: 概述: 总结反思: 题目 T1: 题目分析: 错误代码: 错因: AC代码: T2: 题目分析: 赛时代码&#xf…

Centos Stream 9备份与恢复、实体小主机安装PVE系统、PVE安装Centos Stream 9

最近折腾小主机,搭建项目环境,记录相关步骤 数据无价,丢失难复 1. Centos Stream 9备份与恢复 1.1 系统备份 root权限用户执行进入根目录: cd /第一种方式备份命令: tar cvpzf backup.tgz / --exclude/proc --exclu…

CSS基础-常见属性

6、CSS三大特性 6.1 层叠性 如果样式发生冲突,则按照优先级进行覆盖。 6.2 继承性 元素自动继承其父元素、祖先元素所设置的某些元素,优先继承较近的元素。 6.3 优先级 6.3.1 简单分级 1、内联样式2、ID选择器3、类选择器/属性选择器4、标签名选择器/…

若无向图G(V,E)中含7个顶点,为保证图G在任何情况下都是连通的,则需要的边数最少是多少?

这乍一看是不是可抽象(迷糊)了,butttt待我小翻译一下。 先举少一点的例子,假如我们有三个点,我给你两条边,那是不是不管咋连都一定一定是连通的。 那我们再进一步,假如四个点呢?我给…

大厂进阶之CSS死磕牢记的7大知识点

本文主要讨论7大CSS知识点,个个都是金刚附体,干货满满: 1、移动端样式适配 2、回流和重绘 3、flex布局 4、BFC 5、CSS垂直居中方法 6、CSS两栏、三栏自适应布局 7、CSS单行、多行文本溢出省略号格式 一、如何做到移动端样式适配 1、媒体查询…

CloudCompare插件编写

预置环境:Windows10GitCMake3.23.3VS2019Qt5.14.2 编译CloudCompare工程 首先克隆CloudCompare工程,注意必须加上--recursive否则无法下载完整代码编译会失败: git clone --recursive https://github.com/CloudCompare/CloudCompare.git这…

鸢尾花书实践和知识记录[编程1-11二维和三维可视化]

作者空间 文章目录 思维导图函数使用 二维可视化方案平面散点图散点图的示例代码1:绘制鸢尾花的散点图代码2Plotly绘制散点图 数据类型和绘图工具的对应 平面等高线代码3生成等高线网格数据 plotly.express关键的绘图函数 Plotly的另一个模块代码4 Plotly生成的 热图…

李宏毅深度学习-梯度下降和Normalization归一化

Gradient Descent梯度下降 ▽ -> 梯度gradient -> vector向量 -> 下图中的红色箭头(loss等高线的法线方向) Tip1: Tuning your learning rates Adaptive Learning Rates自适应 通常lr会越来越小 Adaptive Learning Rates中每个参数都给它不同…

如何使用MethodChannel通信

文章目录 1 概念介绍2 实现方法3 经验总结我们在上一章回中介绍了Visibility组件相关的内容,本章回中将介绍Flutter与原生平台通信相关的内容.闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 在移动开发领域以Android和IOS SDK开发出的应用程序叫原生开发,开发同一个程序…

Redis: Sentinel工作原理和故障迁移流程

Sentinel 哨兵几个核心概念 1 ) 定时任务 Sentinel 它是如何工作的,是如何感知到其他的 Sentinel 节点以及 Master/Slave节点的就是通过它的一系列定时任务来做到的,它内部有三个定时任务 第一个就是每一秒每个 Sentinel 对其他 Sentinel 和 Redis 节点…

【Canvas与徽章】金圈蓝底国庆75周年徽章

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>金边黑盾75周年</title><style type"text/css"&g…

万知:告别繁琐,轻松办公

零一万物这位科技创新的弄潮儿&#xff0c;带着它的最新杰作——万知&#xff0c;闪亮登场。这不仅仅是一个产品&#xff0c;它是对传统工作方式的一次轻松挑战。作为一款一站式AI问答、阅读和创作平台&#xff0c;万知旨在为用户提供高效、便捷的工作体验。万知通过集成多种智…

Suricata:开源网络分析和威胁检测

Suricata 是一款高性能、开源网络分析和威胁检测软件&#xff0c;被大多数私人和公共组织使用&#xff0c;并被主要供应商嵌入以保护他们的资产。 Suricata 功能 Suricata 提供全面的网络安全监控 (NSM) 功能&#xff0c;包括记录 HTTP 请求、捕获和存储 TLS 证书以及从网络流…

关于Vben Admin多标签页面缓存不生效的问题

情况说明 笔者在接手一个基于Vben Admin框架改造的vue3后台管理项目&#xff0c;客户要求在切换头部Tab页面时&#xff0c;不要刷新清空已经填写的表单页面或者表格。 然而&#xff0c;笔者根据Vben Admin的官方文档来配置多标签页面缓存后&#xff0c;页面每次切换后&#x…

光通信——FTTx

目录 FTTH模式 FTTO模式 FTTR模式 FTTB/CLAN/xDSL模式 FTTCabxDSL模式 根据接入光纤到用户的距离分类&#xff0c;PON可应用于光纤到交接箱&#xff08;FTTCab&#xff09;、光纤到大楼/路边&#xff08;FTTB/C&#xff09;、光纤到办公室&#xff08;FTTO&#xff0…

Tiny-universe手戳大模型TinyRAG--task4

TinyRAG 这个模型是基于RAG的一个简化版本&#xff0c;我们称之为Tiny-RAG。Tiny-RAG是一个基于RAG的简化版本&#xff0c;它只包含了RAG的核心功能&#xff0c;即Retrieval和Generation。Tiny-RAG的目的是为了帮助大家更好的理解RAG模型的原理和实现。 1. RAG 介绍 LLM会产…

一文彻底搞懂多模态 - 多模态理解+视觉大模型+多模态检索

文章目录 技术交流多模态理解一、图像描述1. 基于编码器-解码器的方法2. 基于注意力机制的方法3. 基于生成对抗网络的方法 二、视频描述三、视觉问答 视觉大模型一、通用图像理解模型二、通用图像生成模型 多模态检索一、单模态检索二、多模态检索三、跨模态检索 最近这一两周看…