关系数据库设计之Armstrong公理详解

在这里插入图片描述

~犬📰余~
“我欲贱而贵，愚而智，贫而富，可乎？曰：其唯学乎”

一、Armstrong公理简介

Armstrong公理是一组在关系数据库理论中用于推导属性依赖的基本规则。这些公理是以著名计算机科学家威廉·阿姆斯特朗（William W. Armstrong）命名的。Armstrong公理提供了一种形式化的方法，用于推导关系数据库中的所有属性依赖。通过使用这套公理，我们可以理解和掌握一个数据库的所有潜在的属性依赖，从而帮助设计合理的数据库模式，确保数据的一致性与完整性。
在关系数据库中，属性依赖是一个核心概念。它描述了一个属性集合如何通过另一个属性集合来确定，换句话说，若存在两个属性集合 ( X ) 和 ( Y )，若 ( X ) 可以唯一地确定 ( Y )，那么我们说 ( X → Y )，即 ( Y ) 函数依赖于 ( X )。Armstrong公理为我们提供了推导属性依赖的基础工具，使得我们能够通过有限的一组规则来确定数据库中的所有可能存在的依赖。

二、Armstrong公理的组成

Armstrong公理包括三条基本规则，它们分别是：

1. 反身性

若属性集合 ( Y ) 是 ( X ) 的子集，则 ( X → Y ) 成立。即：

X⊇Y⇒X→Y

2. 增广性

如果 ( X → Y )，则 ( XZ → YZ ) 也成立。即，如果 ( Y ) 是 ( X ) 的函数依赖属性，则在任何集合 ( Z ) 加入到两侧的情况下，依赖关系仍然成立：

X→Y⇒XZ→YZ

3. 传递性

如果 ( X → Y ) 且 ( Y → Z )，则 ( X → Z ) 也成立。即：

X→Y and Y→Z⇒X→Z

三、Armstrong公理的扩展

上述三条公理是推导数据库中所有函数依赖关系的基础。在实际应用中，这三条基本规则常与如下推导规则一起使用，这些规则可从Armstrong公理中导出，帮助我们更高效地推导依赖关系：

1.并合性

如果 ( X → Y ) 且 ( X → Z )，则 ( X → YZ )。换句话说，如果一个属性集合可以分别决定两个属性集，它也可以决定它们的并集。并合性可以通过反复使用Armstrong公理的增广性和传递性推导出来：

X→Y and X→Z⇒X→YZ 例如，假设 ( A → B ) 且 ( A → C )，那么根据并合性，( A → BC ) 也是成立的。这条规则对简化多个函数依赖的分析非常有用。

2.分解性

如果 ( X → YZ )，那么 ( X → Y ) 和 ( X → Z ) 都成立。即，如果一个属性集合可以决定某个并集，那么它也可以决定并集中的每一个子集。分解性也是通过Armstrong公理推导出来的：

X→YZ⇒X→Y and X→Z 例如，如果 ( A → BC ) 成立，那么我们可以推导出 ( A → B ) 和 ( A → C ) 都是成立的。这条规则对识别复杂依赖关系的组成部分非常有用。

3.伪传递性

伪传递性是一种类似于传递性的规则，它表明如果 ( X → Y ) 且 ( WY → Z )，则 ( WX → Z ) 成立。这条规则适用于处理那些不仅依赖于单个属性集合的复杂函数依赖关系：

X→Y and WY→Z⇒WX→Z 伪传递性适合用于数据库设计的某些特殊场景，它帮助我们在复杂函数依赖链中找出新的依赖关系。

四、Armstrong公理的应用

Armstrong公理在关系数据库设计的多个方面都有应用，尤其在以下几个领域：

1. 规范化

关系数据库的规范化过程旨在减少数据冗余和避免插入、删除和更新异常。在规范化过程中，我们需要识别关系中的所有函数依赖，以便将关系分解为更小的、没有冗余的子关系。Armstrong公理在这一过程中扮演了重要角色，它帮助我们推导出所有可能的依赖关系，从而更好地进行分解。
例如，在第三范式（3NF）的分解过程中，我们需要确保所有非主属性完全依赖于主键，而不是部分依赖或传递依赖。通过使用Armstrong公理的传递性规则，我们能够识别传递依赖，从而进行适当的分解。

2. 属性闭包

属性闭包是关系数据库设计中的一个重要工具，用于确定一个属性集合的所有可以通过函数依赖推导出的属性。Armstrong公理的反身性、增广性和传递性规则在计算属性闭包时尤为重要。通过应用这些公理，我们能够系统地推导出一个属性集合能够确定的所有属性。
例如，给定一个关系模式 ( R(A, B, C, D) ) 和已知的依赖关系 ( A → B ) 和 ( B → C )，我们可以通过计算 ( A ) 的闭包来确定 ( A ) 可以唯一决定哪些属性。根据Armstrong公理的传递性，闭包计算结果为 ( A^+={A, B, C} )。

3. 推导最小依赖集

在设计数据库时，我们通常希望找到一个最小的函数依赖集，即在保留所有推导能力的前提下，减少冗余的依赖关系。Armstrong公理在推导最小依赖集的过程中非常有用，因为它允许我们系统化地分析哪些依赖是可以从其他依赖推导出来的，从而简化依赖集。

五、Armstrong公理与数据库规范化

Armstrong公理在数据库的规范化过程中发挥着关键作用。规范化旨在将关系数据库中的关系模式分解为更小的、无冗余的子关系，以确保数据一致性并避免更新异常。规范化的目标是使数据库达到某些范式（Normal Form），如第一范式（1NF）、第二范式（2NF）、第三范式（3NF）以及BCNF（Boyce-Codd Normal Form）。