将数据分组或组合到称为“数据多维数据集”的多维矩阵中时。数据多维数据集方法具有一些替代名称或一些变体, 例如“多维数据库”, “物化视图”和“ OLAP(在线分析处理)”。
这种方法的总体思想是实现某些经常查询的昂贵计算。
例如, 可以将与架构销售(零件, 供应商, 客户和销售价格)的关系具体化为一组八个视图, 如图1所示, 其中psc表示由聚合函数值组成的视图(例如total-value)。通过将三个属性零件, 供应商和客户分组来计算得出的销售额), p表示一个视图, 该视图由单独对零件进行分组等得出的相应聚合函数值组成。
文章图片
【什么是数据立方体()】数据多维数据集是从数据库中的属性子集创建的。选择特定属性作为度量属性, 即, 其值是感兴趣的属性。选择另一个属性作为尺寸或功能属性。度量属性根据维进行汇总。
例如, XYZ可以创建一个销售数据仓库来保存有关时间, 项目, 分支和位置维度的商店销售记录。这些尺寸使商店可以跟踪物品的月度销售情况, 以及销售物品的分支机构和位置。每个维度可能都有一个与之标识的表, 称为维度表, 该表描述了维度。例如, 项目的维度表可能包含属性item_name, brand和type。
数据立方体方法是一种有趣的技术, 具有许多应用程序。在许多情况下, 数据多维数据集可能很稀疏, 因为并非每个维度的每个单元都可能在数据库中具有相应的数据。
应该开发出可以有效处理稀疏立方体的技术。
如果查询包含的常量的级别甚至低于数据多维数据集中提供的常量, 则不清楚如何充分利用存储在数据多维数据集中的预计算结果。
模型以数据多维数据集的形式查看数据。 OLAP工具基于多维数据模型。数据立方体通常为n维数据建模。
数据立方体使数据可以在多个维度上建模和查看。围绕中心主题(例如销售和交易)组织多维数据模型。事实表代表了这个主题。事实是数字量度。因此, 事实表包含度量(例如Rs_sold)和每个相关维表的键。
维度是定义数据多维数据集的事实。事实通常是数量, 用于分析维度之间的关系。
文章图片
示例:在2-D表示中, 我们将查看在温哥华市每季度售出的商品的“所有电子产品”销售数据。衡量的展示(以美元为单位)(以千为单位)。
文章图片
三维长方体 假设我们想用第三维来查看销售数据。例如, 假设我们要根据时间, 项目以及芝加哥, 纽约, 多伦多和温哥华等城市的位置查看数据。衡量的展示(以美元为单位)(以千为单位)。这些3-D数据显示在表中。该表的3-D数据被表示为一系列的2-D表。
文章图片
从概念上讲, 我们可以以3-D数据立方体的形式表示相同的数据, 如图所示:
文章图片
让我们假设我们想用附加的第四个维度(例如供应商)查看我们的销售数据。
在数据仓库中, 数据多维数据集是n维的。汇总级别最低的长方体称为基本长方体。
例如, 图中的4-D长方体是给定时间, 项目, 位置和供应商尺寸的基本长方体。
文章图片
图中显示了根据时间, 物料, 位置和供应商维度的销售数据的4-D数据立方体表示。显示的度量单位是出售的美元(以千计)。
最高级别的0-D长方体是最高的汇总, 被称为顶点长方体。在此示例中, 这是所有四个维度的总销售额或总销售额。
长方体的晶格形成一个数据立方体。该图显示了长方体的晶格, 该长方体为时间, 物料, 位置和供应商创建了4-D数据立方体。每个长方体表示不同程度的汇总。
文章图片
推荐阅读
- 什么是数据集市()
- 40多个顶级CSS常见面试问题和答案合集
- 最佳软件测试常见面试题及答案合集介绍
- Python学习线路图(如何学习Python(分步指南))
- Java学习线路图(如何学习Java(分步指南))
- 2022年前端开发人员必备的最佳CSS框架合集
- Symfony框架用法教程(完整的初学者指南)
- jQuery学习线路图(如何学习jQuery(分步指南))
- SQL学习线路图(如何学习SQL(分步指南))