数据仓库中有各种实现, 具体如下
文章图片
1.需求分析和容量规划:数据仓库的第一个过程涉及定义企业需求, 定义体系结构, 执行容量规划以及选择硬件和软件工具。此步骤将包括咨询高级管理层以及其他利益相关者。
2.硬件集成:一旦选择了硬件和软件, 就需要通过集成服务器, 存储方法和用户软件工具来放置它们。
3.建模:建模是一个重要的阶段, 涉及设计仓库模式和视图。如果数据仓库很复杂, 则可能包含使用建模工具。
4.物理建模:为了使数据仓库有效执行, 需要进行物理建模。这包括设计物理数据仓库组织, 数据放置, 数据分区, 确定访问技术和建立索引。
5.来源:数据仓库的信息可能来自多个数据来源。此步骤包含使用网关, ODBC驱动器或另一个包装器标识和连接源。
6. ETL:来自源系统的数据将需要经过ETL阶段。设计和实施ETL阶段的过程可能包含定义合适的ETL工具供应商以及购买和实施工具。这可能包含定制工具以适合企业的需求。
7.填充数据仓库:商定了ETL工具之后, 可能需要使用暂存区进行测试。一旦一切工作正常, 可以使用ETL工具在给定架构和视图定义的情况下填充仓库。
8.用户应用程序:为了对数据仓库有所帮助, 必须有最终用户应用程序。此步骤包含设计和实施最终用户所需的应用程序。
9.推出仓库和应用程序:填充数据仓库并测试最终客户端应用程序后, 可以推出仓库系统和操作, 以供用户社区使用。
实施准则
文章图片
1.增量构建:数据仓库必须增量构建。通常, 建议创建一个数据集市时要牢记一个特定的项目, 并且一旦实施了该计划, 企业的其他几个部门也可能希望实施类似的系统。然后, 可以以迭代方式实现企业数据仓库, 从而允许所有数据集市从数据仓库中提取信息。
2.需要一个冠军:数据仓库项目必须有一个冠军, 他要积极地对项目的预期价格和收益进行大量研究。数据仓库项目需要企业中许多部门的投入, 因此需要由与企业中的人员进行交互并能积极说服同事的人驱动。
3.高级管理人员的支持:数据仓库项目必须得到高级管理人员的完全支持。考虑到此类项目的资源密集型特征以及实施这些项目所花费的时间, 仓库项目发出信号, 要求高级管理层作出持续的承诺。
4.确保质量:唯一已清除且组织隐含质量的记录应加载到数据仓库中。
5.公司战略:数据仓库项目必须适合公司战略和业务目标。必须在项目开始之前定义项目的目的。
6.业务计划:所有利益相关者都必须清楚地概述和理解财务成本(硬件, 软件和人员软件), 预期优势以及数据仓库项目的项目计划。没有这种理解, 关于支出和收益的谣言就可能成为唯一的数据来源, 从而颠覆了项目。
7.培训:数据仓库项目一定不能忽视数据仓库的培训要求。为了使数据仓库项目成功, 必须培训客户使用仓库和了解其功能的能力。
8.适应性:项目应具有灵活性, 以便在需要时以及在需要时可以对数据仓库进行更改。像任何系统一样, 数据仓库将需要随着企业需求的变化而变化。
【数据仓库实现】9.联合管理:项目必须由企业中的IT和业务专业人员共同处理。为了确保与利益相关者进行适当的沟通, 并且以该项目为目标来协助企业的业务, 业务专业人员必须与技术专业人员一起参与该项目。
推荐阅读
- 数据仓库建模
- ETL和ELT之间的区别
- 数据仓库交付流程
- 数据仓库的组件或构建块
- 数据仓库架构
- 数据仓库入门介绍
- 什么是OLAP(OLAP的特征)
- 数据仓库|MapReduce分片阶段详解
- 数据仓库|DolphinScheduler