作为数据应用场景基石的数据模型应该如何构建(Smartbi来教你!)
当业务体量到了一定程度,业务模型有了一定的稳定度,数据模型的构建就显得尤为重要。数据模型是保证数据口径统一、提升数据质量的核心,是后续快速高效迭代支持更复杂数据应用场景的基石。
那么,应该如何构建数据模型呢?
文章图片
01 确定模型主题
业务由很多场景组合而成,数据模型的构建需根据业务场景进行主题分类,所以如何确定主题分类呢,可参考如下几个原则:
每个主题都是最底层的原始主题,即衍生的指标都是基于这些主题域的数据计算得来的;
企业经营的业务组成模块可作为参考;
主题之间有一定的交叉衔接关联,但是呢,又需各领风骚,各自独立;
主题之间有依附关系,有些主题是基于更基础的主题衍生得来的。
02 基于确定的主题,梳理需求
需求梳理是核心,做好需求的梳理是很关键的,要做到以下几点:
已经发生的数据需求场景需全部囊括,记住是全部哦
未来可能会有哪些场景发生呢,亦需囊括。
那我们如何可以做好呢? 可以参考以下几种做法:
常用报表,整理已经产生过的所有报表需求;
临时数据,整理已经产生过的所有临时需求;
SOP流程,SOP流程是梳理需求的灵魂,掌握这个,是所有工作的核心,但如何把这个利用好呢,有个小技巧,把流程中每个环节可能需要看数据的度量值、维度全都穷举出来。
【作为数据应用场景基石的数据模型应该如何构建(Smartbi来教你!)】基于以上三步,整理出全部需要看数据的场景,再进行完整的系统性的梳理。
03 数据计算规则
这个环节是最最最需要细心和耐心的,一旦错误,整个数据模型就大打折扣
要做好,有几个难点需要特别注意:
杂:业务系统复杂多源,比如有营销系统、库存系统、结算系统等等;
多:数据来源表很多很多;
像:同一个指标,如损耗,在A系统和B系统都有,听起来貌似都是我们要的,那我们到底应该用哪个呢?他们有何不同?
04 数据验证
数据质量是数据应用的核心基础,数据验证是非常重要的一环,若质量把控不够严格,后续所有的行为都可能有偏差甚至错误,所以做好数据验证很关键。
上面介绍了数据模型的构建思路,那么我们要怎么落地呢?其实现在有的BI产品就已经可以构建数据模型了,并不需要依赖数据仓库。例如由广州思迈特软件推出的Smartbi V10就集成了数据模型功能,它使分析人员具有数据再加工的能力,自由调配“数据原料”,并由里及外,以点带面,极大提升了数据分析的灵活性,像艺术创作一样自由分析。
推荐阅读
- Docker应用:容器间通信与Mariadb数据库主从复制
- JS中的各种宽高度定义及其应用
- 使用协程爬取网页,计算网页数据大小
- 两感一练
- Java|Java基础——数组
- Python数据分析(一)(Matplotlib使用)
- Jsr303做前端数据校验
- Spark|Spark 数据倾斜及其解决方案
- java之static、static|java之static、static final、final的区别与应用
- Android7.0|Android7.0 第三方应用无法访问私有库