三问数据中台 数据中台

数据中心(三个问题的数据中心)
自从阿里提出“大中小前台”的概念后,数据中台的概念这几年火了起来,互联网巨头纷纷成立自己的数据中台 。数据中台到底有什么魅力能让企业如此重视?笔者从什么是数据中心,怎么做,为什么要做三个方面来回答这个问题 。
1.什么是数据中心?很多人会问,数据中心到底是什么?
一般来说,数据中心是在数据层面为企业业务提供帮助和决策的工具 。
过去,数据往往只显示,不存储;慢慢的,人们需要随时随地查找数据,存储数据的概念被普遍认可;慢慢的,人们逐渐养成了数据思维,发现可以通过看数据来制定运营策略 。当互联网时代已经进入爆发期,产生了大量的数据 。人们通过数据挖掘收集大量的外部数据作为决策的依据 。
现在的互联网已经进入了一个相对成熟的时期,大公司都建立了自己的数据中心,把海量的数据作为自己的资产,并且善于利用数据中心来整合和智能分析数据,驱动决策 。
说到数据中心,就会涉及到数据仓库 。很多人看,数据仓库?它只是一个数据库,一个存储数据的东西 。其实这并不是一个正确的认识 。两者有什么区别?
1.不同的业务场景 。数据仓库主要对收集的数据进行分析和处理;
数据库主要面向事务;
2.专注于以不同的方式优化数据 。数据仓库主要是集中资源优化获取资源的方式,因为业务人员和运营人员对数据的获取需求很大,往往每天都会调用、获取和处理大量的数据;
数据库主要集中资源优化添加、删除、修改、搜索等功能 。,防止过多的数据更新和事务影响数据库的效率和稳定性;
3.数据以不同的方式组织 。数据仓库通常按时间组织数据 。以电商订单为例 。数据仓库会分别用“1小时订单”、“1天订单”、“1个月订单”组织数据分析表,方便业务人员获取分析;
数据库按索引和物理内容组织数据,如“数码产品订单”、“生鲜食品订单”、“服装订单”等 。
4.冗余是不同的数据仓库往往是高度冗余的,因为数据仓库希望用更多重复类型的数据来分析整个产品的运营趋势,为下一步的运营决策做依据;
而数据库往往冗余度较低,数据库不希望存储大量重复类型的数据,从而影响数据库的整体性能和效率 。
说到这里,我们大概对数据中心有了初步的了解,那么我们就来看看如何搭建一个最适合我们公司的数据中心 。
二、如何建设最合适的数据中心?为什么说它是“最适合”自己的数据中心?
数据中心在功能和逻辑上非常复杂,涉及很多领域和维度,那么如何打造最适合的数据中心呢?请这样想:
1.先分析你需要什么数据 。首先要根据自己的业务来分析需要哪些数据 。下面是一个例子:
(1)电子商务业务
电子商务离不开订单、商品、支付等数据 。就订单数量而言,可以拆分这些维度进行统计:分钟/小时/天/周/月订单、人均订单、男/女用户订单、服装/数码产品订单、复购订单数量、订单销售额、订单周转率、订单退货率等 。
如果是商品,会涉及到商品类型的交易次数,商品的点击率,商品的评价次数等 。
如果是支付,会涉及到支付成功率/失败率、支付次数、支付渠道、支付优惠使用率等等 。
(2)直播服务
说到直播业务,核心角色可以分为主播和用户,整个直播平台都是围绕这两个核心角色来设计的 。
简单来说,直播就是主播和用户进行信息交流的过程 。主播提供内容,用户消费内容,反馈信息(发弹幕,送礼物等 。).当然,用户可以什么都不做,但也为主播提供了人气和受众);
整个直播过程可以分析如下:主播打开直播间——用户通过接收推荐/订阅提醒/搜索/首页推荐等方式进入直播间 。-主播与用户交流信息互动-用户退出直播间/主播下载-直播过程结束 。
那么,从这个简单的过程中,我们可以挖掘出很多数据指标,比如:播出后每小时的观看人数、消息推送/订阅/首页推荐的点击率、搜索次数、弹幕发送次数/速率、礼物类型/数量、观看直播1/5/10…分钟的用户数、各种留存率等 。由于数据指标太多,以上数据暂且列出 。
(3)旅游业务
出行也是按照业务流程来分析的:用户提交订单——司机接单——用户上车,司机确认,订单开始——到达目的地,司机确认,用户下车——用户付款(是否评价自行决定)——订单流程结束 。
根据流程可以继续挖掘数据指标,比如:某区域一小时内发起的订单数、司机一天接到的奇数单数、平均订单金额、订单取消数/率、订单公里数、某区域订单平均响应时间、订单好评率/差评率等等 。
所以,为了分析需要哪些数据,我们实际上必须从自己的业务流程中一步一步地拆解各个指标数据 。
2.如何在中间平台发展?(1)明确需求
当你知道自己需要什么数据的时候,这个时候就可以和业务、运营人员沟通了 。他们需要什么样的数据,如何组合数据,如何呈现,是否支持导出数据等 。,都需要产品经理与业务方进行详细的沟通,把每一个需求都讲清楚,这样才算是前期准备工作的一个好的开始 。
(2)原型设计
当需求明确后,就可以开始原型设计了 。这里涉及到设计的细节:如何让数据可视化更清晰?如何让商务人士的操作更简单容易?
所以在设计的过程中,除了保持与开发者的沟通,还需要与业务人员保持联系,防止原型设计好了,业务人员不满意,不得不做出大的改动 。
(3)需求评估,跟进开发进度 。
当原型设计好,需求文档写好,就可以进行需求评估了 。如果有现阶段难以实现的功能,产品和开发要共同思考如何改变另一种设计方法来解决同样的问题 。
然后是需求调度,大致确定每个时间节点,产品经理跟上开发进度 。
(4)开发完成,严格测试 。
你可能觉得中间平台不是给C端用户用的,没必要测试那么严格;但是,也正是因为中间的办公桌不是用来用的,是给业务人员用的 。如果出现影响运营决策的严重数据错误,业务影响会非常严重,因此严格的测试必不可少 。
(5)上线成功,一直跟进问题 。
考完试,终于可以上线了 。然而,重头戏才刚刚开始 。这时候你会发现,业务端会问你各种各样的bug,这些bug是用了中间平台之后之前的测试检测不出来的 。除此之外,它还会吐槽各种不好用的功能,甚至会给你其他的要求...
作为中国台湾的产品经理,这个时候你可能会觉得压力很大,但是只要我们不断跟进,合理安排项目进度,解决需求,我想商科同学不会故意为难你的 。
3.为什么大公司需要自建数据中心?据调查,其实市面上有很多第三方智能数据平台,如“厕神数据”、“BDP”、“泛软”等 。,企业购买后即可使用 。那就相当于有现成的了,何必自己去开发呢?
我想可能是因为这些原因:
1.数据安全对于大公司来说,他们掌握的数据是海量的,海量数据中往往有很多商业价值极高的数据,简称商业秘密,是不能对外泄露的 。所以自研平台可以保证一定的安全性 。
2.数据是资产 。对于一个数据企业来说,是资产,尤其是在大公司,数据是运营决策的基础 。如果竞争对手提前获知数据,判断出对方下一步的运营策略,那么在一个重要节点的活动中,如果竞争失败,将会给企业造成巨大的损失 。
3.成本可控性第三方数据平台往往根据支付的价格来区分服务质量 。想要享受更多更好的服务,就必须增加付费 。如果需要定制方案,成本会变高;
如果采用自建平台,可以自己决定先开发什么功能,调用多少资源,对成本有一定的控制能力 。同时,如果后期功能扩展的话会更加方便 。
【三问数据中台 数据中台】4.组合多样性由于用户需求的多样性,业务人员提出的需求往往具有个性化的特点,如需求以报表的形式呈现,由各种指标组成 。指标之间是多对多的关系,指标之间是相互关联的,多元化的指标是第三方平台无法满足的,自建平台才能体现其作用 。
当互联网的红利逐渐消失,如何利用数据进行智能运营,将是每个企业的重要任务 。运营人员的能力固然重要,但是拥有一个好的中台会让你的运营更加顺利 。

    推荐阅读