数据驱动的企业|被视为下一个“Snowflake”,图数据平台Neo4j高明在哪儿?

数据驱动的企业|被视为下一个“Snowflake”,图数据平台Neo4j高明在哪儿?
文章图片

Snowflake的市值已经突破800亿美元,较去年120美元/股的发行价,Snowflake股价已经涨近150% 。这让云上数仓成为近一年来资本加倍关注的对象 。
实际上,不止是云上数仓( the cloud-based data warehouse),Snowflake的大火也让资本的目光更多地投到了能在数字化转型浪潮中发挥重要作用、与“数据”有关的其他生意 。比如在今年6月份,图数据库(Graph Database )公司Neo4j入账的一笔高达3.25亿美元的F轮融资,被称为数据库史上最大的一笔投资,领投方为有着140多年历史的投资集团Eurazeo ,原谷歌风投Google Ventures(GV)也参与其中 。
Neo4j估值随即涨到20亿美元 。Neo4j联合创始人兼CEO Emil Eifrem 将这描述为数据库市场的一个转折点 。外媒评论表示:“这会成为下一个‘Snowflake’吗?”
从图数据库当下发展的势头来看,Neo4j成为下一个“Snowflake”也不是没有可能 。只不过,两者存在共性的同时,他们之间更多应被关注的是从产品到服务场景上的诸多不同 。
云上数仓与图数据库区别云上数仓Snowflake与图数据库Neo4j在业务上的不同,可以从其商业模式及产品应用场景来看 。
Snowflake在商业模式上的创新,一方面是帮助企业实现了数仓按需上云,其数仓的底层可对接AWS、谷歌云等主流云计算平台供客户选择;另一方面,实现了存储与计算分离,在资源管理上更为精细化 。
现阶段,企业之所以对云上数仓需求在逐年增长,很大原因在于企业在业务发展过程中逐步积累了大量数据,同时企业“数据驱动决策”的观念也逐步觉醒 。
企业业务数据要反哺决策,需要经过数仓流转 。从技术层面理解,业务数据库是为数据快速读写服务的,比如电商平台用户进入业务系统需要读取商品信息,下单后再在系统写入信息,这个过程对系统可用性要求极其高;而服务数据决策的数据库却同这个逻辑有很大不同,它不需要频繁读写,而是要求对数据进行只读的查询和分析 。
企业数据规模不大的时候,在业务数据库中查询和分析,系统还能承载;一旦企业数据进入一定规模,如果两个数据库不能各司其职,就会拖慢整个系统的运行效率,而且还会存在风险 。这也是为什么业务数据系统与数据决策系统从技术架构和运行逻辑上都需要单独的系统来针对性解决不同问题的重要原因 。
在这个大趋势下,Snowflake凭借其在商业模式上的创新,顺利站上了风口 。
Neo4j的图数据库也正是如此 。Gartner在《2021十大数据与分析技术趋势》一文中断言:“到 2025 年,图技术(graph technologies)将用于 80% 数据与分析的创新,这一数据高于 2021 年的 10%,图技术将会促进整个组织的快速决策 。”
与Snowflake使用SQL数据库(关系型数据库)不同,Neo4j的图数据库实际上是NoSQL(非关系型数据库) 。Snowflake使用了新型的关系型数据库引擎、主力解决的是企业数据反哺业务决策的问题,而Neo4j的图数据库则主要解决的是数据关系问题:在Neo4j发布的一份《图数据库技术十大案例》中,详细介绍了图数据库的几大应用场景,分别是欺诈检测、实时推荐引擎、知识图谱、反洗钱等 。
不过这里最值得强调的是,除了以上场景,利用数据之间的关系,图数据库还可以解决企业的主数据管理(MDM)问题——这是企业数据化转型过程中,较为关键的一环 。

推荐阅读