Oracle在MySQL市场掀起了一股热潮

君不见长松卧壑困风霜,时来屹立扶明堂。这篇文章主要讲述Oracle在MySQL市场掀起了一股热潮相关的知识,希望能为你提供帮助。
在传统的企业数据管理中,Oracle数据库占主导地位,而mysql在开发人员中非常流行,并且MySQL是大多数云原生应用程序中使用的默认数据库。

MySQL受欢迎的原因是因为它的简单易用,并且具有为事务处理优化的丰富功能。最初在MySQL中小型企业中被迅速采用,随着它不断的发展,它也在大型组织的部门内得到了大量的应用。

MySQL经过多年的发展,令许多以MySQL为标准的中小型公司发展成为仍然依赖于它作为数据管理平台的大型组织。并且,大型组织中使用MySQL的部门和业务单位在MySQL中积累了大量的关键数据。

对于依赖MySQL的客户来说,这是他们面临的一个挑战。作为一个在线事务处理(OLTP)数据库,MySQL的设计不适用于深度和复杂的分析处理。虽然市场上的一些公司和云计算产品提供了某些分析产品组件,但没有一个能够进行实时分析。

Oracle 拥有 MySQL,但它从未在 MySQL 云服务中获得外界的的关注。2020年12月Oracle推出了一个新服务,在Oracle 云基础设施 (OCI) 上推出了一项新的完全托管的 MySQL 服务,它与现有云提供商已经提供的各种MySQL 云服务不同。其核心是“HeatWave”,是一种为 MySQL 数据库服务开发的新型内存分析引擎,通过将分析引擎集成到传统的以事务处理为主的MySQL,将 MySQL 带入了一个新领域。


MySQL 最初在 1990 年代被设想为一个相对简单、易于实现的关系数据库,用于处理 Web 应用程序的事务。它成为开源 LAMP 堆栈(包括 Linux、Apache 网络服务器、MySQL 以及 Perl、python 或 php 编程语言)的数据库。

MySQL 目前仍然是一个非常受欢迎的数据库。根据 db-Engines 的排名,MySQL 的受欢迎程度仅次于 Oracle 数据库。

Oracle 的新 MySQL 服务使用与本地部署的MySQL相同的 lnnoDB 存储引擎,并且添加了一个为 MySQL 数据库服务开发的新的内存分析引擎——HeatWave。它是一种分布式、可扩展、内存中、混合列式查询处理引擎,专为快速执行分析查询而设计。有人可能会将其与 Oracle Database In-Memory 的列式技术相关联。但是,HeatWave 是一种完全不同的内存混合列式实现。

使用 HeatWave,数据将持久保存在 MySQL lnnoDB 存储引擎中。通过使用轻量级更改传播算法在后台传播,任何更新都会实时自动传播到 HeatWave 节点的内存中。后续查询始终可以访问到最新数据。此外,在运行分析查询之前无需为数据创建索引。

HeatWave 集群的大小取决于加载所需的表和列,以及在内存中数据实现的压缩。 可以使用机器学习估算节点数量。
HeatWave 分析引擎对混合列存储中的数据进行微分区,可以实现大规模查询并行化。并且,它还引入了向量处理,可以允许在一组行上执行一系列指令,执行的开销分布在多行上,从而提高了性能。传统的内存列式、微分区和向矢量处理的组合使 HeatWave 独一无二。

Oracle在MySQL市场掀起了一股热潮

文章图片

Oracle在MySQL市场掀起了一股热潮

文章图片

MySQL 云服务对底层 Oracle 云基础架构 (OCI) 进行了进一步优化。计算节点之间的计算和通信针对网络带宽也同样进行了优化,分区的大小经过优化适应于CPU的缓存。这些帮助 HeatWave 在大量服务器上获得非常好的可扩展性。

在用户向 MySQL 数据库提交查询后,MySQL 查询优化器就会决定是否应将查询加载到 HeatWave 加速执行。HeatWave 将 MySQL 的分析查询性能提高了 400 倍,并且可以扩展到数千个内核。Oracle提供了测试的相关脚本https://github.com/oracle/heatwave-tpch
【Oracle在MySQL市场掀起了一股热潮】
Oracle在MySQL市场掀起了一股热潮

文章图片

HeatWave 利用 MySQL 的可插拔存储引擎架构,并与 MySQL 的默认存储引擎 lnnoDB本地集成。它的实现方式将存储级别的低级实现细节与最终用户进行隔离。用户可以使用相同的管理工具(包括 Oracle 云基础设施控制台、REST API 和命令行界面)管理 Oracle MySQL 数据库服务中的两个存储引擎。并且通过 MySQL 连接到 HeatWave,因此,所有标准工具和基于标准的 ODBC/JDBC 连接器不需要修改即可使用。HeatWave 支持与 MySQL 相同的 ANSI SQL 标准和 ACID 属性,并支持多种数据类型,并且无需更改应用程序代码。

在对大型数据集进行复杂查询的情况下,会面临两个问题,第一个问题是时间,分析引擎执行查询并将有价值的结果返回给请求者所需的时间。第二个问题是复杂,在数据驱动的组织中,数据保存在部门和业务单元的不同数据源中,这些数据源通常是MySQL数据库,但是MySQL并不适合OLAP处理。大多数情况下,组织多使用手动、分步骤的方法来为MySQL环境执行OLAP查询。通常使用ETL工具从多个MySQL源获取数据,并将其保存在用于OLAP处理的数据仓库中,最后,对数据运行分析。即使是云厂商提供的服务,同样需要使用ETL将数据移动到独立的数据库和工具。HeatWave改变了这一现状。使用HeatWave的一个优势在于省去了传统大数据分析的ETL过程。可以在不需要任何数据移动的情况下运行事务处理和分析,这在这个领域是首创的。客户也可以通过HeatWave实时做出决策,因为没有ETL数据——所有数据都在一个单一的数据库中。可即刻查询,这完全不同于目前的MySQL数据库云服务。
此外,还可以利用MySQL的复制功能,将本地部署的MySQL实例中的数据通过复制功能同步到HeatWave。通过这种混合部署,可以使得大量的本地MySQL数据在云端通过HeatWave进行加速分析处理。

管理每天产生的大量数据是IT部门面临的最重大挑战之一。同样具有的挑战是提取运行MySQL的部门和业务单元数据库中的大量数据。数据量年复一年地增长,到目前为止,解决方案提供商都是使用一些ETL方法将数据移动到分析工具或服务,同时尝试分析可能的最新数据集。这可能导致过时的数据,进而误导业务。每个主要的云提供商都试图通过一系列专门的服务来实现实时分析,但这些服务要求将数据存储在其云中,移动和分析数据非常耗时。Oracle提供了一个全新设计的实时分析引擎,以利用云架构的优势。
HeatWave是MySQL唯一的原生集成分析引擎,在性能和成本方面在行业内是无可匹敌的。

    推荐阅读