OAC教程之机器学习使用

1. OAC简介

Oracle Analytics Cloud empowers business analysts and consumers with modern, AI-powered, self-service analytics capabilities for data preparation, visualization, enterprise reporting, augmented analysis, and natural language processing/generation.
OAC(Oracle analytic Cloud,甲骨文分析云),就是甲骨文最新云版数据可视化和数据分析工具。
更多OAC知识请移步OAC文档。

OAC教程之机器学习使用
文章图片
数据可视化界面
2. 文档描述 此技术文档主要描述了在OAC中如何使用机器学习,使用回归算法训练一个模型,根据优惠编码和日期预测销售数量,包括建立模型和应用模型。主要面对的是OAC工具的使用,机器学习算法明细不在此文档范围内。
3. 创建和训练模型 3.1 创建数据流
【OAC教程之机器学习使用】我们选择Oracle ADW自带的销售数据(sh.sales表)作为数据集。
我们需要用time_id, promo_id来预测quantity字段,为了后面筛选数据,添加product_id字段,所以需要取数据集这四个字段:
  • Product_id
  • Time_id
  • Promo_id
  • quantity

    OAC教程之机器学习使用
    文章图片
    创建数据流
3.2 添加筛选器
因OAC中ML一次只能运行不超过12500数据,我们做一个筛选,只选取product_id为30的数据。

OAC教程之机器学习使用
文章图片
添加筛选器1
OAC教程之机器学习使用
文章图片
添加筛选器2
OAC教程之机器学习使用
文章图片
添加筛选器3 3.3. 添加训练数字预测步骤
这里我们选择线性回归作为此次预测算法。

OAC教程之机器学习使用
文章图片
添加训练数字预测步骤1
OAC教程之机器学习使用
文章图片
添加训练数字预测步骤2 3.4 配置线性回归模型参数
在Target中选择QUANTITY列作为预测目标列;

OAC教程之机器学习使用
文章图片
配置线性回归模型参数1
回归方法选择OLS,即最小二乘法;
其它参数请参见线性回归相关机器学习知识。

OAC教程之机器学习使用
文章图片
配置线性回归模型参数2 3.5 保存模型
添加保存模型步骤,取模型名称为regr_test,注意,名称最好为英文。

OAC教程之机器学习使用
文章图片
保存模型 3.6. 运行数据流训练模型
点击右上角运行数据流按钮,运行时会提示需要先保存数据流。

OAC教程之机器学习使用
文章图片
运行数据流训练模型1
OAC教程之机器学习使用
文章图片
运行数据流训练模型2 4. 查看生成的模型 主菜单 > 机器学习 可查看创建的模型。

OAC教程之机器学习使用
文章图片
查看生成的模型1
鼠标指针放置在模型列上,点击右边图标按钮,点击检查菜单可查看模型信息。

OAC教程之机器学习使用
文章图片
查看生成的模型2
OAC教程之机器学习使用
文章图片
查看生成的模型3 5. 应用模型预测数据 准备测试数据,可以手工创建,我们需要的是指定promo_id和time_id,然后应用建立的regr_test模型,预测quantity值。
5.1. 准备数据
需要准备测试集数据,用于验证模型。这里从sh.sales中随机抽取了一定量数据用于演示。
5.2. 添加应用模型步骤
这里我们选择开始建立的regr_test模型。

OAC教程之机器学习使用
文章图片
添加应用模型步骤1
OAC教程之机器学习使用
文章图片
添加应用模型步骤2
指定输出列名称,这里我们保持系统自动生成的名称。
在输入栏里指定列的映射。

OAC教程之机器学习使用
文章图片
在输入栏里指定列的映射 5.3. 添加保存数据步骤
该步骤会生成一个新的数据集,这里我们指定名称为Test Data Set。

OAC教程之机器学习使用
文章图片
保存数据1
OAC教程之机器学习使用
文章图片
保存数据2 5.4. 运行数据流生成包含预测列的数据集
运行前会要求保存数据流。

OAC教程之机器学习使用
文章图片
保存数据流
运行成功后我们能在数据集中查看建立的数据集。

OAC教程之机器学习使用
文章图片
查看数据集 6. 建立项目查看预测值和原值匹配程度 因本次训练集和测试集为同一表,故按时间求和后数据完全一致。如测试数据为新建数据,更能验证预测准确率。
其中数量列为实际值,PredictedValue列为预测值。

OAC教程之机器学习使用
文章图片
查看预测值和原值匹配程度
7. 结语 原创文章,需转载请留言和私信联系。如有疑问,欢迎留言或私信共同探讨。

    推荐阅读