九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书

IDC预计,2020-2025年间,中国人工智能市场复合增长率将达到35.2%,持续保持中国速度,仍然占据全球主导地位。从整体解决方案的角度,预计到2024年,人工智能技术支出占整体IT支出的比例也将从2020年的5.2%提升至9.1%。
AutoML技术将为企业数智化升级带来何种机遇和可能?
九章云极DataCanvas联合全球知名的研究机构IDC中国重磅发布《引入AutoML,破局企业智能白皮书》,探讨AutoML创新应用的新未来。
今天的AI:潜力与挑战并存
人工智能发展迅猛,其落地应用带来的业务价值——为客户提供全渠道智能服务体验,精准识别潜在用户,降低运营成本,降低运营风险,提高生产效率等等日渐清晰。然而,推动AI落地的挑战依然非常突出:
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨开发机器学习、AI面临的挑战
在行业企业开始广泛而深入地推进AI的阶段,如何解决人才匮乏、数据稀缺、内部技能短缺的挑战是当务之急。IDC认为,解决这些挑战的路径有提供低代码开发模式、预训练模型、自动化AI等,这些路径都可以在自动化机器学习平台得以实现。
机器学习开发新要求:自动化
完整的机器学习/AI应用开发链路包含数据准备、模型训练、上线部署过程。而数据准备耗时长、模型选择以及训练技术门槛高,都是现阶段制约机器学习与AI规模化应用的瓶颈。自动化机器学习旨在解决如上挑战,降低组织应用AI的门槛,加快AI应用,实现真正的AI普惠。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨机器学习开发流程
人工智能的先行者对完整的AI开发流程已经积累了一定的实践经验,而处于人工智能应用初期的企业则可能会面临数据、人才、技能等多方面的挑战。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨企业采用机器学习平台希望改善的环节
要加速机器学习与人工智能的落地,除了解决人才、技能、数据资源、AI解决方案成本问题,在进行AI开发的过程中,也有必要从数据收集到特征工程提取、模型训练、再到部署上线的全流程,为各个环节提供一定的自动化工具或端到端的开发套件,引入自动化机器学习工具。
降低AI门槛,加速智能化
降低机器学习、AI应用开发门槛已成为推动AI规模落地的重要路径。如何实现端到端的AI开发自动化、机器学习自动化,也是技术供应商的重点攻关方向。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨机器学习自动化实现方式
围绕ML (机器学习)过程中的数据获取和预测,AutoML (自动化机器学习)用于实现自动化的特征工程、模型选择、超参优化等功能,已经实现了很多性能提升。IDC根据当前的实现路径分成如下几个阶段。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨AutoML成熟度阶段划分
IDC认为,全面认识AutoML工具,了解不同机器学习平台提供的自动化能力,才能为企业内部各部门的用户适配不同程度的自动化工具。
企业级AutoML需具备的能力
在综合当前产品以及行业用户智能化现状的基础上,IDC认为企业级AutoML产品在遵循机器学习开发流程的基础之上,现阶段必须具备六大能力:需具备适配行业属性、开放灵活、低代码易上手、良好的可视化效果、效率与成本的平衡以及支持快速部署的能力。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨企业级AutoML需要具备的能力
自动化之外,可解释性也将加速AutoML的应用。在采用自动化机器学习加速AI落地、扩展AI应用部署的同时,可解释性、AI治理能力也需要被强调、被重视,这一议题在行业用户中也逐渐被提上日程。
使用九章云极DAT自动化机器学习开发流程
作为中立的软件提供商,九章云极将核心的DataCanvas数据科学平台软件产品定位为“开放、自动、云原生”,为客户提供自动化机器学习分析和实时计算能力,提供从自动建模、模型运营到模型生产化的全生命周期服务,实现不同部门、不同技术能力的人群高效协同开发、共享模型成果,真正发挥企业级AI平台的价值。
九章云极DataCanvas自主研发的DataCanvas AutoML Toolkit(DAT)作为数据科学平台软件的重要组件,用于提升客户已有的各类机器学习平台的技术能力并对其进行加速,以降低企业使用AI等数据科学技术的门槛。DAT产品包含了一系列功能强大的AutoML开源工具,从底层的通用自动机器学习框架到用于结构化及非结构化领域端到端的自动建模工具,其中包含:
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨九章云极DAT2.3工具栈总览
基于AutoML技术,DAT将开发流变成自助流,通过扩大搜索空间并对现有模型深挖以取得更好效果来辅助数据科学家的工作,同时提供简单可视化Web界面的交互式系统来实现业务自助流,在不暴露任何编程接口的情况下,通过界面点击操作的方式即可实现建模,让没有专业基础的人员也可以完成机器学习建模工作,释放业务价值。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨DAT最佳实践案例(图源:九章云极DataCanvas)
目前,DAT已在金融、航空、电信等多行业企业中实现创新应用。
应用AutoML,加速您的AI应用上线
在AI人才还不充足的今天,随着组织中需要管理的模型数量的增长以及日益增加的应用AI实现智能化升级的需求,有必要考虑引入AutoML工具,加速智能化应用的部署上线。从机器学习开发流程的角度,AutoML可以减少人类在设计机器学习模型时出现的偏差和错误;企业也可以通过应用AutoML来降低人力和时间成本。
九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书
文章图片

图丨采用自动化机器学习,加速AI上线
人工智能应用开发的管理正在从模型训练、测试、部署上线等单个环节扩展到全生命周期的管理。IDC指出,专注在模型运维层面,拥抱全自动或者半自动化机器学习,从成熟的应用场景开始,将加速企业的智能化转型升级,实现普惠AI。
【九章云极DataCanvas 发布 2021 AutoML 自动机器学习白皮书】在公众号九章云极DataCanvas后台回复关键词“AutoML”获取完整版PDF报告

    推荐阅读