投稿|人工智能,“抛弃”真实数据集?( 二 )


去年底,Gartner 发布了 2022 年重要战略技术趋势,将生成式 AI 称为是“最引人注目和最强大的人工智能技术之一” 。
据 Gartner 预测,预计到 2025 年,生成式 AI 将占所有生成数据的 10%,而目前这一比例还不到 1% 。
投稿|人工智能,“抛弃”真实数据集?
文章图片

图|Gartner 2022 年重要战略技术趋势(来源:Gartner 官网)
2020 年,生成式 AI 作为一个新增技术热点,在 Gartner 发布的“Hype Cycle for Artificial Intelligence,2020”中首次被提出 。
在最新的“Hype Cycle for Artificial Intelligence,2021”报告中,生成式 AI 作为 2-5 年即可成熟的技术出现 。
投稿|人工智能,“抛弃”真实数据集?
文章图片

【投稿|人工智能,“抛弃”真实数据集?】(来源:Gartner Hype Cycle for Artificial Intelligence, 2021)
生成式 AI 的突破在于,它可以从现有数据(图像、文本等)中学习,并生成全新、相似的原始数据 。也就是说,它不仅可以做出判断,还能够进行创造,可以用于自动编程、药物开发、视觉艺术、社交、商业服务等 。
但是,生成式 AI 也会被滥用于诈骗、欺诈、政治造谣、伪造身份等,比如经常产生各种负面新闻的 Deepfake 。
那么问题来了,如果我们有足够好的生成模型,还需要真实的数据集吗?
原文链接:

  • https://openreview.net/pdf?id=qhAeZjs7dCL
  • https://news.mit.edu/2022/synthetic-datasets-ai-image-classification-0315
  • https://www.gartner.com/en/documents/4004183

推荐阅读