谷歌|谷歌大神 Jeff Dean 领衔,万字展望五大AI趋势( 六 )


谷歌|谷歌大神 Jeff Dean 领衔,万字展望五大AI趋势
文章图片

除了用手机进行创造外,许多人还依赖手机与他人实时跨语言沟通,例如在打电话时使用 Live Translate 和 Live Caption 。由于自我监督学习(self-supervised learning)和有噪音的学生训练(noisy student training)等技术,语音识别准确率持续改善 。对有口音的语音、嘈杂的语音或重叠语音等有明显的改善 。在文本到语音合成的进步基础上,人们可以使用谷歌朗读技术 Read Aloud 在越来越多的平台上收听网页和文章,使获取信息更加便宜,跨越了模态和语言的障碍 。通过稳定生成的即时翻译,谷歌翻译(Google Translate)的实时语音翻译水平显著改善 。高质量的语音翻译在多语言交流时提供了更好的用户体验 。在 Lyra 语音编解码器和 Soundstream 音频编解码器中,机器学习与传统编解码器方法相结合使语音、音乐和其他声音能够以低得多的比特率保真地传送 。
谷歌|谷歌大神 Jeff Dean 领衔,万字展望五大AI趋势
文章图片

智能文本选择(Smart Text Selection)等工具得到了改进,它可以自动选择电话号码或地址等信息,以便复制和粘贴 。此外,Screen Attention 可以防止手机屏幕变暗,凝视识别技术有所的改进 。机器学习还让人们的生活更加安全 。例如,Suspicious Message Alerts 对可能的网络钓鱼攻击提出预警,Safer Routing 提出更加安全的替代路线 。
考虑到这些功能使用数据的敏感性,把它们默认设置为不共享是很重要的 。以上提到的许多功能都在 Android的Private Compute Core 中运行 。这是一个开源的、安全的环境,与操作系统的其余部分隔离开 。Android 确保未经用户同意,不会将在 Private Compute Core 中的数据共享给任何应用程序 。Android 还阻止 Private Compute Core 的任何功能直接访问网络 。功能通过一小部分开源 API 与 Private Compute Services 进行通信,这样就能剔除身份敏感信息并使用联邦学习、联邦分析和私人信息检索等功能保护隐私 。 
这些技术对于发展下一代计算和交互范例至关重要,个人或公共设备需要在不损害隐私的情况下学习并帮助训练(算法)模型 。联邦的无人监督学习方法,可以创造出越来越智能的系统 。这些系统的交互更加直观,更像是一个社交实体,而不是一台机器 。只有对我们的技术进行深刻变革,才有可能广泛而公平地拥有这些智能系统,让它们支持神经计算 。
趋势4:机器学习在科学、健康和可持续发展方面的影响越来越大近年来,我们看到机器学习在物理、生物等基础科学科的影响越来越大,在可再生能源和医学等领域也有许多令人兴奋的应用 。计算机视觉模型对个人和全球问题都有所功效 。它们可以帮助医生进行工作,扩大我们对神经生理学的理解,还可以提供更好的天气预报,加快救灾工作 。其他类型的机器学习模型能发现减少碳排放和提高替代能源产量的方法,在应对气候变化方面至关重要 。这样的模型甚至可以作为艺术家的创作工具!随着机器学习变得更加强健(鲁棒)和完善,它在的应用潜力继续扩大,有助于解决我们面临的一些最具挑战性的问题 。
计算机视觉提供新的洞察力:
在过去的十年里,计算机视觉的进步使计算机能够完成不同科学领域的各种任务 。在神经科学中,自动重建技术可以从脑组织薄片的高分辨率电子显微镜图像中重现脑组织的神经连接结构 。前些年,谷歌为研究果蝇、老鼠的大脑创造了这样的资源,去年,我们与哈佛大学的利希特曼实验室(Lichtman Lab)合作,进行了第一次大规模的人类皮质突触连接研究 。该研究跨越了所有皮层的多个细胞类型 。这项工作的目标是帮助神经科学家研究令人惊叹的人类大脑 。例如,下图显示了成人大脑中约 860 亿个神经元中的 6 个 。

推荐阅读