人工智能颠覆下的科学与科学家 人工智能颠覆下的科学与科学家是谁


人工智能颠覆下的科学与科学家 人工智能颠覆下的科学与科学家是谁

文章插图


作者:王大顺/艾伯特-拉斯洛?巴拉巴西
“刚才发生了什么”
2018年12月2日 , CASP会场上弥漫着一种困惑的气氛 。CASP是结构预测关键评价(CriticalAssessmentofStructurePrediction)的缩写,它是一项两年一度旨在预测蛋白质3D结构的竞赛 。预测蛋白质的形状可以让我们更好地理解它在细胞中的作用,以及诊断和治疗由于蛋白质错误折叠引发的阿尔茨海默病、帕金森病、亨廷顿病和囊肿性纤维化等疾病 。但是 , 蛋白质如何把其很长的氨基酸链折叠为紧致的3D形状依然是生物学中最重要的未解问题之一 。
CASP成立于1994年,被称作蛋白质折叠领域的肯塔基德比马赛 。每隔两年,这个领域的顶尖研究小组就会参加这一“赛马”盛会,比较各自的最佳方法,为整个领域建立新的基准 。然后,研究人员就回到各自的实验室,研究他人的方法,改进和发展自己的方法 , 以期在两年后赛出好成绩 。
在2018年的会议上发生了两件非同寻常的事情 。首先,正如组织者所言,“计算方法在预测蛋白质结构的能力上取得了无与伦比的进步” 。客观来说 , 这场竞赛取得的进步大体相当于通常需要两次竞赛才能取得的进步 。其次,这一巨大飞跃并非是由该领域的科学家完成的 。获胜的团队对于大家而言是完全陌生的 。
过去几年,人工智能在许多领域内都系统性地超越了人类专家,2018年的CASP竞赛结果只是其中一个例子 。这些进展已经促成一种共识:正在发生的人工智能革命将会改变几乎每一个行业,创造巨大的社会和经济机会以及同样多的挑战 。整个社会都将要面对人工智能时代的到来,它们也许会超越甚至取代人类医生、司机、士兵和银行业者 。我们需要问的是:人工智能将会如何影响科学?这些改变对科学家又意味着什么?
这波人工智能浪潮有什么不同
当前人工智能革命的核心技术是深度学习,更为专业的叫法是深度神经网络 。尽管人工智能专家对于许多事情都还没有形成共识 , 包括这一领域究竟是应该被称作“人工智能”还是“机器学习”,但是学术圈内外都意识到这确实是“下一个大事件” 。
深度学习确实有效 , 这一点应该说已经得到了验证 。2012年以来,深度学习已经在多到让我们难以记录的领域内击败原有的机器学习方法 。这些进展无疑已经改变了它在预测蛋白质的3D结构方面打败了所有的科学家 。
简而言之,人工智能帮助我们发现数据中那些隐含的、不确定的模式和结构 。这些模式对于人类而言是易于发现的(例如,在一幅监督学习 。该方法要求只给算法提供两组信息:大量的输入 , 也被称作“训练数据”以及为了给输入分类所用到的清晰的指令(“标记”) 。例如,如果目标是识别垃圾邮件 , 那么就给算法提供数百万的邮件并告知其中每个邮件是否是垃圾邮件 。然后算法就会仔细检查数据以确定垃圾邮件的特征 。在这一学习任务完成后,如果给算法输入一封新邮件,算法就会告诉你该邮件是否看上去是垃圾邮件 。
深度学习的魔力在于它无须人工输入就能找出数据的最佳表示方式,这是因为它包含许多中间层,并且其中的每一层都会根据标记给出数据的一种表示和转换方式 。只要层数足够多,深度神经网络就有可能很好地揭示隐藏在数据中的极为错综复杂的结构或模式 。更值得注意的是 , 深度神经网络完全是靠自己发现这些模式的 。我们可以把深度神经网络具有不同层想象为它拥有了能够调节数百万旋钮的灵活性 。只要给系统提供指引清晰且足够多的数据 , 它就能够自动调节所有的旋钮以找出表示数据的最佳方式 。
当前的人工智能与以往有什么不同?毕竟20多年前IBM的国际象棋程序深蓝(DeepBlue)就击败了当时的世界冠军卡斯帕罗夫(GarryKasparov) 。过去的人工智能依赖的是缺乏智能的精细计算 。深蓝击败卡斯帕罗夫是因为它每秒可以估测2亿个位置,从而预判哪一步最有可能获胜 。这种人工智能在面对围棋和蛋白质折叠这类更为复杂的游戏时就无能为力了,因为它无法处理所有的可能性 。
然而,深度学习却在这些领域取得了巨大的成功 。2016年,DeepMind研究团队设计的AlphaGo在5轮比赛中击败了围棋世界冠军李世石 。它取得胜利并非靠评估每一种可能的走法,而是靠研究人类棋手完成的棋局以学习何种走法有可能获胜或失败 。

推荐阅读