大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)

她力量
大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)
文章图片

近年来,“她”力量正在科学家群体中快速升温。

在一年一度的妇女节到来之际,智源社区选取了五位颇具代表性的女性科学家,进行了深度访谈。在她们中,有人选择食物图像识别,对选择的科研方向热爱到底;有人享受不确定的科研乐趣,在统计+生物学研究上更向前一步;有人也曾在读博和带娃的困难中迷茫,用理想温暖10年科研路;还有人从Facebook大厂回国,做更有温度的AI研究。
从她们的故事里,我们得以一览当代女性科研工作者的独特风采。
大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)
文章图片

“如果给所有女性科研工作者一个建议,是什么?”

“听从自己内心的需求。”
李婧翌,2007年清华生物系毕业生,加州大学洛杉矶分校(UCLA)统计系终身副教授,2018年斯隆奖获得者,入选《麻省理工科技评论》“35 岁以下科技创新35 人”(Innovators Under 35)2020 年中国区榜单。
当这些耀眼的标签在同一个人身上出现时,人们就知道,这一定是位不平凡的女性。
最近,李婧翌刚好在读一本书,是Facebook 首席运营官Sheryl Sandberg写的《Lean in: Women, Work, and the Will to Lead》。
“LEAN IN”,即向前一步。李婧翌认为,与其总去想“我应该做什么”,不如去思考“我想做什么”,因为怀疑自己恰恰是最没有意义的。
采访:李梦佳
撰稿:香农
01
从清华到UCLA

一个女性在成长过程中,可能会听到很多种声音,李婧翌似乎很少受到这些声音的干扰。
“潜心科研,终生学习,以及保持充足的好奇心。”她的人生规划无比清晰,且从未动摇过。
一定意义上说,李婧翌之所以会坚定地走科研道路,不能忽视家族中两位女性长辈的影响:李婧翌的外婆是解放前的大学生,毕业后从医,从小就一直鼓励她多读书、多思考。而曾任职高中数学教师的母亲,在李婧翌读中学的时候重新回到学校读研,一路读到完成博士,并留在了大学任教。
或许就在那时,李婧翌的科研梦想已经留存心中。后来,她保送进入清华,再后来又拿到UC伯克利的博士学位,整个过程非常顺畅、自然。
谈到最初为什么选择清华就读生物专业,李婧翌陷入了回忆:清华生物科学与技术系在当时的前沿师资力量是不言而喻的,绝对算得上是中国最适合做生命科学研究的地方之一。
更深一层原因是,在李婧翌看来,生命科学领域还存在很多未知问题,未来会有丰富的探索空间,这让她感受到一种“兴奋”。清华生物科学与技术系很重视分子生物学领域的前沿研究,这种氛围也和自己的梦想不谋而合。
2007年,李婧翌本科毕业于清华大学生物科学与技术系,并获得优秀毕业生荣誉。
毕业后,李婧翌前往UC伯克利攻读生物统计学博士学位。关于这段求学经历,李婧翌提到了一种思想转变:“本科时候感觉更多是需要上课、完成考试和一些基础的科研任务。但博士时期的科研工作需要学会创造,寻找一个目前没有人给出过答案的问题,甚至最终你可能会意识到,这个问题就是没有答案的。经历了这个过程,我才从一个学生变成了真正的研究者,开始把科研当作一种职业。”
本科期间,李婧翌已经发掘出自己对交叉学科的兴趣,她更喜欢用定量方法和数学工具来研究生命科学里的问题。但博士期间的方向相当于一次“换专业”,很多东西还是要从零开始,两位导师对她的信任和潜力的认可,是她当时最大的支持力量。
这段时间,李婧翌还逐渐接受了一个想法:很多事情不是努力就会有结果的,需要克服短期快感的念头,把注意力放在正在做的事情上,不必过分关注回报周期。
02
享受科研,享受不确定性带来的乐趣

“我意识到生命科学领域有很多的问题等待去解决,但解决问题仅仅用实验手段是不够的,做好实验后的数据分析更加重要。”这个当时看来是感性认知的结论,在李婧翌后来的科研生涯中慢慢被证明是完全正确的。
“因为科研是一种创造性工作,所以存在很多的不确定性。从某种意义上来说,科研工作本质比较辛苦,对于男女来说均是如此。”
其实,李婧翌很享受这种“不确定性”。
她提到了印象非常深刻的一项成果:在UC伯克利读博期间,李婧翌曾与劳伦斯伯克利国家实验室的 Mark Biggin 博士共同研究中心转录法则的定量工作。他们发现,2011 年发表在《Nature》上的一篇文章首次在小鼠的全基因组的基因中进行了 4 项步骤的测量,得出了这样的结论:一个基因内 mRNA 的高或低并不太能代表它的蛋白质含量的高或低。
长期以来,研究界普遍认可,不同组织之间的差异,例如大脑和肌肉,以及健康和不健康的人体细胞之间的差异,很大程度上取决于细胞中蛋白质丰度的变化。“转录”这一控制遗传信息从DNA 流向RNA 的过程,被认为在确定细胞中蛋白质的数量方面发挥着主导作用。
但在过去十年中,许多研究声称,在动物中,RNA 翻译成蛋白质的速度差异是一个更重要的因素。如果这篇Nature文章的结论是对的,那么之前很多 mRNA 的结果就要被推翻了。
到底什么才是对的结论呢?
大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)
文章图片

来源:李婧翌的论文 Li et al. (2015). Statistics requantitates the central dogma. Science 347(6226):1066-1067.
在后续的深入研究中,李婧翌等研究者发现,这篇Nature文章严重低估了mRNA 和蛋白质含量的相关性,而转录实际上是决定蛋白质丰度最有影响力的步骤。
李婧翌和Mark Biggin指出,此前的研究中,许多被认为是翻译步骤的影响实际上是实验误差的结果。同时还指出,科学家需要更精确的测量和分析方法以精确地模拟基因表达。相关研究成果2015年发表在了《Science》杂志上,并收录于本科教材 Molecular Cell Biology 中。
2013年,李婧翌在加州大学伯克利分校获得了生物统计学博士学位,随后加入了UCLA统计系,目前领导着一个简称为JSB(即统计与生物的交叉路口)的实验室。
李婧翌提到,现阶段的生物数据分析还存在诸多要解决的问题,比如很多新提出的计算方法缺乏统计学意义上的严谨性,可能会阻碍科学发现的可重复性和可靠性。同时,对于同一类型的数据通常存在着多个为了同一个目标而开发的计算方法,从用户的角度而言,如何去选择合适的计算方法也是一个难题。
针对生物数据分析领域现存的难题,李婧翌带领团队已经做出了多项成果:
2020年,李婧翌研究团队提出了一种新的计算框架“Clipper”,使用户能在无需计算高精度p值的情况下直接控制高通量数据分析中的假发现率。目前,团队正致力于将Clipper应用于多种类型的生物数据分析,譬如识别全基因组层面的差异表达基因和蛋白质结合位点。
此外,为了进一步公平化计算方法的评测和优化实验参数(测序的细胞数目和深度)的选择,李婧翌团队先后开发了单细胞仿真数据模拟器scDesign和scDesign2。
除了上述工作之外,李婧翌团队还开发了一系列关于基因测序数据的计算方法,包括AIDE、PseudotimeDE、scPNMF等,这些方法更着重于对数据中噪音的考量以及对分析结果的假阳性的控制,从而使得研究者可以更加准确地对第二代测序数据进行全长mRNA层面的分析(AIDE)或更加可靠地从单细胞RNA测序数据挖掘信号:表达值随着细胞状态变化的基因(PseudotimeDE)和表达值能区分细胞类型的基因(scPNMF)。
可以看到的是,基于高通量生物数据的定量研究会在生物医学中发挥更重要的作用。不断进步的实验技术会产生更多,更精确的生物数据,随之而来的是对更严谨的计算方法的需求。
如果用一句话形容统计学与生命科学的交叉领域最有魅力、最吸引人的地方,李婧翌这样说道:“一旦有新的实验技术、新的数据类型出来,就会有新的问题,你不是在故纸堆里去找问题,而是一直在去做新的问题。对于学习新东西能力比较强的人、好奇心比较强的人,这是一个可以感觉到很兴奋的学科。”
随着近年来人工智能技术的飞速发展,近来AI+生物学的交叉成果也让李婧翌颇感惊喜,比如用AI预测蛋白质结构的AlphaFold2。此外,空间组学数据也是接下来她看好的一个方向。
“我经常会跟我的学生讲,做研究其实像一场马拉松,并不是短跑,所以你不需要暂时跑得比别人快,也不在乎一时有什么成就,而是争取能够一直做下去。”
大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)
文章图片

李婧翌在UC伯克利过中秋节(左四)
03
勇敢“Lean in”

在《Lean in: Women, Work, and the Will to Lead》这本书中,作者这样写道:“通常女性在总会在无意识中妨碍自己的发展、降低对自己的期望值,甚至很容易就放弃工作、放弃获得更大成就的可能性。与男性相比,女性在职场中的态度仍然不够积极、不够进取。”
从小到大,由于自身听到的社会偏见也好,由于自身所处的文化教育环境对男性女性的期望值不同也好,这些都多多少少会让女性更加容易怀疑自己:“我是不是就不要做这个了?需要那么辛苦吗?”
其实,对女性而言,拥有一个强大的内心,更多地去想“我想做什么”,比总是去想“我应该做什么”更有意义。
在李婧翌看来,个体差异绝对大于性别差异。“一类群体无法去代表所有女性,重点是每个人都要想一想,我心里是否愿意做这件事情。比如选择科研这条路,和感受到的乐趣和成就感相比,付出的那些辛苦你觉得值不值?”
“举个例子,如果所有人都告诉你,女生就是没有男生适合学数学,如果你听到这个观点也记在心里了,当你学到比较难的内容的时候,可能第一想法就是『确实,因为我是女生,所以我不太适合』,也许就不会推动自己去努力把问题想明白。”这种先入为主的想法,其实会影响到自己的表现。
“LEAN IN”的意思是向前一步。在很多情况下,女性只有向前一步,才能发挥出自己的潜力,拓展出原本以为的“不可能”。
在做研究之外,李婧翌经常会收获一些“有趣”的观察:从生物学的角度出发,自己更多是被科学问题驱动。但一起合作的统计学家和计算机学家则更多从计算机科学和数据科学的角度出发,更加注重发展新方法,以及将工具做完整。
闲暇时光,她也会走出实验室,在爬山、瑜伽等运动中,放松自己的心情。
大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)
文章图片

李婧翌(中)

如果享受过程,回报可能就没有那么重要了,最后也就更容易感到满足;如果只是在等待回报,而认为过程很痛苦,人就会容易觉得失望。世界上的事莫不如此。
04
李婧翌给女性科研工作者的建议

不管是男性还是女性,可能都不存在一种放之四海而皆准的生活方式。面向女性科研工作者,李婧翌也给出了一些关于学术生涯和职业选择的建议。
“我见过很多学生,她们一路走来都很优秀,但是她们对于自己到底想做什么、想要什么,可能没有很强烈的想法,这对于女性成长不是一件有利的事情。”
李婧翌从小也属于“别人家的孩子”,不过她对人生之路问题有一些额外的思考:“我们可能会受到很多约束,从小被灌输什么是对的、什么是错的,但最重要的是内心要经过充分的思考。”
无论是什么职业,最后能够走下去或者做出成就,都是因为对这个职业有热情、有追求。“简而言之,我希望女性能够更多地去想一下自己内心的需求。”李婧翌最后这样说道。
大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)
文章图片

【大数据|UCLA李婧翌(女性最不需要做的就是「怀疑自己」| 妇女节特辑)】复旦陈静静 | 把握当下,坚持热爱,与食物图像识别结缘的科研之路

    推荐阅读