原文以A long journey to reproducible results为标题
发布在2017年8月22日的《自然》评论上
原文作者:Gordon J. Lithgow, Monica Driscoll& Patrick Phillips
Gordon J. Lithgow、Monica Driscoll和Patrick Phillips解释说:重复我们的实验结果耗费了4年时间和100000条虫子,却发现了意想不到的结果。
通讯员Geoff Marsh找出了线虫和可重复性结果之间的联系。
Nature Podcast
大约15年前,Gordon J. Lithgow接到了一个让人不甚愉快的电话,这个电话来自他的同事,与他也有合作。经过将近一年的艰苦实验,这位同事即将发表一篇文章反映他们无法重复我们的实验结果,而我们的结果已经高调发表在了一本主流杂志上。
我们的研究第一次明确表明一种类药分子能够延长动物的寿命。我们一再发现这种治疗方式能够将线虫的寿命延长67%。反复的电话和邮件沟通无法确定为何一个这么简单的实验,在不同的实验室产生了不同的结果。接着,另外一个实验室也报告称无法重复我们的实验。尽管我们做了更多的实验,也就这一问题发表了别的文章,我们仍无法弄清楚到底为什么不同的实验室得到的寿命测定结果不一样。时至今日,我们对于这个问题仍没有答案。
秀丽隐杆线虫长约1毫米,可独立生存。
Sinclair Stammers/SPL
几年以后,其它实验室关于一些化合物的研究也遇到了类似的问题。差不多在同一时间,白藜芦醇——红酒中的一种化合物——是否能延长实验室动物的寿命引发了激烈争论。
利用药物延迟衰老的可能性催生了很多公司,甚至开辟了新的科学领域。但是,针对这一领域的研究却让人们意识到,想要重复有力的延长寿命的结果是极具挑战性的。抗衰老研究一直以来都努力把自身结果与伪科学观点区别开来。知名实验室的结果无法重复,令人担心未来会有更多虚假结果,由此引发了寒蝉效应:一些研究人员(包括Gordon J. Lithgow)中断药物研究多年。
尽管如此,仍有许多关于延缓衰老的化合物的研究结果发表。不过很少有人试图去重复它们。2013年,我们三人被指派了这一单调乏味的任务。
我们当然没有解决文献里的种种矛盾。但是通过跟踪100000多条线虫的寿命,我们发现认识不同实验室和不同实验之间差异的来源是非常重要的。我们甚至看到了可能解释这类差异的生物学新特性。
更大范围的问题
一般而言,提高实验结果可重复性的关键在于确定实验方法。自噬是细胞清除已降解成分的生物学过程,研究自噬的科学家们花了很大功夫制定各种实验指南并定期更新。例如,如何定量测定某一成分已被吞噬,或如何证实某一基因参与了自噬。
另一个现在非常著名的例子是,两个肿瘤实验室花了一年多的时间尝试弄清楚相互结果的差异。两边的科学家一起做相同的肿瘤组织活检,结果发现了他们分离肿瘤细胞方式的微小差异——一个剧烈搅拌,另一个长时间温和摇晃,正是这一差异导致双方最终实验结果的不同。
一直以来,细节对于生物实验的成功非常重要。在研究人员尚未普遍开始购买试剂盒进行常规实验时,有的团队在搬迁到另一实验室时会将蒸馏水一起带过去,实验室成员会不断微调各种条件直到新实验室的水能够和原实验室的起到完全相同的作用。
差异的来源包括试剂的质量和纯度、微环境的每日波动以及研究人员的个人技术。如此多方面的因素都能够影响实验结果,或许我们应该诧异的是竟然有那么多实验结果都是可重复的。
关于线虫
美国国立老化研究所(NIA)隶属于美国国立卫生研究院 (NIH),它致力于研究各种老化研究结果存在差异的原因。毕竟是该机构在为这些研究提供资金支持,它要求所得结果是可靠的。NIA有过这方面成功的经验:其干预测试项目(Intervention Testing Program)发现,在三个独立实验室里,使用统一的实验方法,纳巴霉素都能够延长小鼠寿命。因此,为了类似的目标,NIA启动了隐杆线虫干预测试项目,派我们三个来自不同专业领域、过往也未有过合作的研究人员,以秀丽隐杆线虫为对象系统测试老化干预措施。
这些线虫被养在琼脂培养基上,喂以活菌。测试的化合物通常混入培养基或者喂食的活菌里,寿命以活动性来测定——如果用金属线刺激,线虫移动了那就说明它是活着的。这一判定方法已经在寄生虫研究领域沿用了25年了。我们的首要任务看起来简单明了——制定一个标准的实验操作流程。
但是细微的差异是讨论不完的。在一次特别煎熬的电话会议中,我们花了一个小时争论如何挑选线虫并转移到新的培养基上。在比较温和细致的技术人员手上,有的线虫可以多活一整天。因为线虫的平均寿命只有20天左右,多一整天可以算很了不起了。经过无数的邮件和电话会议,我们把问题聚焦在了技术上,但是不同实验室之间的差异仍然达到了3天之大。后来发现寿命差异的原因在于实验室对于年龄的评定不同,一个实验室以虫卵孵化为起点,另一个实验室则以虫卵产下为起点。
我们决定从头开始购买统一要用的试剂。协调工作简直是噩梦:我们安排供货商提供相同批次产品,并在同一时间更换批次。我们从相同的地方购买线虫和喂食的活菌,对培养线虫制定了严格的操作规定。我们制定了各类操作规范,甚至包括高压蒸汽消毒过程中烧瓶放置的位置。我们在同一时间从同一供应商那里买了线虫孵育器。
我们还要将各实验室的大量数据汇总到一个单独的数据库中。我们开发了一个iPad应用,使测量数据能够直接输入系统,而不用先将数据记在纸上然后再输入进去。这款应用提示我们完整记录每个培养基里线虫的情况,并确保每个实验的数据和元数据都经过校对(例如MY16和my16就是不同的品系名)。这一简单技术减少了记录错误带来的数据分析差异。
一旦这一系统就位,实验室之间的结果差异就能缩小。经过一年多的试点和细到极致的方法学讨论,我们几乎完全消除了实验室间线虫生存的系统性差异。
我们的数据还揭示了另一个重要的差异原因。即便是在同一个实验室进行完全相同的实验,我们也不能完全消除每一次实验之间的差异。经过反复实验,我们意识到某些品系的线虫本身就可以分成两类:短寿和长寿。出现这种区别的原因尚不明确,但是这个发现表明,如果我们想要了解某种化学化合物的作用,可能需要重复比预期更多的实验。我们同时还需要考虑研究的线虫数量以及进行的独立实验数量。
正是在这样的背景下,我们开始测试不同的化合物。为了研究遗传背景的影响,我们使用了不同的广杆属线虫,秀丽隐杆线虫和双桅隐杆线虫可能在显微镜下看起来一样,但实际在基因方面的差异可能就类似鲸鱼和蝙蝠。
我们的研究结果既鼓舞人心,也引人思考。我们预计能延长遗传差异如此之大的线虫寿命的化合物或将成为未来进一步研究的对象。(微观线虫可能因此被用于开发延缓人类衰老的药物。)我们发现有一种化合物能够广泛延长各类线虫寿命,而其他大部分化合物只对两到三类线虫有效,对其它的则有危害。这就引发了一系列令人关注的机制问题,或有助于我们揭晓基因如何影响个体对于老化干预措施的反应。
实验结果差异还可能来自方法学方面的微小不同。例如孵育器或者工作台温度的小范围波动以及喂养细菌的质量都可能对结果造成严重影响。
很少有研究如此精确地细化实验方法。事实上,有些鼠类研究人员认为将实验方法标准化会适得其反——与其去追求那些在严苛条件下才能获得的结果,还不如关注那些在宽泛条件下就可以重复得到的结果。
而我们认为另一种做法是发现实验结果的差异,然后尝试在一般实验环境下找出原因。目前我们正在努力寻找同一品系的短寿线虫和长寿线虫之间的分子差异。当初如果不是我们排除了几乎所有其它影响因素,我们根本就不可能发现同一品系的线虫还存在长寿短寿之别。
我们已经认识到,在进行生命科学探索的时候,描述研究方法和描述观察结果同样重要。ⓝ
Nature|doi:10.1038/548387a
点击“阅读原文”阅读英文原文
相关文章
版权声明:
本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件Chinapress@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。
© 2017 Macmillan Publishers Limited, part of Springer Nature. All Rights Reserved