我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告
对改进的数据再现性
文章

对改进的数据再现性

对改进的数据再现性
文章

对改进的数据再现性

阅读时间:

繁殖能力的另一位研究员的工作是科学的基石,然而,在许多情况下,科学家没有被别人访问数据或方法能够验证和自信建立在他们的发现。为什么数据再现性经常这样吗可怜的吗?又能做些什么呢?在本文中,我们看一些措施我们可以作为一个全球社区作为单独的科学家和改善的再现性和严格科学的努力。

为什么数据重现性很重要吗?


数据重现性是能够再生一个实验的结果,如科学出版物中提供的数据,通过使用作者的数据集、分析方法和代码。它是有别于复现性,重复实验使用不同的设置和到达相同的结果。都是坚实的科学研究的一个重要组成部分的一系列不同的原因。

“再现性是每个科学领域的基础,”说Susanna-Assunta桑松在数据准备副教授牛津大学和牛津e-Research中心副主任。“科学是关于连续性:发现使用别人的数据,使用我们的集体知识和进步。然而,无法复制的数据和知识,验证,因此信任帮助任何人。它缺乏任何潜在的和是无用的。”

除了能够信任的基础科学知识,也有认真对待数据再现性更自私的原因。Florian Markowetz是一个英国癌症研究中心的资深组长剑桥研究所和本地网络领先的英国再现性网络。在他的文章中,“五个自私的理由可再生产地工作”,1 他认为,数据重现性有几个好处超出保护的基础科学,包括避免数据分析灾害,使其更容易写论文和建立你的职业声誉。

“我有一个非常简单的数据再现性方法,“Markowetz说,“如果你想有一个很好的职业,如果你想做良好的科学,有一定的需求,环境必须建立以某种方式。例如,您必须了解别人如何进行他们的研究真正接触他们,与他们的结果。如果他们不跟我分享他们的数据和方法,我将永远无法理解他们所做的。这对我来说是问题所在。”

五个幸存的下一个实验室检查

即使有健全的质量体系管理你的分析实验室和一个强大的数据完整性(DI)的程序,你可能仍然担心准备监管检查。调查人员想要知道什么?他们会问什么?是你的团队准备?看这个网络研讨会发现期待什么、获得深入了解DI在检验过程中发挥作用,如何理解和回答检查员的问题。

看网络研讨会
担心数据再现性

近年来,已经有越来越多的关注数据的再现性的原因很多,与报道的“再现性危机“在某些领域。2为什么数据再现性日益令人担忧?

“首先,越来越多的学术数字资产的规模和多样性(包括数据、代码、模型、文章、预印本、协议)将压力的机制我们目前对同行评审和质量控制的信息是共享的,“桑松说。“第二,绝大多数在公共领域的数据和代码还没有可重用,原因很多。即使是公开可用的,经常是糟糕的描述,这意味着它不适合第三方使用”。

是数据集的相当大的障碍仍然需要大量的准备之前,研究人员可以开始重用他们回答研究的问题。准备数据共享是需要时间和精力的。

“必须承认的一件事是,在短期内,你需要采取的步骤,以使数据可再生的不让你的生活更容易,因为你必须学习各种新工具,“Markowetz说。“如果你只是想在一起一个表的所有信息,我敢肯定,Excel比学习如何编程,快收拾您的数据。所以,你必须把它作为一个长期投资。”

Markowetz的实验室,他们的方法重现性通过使用数据管理和版本控制工具在Python中,R和Github收集和分析的不同阶段。“一个普遍的问题是管理混乱的数据,可能会有十个或更多不同的科学术语的拼写或药物的名字,有人必须清理这——这是一个重要的一步整理数据,“他解释说。“一旦我们知道我们想要哪个方向分析,我们试图尽可能多的文件我们可以因为我们希望,如果成功,这将是我们的下一个。我们不想成为一个愚蠢的情况我们已经忘记了如何得到我们的结果。最实用的一步数据再现性的多学科环境是每个人都知道如何编程软件语言和知道GitHub等版本控制系统如何工作,然后你差不多了。”

避免假阳性ELISA数据

酶联免疫吸附试验(elisa)是常用的量化生物标志物血清,血浆和细胞培养上清液。这些样本含有多种因素干扰ELISA结果,通常被称为矩阵的影响。下载这个应用程序报告了解更多关于人类GDNF阻塞时试剂检测的重要性和测试的重要性阻滞剂在其他Quantikine埃尔莎板。

视图应用笔记

系统范围的努力改善数据再现性


值得庆幸的是,随着越来越多的资助者和出版商设定预期更多的开放存取数据,有更多的工具被开发来支持这些,还有更多的指导和培训可以在如何通过创新的方式工作。

2016年,一群国际公认的领导人一起在数据管理中,桑松合著公平的原则——一组指导原则,以确保当代数据资源和学术输出是可发现的,访问,可互操作和可重用(公平)。3这些已经被广泛采用科学的许多利益相关者的生态系统,并推动全球讨论更好的数据管理。

“资助机构现在巩固公平原则纳入融资协议,出版商美国公平背后来保持开放的前沿研究和在私营部门公平被采用,主要体现在政策生物制药,图书馆和工会,“桑松说。”的原则也被支持20国集团等全球和政府领导人,七国集团(G7)专家小组在开放的科学,和经济合作与发展组织(OECD)委员会科学技术政策,使他们一个事实上的全球优秀的研究规范数据管理和数据科学的先决条件。”

但是尽管公平原则具有加速全球讨论更好的数据管理在所有学科中,他们仍然需要转化为实践。尽管有一些改进,数据仍然很少遵循公平原则和他们继续有抱负的。

利用扩展的现实(XR)技术来推动实验室的工作效率

最大化的输出实验室,科学家需要能够依靠技术进步,创新的软件和改进的过程。最终,提高生产率,简化日常活动是一个主要组件成为未来的实验室。看网络研讨会,了解更多关于一个完全连接的生态系统的价值以及如何实现这一目标在你的实验室。

看网络研讨会

将公平原则付诸实践


全球许多社区正在努力把公赌欧洲杯赔率平变成现实。“这是被设计和实现了相关技术和社会基础设施,以及文化和政策变化,新的教育和培训支持的元素,“桑松说。“这不仅完成工作与研究人员,但与所有利益相关者参与数据生命周期:从开发商、服务提供者、图书管理员、杂志出版商,资助者,社会在学术以及在商业和政府设置。”

这样的一个例子是UKRN马库斯•穆纳佛教授,这是由布里斯托尔大学和剑桥Markowetz当地领导。“成立,因为再现性是一个大问题,比个别机构和个人学科,“Markowetz解释道。“所以,解决这个问题是有意义的全国更连贯的方法,和有很多的再现性网络现在在不同的国家。“研究国与国之间的文化和景观不同,所以我们必须解决这个在国家层面上。UK-wide主动性的提高再现性从心理学政治科学和生物医学跨学科。“UKRN解决这个问题在两个方面:通过高层与资助者和建设基础设施来支持再现性的合作,并通过培训基层如何进行科学地涵盖了一切从编程到领导。

“研究领导人真正需要的是在大学中更加明确支持数据再现性,“Markowetz说,“我们有这些大型国家努力像UKRN,和大量的兴奋和职业生涯早期研究者的参与,但是我们还没有中间部分,高层领导的个人大学认真地对待这个问题,改变他们的终身职位过程或学术职业发展框架,例如。”

在牛津,桑松帮助支持的努力UKRN和类似的国家计划在其他国家虽然她的工作数据准备组研究和开发方法和工具,以提高数据的重用。她的团队协同工作与国际利益相关者产生FAIR-enabling资源等fairshare合理的食谱与大型制药公司支持的工作UKRN及其同行在其他国家。4

不过,最终还是到个人实践研究社区。“社区需要帮助自己改变研究文化(我们做研究的环境)和其研究实践(我们如何做研究),“桑松说。“科学是一种团队运动,团队合作是困难的,但是你必须承担自己的角色。更好的数据意味着更好的科学。”

引用

1。Markowetz f .五个自私的理由可再生产地工作。基因组医学杂志。2015;16:274 . .doi:10.1186 / s13059 - 015 - 0850 - 7

2。贝克m . 1500名科学家的再现性。自然2016;533:452 - 454。doi:10.1038 / 533452

3所示。威尔金森博士Dumontier M, Aalbersberg IJ, et al。公平科学数据管理和管理指导原则[校正出现在出版科学数据。2019年3月19日,6 (1):6)。科学数据2016;3:160018。doi:10.1038 / sdata.2016.18

4所示。桑松SA McQuilton P, Rocca-Serra P, et al . fairshare作为一个社区的标准方法,存储库和政策。生物科技Nat》。2019;37:358 - 367。doi:10.1038 / s41587 - 019 - 0080 - 8

满足作者
乔安娜•欧文斯博士
乔安娜•欧文斯博士
广告