跟上工作:技术在可再现研究中的作用

Allbio标识关于“研究中的可重复性”的讲习班,一个隐喻的瓶子砸碎了基因组分析中心(TGAC)'闪亮的新培训设施

在黑客,标记笔和一系列茶和饼干的推动下,研讨会(研究科学家,博士生,编码人员,资助者和出版商的混合物)着手提出问题:'可再现研究的障碍是什么?'

合影
小组照片(单击放大)

奔跑站立

Allbio-logo建立了Allbio是为了将生物信息学的技术带入各种各样的生物学学科,但是随着这次研讨会,它逐渐跨越了Research的Flipside:Publishing。

无论是数据还是论文,很明显,技术进步在改善科学进步的方法方面需要提供很多提供。

以前已经完成了。BioMed Central建立在这样的原则上,以至于全球网络的新广泛可用性使开放式访问权限,仅在线出版在我们进入新千年时要做的明智的事情。

在激进的时候,Biomed Central的愿景将被证明具有传染性,并且开放访问模型现在已被所有生物医学领域的发行商的数百篇期刊采用。

生态系统

但是,我们不想在2000年及时冻结:技术进步继续重新定义出版物的可能性以及报告哪些类型的数据,我们需要对它们做出回应。

大型生物数据集及其随后的生物信息学分析被传播的方式肯定会发生。通常,其中一个或两个根本没有传播。默认值是数据和代码转储,其策划最小,最小发现性和最小的互操作性。

从研讨会中出现的想法包括呼吁开发生态系统,这将使研究人员更容易更改发布数据和代码的方式。

至关重要的是,这将使其他人不仅可以在不重复的情况下重复使用和回收利用,还可以测试研究中提出的索赔的严格性。

没有节奏

对代码和生态系统的关注似乎有生物信息学弯曲 - 鉴于Allbio和TGAC的起源,这是可以预期的,因此可以对研讨会的组成 - 但可重复性的原则应普遍适用于生物医学中的所有领域。

BMC生物学很高兴最近能够在这使数十年的古老教条拿着果实苍蝇以典型的节奏剥夺了他们的求爱歌曲。

大卫·斯特恩
大卫·斯特恩

大卫·斯特恩(David Stern)的新实验和对原始数据的重新分析的结合表明,这些节奏根本不存在。正如他在伴随的博客文章,所谓的节奏仅仅是将数据组合在一起的方式。

在Allbio研讨会的设想生态系统中,怀疑论者有可能在发布后立即与分析进行互动。希望是,有了这样的开放性,在致命缺陷暴露之前,将少于30年。

甚至讲习班也开放

hackpad驱动的研讨会的奖励是,所有使用Motherpad URL的人都可以访问所有讨论,想法和结果。好吧,包括您,因为这里是:https://pad.riseup.net/p/orb14

亮点包括下一代测序分析中的原则标准清单为dummies,使用RNA-seq管道作为一个例子,以及关于建立一个的讨论Docker- 以促进计算分析的可重复性的生态系统。Docker仅是去年首次发布的,这是一个具有启发性的例子,说明技术如何继续改变科学出版中的可能性。

裸mole鼠
点击放大

该研讨会位于TGAC,周围有许多我们瞄准的工具和实践的精彩例子。

从本月发布裸mole鼠基因组资源领导biojs数据可视化项目,这提醒人们,已经在进行许多计划,以提高研究的开放性和可重复性。

创意激励措施

也就是说,这些原则远非普遍接受,因为plos发现当他们面对反开放的数据反弹时。在被接受的地方,就时间和精力而言,成本可以证明与意识形态一样大。

我们可以采取的三个方向降低这些障碍很明显:

(1)创建用于数据和代码沉积的用户友好,快速的系统;

(2)对研究人员如何共享数据和代码的更多培训;

和,(3)以一种可能使时间和精力值得的方式激励良好实践。

甚至公共便利也可以授予“开放数据证书”(单击以放大)
甚至公共便利可以授予“开放数据证书”(单击以放大)

即使涉及激励措施,新技术也可能发挥作用,欧洲生物信息学研究所的作用丹·布尔瑟(Dan Bolser)

他提出了使用比特币- 像加密货币一样奖励良好实践,使用诸如'打开数据证书'。

指标还可以帮助激励,为研究人员提供简单的数字,以证明其贡献和对传统引文测量以外的社区的影响。

但是,尽管目前存在Altmetrics的时尚,但在使用情况下,生物信息学软件工具和生物数据资源的普及仍然没有标准指标。

其他人则赞成“大型棍子”方法,并从期刊编辑,评论者和资助者执行标准方面更加积极。最终,未来很可能在于胡萝卜,棍棒,训练和更好的系统的混合。很可能是由尚不存在的技术驱动的。

查看有关生物学主页的最新帖子bob电子体育竞技

注释