进入现代科学话语时代以来,科学界对数据的处理方式也在不断发展和变化。科学伦理方面认知的进步,以及文献数量的大量增加,导致可重复性等等的概念不断发生演化。
同样,数据收集的方法也已经产生了巨大的进步,收集海量的数据不在话下,因此数据本身也发生了根本性的变化。
此外,技术和统计方法的提升还使得对现有数据进行重新分析成为可能。
何时共享——共享的目的
下面我们从两个角度讨论数据共享的目的。
第一是与科学研究的严谨性有关。
自20世纪40年代以来,随着对科学的投资不断增加,这类投资要求强化问责制度。
随着科学从受资助的学术圈转向由政府和跨国组织支持的工业-学术综合体,学术界不断专注于如何确保问责制,以打击科研欺诈和低质量研究。
现代社会中,数据共享则是其中的关键。学术界乃至我们整个社会开始认识到,数据本身作为研究的产出,需要透明、归档,并在需要时能进行核查。
第二,数据共享的目的涉及到学术界的效率,可理解为未能共享数据的机会成本。
随着技术和方法的进步,数据是一种商品这一点变得显而易见。基于数据的科学发现和结论虽然有价值,但不能取代原始数据,因为数据本身可能有进一步的或未来的效用。
虽然还值得商榷,但是我们基本可以认为受技术改进影响的主要科学流程部分是数据的吞吐量水平。
吞吐量的巨大增长意味着旧数据成为集体数据库的一部分,可以用于新的、独立的研究、发现和结论。
学术界已经认识到,这意味着所有研究人员都需要共享数据,以确保潜在的研究结果和结论不会丢失。
毫无疑问,数据共享应该是所有研究的一个持续性和例行常规的行为。
如何共享——准备可共享的数据
基于以上原因,我们看到数据共享已经成为学术界成员的一项责任。然而,它与任何责任一样都需要资源来完成。就数据共享而言,主要是进行准备工作所需的时间投资。
可共享数据的准备工作包括3个关键部分。
文件
为了在未来的研究中处理和使用数据,需要清晰、一致的文件。
存储
数据必须存储在可靠的数据库中,在可靠的平台上,以便数据收集完成以后可以长期访问。
发现
元数据对于使用数据进行新的研究至关重要。如果没有人能发现这些数据的存在,数据共享就只是纸上谈兵,毫无实际意义。
数据收集者所遵循的具体协议将决定在什么阶段共享数据以及把数据保存在哪里。
这方面有很多不同方式,也可以共同使用,可以将数据与研究论文挂钩,或是两者独立处理。
下面我们来讨论数据共享的3个途径。
何处共享——常规进行数据共享
共享数据的方式在不同程度上由科研的资助方、出版商和科研人选择的独立平台决定。
科研资助方的政策中可能要求将数据共享。这样的情况下“哪里”就由资助方决定。某些情况下,作为基金管理过程的一部分,资助方会提供专有或附属的工具来提交数据。
其他情况下,资助方可能要求将数据作为科研论文出版过程的一部分来共享,见下一段的描述。
如果论文发表的期刊有数据共享的途径,数据可以作为稿件出版过程的一部分进行共享。
许多机构采用这种方式,不过目前各研究领域的情况不尽相同。科研人可以选择此种方式来主动共享数据,也可以通过这种方式来满足资助方对数据共享的要求。
最后,还有不与资助方或出版商挂钩的数据存储库,可以让科研人来自行决定共享数据,或以此来满足资助方对数据共享的要求。
这些数据库可能比主要资助方和出版商的数据库存在的时间短、不够成熟,所以要仔细做出选择,以确保数据可以永久共享。
联系我们 | 站点地图 | 友情链接 | 授权代理商 | 加入我们
© 2010-2024 中国: LetPub上海 网站备案号:沪ICP备10217908号-1 沪公网安备号:31010402006960 (网站)31010405000484 (蝌蝌APP)
增值电信业务经营许可证:沪B2-20211595 网络文化经营许可证:沪网文[2023]2004-152号
礼翰商务信息咨询(上海)有限公司 办公地址:上海市徐汇区漕溪北路88号圣爱大厦1803室