解放科学记录,为何就是捍卫科学发展?|观点
pixabay.com
- 编者按 -
最近,国际科学理事会发布报告,提出科学记录都应普遍地开放获取,并保证后代子孙可以公开访问,并就从私人商业化垄断中解放科学出版物提出需要解决的问题。
长期从事数字信息服务、开放获取、开放科学研究与应用的张晓林博士就该报告进行了解读。
本文仅代表作者个人观点,不代表《知识分子》编辑部的观点。
撰文|张晓林(中国科学院文献情报中心、上海科技大学)
● ● ●
国际科学理事会(international science council,isc)在2021年2月发布《解放科学记录:让数字时代的学术出版为科学服务》(opening the record of science: making scholarly publishing work for science in the digital era)[1]。我和同事们对该报告(简称isc报告)做了翻译,中文版可从上海科技大学知识管理系统下载 [2]。
isc报告是在一个国际工作组共同努力下产生 [3],经过isc成员多次会议讨论,经由美国国家科学院、工程院和医学院召集的专家团队修改,经isc理事会同意,作为isc报告正式发布。它是对数字时代科学出版的一次全面体检,在各种纷杂信息、甚至有意无意的误导/掩盖/混淆/离间之中,梳理历史、解剖当下,抽丝剥茧、询证澄疑,正本清源、拨乱反正地提出了很多值得深思的观点和建议,为isc后续关于 future of scientific publishing 的研究提供了基础。建议关心科技出版、科学数据、科学基础设施的人们都读读(读全文、读原文、自己读)。
科学出版的原则
报告认为,科学所创造的知识要及时和可理解地传播到公共领域得到应用,才能最有效地为公众利益服务,而这也就是科学出版的目标。它从科学服务社会的目标出发,从科学出版的本源宗旨出发,提出了科学出版及所形成的科学记录(record of science)应该遵循的基本原则:
● 无论对作者还是读者,科学记录都应普遍地开放获取。
● 科学出版物应得到开放许可,允许再使用以及文本和数据挖掘。
● 严格和持续的同行评议对科学记录的完整性至关重要。
● 支持出版物结论的数据/观察资料应同时公布。
● 应长期保存科学记录以确保子孙后代能够公开访问。
● 应尊重不同学科的出版传统。
● 出版体系应适应新的机会,避免陷入陈旧僵硬的机制中。这些原则得到了国际科学理事会成员机构所代表的国际科学界的充分肯定。
把公共资源产生的科学出版物从私人商业化垄断中解放出来
报告指出,当前出版的绝大多数科学记录来自公共投资,公众(通过资助机构)、科研机构(通过提供各种基础条件)、科研人员(通过科研)在科学出版物的生产与传播中做出了最大占比份额的投资,但是科学界向期刊免费提供作品,将0008全讯注册的版权拱手让给出版商,担任出版商期刊的编委,无偿提供同行评审,然后不得不高价回购其发表的作品,而且在大多数情况下被 “合法地” 禁止通过文本和数据挖掘本由他们提供的已发表科学记录来进一步分析。
这是对以公共资助为主产生的知识资源无偿地进行私有化,还通过付费壁垒阻碍人们(包括创造这些知识的人们)获取这些资源。公共投资和研究人员在公共资助下为出版商所做的工作,被粗暴地占有,而最大商业出版商普遍维持着高额利润及其远超通胀的年度涨幅。这在经济上、法律上和道德上都是一种倒行逆施。
报告强调,把公共研究成果的0008全讯注册的版权转让给出版社不符合公共利益,0008全讯注册的版权转让对科学界造成了根本性损害,应该被视为一种不道德的行为。应该打破学术知识的私有商品性质,迈向一个适合学术交流本身目的的开放交流系统。
报告提到,开放获取有丰富的形态和多样化、有时还是复杂的发展过程,预印本库(preprints)和机构知识库作为科学出版的重要形式的作用日益增长,拉丁美洲等地区积极开辟公共支持下的开放获取新模式,许多可负担和充满创新的开放交流机制不断涌现,当然不同机制也存在争议和各自的可能的多面影响。但这都无损科学记录开放获取本身的正义性和发展潜力,反而暴露目前某些商业出版社采取的成本高、包容性差、外部性消极的机制的不合理性。
报告要求,所有科学记录都应该开放获取,而且都应该采用开放许可,最大限度地提高其他人在前人别人工作上进一步研究的能力,也把利用不断出现的各种新技术来挖掘科学记录体系中新知识的能力向所有人开放,不能再把来自于社会公共投资的产出成果的巨大科学、经济与社会发展潜力拱手让给商业出版社。科学界必须努力把出版市场发展成为最大程度优化科学价值的市场,出版社必须根据科学价值观(前面提到的科学出版七项原则)、服务和价格来竞争我们的市场。
让科学数据作为科学记录内在部分为科学和社会服务
报告指出,科学数据是科学成果中的一等公民和科学记录中的基本部分,在发布一项发现或创造时,为它提供证据的数据、模型和算法等也必须接受审查。因此,发表论文时,应该将支撑论文结论的科学数据同时发布,置于可公共获取的、可信赖的数据存储库中,保证科研数据能被获取、保障对科学结论及其证据的仔细审查和重复验证。这些数据还应被汇集和保护,遵守fair数据标准提供共享 [4],这对于维持科学的自我修正过程至关重要,也将有助于缓解过去不时出现的研究结果不能重复验证的情况。
严格来说,对于研究人员来说,不共享论文关联数据就是科学不端行为,所有科学期刊应该强制要求这点。而且,科学数据管理与共享应该作为数字时代科学研究的内在责任、有机部分和固有成本,而不是仅作为一个附加的可选项。
报告专门提到,通过开放科学和更大程度地共享数据,能提高科学探索的效率,有益于跨学科研究,有助于通过多维度数据流分析内在复杂问题。在covid-19疫情期间,中国科学家和中国机构首先向全球共享病毒基因序列,引领了全球范围研究数据和早期结果广泛快速的共享,有力证明了开放科学造福人类的巨大潜力。如何可持续地发展开放科学,并有效避免发展中的问题,仍然是一个巨大的挑战。
打破期刊计量指标对科学评价和科学发展的窒息性控制
报告认为,在科学出版被商业化垄断下,一些出版物计量指标被当成了主导科学评价、甚至决定科学选题和科研资源配置的手段。所谓的 “期刊影响因子”(jif或citescore),只是反映一种期刊若干年间发表论文的年平均被引次数的指标,所谓引用次数或者高被引也有很多复杂原因 [5],但有意无意之间,它们常常被作为评估论文质量甚至个人水平的替代指标。
当各类评审或聘任委员会直接或间接地用它们来做遴选时,进一步恶化了将本来用于具体、有限目标的、且具有内在缺陷的出版物计量指标拿来作为科学评估手段的做法。即使像高被引率、h指数等,也不是评价个人或群体研究成就的合适指标。
学术出版本应只是一种交流手段,却被人为扭曲为一种评估手段,以期刊出版物为基础的计量指标,被滥用为研究质量的代替物,从而赋予 “出版” 一种与其基本作用不符的含义,驱使学术界被锁定在可方便简单计量的、而不是真正有价值的工作中。
报告主张,要积极落实关于研究评价及其评价指标的dora宣言(declaration on research assessment)[6] 和莱顿宣言(leiden manifesto for research metrics)[7] 中的要求,构建科学家主导的分类和多元的评价机制。
报告警示,要注意那些几乎达到垄断地位的索引数据库(例如web of science和scopus)对科学评价和科学运行的影响,它们不但本身存在许多内在歧视性(例如排除了许多欧美以外出版机构、非英语出版物和非英语作者等),还在很大程度上已经对 “什么是值得研究的问题” “什么算好的研究成果” “什么是研究前沿” “如何评判科学影响力和竞争力” 等几乎形成了垄断性影响。结合下面谈到的趋势,我们需要赶快拨乱反正。
坚决捍卫科学界对数字时代科学体系自主可控的治理权
报告提醒,所有学科现在都在数字世界中运行,研究过程的所有元素都可以数字化表征、从而具有现实或潜在的可访问性、“可发表性”、甚至可计算性。整个研究生命周期具备了实现数字互操作性的可能性,所有开放的数字化的研究元素共同构成了一个开放关联的数字基础设施。
这种数字科研新常态,不仅支持研究过程和产出研究成果,而且还生产了大量关于研究过程和演进体系的信息,这对研究人员跟踪发展、大学管理和评价研究与研究人员、国家机构评估科研趋势和科研生产力,都具有极为重要的价值。
严峻的挑战是,主要商业出版商早已认识到这一现实,充分利用它们从出版中积累(科学界主动免费提供)的关于科研人员、机构、主题、影响力、合作网络中的丰富信息及其计算能力,迅速进入研究周期中的基础设施构建与科研服务行业。它们公开宣称自己是数据公司、分析公司和研究服务公司,强力向科研机构推销它们从出版活动数据中派生的研究评估系统、研究生产率工具、集成协同研究平台、在线学习分析与管理系统等,正积极寻求将整个研究周期及其管理和评估本身商业化。
这个过程,虽然包含了出版社维持其期刊出版市场份额的意图,但更根本地是重塑市场、商业模式和竞争能力。这时的竞争主要不是出版社之间的竞争,而是与科研机构、科研评价机构、科研战略研究机构、甚至科研管理与资助部门在其 “主责主业” 上的直接竞争。
例如,有的主要商业出版社早在 2015年就明确表示,打算越来越多地为大学、资助机构、政府服务,提供评价和改进研究生产力、优化科研资助决策的工具。君不见,许多科研管理部门的战略调研和规划部门,都被不少商业化出版商或分析服务商贴身围猎?许多高层 “战略研究” 结果的基础支撑都不得不依赖这些商业化机构了?
主要商业出版商已经在打造科研的数字服务(及评价与管理)平台,它们有能力(以及强烈的利益驱动甚至无孔不入的市场运作),来垄断围绕科研生命周期的各种服务,有能力非常迅速地投入和发展这些平台来跑赢或绕过那些旨在保护公众利益的监管、法律和治理机制,以致等社会发现某个平台对科学界和对社会造成严重损坏时,要么 “大而不能倒”、要么 “要死一起死”。
我们都见识过这种 “数字平台” 的威力。并非说私营部门不能向科学界和公共科研管理提供服务,但科学界应该问自己,全面数字科研下,基于大数据计算的科研规划、科研评估、科研管理、科技资源配置等等这些对科学未来至关重要的系统的治理,应该掌握在谁的手里?它关乎科学体系的治理权和发展。
科学界应该采取紧急行动来保持对基础设施、科学出版、数据和数据分析的控制,防止被大规模商业利益 “卡脖子” 或 “带歪路”。私营公司可以发挥作用,但它们是向由科学界治理的体系提供服务,而不是在一个它们统治的系统中。
isc将寻求与国家与国际资助者、大学、开放科学机构、出版商和科学家接触和合作,建立一个强大和基础广泛的变革联盟,以确保科学成果的有效传播和使用,并将此作为振兴开放科学的核心部分。
笔者深刻感到,这个报告不仅让我们进一步认识解放科学记录的必要性、紧迫性以及多样化的可能性,而且让我们直面正在聚集、甚至已经听得加呼啸的风暴。我们已经不能说前面第4和第5部分指出的现象还可能是黑天鹅,它们实际上已经是开始向我们冲来的灰犀牛。只是这次,在解放科学记录中,我们还会缺席或者迟到吗?
制版编辑 | 卢卡斯