——基于诺贝尔生理学或医学奖的一种引领性原创成果文献评价指标高东平1* 车美龄1* 魏晓瑶1 杨渊1 林建海1(1.中国医学科学院医学信息研究所,北京,100020)摘要:为了挖掘“引领性原创成果”特征,本文对获诺贝尔“生理学或医学奖”学者代表性文献进行了分析,发现被引频次超过2000次,发表数年达到被引峰值,两方面特征具有一定代表性。其中,被引峰值平均数是14.25年,中位数是9年,将两种特征融合,给出了一种具有可操作性的“引领性原创”文献识别指标“睡美人2000”,并将其推广为一种以“时间-实践”双维度反应文献超前性、广泛关注性的评价范式:“睡美人T-N”。关键词:睡美人;睡美人2000;生物医学文献成果;文献评价指标An evaluation index of leading and original literature based on the Nobel Prize in Physiology or MedicineGao Dongping1* Che Meiling1* Wei Xiaoyao1 Yang Yuan1 Lin Jianhai1(1.Institute of Medical Information, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100020, China)Abstract: To explore the characteristics of leading original achievements, this paper presents a feasible index—Sleeping Beauty 2000—to identify leading original literature based on the analysis of representative literature regarding the Nobel Prize in Physiology or Medicine and promotes it as a “time-practice” two-dimensional evaluation paradigm that reflects the pioneering and widely concerned literature: “Sleeping Beauty T-N”.Keywords: Sleeping Beauty; Sleeping Beauty 2000; biomedical literature; index for literature evaluation科技创新已成为当今社会生产力发展的重要基础和标志,是经济发展中最重要的驱动力。坚持自主创新、建设创新型科技强国,是我国的重大战略决策和部署。加强原创性、引领性科技攻关已成为国家战略,如何在众多科技成果,尤其是科技文献中识别出引领性原创成果也愈发重要。科技文献的评价方式可以分为定性和定量两种。定性评价通常是指专家和同行评议,即由学科领域内的专家对文献的质量和价值进行评价。定性评价可以对科技文献的内容和形式同时进行评价,但其具有过程不够透明,结果不够客观等弊端[[2]]。定量评价是指利用科学计量指标对文献影响力进行评价,是对科技文献的形式评价。现有的定量评价指标虽因其难以对科技文献的内容质量做出准确、恰当的价值判断,一直受到学术界的质疑[[3]],但不可否认其具有计算过程简便、结果精确等特点,因此其仍是当前学术评价的重要方式。定量评价可以从文献、期刊和学者等不同维度和水平进行,大多数定量评价指标都可视为这几个维度的拓展或变体。目前被引频次、篇均被引频次、高被引文献数量、高被引文献比例和h指数等是应用较多的基本定量评价指标[[4]]。其中篇均被引频次主要是在期刊水平对文献影响力进行评价,其最常用的变体指标是期刊影响因子(Journal Impact Factor, JIF)[[5]]。以期刊影响因子为代表的SCI评价体系在很长一段时间里都处于国际期刊评价的领导地位,这也引发了期刊自引、互引等一系列学术不端行为[[6]]。针对影响因子“以刊评文”等诸多缺陷[2][[7]][[8]][[9]],学者们利用时间窗口、学科领域等特征进行了各种改进,提出了多种新指标,如历史影响因子[[10]]、特征因子[[11]]、加权生命周期影响因子[[12]]、学科影响因子[[13]]等,但大部分仍仅停留在概念层面。高被引文献(Essential Science Indicators(ESI)数据库定义)是指近十年被收录的、被引频次位于同学科前1%的文献[[14]]。高被引文献数量、高被引文献比例相关的指标也都是从期刊的层面进行影响力评价,h指数及其变体则是从学者的层面进行评价。此外,随着科研社交网络平台的发展,Altmetrics计量指标成为传统计量方法的补充。综上可知,虽目前评价文献的量化指标众多,但针对“引领性原创”文献的定量评价指标研究仍较少。本文面向科技文献,着重关注生命科学或医学领域,对诺贝尔生理学或医学奖得主发表的与获诺奖相关的文献进行了实证分析,在此基础上提出一种新的具有可操作性的“引领性原创”成果文献评价指标“睡美人2000”。并且融入了基于时间及实践评价文献的思想,提出了“睡美人T-N”的指标范式。
2.基于“诺贝尔生理学或医学奖”引领性原创文献的特征分析诺贝尔生理学或医学奖是医学界的最高奖项,是衡量国家医学科学实力的重要指标。获得诺贝尔奖的科学家也通常被称为世界顶级科学家,其发表的与获诺奖内容相关的文献也通常被认为是典型的“引领性原创”文献。因此,分析诺贝尔生理学或医学奖得主所发表文献的特征,对识别“引领性原创”文献具有重要意义。本文对2000-2022年诺贝尔生理学或医学奖得主(以下简称诺奖得主)所发表的文献及与诺奖内容相关的文献进行了多维度统计分析。学者的个人信息来源主要为诺贝尔奖官网,同时参考了百度百科、人物传记等资料,保证数据的准确度和可靠度。学者文献的各项信息均来源于Web of Sciences数据库。虽然诺奖的评价对象是一项成果,而不是单篇文献,但文献往往是成果最重要的载体。因此,我们将2000-2022年获诺贝尔生理学或医学奖的56位得主发表文献中与诺奖主题相关的、被引频次排名最高的文献进行了分析和研读。虽然综述通常有较高的被引频次,但其创新性较低,为保证文献类型的统一性,本研究将综述文章排除在外,不纳入分析。被引频次是文献计量学中被用来测度学术影响力和认可度的重要指标,虽不能直接反应学术文献的价值,但学界普遍认为被引频次达到一定数量时,一般而论是学术文献原创水平的标志[[24]],文献被引频次间接表征了该篇文献对科学发展的价值[[25]]。从学术文献的高被引频次者那里可以发现杰出的人才。在“引文桂冠奖”甄选过程中,参考的数值是被引频次超过2000。“引文桂冠奖”组织方曾表示:被引频次达2000次或以上极为少见。“引文桂冠奖”得主通常从这些文献的作者中甄选产生。他们的研究成果拥有非常高的被引频次,对科学发展具有极大影响,有些甚至做出了变革性的贡献[[26]]。我们将诺奖得主在获诺奖前发表的、和获奖主题相关的、被引数最高的文献称为“高被引代表性文献”。检索每位诺奖得主发表的文献,在56位获奖学者中,有41人(73.21%)有被引频次超2000的文献,其中26位有多篇文献被引频次超过2000,有15位只有一篇被引频次超2000的文献。具体分布情况见图1(a)。图1 2000-2022年诺贝尔生理学或医学奖得主文献特征分布. a:得主被引超2000的文献的数量分布; b:得主高被引代表性文献被引频次分布; c:得主高被引代表性文献所在期刊分布; d:得主高被引代表性文献JIF分布Fig 1 Feature distribution of literature by Nobel Prize winners in Physiology or Medicine in 2000–2022. a: Distribution of literature with citations exceeding 2000; b: Distribution of citations for highly cited representative literature; c: Distribution of journals for highly cited representative literature; d: Distribution of JIF for highly cited representative literature将每位获奖学者发表的与诺奖获奖主题相关文献中被引频次最高的一篇文献纳入研究进行分析,共纳入文献53篇[27]。如图1(b)所示,在高被引代表性文献中,62.26%的文献被引频次超过了2000。被引频次超过2000的文献中,发表时间最早为1973年,最迟为2010年。截至2023年7月,被引频次过万的有三篇。第一篇是2012年得主Shinya Yamanaka 2006年发表在Cell期刊上的一篇名为“Induction of Pluripotent Stem Cells from Mouse Embryonic and Adult Fibroblast Cultures by Defined Factors”的文章,这篇文章发现了小鼠的成体细胞是可以被重编程为诱导多能干细胞的,颠覆了细胞生长过程不可逆的错误认知,革新了当时人们对细胞和有机生命体发育的理解。另外两篇分别是2006年得主Andrew Fire和Craig Mello于1998年发表在Nature上的文章“Potent and specific genetic interference by double-stranded RNA in caenorhabditis elegans”和2002年得主Sydney Brenner在1974年发表在Genetics上的文章“The genetics of Caenorhabditis elegans”,他们分别因发现RNA干扰机制和程序性细胞死亡而获奖。纳入分析的53篇高被引代表性文献刊登的期刊有16种,具体期刊及其数量分布详见图1(c)。本研究采用期刊影响因子JIF[28]来评价期刊的影响力,高被引代表性文献所在期刊的JIF分布情况见图1(d)。由于纳入的文献,有些发表时间太早,无法确定发表当年的JIF,故以可以检索到的期刊最早的JIF代替,即以1997年期刊的JIF代替1997年以前期刊的JIF值作为统计指标。1997年及以后发表的文献所在的期刊的JIF以发表当年JIF作为统计指标。其中,期刊“Journal of Physics C: Solid State Physics”于1988年停刊,故未统计其JIF的值。所有文献的所在期刊JIF平均水平为23.25(停刊期刊的JIF按0分计入,若同年的同一本刊仅计算一次,则期刊的JIF平均值为17.47)。期刊的JIF值大小不一,JIF高的期刊是1998年的Cell,其JIF为38.69。JIF最低的期刊是Planta Medica,其JIF为1.43。纳入的文献较多发表在知名期刊上,但也有19.23%的高被引代表性文献刊登期刊的JIF小于10。由诺奖得主的这些高被引代表性文献发表期刊可见,引领性原创成果与发表期刊的影响因子没有必然联系。将文献按照被引次数达到峰值所用的年数进行统计,文献随着被引峰值年数的累积篇数占比分布见图2。高被引代表性文献中,最迟的在发表后第48年才到达被引峰值,该文献为2002年生理学或医学奖得主Sydney Brenner在1974年发表的“The genetics of Caenorhabditis elegans”。高被引代表性文献被引频次达到峰值所用的年数有较大的差异,最大和最小值相差45。在纳入研究的53篇高被引代表性文献中,没有发表3年内(不包括3年)到达被引峰值的文献75.47%(40篇)的文献在5年后(包括5年)达到被引峰值,将近一半的文献在发表10年后(包括10年)才达到被引峰值;纳入文献达到被引峰值平均年数为14.25年,中位数为9年。图2 2000-2022年诺贝尔生理学或医学奖得主高被引代表性文献的被引峰值年数分布Fig 2 Distribution of citations peak of literature by Nobel Prize winners in Physiology or Medicine in 2000–2022诺奖文献大多具有十分重大的创新意义,这些引领性原创研究往往是提出一种新理论,甚至是在“无人区”探索的结果,这些成果所体现出的思想或提出的理论具有一定超前性或颠覆性。超前性研究往往由于科学共同体不知其存在或意识不到其潜在知识价值,因此易被忽视;变革性研究由于颠覆现有研究范式,科学共同体对此保持较大的心理距离,从而低估其知识价值,因此易被抵制[[29]][[30]],诺奖文献被引频次普遍会在发表数年后才达峰值的特征也印证了这一点。“睡美人现象”(Sleeping Beauties)可以在一定程度上反应出这种超前性。2004年,荷兰科学计量学家van Raan提出科学中的“睡美人现象”[[31]]:睡美人文献在发表后相当长的一段时期内零被引或低被引,仿佛在沉睡,而后突然高被引,就像被唤醒一样。睡美人这一指标动态地反映了文献被引的时序特征,从科学计量学角度对延迟承认现象作了定量描述。与其他类型的文献相比,睡美人文献的引文曲线表现为“初始长期未被引,而后突然高被引”,这一典型特征对于分析科学研究前沿、揭示科技发展规律提供了新途径,同时也为发现前沿性文献提供了新的思考方向。van Raan教授定义的“睡美人”标准为:(1)沉睡期内年均被引不超过2次;(2)沉睡期至少5年;(3)唤醒期4年内被引频次超过20。对此标准学者们也有过很多争议和发展[[32]][[33]][[34]][[35]]。但对睡美人文献的涵义学界是具有共识的。睡美人现象可以很好的反应成果的延迟承认,排除利益冲突等因素外,我们认为延迟承认的重要原因是成果在发表当时具有一定的超前性。图3 2000-2022年诺贝尔生理学或医学奖得主发文总量及h指数分布. a:得主发文总量分布; b:得主2023年h指数分布Fig 3 Distribution of literature number and h index of Nobel Prize winners in Physiology or Medicine in 2000–2022. a: Distribution of literature number; b: Distribution of h index2000-2022年诺贝尔生理学或医学奖得主的2023年h指数差异较大,见图3(b)。h指数最大的为180,最小的为10。h指数用来评价学者的学术贡献与学术影响力,兼顾了学者发表文献的数量与质量,但无法反映学者的高被引代表性文献,也就难以评价发表文献数量较少但质量极高的学者。3.基于时间和实践两个维度评价“引领性原创”文献——睡美人2000通过对诺贝尔生理学或医学奖得主发表的高被引代表性文献进行分析,可以看到发文总量、h指数、JIF等定量指标差异均较大。在这53篇引领性原创文献中,28篇(52.83%)文献均满足总被引频次超过2000,且在发表5年及以上年度被引频次达到峰值。因此我们提出一种评价“引领性原创”的指标:“睡美人2000”。即发表5年后被引频次达到峰值,且被引频次超过2000的文献,我们可以认为其是“引领性原创”文献。“睡美人”特征用以反映发表初期较为沉寂而后被引频次达到峰值的特点,“被引频次超2000”这一超高被引频次特征用以反映在学术领域获得极高的认可和影响力。在哲学层面,“睡美人2000”旨在体现用时间和实践作为评价“引领性原创”的思想。考虑到每个学科不同的学术成果内容和文献传播特点,以及不同的评价目的,我们也可将“睡美人2000”推广为一种反映“引领性原创”文献的超前性、已获得广泛关注的可操作性评价范式:“睡美人T-N”。“睡美人T-N”文献指总被引频次超过N,在发表T年及以上年度被引数达到峰值的文献。对于T和N的选择,学科不同、评价目的不同,均可选择不同的数值,甚至于N也可用分学科的前1%,或前0.1%等相对数值进行代替。为了挖掘“引领性原创成果”特征,本文基于对“获诺贝尔生理学或医学奖”的成果的相应代表性文献的分析,给出了一种具有可操作性的“引领性原创”文献识别指标“睡美人2000”,并将其推广为一种“时间-实践”双维度反映文献超前性、获得广泛关注的评价范式:“睡美人T-N”。“睡美人2000”在“生理学或医学”领域是一个仅有极少数研究成果可达到的指标,如上述分析所示,21世纪获诺贝尔生理学或医学奖的文献也不全部满足。被引频次超过2000在一定程度上反映了文献的重要性和被认可度,多为开创一个新的研究领域或发现重要突破成果。通过在WOS上对我国学者发表的文献进行检索分析可以发现,我国被引频次超过2000的生物医学领域文献仅有88篇,而满足“睡美人2000”的文献仅有27篇。“睡美人2000”主要目的是评价筛选生物医学领域具有极高创新性、前瞻性的文献,故纳入了2000年以来诺贝尔生理学或医学奖得主的代表性成果文献进行实证分析,尽管纳入文献的数量较少,但代表性极强,其论证结果也体现了“睡美人2000”可以体现大部分引领性成果文献的共性。本文仅对WOS数据库中的文献数据进行分析,而诺奖评价的并非单篇文献,而是领域内重大成果。且受科学家国别所限,相关研究成果也不仅仅是以英文语种发表,但WOS数据库仅能检索到本研究需要的英文文献,因此这也是本文分析的局限性之一。另外,由于科学计量学中的定量指标均为“文档”特征指标,其并不直接涉及科学活动和科学成果本身,因此,定量指标有其固有的局限性。但我们通过对诺贝尔生理学或医学奖得主高被引代表性文献进行分析可见,引领性原创成果多具有在发表初期较为沉寂,经较长时间后逐步达到超高被引频次的特点,虽仍不直接反映内容价值,但反映了引领性原创成果具有超前性和经得起时间和实践检验的特点。参考文献:
- 本文受国家社科基金重大项目(19ZDA041);中国医学科学院医学与健康科技创新工程(2021-I2M-1-056)资助。
- Fu W T. Overview of peer review of Chinese academic journals (in Chinese). Chin J Sci Tech Period, 2019, 30: 819–826. [付伟棠. 我国学术期刊同行评议研究综述. 中国科技期刊研究, 2019, 30: 819–826.]
- Zhang Y M. Challenges and approaches: peer review in the digital era (in Chinese). Theory Reform, 2023, 3: 24–42. [张耀铭. 挑战与进路: 数字时代的同行评议. 理论与改革, 2023, 3: 24–42.]
- Waltman L. A review of the literature on citation impact indicators. J Informetr, 2016, 10:365-391.
- Bu Y, Xu J W, Huang W B. Citation-based quantitative evaluations on scientific publication: a literature review on citation-based impact indicators (in Chinese). Doc Inf Knowl, 2021, 38: 47–59. [步一, 许家伟, 黄文彬. 基于引文的科学文献定量评价: 引文影响力指标评述. 图书情报知识, 2021, 38: 47–59.]
- Yang H Y, Ren S L, Jiang K, et al. Inappropriate and irregular citations of academic papers in pursuit of fame and fortune and its preventive measures (in Chinese). Acta Editol, 2022, 34: 596–602. [杨海燕, 任胜利, 蒋恺, 等. 基于追名逐利的论文引用失范现象与防范措施. 编辑学报, 2022, 34: 596–602.]
- Wen J X, Ning B. A brief analysis of the series of changes to journal citation report and impact factors and their impact (in Chinese). Publish Res, 2023, 3: 57–61. [温景骁, 宁笔. 期刊引证报告和影响因子的系列变化及其影响简析. 出版发行研究, 2023, 3: 57–61.]
- Fang H L. Influencing factors of the foreign periodicals papers cited peaks research based on library and information science journal included by SSCI (in Chinese). Chin J Sci Tech Period, 2015, 26: 1200–1204. [方红玲. 国外期刊论文被引峰值年代及其影响因素研究——以SSCI收录图书情报学期刊为例. 中国科技期刊研究, 2015, 26: 1200–1204.]
- Ma H C. Study on the concept, function and improvement strategy of the impact factors of academic journals (in Chinese). J Shandong Norm Univ (Soc Sci), 2020, 65: 118–126. [马合成. 学术期刊影响因子的概念、功能及其改进策略. 山东师范大学学报(社会科学版), 2020, 65: 118–126.]
- Yu L P. History impact factor: a new academic journal stock assessment index (in Chinese). Libr Inf Serv, 2015, 59: 89–92. [俞立平. 历史影响因子: 一个新的学术期刊存量评价指标. 图书情报工作, 2015, 59: 89–92.]
- Liu Y H, Hua W N. A new journal evaluation indicators——eigen factor (in Chinese). J Intell, 2010, 29: 122–126. [刘艳华, 华薇娜. 期刊评价新指标——特征因子. 情报杂志, 2010, 29: 122–126.]
- Hou X, Lv J B. Impact factor in consideration of weighted life cycle (in Chinese). J China Soc Sci Tech Inf, 2013, 32: 961–967. [侯湘, 吕建斌. 加权生命周期影响因子对期刊评价的影响. 情报学报, 2013, 32: 961–967.]
- Dang Y R. Subject impact factor: evaluation the development trend of various disciplines in China (in Chinese). Inf Stud Theory Appl, 2001, 4: 265–268. [党亚茹. 学科影响因子: 我国各学科发展趋势评价. 情报理论与实践, 2001, 4: 265–268.]
- Zhang B, Wu H, Gao d B, et al. Research on identification of innovation fronts based on potentially high cited papers and high value patents(in Chinese). Libr Inf Serv, 2022, 66: 72–83. [张彪, 吴红, 高道斌, 等. 基于潜在高被引论文与高价值专利的创新前沿识别研究. 图书情报工作, 2022, 66: 72–83.]
- CiteScore=(某刊前三年所发表文献在统计当年的被引用次数)/(该刊前三年发表文献的总篇数)。目前,Elsevier旗下产品均采用CiteScore指标对期刊进行评价。
- Hirsch J E. An index to quantify an individual’s scientific research output. Proc Natl Acad Sci USA, 2005, 102:16569-16572.
- Egghe L. Theory and practice of the g-index. Scientometrics, 2006, 69:131–152.
- Alonso S, Cabrerizo FJ, Herrera-Viedma E, et al. hg-index: a new index to characterize the scientific output of researchers based on the h-and g-indices. Scientometrics, 2010, 82:391-400.
- Anand B, Sudhakar T. EM-index: a new measure to evaluate the scientific impact of scientists. Scientometrics, 2017, 112:659–677.
- Aziz NA, Rozing MP. Profit(p)-index:the degree to which authors profit from co-authors. PLoS One, 2013, 8:e59814.
- Zhang CT. The e-index,complementing the h-index for excess citations. PLoS One, 2009, 4:e5429.
- Xie H L, Camille T. An overview of altmetrics research (in Chinese). Sci Focus, 2019, 14: 28–34. [谢华玲, 卡米尔·汤姆森. 国内外Altmetrics研究综述. 科学观察, 2019, 14: 28–34.]
- Yang H, Cai Y H. Increasing frequency of quotation: significance, objective factors and subjective efforts (in Chinese). Eval Manag, 2010, 8: 24–27. [杨华, 蔡言厚. 论提高被引频次的意义、客观条件和主观努力. 评价与管理, 2010, 8: 24–27.]
- Wang H Y. Coming out zero and awakening “sleeping beauty” (in Chinese). J China Soc Sci Tech Inf, 2014, 33: 113. [王海燕. 无中生有与唤醒“睡美人”. 情报学报, 2014, 33: 113.]
- Wang L, Yue W P. Selection of Nobel Prize level scientists based on citation analysis——an overview of clarivate analytics citation laureates (in Chinese). World Sci-Tech R&D, 2019, 41: 447–454. [王琳, 岳卫平. 基于引文分析的诺贝尔奖级科学家遴选——科睿唯安“引文桂冠奖”详解. 世界科技研究与发展, 2019, 41: 447–454.]
- 因获诺奖学者中有合作发表文献情况,故纳入文献数少于获诺奖学者数。
- Campanario J M. Rejecting and resisting Nobel class discoveries: accounts by Nobel Laureates. Seientometrics, 2009, 81:549-565.
- Fang H. An explanation of resisted discoveries based on construal-level theory. Sci Eng Ethics, 2015, 21:41-50.
- van Raan A F J. Sleeping Beauties in Science. Scientometrics, 2004, 59:467-472.
- Li J, Shi D, Sleeping beauties in genius work: When were they awakened? Asso Info Sci Tech, 2015, 67:432-440.
- Ke Q, Ferrara E, Radicchi F, et al. Defining and identifying sleeping beauties in science. Proc Natl Acad Sci USA, 2015, 112:7426-7431.
- Coelho D H, Kirk A, Miller D, et al. Sleeping beauties in the otolaryngology-head & neck surgery literature. Laryngoscope, 2020, 130:609-614.
- Du J, Wu Y S. A new parameter-free index for indentify “sleeping beaty” literature (in Chinese). Inf Stud Theory Appl, 2017, 40: 19–25 [杜建, 武夷山. 一个用于识别睡美人文献的新的无参数指标——基于“Science”和“Nature”上睡美人文献的验证. 情报理论与实践, 2017, 40: 19–25.]
百度浏览
来源 : iNature
版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)