注册 | 登录 | 充值

数据错误=学术造假?必须弄懂!

媒体聚焦

2022-10-06   来源 : 掌桥学术论文

10879 0


时光荏苒,转眼间,2022年已经又到了9月份了,年底即将毕业的硕士、博士研究生们,也到了毕业论文的收官阶段了。

前几天,很多学生找到我,问了同一个问题:

论文的基础数据如果有误,算不算学术造假?会有什么后果?如果在令人“闻风丧胆”的数据真实性检查中被发现,会有什么后果?如果在答辩的时候被教授指出问题,该怎么做?


数据造假者,所求不过利益二字

马克思在《资本论》中引用过这样一段话:当利润达到百分之十的时候,便有人蠢蠢欲动;当利润达到百分之五十的时候,有人敢于铤而走险;当利润达到百分之一百的时候,他们敢于践踏人间一切法律;而当利润达到百分之三百时,甚至连上绞刑架都毫不畏惧。为了攫取更多利润,各行各业中都有假货的身影,科研行业也难逃窠臼,也存在弄虚作假的现象,数据造假就是其中之一。

普通假货被制造出来的主要动机是攫取更大的利润,科研行业弄虚作假的主要动机包括发表论文、骗取项目经费和专利补贴、稳固自身江湖地位等……数据造假的方式方法也有很多,其中最常见的就是捏造和篡改数据。

熟能生“巧”,“巧”夺天工

在江湖公认的“十大学术不端行为中”,伪造数据(Falsification of Data)排行第三,其余上榜通缉犯包括盗用别人的观点(Misappropriation of Ideas)、抄袭(Plagiarism)、自我抄袭(Self-Plagiarism)、不当使用署名权(Impropriety of Authorship)、违反法律或监管要求(Failure to Comply with Legislative and Regulatory Requirements)、违反普遍公认研究做法(Violation of Generally Accepted Research Practices)、故意不支持别人验证自己的研究结果(Failure to Support Validation of your Research)、故意对验证实验结果不做回应(Failure to Respond to Known Cases of Unsuccessful Validation Attempts)和涉嫌不端行为的不当举动(Inappropriate Behavior in Relation to Suspected Misconduct)。

笔者曾经见过一名“数据大牛”,由于其人在实验室地位不高,因此组里大部分的数据处理都要经过他的研究分析处理。当然,他的目的只是为了处理掉实验数据中完全不符合逻辑的信息,比如噪声点等等。结果后来他无师自通,在数据处理这条羊肠小路上走出了自己的阳关大道,他曾经骄傲的说,在全中国,数据处理这一行比他强的人,两只手就能数出来,而且因为数据处理很难发论文,大部分数据处理人才都流失到工业行业了。据他介绍,一个科研项目中,从设备调试开始,到实验样本挑选制备,再到整个实验过程,最后到数据筛选处理,每一步都有操作空间。就以实验过程来说,一个实验过程,通常有十几个甚至几十个步骤、参数,还有数以百计千记的阈值,同一组数据,只要微微调整上述任意一个数值,实验结果可能完全不同。
在学术界,有一个词语叫做“诚实性错误”,这个词语是指科研人员在主观上认为其行为正确,但其实客观上其行为与实际不相符,属于“非有意”的行为。
出现“诚实性错误”的原因有很多,比如因为科研人员水平不足,误以为其方式方法正确;或者科研人员因一时的疏忽大意导致“差之毫厘、谬以千里”,但是原因一定都是非恶意原因。在笔者搜集的我国相关资料中,未发现“诚实性错误”成为学术不端行为主观要件的案例,也未发现过失行为承担学术不端责任的相关规定。

数据大牛:揭露数据造假的惯用手段

近二三十年来,随着科学技术的迅猛发展,国内外的科研数据造假情况也愈演愈烈,成为社会关注的热点问题。在医学、物理、生物、心理学等多个领域中也陆续爆发出对于论文数据真实性的质疑情况,导致大批期刊甚至顶刊论文获撤稿处理,相关责任人遭到应有的处罚甚至锒铛入狱,其中包括震惊世界的小保方晴子和舍恩事件。
图左:扬·亨德里克·舍恩 (Jan Hendrik Schön);图右:小保方晴子

“数据大牛”向笔者透露,科研数据造假的方式方法,主要包含以下3种:

1 在已知的情况下故意使用不合理的研究方法

这种数据造假方式,不仅在字面上很难理解,在实际鉴别过程中,也非常具有欺骗性,非专业人士无法区别其与“诚实性错误”,即无法甄别其是因为尝试新方法、还是因为技术水平不足选错方法、还是只是明知故犯而已。首先,大概解释一下这种数据造假的情况,就是故意设置为错误的实验条件、或者选用不合适的实验对象、或者套用错误的理论模型及公式,以达到呈现出符合自己想要的结论数据的目的。
那究竟如何发现这种数据造假呢?一般情况下,就是看论文对于实验的基本方法、条件假设、输入输出条件等是否全部进行了阐述说明,即实验过程是否能够复现。如果完整且详细,那么这篇论文99.99%概率是“诚实性错误”,因为严肃认真地使用一个错误的办法进行科学实验,得到的数据都不能被认为是造假,最多是“诚实性错误”,甚至还可能发现新的突破。数据造假的一个重要特征就是隐瞒实验信息,使自己的实验过程无法被复现,从而达到瞒天过海的目的。

2 故意隐瞒、歪曲数据含义从而得出错误结论

这种数据造假方式,在字面上很好理解,但是在实际鉴别过程中,也非常具有欺骗性,非专业人士无法区别其与“诚实性错误”,即无法甄别作者是真的菜的抠脚导致发生这种低级错误,还是作者真的是天才提出不同的观点看法导致结论存在分歧,还是只是明知故犯而已。一般这种数据造假方式的主要表现形式包括通过隐瞒或歪曲数据含义及重要事实,或者通过选择性虚构逻辑、以偏概全的解释方法,以达到呈现出符合自己想要的结论数据的目的。
这种数据造假真的很难甄别,目前也只是通过看实验结论是否存在误导性的利益目的,来猜测是否造假。因为很多人在进行狡辩的时候,会说自己就是一不小心错了,或者自己就是看法与其他人有分歧导致的,指控造假就是破坏学术自由。毕竟科学真理是掌握在少数人手里的,这种情况如果随意就判了作者学术造假的“死刑”,对于科技创新和表达不成熟的新观点都是具有阻碍作用的。

3 故意伪造及篡改数据

这种数据造假方式,在字面上很好理解,同时也是最常见且最没有争议的数据造假方式。这种造假方式主要包括:“无中生有”地编造或添加数据,将原始数据中不符合预期结论的数据(不含“噪声点”等明确误差)删除,对自己无法解释的数据进行隐瞒处理……唯一的争议,就是对于“有效数据”的处理问题算不算数据造假。我们都知道,很多技术上的突破都是难以复现的(例如GPT-3),或者由于当今科技水平的局限性,很多数据是无法得到解释的。如果实验方法和实验数据都没有错误,那这些方法和数据应完整地保留在论文中,从而保持数据和结论的完整性,也可以给后人一个突破机遇。然而,大多数科研人员考虑到同行评审的责难,不愿意保留自己无法解释的数据。因此,每个科研人员是否有权利拒绝公布自己无法解释的数据,一直是一个存在争议的问题。
总之,简单的添加假数据或者删除真实数据能够直接认定为数据造假,但是隐瞒无法解释的数据能够被认定为数据造假一直存在争议。

数据造假是高压线,谁碰谁触电

现如今,学术界对于科研数据造假相关责任人的惩罚措施包括但不限于学术规范处罚(例如期刊通报批评、责任人公开道歉等)、行政处罚(例如单位处分、扣降薪、开除职务等)和民事处罚(例如罚款等)。甚至,有些情节恶劣的数据造假责任人会受到刑事处罚(例如因骗取科研经费而被判刑等)。
除此之外,很多科研大佬也在呼吁建立学术诚信档案制度,使得学术不端成为一名科研人员永久的人生污点。这些措施的目的就是为了告诉全体科研工作者,学术不端、数据造假是高压线,谁碰谁触电!
最后,笔者想说,我当时是这么回答那些学生的:“是数据造假还是数据错误,你自己心里没点数吗?”
掌桥科研注重学术讯息分享,也尊重版权,以上部分信息或图片来源于网络,如有侵权请联系我们,我们将在24小时内删除或整改。

版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。




发表评论

注册或登后即可发表评论

登录注册

全部评论(0)

没有更多评论了哦~

科研资讯 更多>>
  • 肿瘤电场治疗Optune Lua获批治疗..
  • 成本更低的实体瘤抗癌新星:CAR-..
  • 文献速递-子宫内膜癌中的卵黄囊..
  • Nature|MSCs首次用于人体跟腱病..
  • 推荐阅读 更多>>
  • 来自生命的拷问:为什么生物基因..
  • 中华医学会“科普中国医疗健康”..
  • ​焕然医心 医然爱你——中华医..
  • 从2021年中国top1000亿人民币医..
  • 科研诚信专题

    我们提供最新鲜最全面的科研诚信事件和资讯。
    • 相关阅读
    • 热门专题
    • 推荐期刊
    • 学院课程
    • 医药卫生
      期刊级别:国家级期刊
      发行周期:暂无数据
      出版地区:其他
      影响因子:暂无数据
    • 中华肿瘤
      期刊级别:北大核心期刊
      发行周期:月刊
      出版地区:北京
      影响因子:1.90
    • 中华医学
      期刊级别:CSCD核心期刊
      发行周期:周刊
      出版地区:北京
      影响因子:0.94