2022-11-18 来源 : 留德华叫兽 ,作者留德华教授
前言
本文转自我在该知乎问题下的回答,同时引用了其他几个高赞回答。
如果你刚刚关注我的公众号,请前往文末我的自我介绍,了解一下先~
或者可以点击这个视频:
教育|普通家庭十年留学史:飞跃美德全奖读博,最终成德国打工人
注:我的公众号无法留言,请点击文末“阅读原文”前往我的知乎留言、评论。
01 我的回答
这里为学术圈外的吃瓜群众科普一下
科研造假有多么“容易”
我博士所在的计算机、AI领域
随便列一篇学术paper的计算实验结果图
(注:仅作展示用途,不针对任何paper或作者)
如今深度学习的时代
任何一个相关实验用GPU训练
随随便便就要花1-10天的时间(假设1天)
以上看到的表格
列出了多种关于方法和参数的排队组合
共计需要做2x4+3x4 = 20个实验
完成上述一轮实验
一个条件一般的实验室(GPU资源紧张)
可能就需要20天的时间
而深度学习又需要调整参数做对比实验
假设只调节2个参数各5种选择(=10)
完成一篇paper选择其中最好的试验结果
非土豪组实验室的学生(人均一块GPU)
需要200天时间
更关键的是
花200天时间得到“真实”的结果
还不一定是好结果
可能还要推倒重来再一次实验的轮回
vs
花10秒钟篡改数据得到“好”结果
你会做出哪种选择?
有人会问篡改数据备查的风险有多大?
非常小!
为何?
因为计算机实验的机器配置不同
又有无数的参数可以调
要完全复现相同的实验结果
是非常非常难的
Paper里又不可能把实验细节说得非常详细
上面的表格里面
随便改个数据
把右下角最好结果81.8改成81.9
会有人会察觉么!?
而审稿人几乎不可能去复现你的代码或实验
即使你上传了开源的代码也不会!!!
为何?
因为投稿数量巨大
搭配同样实验环境的成本非常高昂
根本没有时间/条件去复现投稿者的代码
好了
以上是计算机深度学习领域的造假难度
生物、化学、化工、材料等实验科学复现实验的难度就更大了
实验仪器动辄几百万
审稿要复现先花几百万配齐整套实验装备!!??
而这些实验的周期以及成本
比起计算机科学来讲更为长久和高昂
时间动辄1年花费100万元的试验设备和成本
生物PhD们养小白鼠的实验大家应该都听过吧
每天需要到实验室给小白鼠投食并且记录实验数据
小白鼠养着养着某天不幸过世了
搞不好还是一个细思极恐的人为“事故”?
实验全部重来
Over~~
因此
科研学术界是否造假
几乎完全凭科研工作者的职业道德和操守
这里
向那些打假人士致以最崇高的敬意
因为打假需要付出的代价真的非常非常大
并且冒着得罪“权威”的风险
每一个学者
做学术前
先学会做人
02 知乎用户@马达熊 的回答
链接:
https://www.zhihu.com/question/300070408/answer/2025987446
03 知乎用户@匿名用户 的回答
04 知乎用户@鸭鸭2019 的回答
链接:
https://www.zhihu.com/question/300070408/answer/593558280
版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)