最近,中国科学院院士、清华大学原副校长施一公在全国政协十三届一次会议上说道“我以前曾经预测,中国会在2020年论文数超过美国,没想到我们提前完成了”。
确实, 从论文发表数量来看,我国已经跃居世界第二、仅次于欧盟的位置 [1],如图1。在国际顶尖期刊上发表论文数也已经居世界第四位[2]。
图1: 中国论文数量比较 (网图)[1]
这说明我国在科研整体实力上有了明显的提升,主要原因是目前在科研一线的中青年老师,在科研能力、论文写作能力、指导学生的能力等多方面都有了质的飞跃。而且,搜索国际前沿论文的途径也较以往有了非常大的便捷。另外,在计算机领域,由于代码共享方式的盛行,也让学科间、学校间在切入研究方向上差异变小、事半功倍。这使得我国的科研队伍能在快速地了解国内外动向的同时,也能迅速实现复制、比较和改进。
但我们在原创性这块还存在比较大的差距,创新力仍有待改善。以人工智能领域为例,近年来主流技术以深度学习为主。尽管在论文发表总量上,我国毫不输于其它国家。但是,在深度学习必需的硬件环境上,我们仍严重依赖于目前还无法国产化的GPU显卡;在软件平台上,依赖于PyTorch、Tensorflow等国外软件;在深度学习的核心算法上,国内提出的关键算法相对较少,多是在国外团队设计的相关算法上的小修小改。
抛开学科、领域的差异,“原创能力弱”的原因很多。基础教育中过分重视分数、填鸭式教育强度过大,导致学生对科研的热情被提前燃尽,后继乏力是一个原因。这需要花时间找到更合理又不失公平的基础教育“减负”平衡点才行,需要“长治”。
国内对科研考核评估的指标制定也是重要原因之一。从总体来看,近年来国内对硕士、博士研究生毕业、教师职称晋升在论文上的指标要求相对十年前是高了不少。这也很正常,毕竟我们科研水平整体提长了,十五年前在国内权威期刊发篇论文就能评上教授,现在在SCI一区期刊上发个三五篇在复旦大学这样的学校晋升的机会也不见得大。
但是,这种考核制度是否有利于原创性高的研究呢?
一、限时考核
对于研究生来说,这种考核从某种意义来看,是限时的,即必须在学业完成前获得达标的论文数量才行。不仅如此,多数学校在研究生评奖学金时,会按论文的档次和数量来评分;老师在晋升职称时,也是如此;各种人才的评选、奖项的评选都看。因此,研究生可能在入学后,就会有个小算盘计算如何能尽早完成这个限时指标。结果,就会优先选择那些不需要花太多时间、不用太依赖于扎实的基础理论、容易快速出成果的研究方向。虽然这并没什么不好,因为现在很多企业是看研究生的论文数量来定年薪的。
但如果博士生的人生目标想以科学研究为主,希望形成原创性高的科研成果,那么就应该在博士期间多花时间打好理论基础、完善论文写作水平、选题时谨慎考虑好可持续性。理论基础可以保证在未来研究方向产生大的变化时,不容易被抛弃,也是形成原创性成果的必要条件之一;论文写作水平可以提升其指导学生的能力;而谨慎选题需要一定时间的探索,持续性则应该能保证其在毕业后三至五年内,在其研究方向上产生有影响力的工作,并能得到学术圈同行的广泛认可。这三项都需要花时间,并非短时就能见效。但一旦以限时指标来考核,三者都很可能被舍弃。结果,在这种环境下,原创性高的成果就很容易被扼杀在摇篮里了。
二、不鼓励原创的论文发表和评审机制
那么,追求发表高档次论文就不利于原创性成果吗?当然不是,它是重要途径之一。但从当前国内外研究的发展趋势来看,这一途径正在变窄,影响力也在逐渐减弱。
再以人工智能及相关领域为例,计算机视觉顶级会议CVPR2018(IEEE Conference on Computer Vision and Pattern Recognition)接收论文数量超过1500篇,而人工智能顶级会议AAAI(American Association of Artificial Intelligence) 2019接收论文数量超过1000篇。据报道,现阶段每20分钟就产出一篇机器学习方向的论文。试想下,如果想了解这些会议的全貌,单纯读个论文目录都可能得花大半天时间,哪还有多少读者真心愿意再仔细去读论文呢?后果就是,这些会议中的很大一部分会议除了作者本人读过外,有可能就3个评审仔细读过了。这导致原创性的研究成果变得不太那么容易被传播,并形成影响力。
另外,发表任何一篇论文都是需要时间的。论文中的方法提出和改进、实验和比较、写作和逻辑,再加上评审评阅论文时主观性带来的偶然性,就有可能导致好的论文容易被拒。尤其在现今相对规范的科研环境下,原创性高的研究事实上更容易被拒绝而非接受。还是以人工智能领域为例,如果一项原创性非常高的工作投某个相关领域的会议,评审通常会希望至少看到两个要点:1)完整的综述。但如果这项工作本身是个新的切入点,很可能做个完整的综述就比较困难。这极容易让评审抓住辫子,说其对相关领域近三年工作不了解而拒稿。2)全面的实验比较。这一点对于原创性的工作也是同样痛苦。因为作者可能是从某种实际应用中,根据发现的新问题提出的方案,但不一定能在现有的研究方法中找到对应的已有成果来进行比较。此时,评审会很自然地以没有看到充分比较,缺乏可信度而拒稿。相比较而言,反而那些原创性低、可能只是一两个小改进,但实验充分且综述完整、论文写作规范的研究,更容易引起评审的好感而被接收。所以,当前的论文发表和评审模式从某种意义上来说,是不利于原创性成果的发表的。
三、重视新时代的传播模式
我们不妨审视下国内外近四十年科研走过的道路。早些年,互联网没流行时,国内外均是通过纸质期刊来了解研究动向,而国内能购买期刊的学校非常之少,这个阶段我国处于资料缺乏阶段,也不太清楚国际前沿的状态。而国外通过会议进行的交流则比国内相对便利不少。绝大多数国内科研工作者处在无从下手的时期。随着互联网的出现,学术论文的购买,国内的实力开始缓步前进。过了二十世纪,进入二十一世纪了,随着海外人才的引进、中青年老师的水平的逐年提高,国内在论文发表方面已经完全摸清了门道。比如模式识别领域曾经极难发表论文的IEEE Transactions on Pattern Analysis and Machine Intelligence,现在国内学者一年发七八篇也并不罕见了。
然而,这种“摸清”并没有对原创性工作产生太明显的改善,更多的是数量的快速提升。这也是国内现在在提倡清理“四唯”的原因之一。
要改变这一局面,我想可以考虑以下四点:1)不宜采用或降低限时考核论文的标准。因为它压缩了科研工作者能形成原创性成果所需的时间。比如博士生毕业指标上,是否可以像中科院数学所一样,只考查学生的毕业论文呢?其它论文发表情况仅作为参考、而非必要条件呢?当然论文的减负,只对学生减负是不可行的。因为这个压力会向后送,到导师、到学院、学校。所以,需要全方面的减负才有可能。2)不宜限定发表论文的档次,鼓励科研工作者多利用网络媒体来传播成果,形成影响力。我们得看到, 纸质媒体正在快速地让位于网络媒体已是不争的事实,最近不少纸质媒体杂志的关停和自媒体的兴起便是佐证。国内在互联网、手机支付方面也全面超过了美国。在网络如此发达的前提下, 再强调SCI、ESI这类靠“统计”数量的传统指标来衡量论文水平和影响力并非完全与时俱进,也不那么“前沿”。更何况这些指标能涵盖的范围本来就有限,对网络的传播更是丝毫未曾考虑。同时,对于科研工作者来说,传统的期刊发表方式是否仍有必要成为唯一途径也值得商榷。在公开的、有知名度的网络文献数据库或科学网上发表成果,是否可以算数或提倡?如果算,我们怎么评估它的影响力和原创性?3)以国内现在在国际上的论文发表情况来看,我们似乎可以不再过多依赖于某些不利于国人的科研尤其是原创性科研的评价标准。不妨另起炉灶,自建一套更符合现今时代的科研评估体系,以保证有更多原创性的成果的产生。4) 规范国内期刊和在线文献数据库或科学网的论文评审流程,比如公开评审意见、在评价时对国内部分期刊给予更高的权值,并在各级学校进行适当的投稿鼓励和支持。另外,既然我国的论文发表数量排名这么高,那至少也说明国内高水平评审人员的数量也不低。只要让他们能对中文论文的评审像国际标准看齐,论文的质量也会上升。这样,会有助于那些原创能力强、但英语写作能力偏弱的国内科研人员有更多的“发声”机会,也有助于提升国内科研论文相关的刊物和网络媒体的总体水平。5)如果担心水军影响公信力,我相信现有的技术手段是完全可以解决这一问题的,比如某歌星的打榜不也被itune发现而从榜单消失了吗?在科研方面,我们不妨把水军的打榜和过度评价视为一种学术不端,以此来提升网络评价的质量。
总之,如果希望提高国内的原创力水平,论文减负首当其冲!假以时日,原创性的成果就会越来越多。
参考文献
1. 有一种科研叫“中国式科研”!链接:https://c.m.163.com/news/a/E4CBO50P0511DV4H.html?spss=newsapp&from=timeline&isappinstalled=0&spssid=91f1dfe54ad4b65e3f30feba124b21e0&spsw=1
2. 佘惠敏. 我国在国际顶尖期刊上发表论文数位居世界第四位,经济日报,2018年11月1日
本文转自作者 张军平
张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEE Transactions系列18篇,包括IEEE TPAMI, TNNLS, ToC, TITS, TAC等。学术谷歌引用2800余次,ESI高被引一篇,H指数28.