了解了阅读的本质,那么我们应当如何阅读paper呢?
首先是要有“速读”的能力,快速知道一篇文章讲了什么。其次是要“精读”。精读有两个方面:批判性阅读和创造性阅读。首先要对论文进行否定、质疑,仔细挑毛病;其次,对论文有了足够的了解之后,如果发现论文中提到的想法非常优秀,那么要创造性地思考你能用这篇论文做什么。第三个步骤,我称之为“研读”,比如说自己尝试将文章中的算法实现一遍。
除了阅读的方式,读者还要理解所读的论文是怎样写出来的。一篇好的论文在逻辑上是层层递进的,不仅能够传达信息也能够激励读者。所以作者在写的时候也是有结构化的逻辑性思考程度的。总体上作者会思考:这篇论文的真实任务是什么、研究发现是什么;论文的贡献是什么等等。
相应地,读者在读论文的时候也应该要有逻辑,首先要清楚论文中的表达是否是我想要学习到的;其次,我能从论文中学到多少,能不能找到新的方向与新的课题初稿;最后,这篇论文的背景是什么——是什么样的背景让这篇论文变得重要和有趣。
无论是计算机视觉领域的文章还是泛计算机类的文章,一般来讲,都可以归为以下几类:提出问题型论文、解决问题型论文、阐述和调查型论文、总结型论文。
快速阅读:如何读标题、摘要和引言
接下来我向大家介绍一些读论文的经验。首先是快速阅读。计算机视觉领域的著名学者 Don Geman 曾经说,一篇文章可以分为标题、摘要、引言、论文主体四个部分,每一部分都需要花同样的时间进行撰写。这个说法虽然夸张但是不无道理,因为大多数读者实际上最关注的就是文章开始的两页纸。对读者而言,看完前两页就知道这篇文章是不是值得去读;对 reviewer 而言,看完开头就知道能不能拒绝这篇文章。
我的前同事 Jim Kajiya 是一个非常了不起的图形学专家,他最牛的地方就是基本上从来不和别人合写文章,都是自己独立完成。Jim曾经写过一篇文章“How to get your SIGGRAPH paper rejected”,文中最核心的观点是文章一定要写得易读——这篇论文是关于什么的?它解决了什么问题?迷人之处在哪?有什么新的东西(我一直强调做科研的终极问题就是 what's new,写文章的时候一定要强调文章中有什么新的东西)?巧妙之处何在?