100多篇CV博文持续更新,上交博士带你研读CV前沿Paper

来自:Datawhale(微信号:Datawhale),作者:Datawhale

   人工智能相关技术更新迭代有多快呢?如果说2016年的研究已经是古董了,那2012年就是上古时代的东西了。这话虽然有些夸张,但也不是没有道理。


   想要了解最新的行业进展,可以说最好的方法就是读最新的论文!说到读论文这件事,读什么,怎么读,怎么更高效的读,这几个问题困惑了无数的小伙伴,今天将从cv领域论文入手,给大家分享计算机视觉领域的系列论文研读,目前已更新至104篇,同时针对关于如何读论文的三个问题,一一做阐述。


首先读什么?


博主是上海交通大学博士,Datawhale荣誉顾问,专研于CV领域,我们先了解一下博主阅读前沿论文的途径。


在他每天的博客中都会标注:Papers from arxiv.org,arxiv.org是一个收录科学文献预印本的在线数据库,目前包含了超过50万篇文章,并且以每个月5000篇的速度增长着。这个数据库包含:数学,物理,计算机,非线性科学,定量生物学,定量财务以及统计学几大分类。其最重要的特点就是“开放式获取”,每个人都可以免费地访问全文数据。访问地址:https://arxiv.org/


为了更便捷地阅读,博主自己写了爬虫程序,每1-2天将最新的计算机视觉相关的论文爬取出来,大概30-50篇。最近一期达到了80篇。某小伙伴说:这师兄读的论文比我读的闲书都多,不瞒你说,我也是!


再者怎么读?


每天爬取这么多的论文,怎么读呢。此处博主分为两大类:略读和精读


略读:关注摘要。论文摘要是很结构化的东西,一般会告诉我们三件事,我研究了什么问题,我用什么方法解决这一问题,以及用该类方法解决这类问题的结果怎么样。作者在每期的文章中会将泛读部分的摘要翻译下来附在文章的末尾,大家可以直接阅读找到自己感兴趣的问题。


博主说一般读完摘要就知道这篇文章自己是否感兴趣,是否值得精读了。达到这种水平,也是阅读了众多文献,熟能生巧的结果。


精读。精读会在略读的基础上选取自己感兴趣的论文进行精读,主要关注点仍然是解决什么问题,用什么方法和结果三类。其中对解决的问题和所用方法更加注重。那接下来我们拿一个博客中例子,具体看下是怎么操作的吧。


解决什么问题?

博客中是这样给出的。如何通过微小的改变改进时尚程度?


用什么方法解决该问题

首先通过两个编码器得到了纹理质地和外形的隐含空间编码,随后利用F++对上述特征进行编辑生成t++和s++特征,s++特征将生成二维分割mask,并与修改后的纹理特征t++更新m++得到了新的特征图u++,最后利用Gt生成最终的修改后的时尚着装x++。


结果

例子中的结果可以看出,计算机给人们的时尚提出了哪些微小的改变呢?大概有高腰原则,颜色搭配的协调性等等。


怎么更高效的读?


这一问题其实在上边已经解决了,想要高效的阅读文献,就要做到略读和精读相结合。当然深厚的知识积累是最基础要素,所以还是要大量的去读论文,就采用读摘要,抓住研究什么问题,所用方法及效果三个方面,大量练习,就会有所获益。


写到最后

也有有人会问:有没有非CV相关的论文导读推荐,其实掌握了方法,读论文是一通百通的,至于如何写好相关论文,可以参考:清华大学刘知远:如何写一篇合格的NLP论文

  

最后附上作者的博客链接,目前访问量已突破20万:https://me.csdn.net/u014636245


在持续更新的cv系列博文中,博主将每天带你学习和研究cv领域的前沿Paper。

推荐↓↓↓
人工智能与大数据
上一篇:重磅 | 完备的 AI 学习路线,最详细的资源整理! 下一篇:GitHub上能让你重拾学习热情的AI项目:权游预测/AI作画/与AlphaZero对弈