学术研讨
VALSE是Vision And Learning SEminar的缩写,它主要目的是为计算机视觉、图像处理、模式识别与机器学习研究领域内的中国青年学者(以70后研发 人员为主)提供一个深层次学术交流的舞台。虽然参与会议和做报告的人主要是做视觉的,但很多问题是机器学习和模式识别当中的一般性问题,所以我这 个搞语音的也去打酱油了^_^。
今年的VALSE在南京东南大学召开,参加会议的人数超出预期,会场爆满,仅学校的老师和公司的研究人员就占了会场大半,学生沦落到只能座最后两排, 或者座分会场(这个太不科学了-_-!)。会程安排也很紧凑,中午几乎没有休息时间,吃饭都很赶,而下午也很晚(6点半左右)才结束。这次会议有好几个 perfect的报告,但也有些不太感兴趣的,有的甚至感觉很2。除了一些报告,还有两个主题讨论会,印象中主要包括三个论题:学术界与工业界的Gap及衔接 问题,深度学习是否是计算机视觉的终极解决方案,计算机视觉要不要从生物视觉机理中受启发等。
闲话少说,言归正传,数萝卜下窖的讲讲这两天的经历吧。 第一天上午,第一个做报告的是MSRA的张磊,主要讲了计算机视觉的一些基本问题,从AI的历史将起,提到了Turing Test,是人工智能 的Benchmark。而CV的一个基本问题是Object Recognition,人们的研究经历了从之前的Model Based到如今的Data Driven及Big Data的过程,各种模型和方法可谓 层出不穷,然而对于真正解决问题、真正达到人类一般的视觉智能,还相差甚远。接着他讲了关于在路灯下找钥匙的故事(详询http://tongyanyan.blog.edu.cn/2006/427512.html), 听了这个故事后,感觉那个找钥匙的人很滑稽可笑,然而再想想我们自己正在做的研究,是不是在某种程度上和故事中的这个人一样呢。通过这个故事,他引出自己 的观点:要想解决Object Recognition这个问题或者说要解决CV的问题,就需要More Effective Representation & Match。接下来讲在Representation方面一些研究 人员提出的一些人工设计的Feature,而在Match方面则从Point、Line、Plane、Volume(点线面体)进行了详尽的讲述。最后还提了一下Deep Neural Network在CV中的 应用,可以discover hidden patterns。虽然对CV中的很多概念和模型方法不太了解,但感觉还是挺有收获的。
上午的后两个报告都是讲Sparse的,虽然之前看过关于Sparse Coding的东西,但当他们在上面讲的,主要偏重与Sparse这个问题的优化求解方法及其变形, 涉及到很多数学公式和推导,感觉很枯燥,加之晚睡早起,有点犯困,所以基本没有听进去。贾佳亚的报告还似懂非懂,而陈欢欢的Sparse Bayesian Learning 表示完全没听懂。个人感觉Sparse还是很重要的,所以在弄完Deep Learning这个专题后,我想有必要对这两个报告及其相关论文再做深入的学习和研究。