学术研讨

VALSE是Vision And Learning SEminar的缩写,它主要目的是为计算机视觉、图像处理、模式识别与机器学习研究领域内的中国青年学者(以70后研发 人员为主)提供一个深层次学术交流的舞台。虽然参与会议和做报告的人主要是做视觉的,但很多问题是机器学习和模式识别当中的一般性问题,所以我这 个搞语音的也去打酱油了^_^。

今年的VALSE在南京东南大学召开,参加会议的人数超出预期,会场爆满,仅学校的老师和公司的研究人员就占了会场大半,学生沦落到只能座最后两排, 或者座分会场(这个太不科学了-_-!)。会程安排也很紧凑,中午几乎没有休息时间,吃饭都很赶,而下午也很晚(6点半左右)才结束。这次会议有好几个 perfect的报告,但也有些不太感兴趣的,有的甚至感觉很2。除了一些报告,还有两个主题讨论会,印象中主要包括三个论题:学术界与工业界的Gap及衔接 问题,深度学习是否是计算机视觉的终极解决方案,计算机视觉要不要从生物视觉机理中受启发等。

闲话少说,言归正传,数萝卜下窖的讲讲这两天的经历吧。 第一天上午,第一个做报告的是MSRA的张磊,主要讲了计算机视觉的一些基本问题,从AI的历史将起,提到了Turing Test,是人工智能 的Benchmark。而CV的一个基本问题是Object Recognition,人们的研究经历了从之前的Model Based到如今的Data Driven及Big Data的过程,各种模型和方法可谓 层出不穷,然而对于真正解决问题、真正达到人类一般的视觉智能,还相差甚远。接着他讲了关于在路灯下找钥匙的故事(详询http://tongyanyan.blog.edu.cn/2006/427512.html), 听了这个故事后,感觉那个找钥匙的人很滑稽可笑,然而再想想我们自己正在做的研究,是不是在某种程度上和故事中的这个人一样呢。通过这个故事,他引出自己 的观点:要想解决Object Recognition这个问题或者说要解决CV的问题,就需要More Effective Representation & Match。接下来讲在Representation方面一些研究 人员提出的一些人工设计的Feature,而在Match方面则从Point、Line、Plane、Volume(点线面体)进行了详尽的讲述。最后还提了一下Deep Neural Network在CV中的 应用,可以discover hidden patterns。虽然对CV中的很多概念和模型方法不太了解,但感觉还是挺有收获的。

上午的后两个报告都是讲Sparse的,虽然之前看过关于Sparse Coding的东西,但当他们在上面讲的,主要偏重与Sparse这个问题的优化求解方法及其变形, 涉及到很多数学公式和推导,感觉很枯燥,加之晚睡早起,有点犯困,所以基本没有听进去。贾佳亚的报告还似懂非懂,而陈欢欢的Sparse Bayesian Learning 表示完全没听懂。个人感觉Sparse还是很重要的,所以在弄完Deep Learning这个专题后,我想有必要对这两个报告及其相关论文再做深入的学习和研究。

中午3个东南大学的同学请我们实验室的在他们学校食堂吃饭,虽然不太记得他们名字了,真心感谢他们!

下午第一个报告是高新波的IQA&VALSE,主要讲了图像质量评价的一些东西,虽然也提到了一些生物视觉方面的东西,感觉很没趣,基本没怎么听,打了个盹。 第二个报告是俞洪波的关于生物视觉方面的东西,很感兴趣,他从深层复杂网络结构、神经元、突触、离子通道、蛋白等多个层面上讲了视觉系统的信息处理流程, 后面还提到了视觉功能柱,指出了视觉神经元具有很强的选择性,不同部位的神经元对不同方向、距离的视觉信息具有选择性的激活增强,最后还讲了一些模拟 视觉系统的计算模型,并描述了一些实验,虽然对报告题目中的Self Organization Model到底是什么还不是很清楚,但对生物视觉系统有了更进一步的了解, 而且知道了他们是怎么获取神经元激活区域的。

下午的第2个Session的第一个报告是颜水成的Fashion Recommendation,包括Hair Style,Makeup,Clothing,Shoes等的Recommendation,不太感冒,只是对他重复提到 的关于华人做研究的一个问题深表同感,他说华人做研究其实很不错的,能在很多TOP会议期刊发Paper甚至Best Paper,但原创性的问题却很少,我们都在提高别人的Citation, 所以华人还需要在发现问题方面多下功夫,而不是仅仅在解决问题方面。后面两个报告一个是王亦洲的General Purpose Vision,表示没听懂。最后一个报告是王晓刚的Crowd Video Surveillance,主要是讲在Video中识别人并跟踪人的移动,或者统计视场中人的数量之类的,只是感性的了解了一下,印象里报告中好像没有提到什么具体的CV技术, 只是举了一个人体位置跟踪的例子,还有一个用在足球视屏中运动员跟踪的例子。

第二天上午第一个Session是两个报告,一个是陈小武的Image/Video/3D Scene Understanding and Editing,主要分以下四个方面:Illumination Learning and Synthesis, Labeling and Lavering and Editing,Estimating 3D Model from a single Image,Video Event Representation and Inference,总体感觉讲的内容涉及到很多东西,甚至他的 学生不仅懂CV,还要懂美术、剪纸等,而且他们每年都会发CVPR、ICCV、ECCV之类的,感觉还挺NB的。另外一个报告是非常期待的于凯的关于深度学习和大数据的报告,但听了之后, 感觉有些Depressed,因为他的报告中没有涉及Deep Learning的一些细节的东西,诸如RBM的原理及其训练等,基本上只是泛泛而谈,之前对Deep Learning做了深入的调研和学习, 自我感觉Deep Learning也没什么神秘的,虽然对Gibbs采样和CD算法的理论还没有完全理解清楚,但我觉得Deep Learning更多的是一种思想方法,在Deep Architecture中,Knowledge 通过一层一层抽象和提取后,对于Classification、Clustering等任务具有更有效Representation,而且在Training Error非常小的情况下,还是可以再Testing中获得理想的Error Ratio, 相比Shallow Architecture,不存在模型Over Fitting的问题。另外,有人提到Deep Architecture中Layer数目的确定的问题,于凯的回答是,在Neural Networks中加一层后,进行Deep Learning的过程,如果相对于没加该层得到的Test Error更小,并且是非常有效的性能提升,那么就加进这一层。然后同样的,再加一层,再进行Deep Learning,以此类推。

上午的后一个Session是关于CV在Industry中的Application,先是来在Industry中的一些研究开发人员对他们目前的工作做一些简短的介绍,感觉某些公司有严重的广告嫌疑,很是讨厌。 然后是讨论阶段,各自就CV在学术界和工业界之间的Gap发表意见,总结起来主要有以下观点:一方面学术界与工业界的Gap是必要的,学术必须要超前,这样工业界才可能将其成熟的应用; 另一方面,学术界与工业界的Gap可以通过在工业界设置研究院(比如MSRA、百度最近在硅谷设置深度学习研究院之类),这样可以加快学术成果应用于工业界的进程,学术最终的目的就是 在工业界中发挥巨大作用,服务广大民众,给社会带来价值。

上午的Panel严重超时了,直到快1点了才结束,去餐馆吃饭,我们跟老板说我们下午要考试,让快点上菜,结果上菜速度果然飞快,而我们吃得也很快,基本上一盘菜一会儿就吃光, 真是高效啊,哈哈!

下午首先是一个Panel,讨论(更确切的说是辩论)了两个主题,一个是关于计算机视觉是否要借鉴吸收生物神经视觉的结果,另一个是Deep Learning是否是CV的终极解决方案,这两个辩论 都非常精彩,笑点不断。Panel开始之前,首先是两位报告者发言,首先上台的是 @老师木(袁进辉),他自我介绍了一番,然后讲了讲生物视觉与计算机视觉的紧密联系,认为计算机视觉要想 取得重大突破,就必须借鉴生物视觉的研究的发现。另外一位是李学龙老师,很有个性,只写了一张PPT,但发言时却如滔滔江水绵绵不绝,可以听得出,他对生物视觉也非常了解,也认为计算机 视觉必须借鉴生物视觉的一些研究成果。后面的讨论非常精彩,将学术娱乐化了。这两个论题本身就很具争议性,正反两方各执其词,要辩论出个是非来,还真需要真才实学。

Panel完之后是两个报告,一个是吴建鑫的Approximating Additive Kernel for Large Scale Vision Tasks,没怎么听懂。另一个是张敏灵的Multi-label Learning,感觉很没趣,主要是 觉得这并不是一个新问题,但在图像标注方面确实是一个很重要的问题。

最后,还可以从一些微博内容中获取更多关于VALSE2013的信息,可以搜索主题\#VALSE\# 或\#VALSE2013\#,或者关注 @潘布衣(会议Chair潘刚)、@张磊MSRA、@余凯_西二旗民工、 @老师木等等。。。

游玩休闲

我们周五下午6点多到,下雨了。坐地铁然后走到旅馆,吃晚饭就8点了,但还好雨也听了,我们就去附近的夫子庙、秦淮河逛了逛。

第二天晚上去阅江楼逛了逛,到哪儿才发现晚上关门,坑爹啊!不过在外面远眺夜晚的阅江楼也不错,然后走了一个把小时到南京长江大桥。
第三天晚上就待在住处。因为订的第四天下午6点多的票,所以白天就可以尽情的去玩玩了。第一站来到了中山园陵
只可惜周一不开放,被挡在“天下为公”的门外。原打算接下来要去的雨花台、大屠杀纪念馆也不开放,坑爹啊!
木办法,就在里面找了一个开放的十朝历史博物馆去了
然后去总统府了,就在外面看了看
再然后去玄武门,一到哪儿就又下雨了
进里面看了看玄武湖,然后就直接回旅馆了

Original Link: http://ibillxia.github.io/blog/2013/04/22/VALSE2013/
Attribution - NON-Commercial - ShareAlike - Copyright © Bill Xia