今天(6月24日),2023年度国家科学技术奖揭晓,复旦大学计算机科学技术学院姜育刚教授、吴祖煊副教授、薛向阳教授与大数据学院付彦伟教授等共同完成的项目“多元协同的视觉计算理论与方法”获国家自然科学奖二等奖。
“我的研究聚焦于视觉计算,它是人工智能的核心方向,旨在赋予机器‘看’的能力。简单来说,就是让机器像我们人一样能够准确识别出图像、视频中的物体、场景、动作、交互等等,甚至能在此基础上预测几秒后发生的事件。”上海市智能视觉计算协同创新中心主任、复旦大学计算机科学技术学院姜育刚教授介绍。
大规模数据集是视觉计算至关重要的组成部分,对于模型的训练和性能提升起着关键作用。秉持着“开源开放是推动技术发展的重要方式”这一理念,姜育刚团队长期致力于数据集、工具集的开放共享,让更多研究者可以从中受益。
相比于大量的图像数据集,动态视频数据集更少,其构建更有挑战性。一方面视频数据的收集、存储更为困难,另一方面是给视频数据进行标注非常耗时耗力。尽管耗时长、成本高,姜育刚带领团队构建了多个高质量、大规模视频数据集,如FCVID、CCV、THUMOS等,涵盖视频识别、视觉匹配、动作定位等多个视觉计算任务,被斯坦福大学、加州大学伯克利分校、微软等千余家机构使用。
“我2014年在欧洲计算机视觉大会上发表的一篇文章用到了姜老师2013年构建的一个数据集。开会时遇到了姜老师,我们针对视频理解的挑战性问题交流了很久,发现有很多共同感兴趣的方向。”项目第四完成人付彦伟在英国伦敦玛丽女王大学读博期间,常基于复旦构建的数据集开展视频理解方面的研究。缘起数据集的火花碰撞为他们后续一系列富有成效的科研合作奠定了基础,2018年付彦伟回国加盟复旦。
在主办评测之外,团队还积极参与其他机构组织的国内外视觉计算技术评测,成绩喜人。在刚刚结束的CVPR会议上,团队在大规模开放词汇目标检测等三个挑战赛中斩获第一名。
团队也实现复旦大学在人工智能领域的多个突破:首位人工智能方向的教育部长江学者特聘教授、首次获批国家科技创新2030“新一代人工智能”重大项目、首次荣获国家自然科学奖二等奖。
“科学研究的乐趣,往往就藏在那些看似不可能解决的问题之中。”这是姜育刚和学生交流时常挂在嘴边的一句话。教书育人十数载,在他看来,每位学生都是独一无二的,因此要挖掘并激发每个人的潜能。不仅自己在视觉计算领域持续深耕,姜育刚更热衷将这份热爱与探索精神传递给自己的学生,让越来越多的年轻人在科研道路上坚定前行。
项目的第二完成人吴祖煊曾是姜育刚和第三完成人薛向阳联合指导的硕士生,他与导师一起提出了对视频中的多元特征进行深度融合的思路,并首次在国际知名的UCF101数据集上取得了超过90%的精度。谈及复旦求学经历,吴祖煊说:“姜老师和薛老师是我学术生涯的启蒙人,我依然还记得在2014年春节的时候我跟姜老师大年初一在实验室里赶一篇投稿,他仔细地教我如何打磨论文。这样的科研训练经历是十分珍贵的。”2016年硕士毕业后,吴祖煊前往美国马里兰大学攻读博士学位,并于2021年回国加入母校。2022年,吴祖煊入选国家级青年人才计划。
未来,团队将进一步开拓视觉计算领域。例如,以视觉内容理解助力海量视觉数据的检索与管理,让机器人更好地感知环境,这是当下火热的“具身智能”的核心技术;在视觉内容生成方面,助力大模型优化升级,通过自动生成高质量图像、视频内容,可以快速实现不同的艺术风格,花开千朵,为大众生产生活插上想象的翅膀。
本次获奖的老师均为上海市智能信息处理重点实验室的视频智能计算方向的老师,祝贺他们!
新闻来源:
不是“预见”,只是迎难而上!复旦这一AI项目获国家自然科学奖二等奖 (qq.com)