(本文阅读时间:8分钟)4月15日,微软亚洲研究院创研论坛 – CVPR 2023 论文分享会,邀你一起攀登科技“瞭望塔”!为回馈各界热烈关注,微软亚洲研究院创研论坛 – CVPR 2023 论文分享会将在微信视频号“微软亚洲研究院”、“微软科技”和 B 站“微软科技”三大平台同步公开直播!
与此同时,我们还特邀马毅教授带来精彩的主旨报告,与大家共话计算机视觉的前沿发展!
在这里,让我们一起审视视觉领域的新兴趋势,拓宽国内计算机视觉领域的认知视野。欢迎扫码观看直播,并加入交流群,参与这场学术交流的盛会!特邀嘉宾马毅香港大学数据科学研究所首任所长加州大学伯克利分校 EECS 教授
简介马毅是香港大学数据科学研究所的首任所长,加州大学伯克利分校 EECS 的教授。他的研究兴趣包括计算机视觉、高维数据分析和集成智能系统。马毅教授于1995年从清华大学获得自动化和应用数学双学士学位,1997年获得加州大学伯克利分校 EECS 和数学双硕士学位,2000年从加州大学伯克利分校获得 EECS 博士学位。他曾任教 UIUC ECE 系(2000年至2011年),微软亚洲研究院视觉计算组的首席研究员和经理(2009年至2014年),上海科技大学信息科学与技术学院执行院长(2014年至2017年)。他于2018年加入加州大学伯克利分校 EECS 任教。他已在计算机视觉、广义 PCA 和高维数据分析等领域发表了60多篇期刊论文、120多篇会议论文和3本教材。他于2004年获得 NSF 职业生涯奖和2005年的 ONR 青年研究员奖。他还获得了1999年 ICCV 的马尔奖(最佳论文)和2004年 ECCV 和2009年 ACCV 的最佳论文奖。他曾担任 ICCV 2013 的程序委员会主席和 ICCV 2015 的大会主席。他是 IEEE、ACM 和 SIAM 的会士。报告内容简约性和自洽性原则:从人工智能到自主智能在深度网络和人工智能获得复兴的10年后,我们提出了一个新的理论框架,通过从高维数据中学习低维结构的角度来阐释深度网络。我们认为,学习和智能的最基本的目标之一是学习感知世界的简洁和结构化表示以最大化内部信息增益。以线性判别表示(LDR)这一类重要模型为例,我们展示了此类表示如何被这种第一性原理所有效学习到。这一类模型的信息增益可以通过一种称为“码率降低”的方法来准确测量。流行的深度网络(例如 ResNets、CNN 或 Transformers)的结构和运算符都可以解释为用展开型优化方法(例如梯度下降)来最大化“码率降低”目标。为确保学到表示的正确性或一致性,我们认为额外地自我纠错和自我批判机制的必要性的,它们通常可以用“闭环”反馈和博弈机制来实现。这自然地引出了一个统一的计算框架,称为压缩闭环转录(compressive closed-loop transcription),它整合了信息论、控制/博弈论、稀疏编码和优化中的基本思想。除了理论上的证明,我们还在大规模实际视觉数据的实验种验证了这种新的统一框架在解决各种条件下(监督、增量和无监督)的判别式和生成式模型上的强大能力,甚至在实用完全白盒深度网络时。我们相信,压缩闭环转录是一个通用的学习框架,可作为所有自治智能系统(人工或自然)的基本学习单元。点击链接,获取更多讲者信息。直播日程时 间:4月15日9:30 – 17:20致辞&介绍时间:9:30 – 10:00主持人:陈昊欢迎致辞马歆微软亚洲研究院中国计算机学会女计算机工作者委员会兰旭光西安交通大学人工智能学院
自动化学会共融机器人专委会虞晶怡中国计算机学会计算机视觉专委会
上海科技大学耿新中国图象图形学学会视觉大数据专委会
东南大学CVPR 论文分享会介绍胡瀚微软亚洲研究院主旨报告时间:10:00 – 11:10
主持人:胡瀚简约性和自洽性原则:从人工智能到自主智能马毅香港大学Session 1: Visual Generation点击了解更多报告内容时间:11:10 – 12:30
主持人:陈栋探索无文本参与训练下的文本驱动图像编辑董晶中科院自动化所基于多模态扩散模型的联合音视频生成杨欢微软亚洲研究院用一个解耦扩散模型统一版面生成张直政微软亚洲研究院基于扩散模型的高质量 3D 数字人建模方法张博微软亚洲研究院PanelPoster 分享时间:12:30 – 14:00
主持人:张博 / 唐彦嵩Session 2:Visual Foundation Model点击了解更多报告内容时间:14:00 – 15:50
主持人:罗翀自监督学习的理论理解王奕森北京大学无令牌混合器的视觉骨干网络设计张松阳上海人工智能实验室MaskCLIP: Masked Self-Distillation Advances Contrastive Language-Image Pretraining鲍建敏微软亚洲研究院CLIP-ViP: 基于图像语言预训练模型的视频语言表征学习刘蓓微软亚洲研究院提示、生成、缓存:基础预训练模型的合作能显著增强小样本学习性能高鹏上海人工智能实验室基于元学习的广义零样本类增量学习方法金一北京交通大学PanelSession 3:Visual + X点击了解更多报告内容
时间:15:50 – 17:20
主持人:田智强基于语义条件扩散模型的图像描述生成网络潘滢炜京东端到端自动驾驶算法设计思考陈立上海人工智能实验室跨时空上下文蒸馏的连续手语识别薛万利天津理工大学FLAG3D: A 3D Fitness Activity Dataset with Language Instruction唐彦嵩清华大学深圳国际研究生院手语识别与翻译魏芳芸微软亚洲研究院Panel直播平台1. 视频号 “微软亚洲研究院”预约路径:“微软亚洲研究院”视频号- CVPR 2023 论文分享会2. 视频号 “微软科技”预约路径:“微软科技”视频号- CVPR 2023 论文分享会3. B 站 “微软科技”直播链接:https://live.bilibili.com/730线上交流群欢迎扫码加入论文分享会专属交流群
让我们一起相互探讨 共同进步关于 CVPR 论文分享会计算机与模式识别会议 (CVPR)是由 IEEE 和 CVF 联合举办的国际学术会议,是计算机视觉领域三大顶级会议之一。今年,CVPR 2023 将于6月中旬在加拿大温哥华召开。
近年来,CVPR 的论文投稿量持续增加,几乎每年都保持了10%以上的增幅——从 CVPR 2019 的5160篇有效投稿增长到 CVPR 2020 年的6656篇,到 CVPR 2021 的7500篇,再到 CVPR 2022 的8161篇;而今年又再创新高,达到了9155篇,较 CVPR 2022 增加了12%。此外,今年有2360篇投稿被该会议接收,接收率高达25.78%。为促进领域内的学术交流和发展,微软亚洲研究院创研论坛 CVPR 中国论文分享会自2017年开始举办,每年都会邀请计算机视觉优秀工作的作者分享其前沿研究。在进行计算机科研工作和学习的日日夜夜,你或许有些科研中的问题难以开口问询,或许有些焦虑与情绪无处安放,或许在感到迷茫时需要咨询与支持。微软亚洲研究院树洞计划现已开启。你在计算机领域科研、学习、生活中遇到的难题,都可以随时随地倾倒在树洞里。后台会从树洞收到的内容中选择具有代表性的问题匹配到最同频的频道,邀请微软亚洲研究院的研究员们帮忙回答。作为一个半透明的树洞,部分问题与回应会通过微软亚洲研究院账号公开发表。快来点击上图链接,把你的难题倾倒在树洞里吧!让我们将这些困难封存在过去,轻装上阵,继续科研新旅途!你也许还想看: