报告人:王井东 研究员
主持人:林宙辰 教授
时 间:2023/6/5 15:00 - 16:00
地 址:必赢71886网址登录燕园校区理科二号楼2736;昌平校区102教室
报告题目:文心·CV大模型VIMER:算法和应用
报告摘要:
本报告主要内容包括百度文心·CV大模型VIMER以数据为中心的算法和应用。首先,介绍自监督表征学习算法Context Autoencoder(CAE)算法及其推广。然后,讲述基于CAE的工业视觉大模型、OCR文字识别大模型、人体大模型等。最后分享图文对比预训练大模型在自动驾驶数据挖掘中的应用和基于多任务学习的交通感知大模型。
报告人简介:
王井东,百度计算机视觉首席科学家,负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前,曾任微软亚洲研究院视觉计算组首席研究员。2001年和2004年在清华大学获得学士和硕士学位,2007年在香港科技大学获得博士学位。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络、基于transformer attention的图像语义分割网络OCRNet、以及基于近邻图的大规模最近邻搜索等。在微软工作期间,科研成果10多次转化到微软的关键产品和业务中去,包括搜索、广告、OCR、小冰聊天机器人等。在百度带领团队研发的技术已经广泛应用于百度的搜索、智能云以及自动驾驶等重要产品和业务中。
他曾担任过许多人工智能会议的领域主席,如 NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他现在是IEEE TPAMI和IJCV的编委会成员,曾是IEEE TMM和IEEE TCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献,他被遴选为国际电气电子工程师学会和国际模式识别学会会士、国际计算机协会杰出会员。