题目:基于生成模型的编码,评价和取证
内容简介:本次报告将围绕“编码”、“图像质量评价”与“多媒体内容取证”三个方向,介绍本团队在大模型背景下的最新研究进展与思考。在编码方面,我们介绍基于生成模型的编码方法及在标准制定方面的进展。在图像质量评价方面,我们首先评估了通用视觉大模型在感知质量判断方面与人类主观评价的一致性,随后探索了如何融合主观感知机制与视觉基础模型,构建兼具泛化能力与感知一致性的质量预测模型。在多媒体取证方面,我们系统性分析了通用视觉大模型在检测与推理AI生成图像方面的能力,并进一步提出面向AI合成内容的专家模型。通过构建百万级规模的视觉指令数据集,我们赋予大模型识别AI生成图像与分析伪造痕迹的能力,并在可解释性与可扩展性两个方面展开深入研究。面向未来,我们期待推动多模态大模型在真实世界视觉任务中的泛化、可解释与可控性协同提升,进一步缩短基础模型研究与实际应用之间的距离。
报告人:王诗淇
报告人简介:王诗淇,香港城市大学计算机科学系教授、计算学院副院长。主要研究方向包括多媒体、人工智能、图像与视频分析,以及科学领域人工智能应用,累计发表及合作发表同行评审期刊、会议论文400余篇,其中IEEE汇刊论文约150篇。目前担任人工智能、视频处理领域旗舰期刊IEBE-TIP,TMM, TCyber 和TCSVT 编委,并获得 IEEE ICME,VCIP,MultiMedia等多个国际会议和期刊的最佳论文奖。据谷歌学术数据显示,其论文总引用量超23000次,h-index为71。
时间:2026年5月29日(周五)15:00-17:00开始
地点:石牌校区南海楼124会议室
热烈欢迎广大师生参加!
