官全龙、方良达团队论文成果被信息检索与人工智能领域国际顶会SIGIR录用

近日，第49届国际ACM SIGIR（ACM SIGIR Conference on Research and Development in Information Retrieval，简称SIGIR 2026）公布论文录用结果。官全龙、方良达团队在信息检索与人工智能领域取得重要进展，论文成果 “Mitigating Evidence Suppression: Bi-level Active Evidence Injection for Educational Video Understanding”被SIGIR 2026 Full Papers Track录用。SIGIR 2026录用率为18.4%。SIGIR是信息检索与人工智能领域公认的国际顶级学术会议之一，自1978年由ACM SIGIR主办，是中国计算机学会（CCF）推荐的A类国际学术会议。

论文题目：Mitigating Evidence Suppression: Bi-level Active Evidence Injection for Educational Video Understanding

论文作者：刘成、王一评、官全龙（通讯作者）、贺超波、朱星谕、方良达

大型视觉语言模型（LVLM）在知识密集型教育视频问答任务中具有广阔应用前景，但即使相关视觉证据已经存在，模型在实际回答过程中仍常常不能充分利用这些关键信息。研究团队通过区域级分析发现，与干扰信息相比，任务关键的视觉token（如图表等）在编码器输出中往往呈现出更低的表征能量，并在后续解码过程中被较少利用，表现出明显的“证据抑制”现象。这种现象会削弱模型对教育视频中核心内容的理解能力，从而影响回答准确率。为解决这一问题，团队提出双层主动证据注入方法（Bi-level Active Evidence Injection，BAEI）。该方法无需更新大型视觉语言模型主干参数，而是在解码阶段引入轻量级注入策略网络（Injection Policy Network，IPN），并通过GRPO优化，实现对候选证据token的动态选择和结构化残差注入。该框架在两个层面发挥作用：在浅层，通过干预提升证据相关视觉信号对后续解码过程的有效贡献；在深层，则根据预测熵自适应地进行校正，从而更稳定地增强模型对关键视觉证据的利用能力。教育领域基准数据集上的实验结果表明，该方法能够带来稳定的性能增益，验证了解码阶段面向证据信号进行主动干预的有效性。

该研究工作得到了国家自然科学基金项目（62377028，62276114，62477016）等项目的支持。

图文|刘成

初审|龙锦益

复审|彭盼

终审|罗国伟