共 1 篇相关文章
上海交通大学提出PhyAR框架,通过PACC数据集和VARC视觉锚定推理链机制,解决Video-LLM在物理推理中语义先验劫持视觉感知的核心缺陷,无需修改模型架构即可显著提升物理异常检测能力,全面超越GPT-4O等SOTA模型。