近日,Elsevier旗下人工智能领域国际权威期刊《Knowledge-Based Systems》(KBS)(中国科学院SCI一区Top,JCR一区,CCF推荐期刊,2025年影响因子7.6)发表了我校机器视觉科研团队在图像融合领域取得的最新研究成果——LACT-Fusion: Linear Attention-Guided Cross-Modal Learning for Infrared and Visible Image Fusion。论文第一作者和通讯作者为物电学院蔡朝副教授,我校为第一署名单位。
针对传统深度学习图像融合方法容易造成低频细节信息丢失,以及模态间自适应交互机制不足、难以充分保留各自模态固有特征等问题,研究团队提出了一种基于线性注意力 Transformer 的图像融合新方法。该方法创新性地构建了基于辅助矩阵的线性注意力机制,用以替代传统自注意力结构,在显著降低计算复杂度的同时,增强了对异构模态互补信息的自适应建模能力。此外,团队设计了基于局部注意力的多尺度细粒度特征增强模块,有效强化了图像的局部结构与纹理表达,显著提升了融合结果的清晰度与结构保真度。实验结果表明,该方法展现出优异的融合性能和良好的应用前景。
近年来,我院始终坚持学科建设引领科研发展,以人才培养为核心、团队建设为支撑,持续为教师搭建优质科研创新平台、完善科研扶持机制,用心培育科研骨干、凝聚团队合力,鼓励教师深耕学术前沿、勇闯科研难关。此次蔡朝博士以第一单位第一作者身份发表一区TOP论文,既是其个人长期潜心钻研、不懈奋斗的成果,更是我院注重人才培育、强化团队协作的生动体现。下一步,我院将继续秉持“育人才、聚团队、出成果”的理念,持续优化科研创新生态,进一步激发教师科研积极性与团队协作活力,助力科研成果持续突破,为学校科研事业高质量发展贡献院系力量。
论文链接:https://doi.org/10.1016/j.knosys.2026.115531