【学术论坛】ok138cn太阳集团529成功举办第六十三期研究生学术论坛

来源: ok138cn太阳集团529 作者:魏逸飞编辑人:罗园发稿时间:2025-10-27浏览次数:

2025年10月21日晚19时,ok138cn太阳集团529第六十三期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2023级研究生宋浩、蔡茂、何鉴、周双主讲,ok138cn太阳集团529研究生会学术部主办,学院宋博文老师出席了该论坛。

宋浩同学分享的主题为“CPR-CLIP:一种用于动作识别的跨模态一致性与提示多样性正则化的CLIP模型”。提示学习已成为一种有效的策略,用于将多模态视觉-语言模型(VLM)适配到下游任务,如视频动作识别。该技术已被广泛应用于人机交互、视频监控以及医疗等领域。然而,现有方法往往容易过拟合于特定任务分布,并出现提示塌缩的问题,尤其是在数据有限或类别语义高度相似的情况下。针对上述问题,他们提出了CPR-CLIP(Cross-modal Consistent and Prompt-diverse Regularized CLIP),这是一种灵活的框架,用于提升提示学习在动作识别任务中的泛化能力。具体而言,他们引入了跨模态一致性正则化策略,以保持冻结的 CLIP 编码器所学习的原始特征表示,从而减轻提示适配带来的过拟合问题。此外,他们设计了提示多样性正则化项,用于鼓励不同类别之间的提示表示保持分离,从而缓解提示塌缩并提升模型的区分能力。在 HMDB51、UCF101 和 SSv2 数据集上的 base-to-novel 与 few-shot 实验结果表明,CPR-CLIP 在所有设置下均优于现有方法,表现出对新类别的强泛化能力。

蔡茂同学分享的主题为“优化CNN-BiGRU-SA组合模型的BDS-3超短期钟差预报”。针对钟差数据的非线性特征及单一模型在长程依赖建模中的局限,他们提出一种融合卷积神经网络-双向门控循环单元-自注意力机制的超短期钟差预报方法。首先,利用CNN提取钟差非线性特征,BiGRU建模时序依赖关系,SA机制动态分配特征权重;然后,引入混沌映射与Levy飞行策略改进北方苍鹰优化算法优化组合模型超参数;最后,从原子钟类型与采样间隔开展1h、3h、6h预报实验。结果表明,所提模型平均预报精度优于0.2ns,平均稳定度优于0.25ns。

何鉴同学分享的主题为“CIR-DFENet: Incorporating cross-modal image representation and dual-stream feature enhanced network for activity recognition”。单图像着装人体重建对于虚拟人创建与3D打印等应用至关重要。现有基于扩散的方法通过生成多视图图像作为辅助先验来提升重建质量,然而受限于生成图像的分辨率,重建模型仍缺乏几何细节且纹理保真度有限。为此,他们提出多阶段框架 DNormHuman,实现高保真单视图着装人体重建。该框架首先利用多视图扩散模型,从多个视角生成初始彩色图像与法向图作为先验;随后设计双法向细节优化模块,通过超分辨率提升图像分辨率与边缘锐度,并针对法向图进行专门优化以丰富细节;最后,引入网格雕刻模块显式重建人体网格,充分融合多视图信息,得到高保真3D着装人体模型。在 CustomHumans、CAPE 和 THuman2.0 数据集上的大量实验表明,DNormHuman 在几何细节与纹理质量上均优于现有最先进方法。

周双同学分享的主题为“Fabric defect detection method based on improved RT-DETR”。为应对织物缺陷种类有限、尺度变化显著以及模型检测精度低等挑战,他们提出了一种基于RT-DETR的织物缺陷检测方法——DHR-DETR。该方法通过在原RT-DETR模型中引入Dynamic-DCNv2模块、HS-FPN以及RetBlockC3模块,显著提升了检测性能与部署效率,在实际工业检测应用中展现出强大潜力。