【学术论坛】ok138cn太阳集团529成功举办第六十七期研究生学术论坛

来源: ok138cn太阳集团529 作者:魏逸飞编辑人:罗园发稿时间:2026-01-12浏览次数:

2025年1月9日晚19时,ok138cn太阳集团529第六十六期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2023级研究生焦振江、胡贝、张蕾以及王永康主讲,ok138cn太阳集团529研究生会学术部主办,学院罗航老师出席了该论坛。

焦振江同学分享的主题为“Research on Human Sitting Posture Angle Recognition Based on Millimeter-Wave Radar”。良好的坐姿对人体健康具有重要意义,合理的躯干倾斜角有助于提升舒适性并降低颈椎疾病风险。然而,现有研究多聚焦于姿态分类,对躯干倾斜角的细粒度变化关注不足。针对这一问题,本文提出TorsoTrack。该系统利用无线信号感知姿态变化,通过信号修复方法纠正异常片段,并提取幅度谱特征。同时,构建多层特征提取网络,深入挖掘无线信号与躯干倾斜角之间的内在关联。为提升跨个体泛化能力,引入Reptile-PG元学习策略,有效增强模型对新用户的适应性。基于25名受试者的实验结果表明,TorsoTrack表现出优越的识别性能,平均R2为0.9822;在未见个体上仍保持良好效果。

胡贝同学分享的主题为“CoKe-CLIP: Mitigating Semantic Drift via Consistency Optimization and Knowledge-Enhanced Action Representation”。近年来,随着多模态大模型(MLLM)的快速发展,越来越多研究开始探索将其生成的额外知识引入视频动作识别任务,以增强视觉语言模型(VLM)的跨模态理解能力。然而,由MLLM自动生成的额外知识存在语义漂移(SemanticDrift)问题,主要表现为两种形式:一是生成内容可能不准确,二是在相邻帧之间容易产生不连贯的额外知识。为了解决这一挑战,本文提出了一种面向动作识别的额外知识一致性优化框架coke-CLIP,从语义增强、局部感知与一致性优化三个方面系统缓解语义漂移带来的干扰。具体地,知识驱动文本嵌入模块(KTE)融合类别标签与MLLM生成额外知识,增强文本编码器对细粒度语义的建模能力。双通道动态感知模块(BDP)引入边缘图辅助视觉模型聚焦局部结构变化,提升动作区域感知能力。自适应时序优化模块(ATR)通过帧间加权优化机制,缓解单帧额外知识带来的语义漂移,强化时序一致性监督。实验结果表明,本文方法在Charades、HMDB51和UCF101等动作识别数据集上达到了当前最先进的精度。

张蕾同学分享的主题为“Multi-view visual semantic embedding for cross-modal image-text retrieval”。视觉语义嵌入(VSE)是图文检索的主流方法,旨在将图像与对应文本映射到相近的嵌入空间。但图文数据存在显著类内差异:同一图像的不同描述常对应不同视角,内容差异较大。传统VSE将同类样本嵌入到相似位置,抑制了这种差异,影响泛化能力。本文提出多视图视觉语义嵌入(MV-VSE)框架,通过为图像学习多个嵌入来显式建模类内差异,并设计了多视图三元组损失进行联合优化。为兼容传统VSE模型和基于VSE的视觉语言预训I练(VLP)模型,本文将对比损失与三元组损失整合为多视图统一损失。

王永康同学分享的主题为“ST-GCP: A Graph Convolutional Network Model with Contrastive Consistency and Permutation for Spatial Transcriptomics”。空间转录组(ST)技术是一种强大的方法,能够同时保留基因表达谱和空间位置信息,从而促进对组织结构和功能的深入探索。然而,许多现有的计算方法往往依赖带标注的ST数据,并忽视了丰富的空间信息,导致其表示能力有限,聚类效果不理想。本文提出一个面向ST数据的自监督图表示学习框架ST-GCP,并引入结构-特征扰动机制。首先,ST-GCP在特征层面对基因表达矩阵进行随机重排,并在空间邻接网络中执行随机边丢弃,从而构建两个互补的增强图视图。随后,ST-GCP使用两层图卷积网络编码器-解码器来提取空间表示并重建基因表达。最后,基于余弦相似度的对比目标对齐视图特定的表示,整体损失同时优化重建精度和对比一致性,从而在共享的低维空间中耦合图拓扑结构与转录组信息。在多个ST数据集上的实验结果表明,ST-GCP能够挖掘生物学上具有重要意义的模式,如肿瘤异质性、脑发育结构以及细胞发育轨迹等。