上海光机所在光学相干断层扫描技术研究上取得进展近期,中科院上海光机所高端光电装备部研究团队在医学图像处理领域取得重要突破。相关研究成果以“TranSegNet: Hybrid CNN-Vision Transformers Encoder for Retina Segmentation of Optical Coherence Tomography”为题发表于LIFE-BASEL。 OCT技术凭借非侵入、高分辨的优势,成为眼科疾病检测的“金标准”。然而,视网膜层及病灶的精准分割面临巨大挑战:图像噪点、血管阴影、病理结构形态差异等均可能影响传统算法性能。手动标注依赖专家经验,耗时长且主观性强。既往基于卷积神经网络(CNN)的模型虽取得进展,但局部感受野限制导致全局特征建模不足。 TranSegNet通过深度融合卷积神经网络(CNN)与Vision Transformer(ViT)的优势,构建了独特的混合编码架构。以轻量化的改进型U-Net骨干网络为基础,其通过多尺度分层卷积精准捕获局部视网膜纹理特征,同时引入全局注意力机制,利用轻量化ViT模块中的多头卷积注意力层,突破传统CNN的局部感受野限制,有效建模视网膜层间复杂的长程空间依赖关系。通过端到端轻量化设计,模型在不依赖预训练的前提下,以56%的参数量缩减与每秒15帧的实时处理速度(NVIDIA RTX3070),实现视网膜层边界分割误差降低至5.29微米,并在黄斑积液等不规则病灶识别中表现出超越主流模型的鲁棒性,为临床高精度自动诊断提供了高效、可靠的解决方案。 ![]() 图1.数据集A(a-c)和数据集B(d-f)的视网膜OCT图像及标注说明 ![]() 图2.(a)TranSegNet整体网络结构 (b)Transformer层结构设计 该模型已成功应用于实验室自建SD-OCT系统及美国杜克大学公开数据集,可精准分割视网膜8层结构及积液区域,生成定量化厚度图谱,为早期青光眼、糖尿病视网膜病变的筛查提供自动化工具。研究团队表示,TranSegNet的轻量化特性适配边缘计算设备,未来将结合移动OCT设备实现基层医疗场景的快速诊断。 相关链接:https://doi.org/10.3390/life13040976 分享到:
|