肩关节骨关节炎(OA)是一种常见的慢性退行性关节疾病,通常与老化相关的磨损有关,但也可能由创伤、劳损或退变等因素引起。其主要症状包括肩关节疼痛、肿胀、活动受限和弹响等。肩关节骨关节炎的高危因素包括既往肩部手术、创伤史、炎症状况(如类风湿性关节炎)以及肩部过度使用。根据病情的严重程度和骨刺的位置,可以采取不同的治疗选择。治疗范围从康复和药物治疗到关节表面置换和全关节置换,为个体需求提供了一系列干预措施。
现有的 OA 诊断方法主要依赖放射科医生的经验,存在主观性和局限性。深度学习技术在骨关节炎诊断中的应用主要集中在单一任务,例如骨组织分割或关节间隙狭窄程度评估,缺乏对 OA 的全面分析。
本文提出了一种创新的深度学习框架,用于处理肩关节 CT 扫描,旨在简化基于个性化手术器械 (PSI) 的肩关节置换术前计划流程。该框架包括:肩胛骨和肱骨近端语义分割、骨组织 3D 重建、GH 关节区域识别;三种常见 OA 相关病变的分期:骨刺形成 (OS)、GH 关节间隙狭窄 (JS) 和肩胛盂肱关节对位 (HSA)。
1 方法
- 体积分割:使用CEL-UNet模型从CT扫描中提取肱骨和肩胛骨。
- 肱骨头区域检测:利用两个重建的表面在原始CT体积中检测肱骨头区域。
- 多类分期:使用Arthro-Net模型对肩关节(GH joint)进行多类分期,包括:
骨刺分期(3个类别,骨刺大小逐渐增加)。
肩关节间隙(3个类别,严重程度逐渐增加)。
肱骨-肩胛骨对齐(2个类别)
1.1 数据集
研究使用了 607 张轴向 CT 扫描图像,这些图像来自接受肩关节置换术的患者,并伴有不同程度的骨形态变形。
- 数据集包括原始骨表面模型和去除骨刺后的模型,用于增强 PSI 术前规划过程。
- 为了提高模型的泛化能力,数据集被分为训练集和测试集,并进行数据增强操作。
1.2 训练集准备
数据集被分为两个子集:一个用于分割 (DSeg),一个用于分类 (DClass)。
- DSeg 子集通过裁剪和分块方法进行数据增强。
- DClass 子集通过裁剪和翻转方法进行数据增强,并提取 GH 关节区域的中心裁剪块。
1.3 GH 病理性条件分期和数据标注
- 骨刺分期 (OS) 基于 Samilson-Prieto 分级系统进行标注。
- GH 关节间隙 (JS) 基于 Kellgren-Lawrence 分级系统进行标注。
- 肱骨肩胛骨对位 (HSA) 根据肱骨头相对于盂窝表面的位移进行标注。
1.4 分割网络:CEL-UNet
CEL-UNet 是一个基于 UNet 架构的深度学习模型,专门用于分割肩部骨骼。
- 该模型包含两个并行分支:区域分割分支 (RA) 和边缘检测分支 (CA)。
- RA 分支负责生成分割掩码,CA 分支负责识别骨骼边缘。
- 模型使用自定义损失函数,结合区域和边缘特征,提高分割精度。
1.5 分类网络:Arthro-Net
- Arthro-Net 是一个针对 GH 关节病理性条件分期的多任务、多分类深度学习模型。
- 该模型包含一个编码器和一个解码器,解码器包含三个独立的分支,分别对应 OS、JS 和 HSA 分类任务。
- 模型使用加权交叉熵损失函数,平衡不同类别样本的数量。
1.6 网络训练和预测流程
CEL-UNet 和 Arthro-Net 分别在训练集上进行训练。
在预测阶段,首先使用 CEL-UNet 进行分割,然后使用自定义算法提取 GH 关节区域,最后使用 Arthro-Net 进行分类。
1.7 分割和分类质量评估
- 使用 Dice 系数、Jaccard 系数、精确率、召回率和 F1 分数评估分割模型的性能。
- 使用均方根误差 (RMSE) 和豪斯多夫距离评估 3D 重建模型的性能。
- 使用准确率、精确率、召回率、F1 分数和混淆矩阵评估分类模型的性能。
- 测量整个预测流程的运行时间,评估模型的效率。
2 结果
2.1 CEL-UNet 与 nnUNet分割结果比较
- 肱骨分割: CEL-UNet 在 Dice 系数和 Jaccard 指数方面显著优于 DCE-nnUNet 和 FOC-nnUNet,在精度和召回率方面也优于 DCE-nnUNet 和 FOC-nnUNet 之一。
- 肩胛骨分割: CEL-UNet 在 Dice 系数、Jaccard 指数和精度方面显著优于 DCE-nnUNet 和 FOC-nnUNet,DCE-nnUNet 在召回率方面表现最好。
- 定性比较: CEL-UNet 能够准确捕捉骨刺轮廓和肩胛骨的狭窄解剖结构,而 DCE-nnUNet 和 FOC-nnUNet 在识别骨刺和肩胛骨上角方面存在错误。
2.2 肱骨和肩胛骨 3D 重建
- CEL-UNet 的重建精度: CEL-UNet 实现了全球 RMSE 小于 1 毫米的 3D 重建表面。肱骨和肩胛骨的中位数和四分位距分别为 0.22 (0.15-0.38) 毫米,0.37 (0.22-0.77) 毫米,0.55 (0.29-0.78) 毫米和 0.16 (0.12-0.27) 毫米,0.19 (0.13-0.36) 毫米,0.24 (0.15-0.54) 毫米。
- CEL-UNet 的重建质量: CEL-UNet 在重建肩胛骨下凹处表现出色。
- CEL-UNet 的优势: CEL-UNet 在重建不规则肱骨头骨刺方面表现出色,而 DCE-nnUNet 和 FOC-nnUNet 则无法做到。所有三个网络在重建肩胛骨时都遇到了困难,尤其是在上角附近。
2.3 Arthro-Net:三种病理条件的分类结果
- 消融研究: Arthro-Net 的最佳设计配置是 A(7, 48),具有七个处理块和 48 个初始特征图,在三个分类任务中实现了最佳的准确率、精确率、召回率和 F1 分数,范围从 0.88 到 0.95。
- 分类准确性: OS 的召回率在检测小 (<3 毫米) 和大 (>7 毫米) 骨刺时更高,JS 的召回率在生理 (100%) 和不可检测 (93%) 关节间隙条件下更可靠,而 GH 头部偏心的分类准确性略低于同心度 (88% 对 95%)。
2.4 整体流程的部署和推理速度
- 推理时间: 每个操作的推理时间在整个测试集上进行了测量,包括使用 CEL-UNet 进行 CT 分割、3D 重建、GH 区域识别和使用 Arthro-Net 进行诊断分类。
- 最耗时的步骤: 分割是最耗时的步骤,中位数为 9.2 秒。肱骨重建时间超过了肩胛骨重建时间,分别耗时 1.0 秒和 3.6 秒。
- 总时间: 所有流程的总中位数为 14.8 秒,证实了所提出的级联多任务方法的快速吞吐量,使其有可能适用于临床诊断实践。