【摘要】目的:构建基于大语言模型(LLM)的盆底超声报告结构化抽取流程,评估其在膀胱膨出诊断及 Green 分型中的应用价值,并 比较规则模型、Logistic 回归、XGBoost 及融合模型的诊断效能。方法:回顾性纳入 2024 年 1 月—2025 年 10 月在秦皇岛市抚宁区人民医 院接受盆底三维经会阴超声且报告完整的女性患者 109 例,以诊断栏“膀胱膨出”作为金标准(阳性 37 例、阴性 72 例)。构建中文自 由文本结构化抽取流程,采用规则引擎联合 LLM 自动提取尿道旋转角(URA)、膀胱颈移动度(BNM)、膀胱尿道后角(PUV)、肛 提肌裂孔面积(LHA)、残余尿量(RU)等指标,并据此自动判定膀胱膨出及 Green 分型。采用 5 折分层交叉验证分别建立规则模型、 Logistic 回归、XGBoost 及规则 + 机器学习的简单平均融合模型,计算曲线下面积(AUC)、平均精度(AP)、灵敏度、特异度等,并 绘制校准曲线、决策曲线及 SHAP 图。结果:纳入患者平均年龄(40.4±17.9)岁,膀胱膨出阳性率 33.9%(37/109)。与阴性组相 比,阳性组年龄更大,URA、BNM 及 LHA 显著增大(P < 0.05)。结构化抽取覆盖率:URA、BNM、PUV、LHA 均为 100.0%,RU 为 99.1%;膀胱最低点与宫颈最低点覆盖率分别为 2.8% 与 0,提示相关表述仍需优化规则 / 正则。规则模型、Logistic 回归、XGBoost 模型 与融合模型的 AUC 分别为 0.994、0.997、1.000、1.000;AP 分别为 0.976、0.994、1.000、1.000。XGBoost 模型与融合模型在本队列 最优阈值下灵敏度、特异度及准确率均达 100.0%;校准曲线显示 Logistic 回归模型与融合模型一致性良好,决策曲线显示融合模型在较宽 阈值范围内净获益最高。36 例具备 Green 分型金标准的病例中,自动分型一致率为 100.0%。SHAP 图分析显示,URA、BNM、LHA 为主 要贡献特征。结论:LLM 辅助的盆底超声文本结构化流程可在无需额外图像标注下高覆盖率提取关键量化指标,并实现膀胱膨出及 Green 分型的高性能识别;规则模型与机器学习融合模型在诊断效能、校准度及临床净获益方面表现更佳,为历史报告再利用与盆底 疾病智能随访提供可行路径。
【关键词】盆底超声;膀胱膨出;Green 分型;人工智能;大语言模型;Logistic 回归;XGBoost 模型
