一、基础必问

  1. **你的毕业论文研究背景和意义是什么?**要点:骨折筛查量大、医生疲劳、漏诊 / 误诊;AI 辅助诊断提高效率、基层普及。
  2. **为什么选这个课题?你个人做了哪些工作?**要点:结合医疗 AI 热点、临床需求;你负责:选题、方案、数据集、模型训练、实验、写论文。
  3. **目前进展到哪一步了?遇到什么困难?怎么解决的?**你现在:完成选题、方案设计。可以说:数据集获取、数据标注、类别不平衡、小目标检测难、过拟合等。

“您问的这个方法是伪标签(Pseudo Labeling),也是我毕设里计划采用的核心半监督策略。具体来说,我会先用少量标注好的骨折影像,训练出一个基础的 YOLOv11 模型,之后用这个模型去预测大量无标注的骨折 X 光片,筛选出置信度高于 0.85 的检测结果,将其作为‘伪标签’,再把这些带伪标签的数据和真实标注数据混合,重新训练 YOLOv11,反复迭代优化。这样做既能充分利用医院里大量未标注的影像资源,又能避免低置信度的错误标签干扰模型训练,刚好解决医疗影像标注成本高的痛点,同时也能进一步提升 YOLOv11 对细小、不规则骨折病灶的检测精度,贴合我毕设的核心需求。”


二、算法与模型

  1. **为什么用 YOLO,不用 Faster R-CNN、SSD?**一阶段 vs 二阶段:
    • YOLO:速度快、端到端、适合实时筛查
    • Faster R-CNN:精度高但慢医疗筛查要快 + 准,所以选 YOLO。
  1. **为什么用 YOLOv11,而不是 v5/v8/v10?**你可以背:
    • 轻量化更好,模型更小,便于部署
    • 小目标检测能力更强
    • 骨干网络、Neck、损失函数有优化刚好匹配骨折细小、不规则的特点。
  1. **YOLO 的核心原理是什么?**简单说:把图片分成网格,每个网格预测目标框 + 类别,一次性输出,速度快。
  2. **你用的损失函数是什么?**答:分类损失、回归损失(CIoU/DIoU)、目标置信度损失。

\1. 分类损失(BCEWithLogitsLoss):相当于让模型学会“判断”——检测框里的东西,到底是“骨折的地方”还是“正常的骨头”,不能把正常的骨纹理认错成骨折,也不能漏判真正的骨折点,就像帮模型分清“好骨头”和“坏骨头”。

\2. 回归损失(CIoU Loss):相当于让模型学会“瞄准”——找到骨折的地方后,把检测框精准框在骨折点上,尤其是细小的裂纹骨折,不能框偏、框大或框小,确保能准确圈出骨折的具体位置。

\3. 目标性损失(BCEWithLogitsLoss):相当于让模型学会“筛选”——先判断这个检测框里“有没有骨折”,如果没有,就直接忽略,不用浪费精力去分析,只专注于那些可能有骨折的区域,提高检测的效率。

简单总结就是:分类损失判“是什么”,回归损失判“在哪里”,目标性损失判“有没有”,三者配合,让模型能精准、高效地找到X光片里的骨折。


三、数据与实验

  1. **数据集从哪来?有多少数据?**可以说:公开数据集 + 合作医院数据(没有就说公开);数量:几百~几千张都可以,合理就行。
  2. **数据怎么预处理?有没有数据增强?**旋转、翻转、裁剪、亮度、对比度、高斯噪声等,防止过拟合。
  3. **评价指标用什么?为什么?**医疗检测必说:
    • Precision、Recall、mAP@0.5医疗更看重召回率(不漏诊)

先说下模型的评价指标,结合我毕设的骨折检测场景,医疗上最看重的是召回率(Recall),也就是“不漏诊”——哪怕多判几个疑似骨折(允许少量误判),也不能漏掉一个真正的骨折患者。

简单说下三个关键指标,都用大白话讲:

  • **召回率(Recall)—— 核心是 “不漏诊”**先数清楚:医院里总共 100 张真的有骨折的 X 光片(这是 “真实阳性”),我的模型最终检测出了 95 张(这是 “模型判对的骨折”)。计算就是:召回率 = 模型找出来的真骨折数 ÷ 所有真实的骨折数 = 95÷100=95%。这个数越高,说明漏诊的越少,这也是医疗场景最看重的,哪怕多判几个,也不能漏。
  • **精确率(Precision)—— 核心是 “不误诊”**还是举例:模型一共判了 100 张 “有骨折”,但其中只有 80 张是真的骨折(剩下 20 张是正常骨头误判)。计算就是:精确率 = 模型判对的骨折数 ÷ 模型所有判 “有骨折” 的数量 = 80÷100=80%。这个数高,说明误诊的少,但医疗上我会优先保召回率,哪怕精确率稍降一点。
  • **mAP@0.5——“整体表现分”**不用记复杂公式,通俗说就是:第一步,先定个 “及格线” 0.5—— 模型框出的骨折位置,和医生标注的位置重合度≥50%,就算 “判对了”;第二步,把不同召回率下的精确率都算出来,画成一条曲线,曲线下面的面积就是 AP;第三步,因为我只检测 “骨折” 这一个类别,mAP(平均精度)就等于这个 AP 值;如果有多个类别,就把每个类别的 AP 加起来求平均。简单说,mAP@0.5 越高,模型整体检测能力越好。

四、工程与创新

  1. 你的创新点在哪?
    • 把 YOLOv11 用在骨折 X 光 / CT 检测
    • 针对小目标、不规则病灶做优化(数据 / 模型)
    • 轻量化,适合移动端 / 边缘设备部署
  1. 未来怎么继续改进?
    • 扩大数据集
    • 做模型轻量化、部署
    • 结合分割、关键点定位
    • 多模态(X 光 + CT)