yolov7 整体结构 输入input、骨干网络backbone、颈部neck、头部head
图片经过input部分数据增强等一系列操作进行预处理后,被送入backbone 
backbone对处理后的图片提取特征 
提取到的特征经过 Neck 模块特征融合处理得到大、中、小三种尺寸的特征 
最终,融合后的特征被送入检测头,经过检测之后输出得到结果 
 
prototype prototype learning讲解 
K均值聚类是原型学习的一个典型示例
https://openaccess.thecvf.com/content/CVPR2021/papers/Zhu_Prototype_Augmentation_and_Self-Supervision_for_Incremental_Learning_CVPR_2021_paper.pdf 
trick CBAM加一个,在yolov7_backbone处
def forward(self, x):         x0 = self.stage0(x)          x1 = self.stage1(x0)          x2 = self.elan_0(x1)         x2 = self.cbam_0(x2) #! 添加 CBAM                  x3 = self.elan_1(x2)         # x3 = self.cbam_1(x3) #! 添加 CBAM                  x4 = self.elan_2(x3)         # x4 = self.cbam_2(x4) #! 添加 CBAM                  x5 = self.elan_3(x4)         # x5 = self.cbam_3(x5) #! 添加 CBAM                  return x3, x4, x5