有效
基于注意力机制的目标检测模型装置及其训练方法、目标检测方法
朱柯弘、张梓航、赵自然、顾建平、金颖康
北京神目科技有限公司
朱
朱柯弘机构 暂无
技术领域 暂无
张
张梓航机构 暂无
技术领域 暂无
赵
赵自然机构 暂无
技术领域 暂无
顾
顾建平机构 暂无
技术领域 暂无
金
金颖康机构 暂无
技术领域 暂无
摘要
提供了一种基于注意力机制的目标检测模型及其训练方法,所述目标检测模型包括前景特征提取网络、全图特征提取网络和背景特征提取网络,所述方法包括:获取初始图像,所述初始图像包括待检测的目标;处理所述初始图像以获取第一图像特征;将所述第一图像特征输入前景特征提取网络以获取前景特征;将所述第一图像特征输入全图特征提取网络以获取全图特征;以及将所述第一图像特征输入背景特征提取网络以获取背景特征,其中,所述将所述第一图像特征输入全图特征提取网络以获取全图特征包括:将所述第一图像特征输入全图特征提取网络;以及基于注意力机制处理输入的所述第一图像特征,以获取全图特征。
1.一种基于注意力机制的目标检测模型的训练方法,所述目标检测模型包括前景特征提取网络、全图特征提取网络和背景特征提取网络,其特征在于,所述方法包括:获取初始图像,所述初始图像包括待检测的目标;处理所述初始图像以获取第一图像特征;将所述第一图像特征输入前景特征提取网络以获取前景特征,其中包括:将前景掩模图像输入前景注意力子模型,以获取前景注意力矩阵;将所述第一图像特征与所述前景注意力矩阵相乘,得到前景增强特征;将所述第一图像特征输入全图特征提取网络以获取全图特征;以及将所述第一图像特征输入背景特征提取网络以获取背景特征,其中,所述将所述第一图像特征输入全图特征提取网络以获取全图特征包括:将所述第一图像特征输入全图特征提取网络;基于注意力机制处理输入的所述第一图像特征,以获取全图特征;基于所述全图特征、所述前景特征和所述背景特征构建损失函数;以及利用所述损失函数,对所述目标检测模型的参数进行更新。
2.根据权利要求1所述的方法,其中,所述全图特征提取网络包括通道注意力子模型和空间注意力子模型,所述基于注意力机制处理输入的所述第一图像特征包括:使用通道注意力子模型和空间注意力子模型处理输入的所述第一图像特征。
3.根据权利要求2所述的方法,其中,所述使用通道注意力子模型和空间注意力子模型处理输入的所述第一图像特征包括:将所述第一图像特征输入通道注意力子模型;所述通道注意力子模型处理所述第一图像特征,以获取通道注意力矩阵;将所述第一图像特征与所述通道注意力矩阵相乘,以获取通道注意力增强特征;将所述通道注意力增强特征输入空间注意力子模型;所述空间注意力子模型处理所述通道注意力增强特征,以获取空间注意力矩阵;以及将所述通道注意力增强特征与所述空间注意力矩阵相乘,以获取空间注意力增强特征。
4.根据权利要求3所述的方法,其中,所述将所述第一图像特征输入背景特征提取网络以获取背景特征包括:将所述第一图像特征与背景注意力矩阵相乘,得到背景增强特征。
5.根据权利要求4所述的方法,其中,所述方法还包括:基于所述空间注意力矩阵和所述前景注意力矩阵确定背景注意力矩阵。
6.根据权利要求1所述的方法,其中,根据下面的公式,基于所述全图特征、所述前景特征和所述背景特征构建损失函数:其中, 为损失函数, 为全图特征, 为前景特征, 为背景特征, 为边界超参数。
7.根据权利要求3所述的方法,其中,所述通道注意力子模型包括第一池化层、第一卷积层和第二卷积层,所述通道注意力子模型处理所述第一图像特征,以获取通道注意力矩阵,具体包括:利用第一池化层,对所述第一图像特征进行全局平均池化;将经全局平均池化的第一图像特征输入第一卷积层,以获取第一卷积特征;将所述第一卷积特征输入第二卷积层,以获取第二卷积特征;以及利用第一激活函数处理所述第二卷积特征,以获取所述通道注意力矩阵。
8.根据权利要求7所述的方法,其中,所述空间注意力子模型包括第三卷积层、第二池化层、第三池化层和第四卷积层,所述空间注意力子模型处理所述通道注意力增强特征,以获取空间注意力矩阵,具体包括:将所述通道注意力增强特征输入所述第三卷积层,以获取第三卷积特征;利用第二池化层,对所述第三卷积特征进行全局平均池化,以获取第一池化特征;利用第三池化层,对所述第三卷积特征进行全局最大池化,以获取第二池化特征;拼接所述第一池化特征和所述第二池化特征,以获取拼接特征;将所述拼接特征输入所述第四卷积层,以获取第四卷积特征;以及利用第二激活函数处理所述第四卷积特征,以获取所述空间注意力矩阵。
9.根据权利要求7所述的方法,其中,所述第一卷积层和所述第二卷积层均为1×1的卷积层。
10.根据权利要求7或9所述的方法,其中,所述第一卷积层的输入通道数为 ,输出通道数为 ,其中c为第一通道压缩比;以及所述第二卷积层的输入通道数为 ,输出通道数为 。
11.根据权利要求8所述的方法,其中,所述第三卷积层为3×3的卷积层,所述第四卷积层为7×7的卷积层。
12.根据权利要求8或11所述的方法,其中,所述第三卷积层的输入通道数为 ,输出通道数为 ,其中 为第二通道压缩比;以及所述第四卷积层的输入通道数为2,输出通道数为1。
13.根据权利要求1所述的方法,其中,所述前景注意力子模型包括2×2的第四池化层,所述将前景掩模图像输入前景注意力子模型,以获取前景注意力矩阵,具体包括:利用所述第四池化层,对所述前景掩模图像进行最大池化,以获取前景注意力矩阵。
14.根据权利要求1或13所述的方法,其中,所述前景掩模图像为包括前景轮廓的二值化图像。
15.根据权利要求5所述的方法,其中,根据下面的公式,基于所述空间注意力矩阵和所述前景注意力矩阵确定背景注意力矩阵:其中, 为背景注意力矩阵, 为空间注意力矩阵, 为前景注意力矩阵, 为超参数, 。
16.根据权利要求1-3中任一项所述的方法,其中,所述处理所述初始图像以获取第一图像特征包括:将所述初始图像输入第一跨阶段局部网络;所述第一跨阶段局部网络对所述初始图像进行特征编码,以获取第一图像特征。
17.根据权利要求4所述的方法,其中,所述将所述第一图像特征输入前景特征提取网络以获取前景特征还包括:将所述前景增强特征输入第二跨阶段局部网络;以及所述第二跨阶段局部网络对所述前景增强特征进行特征编码,以获取前景特征;和/或,所述将所述第一图像特征输入全图特征提取网络以获取全图特征还包括:将所述空间注意力增强特征输入第二跨阶段局部网络;以及所述第二跨阶段局部网络对所述空间注意力增强特征进行特征编码,以获取全图特征;和/或,所述将所述第一图像特征输入背景特征提取网络以获取背景特征还包括:将所述背景增强特征输入第二跨阶段局部网络;以及所述第二跨阶段局部网络对所述背景增强特征进行特征编码,以获取背景特征。
18.根据权利要求1-3中任一项所述的方法,其中,所述初始图像为通过太赫兹成像装置扫描成像区域获取的图像,和/或通过毫米波成像装置扫描成像区域获取的图像。
19.一种目标检测方法,其特征在于,包括:获取初始图像;将所述初始图像输入目标检测模型,其中,所述目标检测模型是通过如权利要求1~18中任一项所述的方法训练得到的;以及根据所述目标检测模型的输出,确定所述初始图像中的待检测目标。
20.一种基于注意力机制的目标检测模型的训练装置,所述目标检测模型包括前景特征提取网络、全图特征提取网络和背景特征提取网络,其特征在于,所述装置包括:图像获取模块,用于获取初始图像,所述初始图像包括待检测的目标;第一图像特征获取模块,用于处理所述初始图像以获取第一图像特征;前景特征获取模块,用于将所述第一图像特征输入前景特征提取网络以获取前景特征,其中包括:将前景掩模图像输入前景注意力子模型,以获取前景注意力矩阵;将所述第一图像特征与所述前景注意力矩阵相乘,得到前景增强特征;全图特征获取模块,用于将所述第一图像特征输入全图特征提取网络以获取全图特征;以及背景特征获取模块,用于将所述第一图像特征输入背景特征提取网络以获取背景特征,其中,所述全图特征获取模块具体用于:将所述第一图像特征输入全图特征提取网络;以及基于注意力机制处理输入的所述第一图像特征,以获取全图特征,其中,基于所述全图特征、所述前景特征和所述背景特征构建损失函数;以及利用所述损失函数,对所述目标检测模型的参数进行更新。
21.一种基于注意力机制的目标检测模型装置,其特征在于,包括:第一图像特征处理模型,用于处理初始图像以获取第一图像特征;前景特征提取网络,用于处理第一图像特征以提取前景特征,其中包括:将前景掩模图像输入前景注意力子模型,以获取前景注意力矩阵;将所述第一图像特征与所述前景注意力矩阵相乘,得到前景增强特征;全图特征提取网络,用于基于注意力机制处理第一图像特征以提取全图特征;以及背景特征提取网络,用于处理第一图像特征以提取背景特征。
22.根据权利要求21所述的目标检测模型装置,其特征在于,所述全图特征提取网络包括通道注意力子模型和空间注意力子模型;和/或,所述前景特征提取网络包括前景注意力子模型。
23.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~19中任一项所述的方法。
24.根据权利要求23所述的电子设备,其中,所述电子设备为太赫兹成像装置和毫米波成像装置中的至少一个。
25.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~19中任一项所述的方法。
26.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~19中任一项所述的方法。
暂无引用专利



