公司网站建设攻略,新产品推广方案范文,网站免费正能量直接进入app,巩义网站建设公司Mask R-CNN 相关知识点整体框架1.Resnet 深度残差学习1.1 目的1.2 深度学习深度增加带来的问题1.3 Resnet实现思想【添加恒等映射】2.线性插值2.1 目的2.2 线性插值原理2.3 为什么使用线性插值?3.FPN 特征金字塔3.1 FPN介绍3.2 为什么使用FPN?3.3 自下而上层【提取特征】3.4 …
Mask R-CNN 相关知识点
- 整体框架
- 1.Resnet 深度残差学习
- 1.1 目的
- 1.2 深度学习深度增加带来的问题
- 1.3 Resnet实现思想【添加恒等映射】
- 2.线性插值
- 2.1 目的
- 2.2 线性插值原理
- 2.3 为什么使用线性插值?
- 3.FPN 特征金字塔
- 3.1 FPN介绍
- 3.2 为什么使用FPN?
- 3.3 自下而上层【提取特征】
- 3.4 自上而下层【横向连接,特征融合】
- 4. Anchors(候选框生成)
- 5. RPN 区域建议网络
- 6. ROI 感兴趣区域
- 7. DetectionTargetLayer【目标检测层】
- 8. RoiAlign 水平对齐
- 8.1 为什么使用线性插值实现?【使用RoIPool带来的问题】
- 8.2 使用ROIAlign 与RoiPool的原因
- 8.3 ROIAlign优点
- 9.分类与回归
- 相关文章链接
- Resnet论文
- Mask R-cnn论文
- 线性插值原理
整体框架

1.Resnet 深度残差学习
1.1 目的
1.2 深度学习深度增加带来的问题
- 梯度消失与爆炸问题
退化问题
:随着网络深度的增加,准确度会饱和,然后迅速退化。
1.3 Resnet实现思想【添加恒等映射】
- 增加模型层数与
恒等映射
做对比,如果增加层数效果变差,就把权重
设置接近于0
的值。【近似于没有增加模型深度】 - 确保较深的模型应该不会比较浅的模型产生更高的训练误差。

Convolution Block
和identity Block
区别 Convolution Block
通道数和特征图大小变化了

2.线性插值
2.1 目的
2.2 线性插值原理
- 单线性插值: 根据2点确定一条直线,斜率固定,就可以得到插入值的位置
- 多线性插值就是多次的但线性插值得到的
2.3 为什么使用线性插值?
- 对图片上采样,原始图片3∗33*33∗3范围红色框中的值,会得到4∗44*44∗4框中红色框的值。
- 假设目标图片红框坐标为(i,j)(i,j)(i,j),那么在原始图片位置(i∗3/4,j∗3/4)(i*3/4,j*3/4)(i∗3/4,j∗3/4)
- 已知i=2,j=3i=2,j=3i=2,j=3i = 2 , j = 3 i=2,j=3i=2,j=3i=2,j=3i=2,j=3i=2,j=3,所以在原始图片位置(1.5,0.75)( 1.5 , 0.75 )(1.5,0.75)
- 不是整数,在找原始图片位置时,会自动取整
- 即,需要使用线性插值,来降低误差

3.FPN 特征金字塔
3.1 FPN介绍
3.2 为什么使用FPN?
- 在特征提取中去最后一层特征图,对图片语义性较高,但是对于图片的小物体,零散特征不多,使小物体在图片中检测的效果不好
- 将多个阶段特征图融合在一起,有了高层语义特征,也有了底层轮廓特征,效果会更好

3.3 自下而上层【提取特征】
- 使用
Resnet
深度残差算法主干结构提取特征,返回每个阶段最后一层的数据。 - 不改变特征图大小的层为一个阶段
- 每次提取特征都是每个阶段最后一层的输出
3.4 自上而下层【横向连接,特征融合】
- 使用
1*1
卷积核将特征图大小统一 - 使用线性插值进行上采样与此阶段的前一个阶段进行特征融合,以此类推,返回特征融合后每个阶段的值
- 例如:
C5
阶段的特征图上采样后与C4
的特征图融合,得到P4
。

4. Anchors(候选框生成)
4.1 实现步骤
- 对提取的特征图进行区域金字塔网络
- 将生成很多不同的候选框,在图片上进行提取特征,一个图片会提取出多种特征图
anchors
(候选框生成):以每个像素点为中心,设置3
个不同大小的scales
,每个scales
有3
个不同的roatis
,生成各种框- 例如:
scales:(32, 64, 128),roatis([0.5, 1, 2])
,所以每个像素点会生成9
个不同的框

5. RPN 区域建议网络
5.1 目的
- 提取前景与背景
RPN
具有平移不变性 - 在不同位置的同一物体都可以检测出来,因为生成了很多框
5.2 实现步骤
- 分类:对生成的候选框进行二分类,判断是前景还是背景
- 回归:得到候选框偏移量【
ground-truth
与候选框偏移大小】 - 将生成的候选框做前景和背景二分类
- 返回分类得分,分类概率,区域框数据

6. ROI 感兴趣区域
6.1 目的
6.2 实现步骤
- 按照前景得分排序,取前
n
个的得分最高的候选框 - 根据候选框偏移量微调候选框位置,使候选框更接近
grouth-truth
框 - 对于越界的候选框,进行范围修剪
IOU
过滤:筛选出候选框与ground-truth
重叠比例大于阈值的候选框MNS
(非极大值抑制)过滤:候选框重叠比例大于阈值的最高得分候选框- 根据得分值选择前
n
个得分最高的前景,获取正样本数据集

7. DetectionTargetLayer【目标检测层】
7.1 目的
- 找到正样本
GT
的类别,IOU
最大的类别 - 正样本与
GT-box
的偏移量 - 正样本与
GT-box
对应的掩码mask
,即实例分割框 - 负样本的偏移量与
mask
使用0
填充
7.2 实现步骤
- 去除
padding
填充的候选框 - 获取前
n
个得分最高的前景数量不够,会使用padding
填充,凑齐n
个前景 - 去除一个框包含多个物体的去除
- 正负样本判断:基于
ROI
和ground-truth
,通过IOU
值与默认阈值0.5
判断 - 数据集正负比例为
1:3
8. RoiAlign 水平对齐
8.1 为什么使用线性插值实现?【使用RoIPool带来的问题】
- 当一个特征图大小为
800
时,物体大小是665
,对特征图进行卷积,假设特征图缩小了32
倍,800/32=25
,得到新的25
大小特征图,但是665/32=20.78
,所以物体的位置应该在25
特征图上占20.78
,但是他们会舍弃小数,实际是占20
的大小 - 将物体映射到原图,会损失
0.78*32=24.96
个像素点,对于大物体偏差不大,但是对于小物体偏差就会很大【如果出现奇数就会出现这个问题】
8.2 使用ROIAlign 与RoiPool的原因
8.3 ROIAlign优点
- 消除了
RoIPool
的苛刻量化【向下取整】,将提取的特征与输入正确对齐。 RoIPool
没有pixel-to-pixel
之间对齐关系,不能预测到原图位置的像素点,预测位置具有较大的误差。

9.分类与回归
- 将所有特征图大小统一后,就可以进入全连接层
- 进行相关分类与回归操作
文章转载自: http://hermetically.jjpk.cn http://improper.jjpk.cn http://cordiality.jjpk.cn http://tributary.jjpk.cn http://nemoricole.jjpk.cn http://potpie.jjpk.cn http://sleepyhead.jjpk.cn http://clause.jjpk.cn http://moonseed.jjpk.cn http://heeling.jjpk.cn http://silicle.jjpk.cn http://lichenometry.jjpk.cn http://gatepost.jjpk.cn http://outdone.jjpk.cn http://aviatic.jjpk.cn http://canalize.jjpk.cn http://pistole.jjpk.cn http://admonish.jjpk.cn http://egotism.jjpk.cn http://xenoglossy.jjpk.cn http://cautiously.jjpk.cn http://hairif.jjpk.cn http://misstep.jjpk.cn http://spodosol.jjpk.cn http://visive.jjpk.cn http://nonsocial.jjpk.cn http://battle.jjpk.cn http://friction.jjpk.cn http://benumb.jjpk.cn http://drygoods.jjpk.cn http://tomcod.jjpk.cn http://lienable.jjpk.cn http://deponent.jjpk.cn http://monoplane.jjpk.cn http://siracusa.jjpk.cn http://circumlocutory.jjpk.cn http://condominium.jjpk.cn http://jacklight.jjpk.cn http://travelled.jjpk.cn http://questioningly.jjpk.cn http://vaal.jjpk.cn http://nodical.jjpk.cn http://accra.jjpk.cn http://gantry.jjpk.cn http://ammonolysis.jjpk.cn http://timeous.jjpk.cn http://fluorination.jjpk.cn http://dyscrasite.jjpk.cn http://smell.jjpk.cn http://inexpansible.jjpk.cn http://blenny.jjpk.cn http://ergotoxine.jjpk.cn http://impeachable.jjpk.cn http://lupulone.jjpk.cn http://suable.jjpk.cn http://couvade.jjpk.cn http://impunity.jjpk.cn http://inpro.jjpk.cn http://ressentiment.jjpk.cn http://welder.jjpk.cn http://thrombosthenin.jjpk.cn http://heteropathy.jjpk.cn http://empire.jjpk.cn http://owllight.jjpk.cn http://verbify.jjpk.cn http://philtrum.jjpk.cn http://gurge.jjpk.cn http://neatness.jjpk.cn http://decagynous.jjpk.cn http://androcentrism.jjpk.cn http://ticktock.jjpk.cn http://laudable.jjpk.cn http://prude.jjpk.cn http://polite.jjpk.cn http://carbonaceous.jjpk.cn http://apoprotein.jjpk.cn http://ichthyofauna.jjpk.cn http://hydracid.jjpk.cn http://yohimbine.jjpk.cn http://laurelled.jjpk.cn http://abide.jjpk.cn http://tiglon.jjpk.cn http://crucible.jjpk.cn http://tannia.jjpk.cn http://xanadu.jjpk.cn http://chummy.jjpk.cn http://absolvable.jjpk.cn http://tudory.jjpk.cn http://quarenden.jjpk.cn http://crabbery.jjpk.cn http://geniculum.jjpk.cn http://ironwork.jjpk.cn http://outmeasure.jjpk.cn http://babylonian.jjpk.cn http://windsock.jjpk.cn http://ming.jjpk.cn http://extendible.jjpk.cn http://glucosamine.jjpk.cn http://nullipore.jjpk.cn http://vendee.jjpk.cn