门户网站建设思路从事网络营销的公司
AVOD理解
4:RPN->Fusion
RPN:
从RPN得到的输出top_anchors,ground_plane,class_label等作为AVOD检测部分网络的输入.将top_anchors投影到BEV面,得到其的坐标(x1,z1,x2,z2),再交换坐标为(z1,x1,z2,x2);读取图像上的2D框的信息.根据原始的feature map选择mask确定输入
ROI_pooling:
根据初始的feature map以及RPN后的top_anchors信息,进行crop_and_resize,生成7*7的bev_rois,img_rois
Fusion
融合网络被与后面的全连接网络放到了一起.
5:Fusion->fully connection
Layers:
根据config文件,设置layers,输入bev_rois, img_rois, input_weights(bev_mask,img_mask),class,top_anchors.
Fully connection
代码全连接部分.
Output:
Classification:预测的分类,背景/车
**Offsets:**10个回归值,3D-boxes的底面的四个坐标(不涉及高度)以及代表高度的两个h.一个是地面与地平面的距离,一个是顶面