东方耀AI技术分享

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 3448|回复: 1
打印 上一主题 下一主题

[课堂笔记] 总结:SSD标签输入的编码过程:

[复制链接]

1365

主题

1856

帖子

1万

积分

管理员

Rank: 10Rank: 10Rank: 10

积分
14439
QQ
跳转到指定楼层
楼主
发表于 2019-12-2 17:38:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
总结:SSD标签输入的编码过程:
1、生成一个模板矩阵 shape=(batch_size, n_boxes_total, 18) 18=6+4+4+4
类别为6个0,边界框=anchor box(已经归一化),anchor box(已经归一化了), variances全为1.0
2、把模板矩阵的分类的one-hot 全部设为背景(默认)
3、一张图片一张图片的处理 人工标注的gt box标签(先归一化,转变坐标形式corners2centroids,类别进行one-hot编码)
4、当前图片中的所有人工标注的box与该张图片中所有的anchor box计算iou值
5、难点:根据iou值匹配寻找所有正样本(1对1匹配+多匹配)多匹配的阈值是设定的正样本的iou阈值
6、关键:在模板矩阵中给所有正样本的类别和边界框赋值(用人工标注框的类别和box定位坐标)
7、根据负样本的最大iou阈值限制后,找出所有的中立样本 丢弃
8、剩下就全部是负样本了:总样本数-正样本数-中立样本数
9、关键:所有图片都处理完后:将模板矩阵中的边界框坐标(已经归一化了)由绝对坐标变成 相对于anchor box的坐标,
这一步导致我们模型预测的就是相对于anchor box的坐标
10、只有正样本转换的才有意义,负样本和中立样本转换后boxes都是0(没有物体目标啊) 这种转换策略的聪明之处!


  1. 先生成一个模板y_encoded临时的(类别全0,边界框=anchor box(已经归一化了), anchor box(已经归一化了), variances全为1.): (2, 17538, 18) [[0.         0.         0.         0.         0.         0.
  2.   0.00833333 0.01351351 0.03535534 0.11313708 0.00833333 0.01351351
  3.   0.03535534 0.11313708 1.         1.         1.         1.        ]
  4. [0.         0.         0.         0.         0.         0.
  5.   0.00833333 0.01351351 0.02886751 0.13856406 0.00833333 0.01351351
  6.   0.02886751 0.13856406 1.         1.         1.         1.        ]
  7. [0.         0.         0.         0.         0.         0.
  8.   0.00833333 0.01351351 0.05       0.08       0.00833333 0.01351351
  9.   0.05       0.08       1.         1.         1.         1.        ]]
  10. 把模板的y_encoded分类的one-hot 全部设为背景
  11. 正在处理的图像编号:0
  12. 该图片的人工标注框labels: (5, 5) [[  1.  87. 153. 123. 173.]
  13. [  1. 146. 153. 164. 167.]
  14. [  1. 190. 151. 219. 174.]
  15. [  1. 263. 143. 299. 176.]
  16. [  1. 295. 140. 350. 185.]]
  17. 该图片的人工标注框(归一化后,坐标从corners变为中心点(cx cy w h)形式): [[1.         0.21875    0.54333333 0.075      0.06666667]
  18. [1.         0.32291667 0.53333333 0.0375     0.04666667]
  19. [1.         0.42604167 0.54166667 0.06041667 0.07666667]
  20. [1.         0.58541667 0.53166667 0.075      0.11      ]
  21. [1.         0.671875   0.54166667 0.11458333 0.15      ]]
  22. 该图片的人工标注框(归一化后,坐标从corners变为中心点(cx cy w h)形式,类别one-hot编码后)labels_one_hot: (5, 10) [[0.         1.         0.         0.         0.         0.
  23.   0.21875    0.54333333 0.075      0.06666667]
  24. [0.         1.         0.         0.         0.         0.
  25.   0.32291667 0.53333333 0.0375     0.04666667]
  26. [0.         1.         0.         0.         0.         0.
  27.   0.42604167 0.54166667 0.06041667 0.07666667]
  28. [0.         1.         0.         0.         0.         0.
  29.   0.58541667 0.53166667 0.075      0.11      ]
  30. [0.         1.         0.         0.         0.         0.
  31.   0.671875   0.54166667 0.11458333 0.15      ]]
  32. 该图片中的所有人工标注的box与该张图片中所有的anchor box计算iou值(都归一化了 坐标格式都是中心点的):similarities (5, 17538) [[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  33.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  34.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  35.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  36.   0. 0. 0. 0.]
  37. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  38.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  39.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  40.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  41.   0. 0. 0. 0.]
  42. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  43.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  44.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  45.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  46.   0. 0. 0. 0.]
  47. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  48.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  49.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  50.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  51.   0. 0. 0. 0.]
  52. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  53.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  54.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  55.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  56.   0. 0. 0. 0.]]
  57. 严格匹配,最值且唯一不重复的匹配(最优的一夫一妻制):anchor box的索引: [ 7283  6956  7352  7053 15062]
  58. 已经匹配上的anchor box就不能再去匹配了,类似找女朋友一样
  59. 除开与gt box最优匹配的anchor box之外,剩下的anchor box都可以主动去找之最大匹配的gt box(肯定会重复)经过正样本的iou阈值的筛选后 返回gt_indices: 22 [0 0 2 2 2 3 0 0 0 0 0 0 2 2 3 3 3 4 4 4 4 4]
  60. 返回的anchor_indices: 22 [ 6921  6922  6992  6993  6994  7047  7274  7276  7277  7280  7281  7282
  61.   7353  7354  7407  7413 15044 15056 15058 15063 15064 15243]
  62. 以上过程:已经把正样本全部找出来了,正样本的总个数: 27
  63. 计算iou的similarities shape不变: (5, 17538)
  64. max_background_similarities(除了正样本后还有多少iou值不为0)(看前100个): 2337 [0.00776545 0.02395913 0.02794035 0.02794035 0.00437515 0.00478032
  65. 0.02794035 0.01029781 0.01183467 0.02591161 0.01629073 0.01493905
  66. 0.03022686 0.02235518 0.01493905 0.03022686 0.02539204 0.01493905
  67. 0.03022686 0.02539204 0.01493905 0.03022686 0.02539204 0.01493905
  68. 0.03022686 0.02007255 0.00917771 0.01926914 0.01403507 0.00216023
  69. 0.00196928 0.00806864 0.00217201 0.00477654 0.0146467  0.01705473
  70. 0.01705473 0.01705473 0.00722603 0.00176129 0.01720269 0.0269542
  71. 0.01329788 0.01435088 0.03854473 0.04142676 0.04142676 0.01731328
  72. 0.0015806  0.02018475 0.02470847 0.02644253 0.01440761 0.04854334
  73. 0.06301532 0.08486428 0.02756742 0.0785236  0.0806146  0.09995386
  74. 0.03936556 0.11026872 0.00041663 0.0806146  0.09995386 0.03936556
  75. 0.11849917 0.00446018 0.00228858 0.07304377 0.09995386 0.0309109
  76. 0.08628847 0.01049916 0.00416755 0.04990594 0.06039665 0.03330008
  77. 0.06968401 0.01661119 0.00605357 0.06362481 0.07085155 0.04766545
  78. 0.09753235 0.02279761 0.00794669 0.06362481 0.07085155 0.04766545
  79. 0.11189953 0.0258961  0.00979569 0.06362481 0.07085155 0.04766545
  80. 0.11189953 0.0258961  0.00979569 0.06362481]
  81. 经过负样本的最大阈值限制后,找出所有的中立样本neutral_boxes个数: 187 [ 6561  6594  6595  6633  6686  6687  6688  6689  6692  6693  6694  6695
  82.   6699  6717  6723  6729  6909  6911  6912  6914  6915  6916  6917  6918
  83.   6920  6923  6924  6926  6927  6928  6929  6950  6952  6953  6954  6955
  84.   6958  6959  6964  6965  6984  6985  6986  6987  6988  6989  6990  6991
  85.   6995  6996  6997  6998  6999  7000  7001  7038  7040  7041  7044  7045
  86.   7046  7048  7049  7050  7051  7052  7054  7055  7056  7057  7058  7059
  87.   7071  7077  7083  7089  7095  7268  7269  7270  7271  7272  7275  7278
  88.   7284  7286  7287  7288  7289  7314  7315  7316  7344  7345  7346  7347
  89.   7348  7349  7350  7351  7355  7356  7357  7358  7359  7360  7361  7401
  90.   7404  7405  7406  7408  7409  7410  7411  7412  7414  7415  7416  7417
  91.   7418  7419  7431  7437  7443  7449  7455  7635  7641  7713  7767  7773
  92.   7797  7803  7809 14862 14863 14864 14874 14875 14877 14880 14881 14882
  93. 14883 14974 14978 14980 14986 15038 15040 15041 15042 15043 15046 15047
  94. 15050 15052 15053 15054 15055 15057 15059 15060 15061 15065 15068 15069
  95. 15070 15071 15158 15222 15223 15224 15234 15235 15236 15237 15238 15239
  96. 15240 15241 15242 15244 15245 15249 15251]
  97. 所有负样本的个数:(y_encoded中) 17324
  98. 中立样本(y_encoded中分类的one-hot全为0)个数: 187
  99. 所有负样本的个数17324:= (总样本数17538-正样本数27-中立样本数187)
  100. 正在处理的图像编号:1
  101. 该图片的人工标注框labels: (19, 5) [[  1.  36. 161.  60. 170.]
  102. [  1.  50. 159.  70. 168.]
  103. [  1. 105. 156. 123. 165.]
  104. [  1. 106. 157. 125. 169.]
  105. [  1. 124. 150. 150. 170.]
  106. [  1. 158. 154. 165. 159.]
  107. [  1. 170. 150. 190. 166.]
  108. [  1. 185. 150. 198. 160.]
  109. [  1. 196. 150. 222. 170.]
  110. [  1. 259. 146. 294. 159.]
  111. [  2.  64. 155.  82. 165.]
  112. [  5.  80. 139.  85. 149.]
  113. [  5.  80. 140.  86. 152.]
  114. [  5. 151. 118. 157. 129.]
  115. [  5. 153. 119. 159. 130.]
  116. [  5. 180. 117. 187. 127.]
  117. [  5. 182. 117. 186. 126.]
  118. [  5. 230. 134. 236. 143.]
  119. [  5. 230. 135. 235. 145.]]
  120. 该图片的人工标注框(归一化后,坐标从corners变为中心点(cx cy w h)形式): [[1.         0.1        0.55166667 0.05       0.03      ]
  121. [1.         0.125      0.545      0.04166667 0.03      ]
  122. [1.         0.2375     0.535      0.0375     0.03      ]
  123. [1.         0.240625   0.54333333 0.03958333 0.04      ]
  124. [1.         0.28541667 0.53333333 0.05416667 0.06666667]
  125. [1.         0.33645833 0.52166667 0.01458333 0.01666667]
  126. [1.         0.375      0.52666667 0.04166667 0.05333333]
  127. [1.         0.39895833 0.51666667 0.02708333 0.03333333]
  128. [1.         0.43541667 0.53333333 0.05416667 0.06666667]
  129. [1.         0.57604167 0.50833333 0.07291667 0.04333333]
  130. [2.         0.15208333 0.53333333 0.0375     0.03333333]
  131. [5.         0.171875   0.48       0.01041667 0.03333333]
  132. [5.         0.17291667 0.48666667 0.0125     0.04      ]
  133. [5.         0.32083333 0.41166667 0.0125     0.03666667]
  134. [5.         0.325      0.415      0.0125     0.03666667]
  135. [5.         0.38229167 0.40666667 0.01458333 0.03333333]
  136. [5.         0.38333333 0.405      0.00833333 0.03      ]
  137. [5.         0.48541667 0.46166667 0.0125     0.03      ]
  138. [5.         0.484375   0.46666667 0.01041667 0.03333333]]
  139. 该图片的人工标注框(归一化后,坐标从corners变为中心点(cx cy w h)形式,类别one-hot编码后)labels_one_hot: (19, 10) [[0.         1.         0.         0.         0.         0.
  140.   0.1        0.55166667 0.05       0.03      ]
  141. [0.         1.         0.         0.         0.         0.
  142.   0.125      0.545      0.04166667 0.03      ]
  143. [0.         1.         0.         0.         0.         0.
  144.   0.2375     0.535      0.0375     0.03      ]
  145. [0.         1.         0.         0.         0.         0.
  146.   0.240625   0.54333333 0.03958333 0.04      ]
  147. [0.         1.         0.         0.         0.         0.
  148.   0.28541667 0.53333333 0.05416667 0.06666667]
  149. [0.         1.         0.         0.         0.         0.
  150.   0.33645833 0.52166667 0.01458333 0.01666667]
  151. [0.         1.         0.         0.         0.         0.
  152.   0.375      0.52666667 0.04166667 0.05333333]
  153. [0.         1.         0.         0.         0.         0.
  154.   0.39895833 0.51666667 0.02708333 0.03333333]
  155. [0.         1.         0.         0.         0.         0.
  156.   0.43541667 0.53333333 0.05416667 0.06666667]
  157. [0.         1.         0.         0.         0.         0.
  158.   0.57604167 0.50833333 0.07291667 0.04333333]
  159. [0.         0.         1.         0.         0.         0.
  160.   0.15208333 0.53333333 0.0375     0.03333333]
  161. [0.         0.         0.         0.         0.         1.
  162.   0.171875   0.48       0.01041667 0.03333333]
  163. [0.         0.         0.         0.         0.         1.
  164.   0.17291667 0.48666667 0.0125     0.04      ]
  165. [0.         0.         0.         0.         0.         1.
  166.   0.32083333 0.41166667 0.0125     0.03666667]
  167. [0.         0.         0.         0.         0.         1.
  168.   0.325      0.415      0.0125     0.03666667]
  169. [0.         0.         0.         0.         0.         1.
  170.   0.38229167 0.40666667 0.01458333 0.03333333]
  171. [0.         0.         0.         0.         0.         1.
  172.   0.38333333 0.405      0.00833333 0.03      ]
  173. [0.         0.         0.         0.         0.         1.
  174.   0.48541667 0.46166667 0.0125     0.03      ]
  175. [0.         0.         0.         0.         0.         1.
  176.   0.484375   0.46666667 0.01041667 0.03333333]]
  177. 该图片中的所有人工标注的box与该张图片中所有的anchor box计算iou值(都归一化了 坐标格式都是中心点的):similarities (19, 17538) [[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  178.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  179.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  180.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  181.   0. 0. 0. 0.]
  182. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  183.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  184.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  185.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  186.   0. 0. 0. 0.]
  187. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  188.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  189.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  190.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  191.   0. 0. 0. 0.]
  192. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  193.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  194.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  195.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  196.   0. 0. 0. 0.]
  197. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  198.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  199.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  200.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  201.   0. 0. 0. 0.]
  202. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  203.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  204.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  205.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  206.   0. 0. 0. 0.]
  207. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  208.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  209.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  210.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  211.   0. 0. 0. 0.]
  212. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  213.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  214.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  215.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  216.   0. 0. 0. 0.]
  217. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  218.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  219.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  220.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  221.   0. 0. 0. 0.]
  222. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  223.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  224.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  225.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  226.   0. 0. 0. 0.]
  227. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  228.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  229.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  230.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  231.   0. 0. 0. 0.]
  232. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  233.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  234.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  235.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  236.   0. 0. 0. 0.]
  237. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  238.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  239.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  240.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  241.   0. 0. 0. 0.]
  242. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  243.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  244.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  245.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  246.   0. 0. 0. 0.]
  247. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  248.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  249.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  250.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  251.   0. 0. 0. 0.]
  252. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  253.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  254.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  255.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  256.   0. 0. 0. 0.]
  257. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  258.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  259.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  260.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  261.   0. 0. 0. 0.]
  262. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  263.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  264.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  265.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  266.   0. 0. 0. 0.]
  267. [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  268.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  269.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  270.   0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  271.   0. 0. 0. 0.]]
  272. 严格匹配,最值且唯一不重复的匹配(最优的一夫一妻制):anchor box的索引: [7241 7246 6935 6926 6944 6953 6976 6982 6998 6688 6905 5820 6180 4795
  273. 5507 5174 4813 5575 6287]
  274. 已经匹配上的anchor box就不能再去匹配了,类似找女朋友一样
  275. 除开与gt box最优匹配的anchor box之外,剩下的anchor box都可以主动去找之最大匹配的gt box(肯定会重复)经过正样本的iou阈值的筛选后 返回gt_indices: 9 [9 4 4 4 6 6 8 8 8]
  276. 返回的anchor_indices: 9 [6689 6938 6940 6946 6970 6974 6992 6994 7000]
  277. 以上过程:已经把正样本全部找出来了,正样本的总个数: 28
  278. 计算iou的similarities shape不变: (19, 17538)
  279. max_background_similarities(除了正样本后还有多少iou值不为0)(看前100个): 2335 [0.0015805  0.00275804 0.02596375 0.0015883  0.00301762 0.04020804
  280. 0.0015883  0.00074531 0.0095082  0.0015883  0.00099402 0.00763012
  281. 0.01453231 0.05829291 0.00763012 0.01453231 0.04946288 0.00763012
  282. 0.00763012 0.00541776 0.0431047  0.07761704 0.07216262 0.03341164
  283. 0.04332643 0.08552322 0.03341164 0.04332643 0.04203139 0.03416654
  284. 0.02768885 0.04332643 0.00142141 0.00713446 0.02839687 0.05710271
  285. 0.01034301 0.11381261 0.05077593 0.05710271 0.01034301 0.11381261
  286. 0.10104008 0.05077593 0.05710271 0.01034301 0.02114752 0.05710271
  287. 0.01034301 0.01838876 0.01743265 0.05699456 0.08095374 0.06463182
  288. 0.10373396 0.07216262 0.11458333 0.05729167 0.08138535 0.06463182
  289. 0.11458333 0.11458333 0.11458333 0.05729167 0.08138535 0.06463182
  290. 0.06350922 0.03416654 0.1095852  0.05729167 0.08138535 0.06463182
  291. 0.00756895 0.0660066  0.06076389 0.10876532 0.08840401 0.12152778
  292. 0.12013157 0.06076389 0.10876532 0.08840401 0.12152778 0.10104008
  293. 0.12152778 0.06076389 0.10876532 0.08840401 0.0487013  0.06076389
  294. 0.10876532 0.08840401 0.04593122 0.00268445 0.00515145 0.03524502
  295. 0.00268445 0.00515145 0.04324164 0.00268445]
  296. 经过负样本的最大阈值限制后,找出所有的中立样本neutral_boxes个数: 115 [6327 6576 6577 6579 6582 6583 6584 6585 6612 6613 6614 6630 6631 6633
  297. 6636 6637 6638 6639 6677 6680 6682 6683 6686 6687 6692 6694 6695 6701
  298. 6884 6892 6893 6896 6898 6899 6924 6934 6936 6937 6939 6941 6942 6943
  299. 6945 6947 6950 6952 6968 6971 6972 6973 6977 6980 6983 6988 6989 6990
  300. 6991 6993 6995 6996 6997 6999 7001 7004 7006 7007 7040 7042 7046 7047
  301. 7048 7049 7052 7054 7055 7229 7234 7235 7240 7244 7247 7256 7282 7284
  302. 7286 7288 7294 7296 7297 7298 7299 7300 7301 7302 7303 7304 7305 7306
  303. 7307 7332 7333 7334 7350 7351 7352 7353 7354 7355 7356 7357 7358 7359
  304. 7360 7361 7644]
  305. 所有负样本的个数:(y_encoded中) 17395
  306. 中立样本(y_encoded中分类的one-hot全为0)个数: 115
  307. 所有负样本的个数17395:= (总样本数17538-正样本数28-中立样本数115)

  308. 所有图片都处理完后:将边界框坐标(已经归一化了)格式是中心点形式 由绝对坐标变成 相对于anchor box的坐标:
  309. 只看正样本转换的才有意义,负样本和中立样本转换后boxes都是0(没有物体目标啊),这才是:这样转换的核心好处
  310. 看看转换之前的(某个正样本): [6921] [[0.         1.         0.         0.         0.         0.
  311.   0.21875    0.54333333 0.075      0.06666667 0.225      0.52702703
  312.   0.07071068 0.11313708 1.         1.         1.         1.        ]]
  313. 看看转换之前的(某个负样本): [0] [[1.         0.         0.         0.         0.         0.
  314.   0.00833333 0.01351351 0.03535534 0.11313708 0.00833333 0.01351351
  315.   0.03535534 0.11313708 1.         1.         1.         1.        ]]
  316. 看看转换之前的(某个中立样本): [6561] [[0.         0.         0.         0.         0.         0.
  317.   0.225      0.5        0.07071068 0.11313708 0.225      0.5
  318.   0.07071068 0.11313708 1.         1.         1.         1.        ]]

  319. 转换之后的(某个正样本): [6921] [[ 0.          1.          0.          0.          0.          0.
  320.   -0.08838835  0.14412875  0.05889152 -0.52889515  0.225       0.52702703
  321.    0.07071068  0.11313708  1.          1.          1.          1.        ]]
  322. 转换之后的(某个负样本): [0] [[1.         0.         0.         0.         0.         0.
  323.   0.         0.         0.         0.         0.00833333 0.01351351
  324.   0.03535534 0.11313708 1.         1.         1.         1.        ]]
  325. 转换之后的(某个中立样本): [6561] [[0.         0.         0.         0.         0.         0.
  326.   0.         0.         0.         0.         0.225      0.5
  327.   0.07071068 0.11313708 1.         1.         1.         1.        ]]
复制代码






让天下人人学会人工智能!人工智能的前景一片大好!
回复

使用道具 举报

0

主题

117

帖子

258

积分

中级会员

Rank: 3Rank: 3

积分
258
QQ
沙发
发表于 2020-2-3 15:36:57 | 只看该作者
谢谢老师提供的资料。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|人工智能工程师的摇篮 ( 湘ICP备2020019608号-1 )

GMT+8, 2024-5-17 17:41 , Processed in 0.173178 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表