yolov5中训练长条型目标召回率低问题

对于长条目标长宽比比较大的目标,如长1000pix,宽度10pix等在训练时masic数据增强图片中会出现有的图片中标签遗失问题,将原来标注好的目标,但是在增强图片中没有标签,就会导致召回率低的问题。

在训练代码中augmentations.py文件中box_candidates函数用在random_perspective中,是对透视变换后的图片label进行筛选,去除被裁剪过小的框(面积小于裁剪前的area_thr) 并且保留下来的框的长宽必须大于wh_thr个像素,且长宽比范围在(1/ar_thr, ar_thr)之间,函数默认参数为

def box_candidates(box1, box2, wh_thr=2, ar_thr=20, area_thr=0.1, eps=1e-16):
    """box_candidates() is used to filter the labels and reject poor label candidates:
    用在random_perspective中 对透视变换后的图片label进行筛选
    去除被裁剪过小的框(面积小于裁剪前的area_thr) 还有长和宽必须大于wh_thr个像素,且长宽比范围在(1/ar_thr, ar_thr)之间的限制
    Compute candidate boxes: box1 before augment, box2 after augment, wh_thr (pixels), aspect_ratio_thr, area_ratio
    :params box1: [4, n]
    :params box2: [4, n]
    :params wh_thr: 筛选条件 宽高阈值
    :params ar_thr: 筛选条件 宽高比、高宽比最大值阈值
    :params area_thr: 筛选条件 面积阈值
    :params eps: 1e-16 接近0的数 防止分母为0
    :return i: 筛选结果 [n] 全是True或False   使用比如: box1[i]即可得到i中所有等于True的矩形框 False的矩形框全部删除
    """
    w1, h1 = box1[2] - box1[0], box1[3] - box1[1]  # 求出所有box1矩形框的宽和高  [n] [n]
    w2, h2 = box2[2] - box2[0], box2[3] - box2[1]  # 求出所有box2矩形框的宽和高  [n] [n]
    ar = np.maximum(w2 / (h2 + eps), h2 / (w2 + eps))  # 求出所有box2矩形框的宽高比和高宽比的较大者  [n, 1]
    # 筛选条件: 增强后w、h要大于2   增强后图像与增强前图像面积比值大于area_thr   宽高比大于ar_thr
    return (
        (w2 > wh_thr)
        & (h2 > wh_thr)
        & (w2 * h2 / (w1 * h1 + eps) > area_thr)
        & (ar < ar_thr)
    )  # candidates

 尝试修改参数wh_thr=1,ar_thr=50增大长宽比范围

参考 https://zhuanlan.zhihu.com/p/669418392

最近更新

  1. mysql索引篇

    2024-07-10 23:52:02       0 阅读
  2. FedAvg

    FedAvg

    2024-07-10 23:52:02      0 阅读
  3. 我在vue2重生之vite加强版

    2024-07-10 23:52:02       0 阅读
  4. 2024.7.20 暑期训练记录(6)

    2024-07-10 23:52:02       0 阅读
  5. 调用第三方接口-OkHttpClient

    2024-07-10 23:52:02       0 阅读
  6. C Prinmer Plus笔记第1-6章

    2024-07-10 23:52:02       0 阅读
  7. MySQL8的备份方案——差异备份(CentOS)

    2024-07-10 23:52:02       0 阅读
  8. C语言——数组指针

    2024-07-10 23:52:02       0 阅读
  9. 【Golang 面试基础题】每日 5 题(一)

    2024-07-10 23:52:02       0 阅读
  10. npm小记

    2024-07-10 23:52:02       0 阅读

热门阅读

  1. openssl error:0A000126:SSL routines:ssl3_read_n:unexpected eof

    2024-07-10 23:52:02       9 阅读
  2. 各种软件启动方式

    2024-07-10 23:52:02       6 阅读
  3. 【创作纪念日】我的三周年创作纪念日

    2024-07-10 23:52:02       7 阅读
  4. Github 2024-07-07 开源项目日报 Top10

    2024-07-10 23:52:02       8 阅读
  5. 部署LVS-DR群集

    2024-07-10 23:52:02       5 阅读
  6. python的列表推导式

    2024-07-10 23:52:02       7 阅读
  7. pip常用命令详解

    2024-07-10 23:52:02       4 阅读
  8. 相机、镜头基础知识及硬件选型介绍

    2024-07-10 23:52:02       6 阅读