当前位置:网站首页 > C++编程 > 正文

预训练权重和训练权重(mmdetection预训练权重)



YOLOv5 的预训练权重是一个在COCO数据集上预训练的物体检测架构和模型系列,它代表了 Ultralytics对未来视觉AI方法的公开研究,其中包含了在数千小时的研究和开发中所获得的经验和最佳实践。

大多数情况下,无需更改模型或训练设置即可获得良好的结果,前提是数据集足够大且标记良好。如果一开始没有得到好的结果,你可以采取一些步骤来改进,但我们始终建议用户在考虑任何更改之前先使用所有默认设置进行训练。这有助于建立性能基线并发现需要改进的领域。

如果您对训练结果有疑问,我们建议您提供尽可能多的信息(如果您希望得到有用的响应),包括结果图(列车损失、价值损失、P、R、mAP)、PR 曲线、混淆矩阵、训练镶嵌、测试结果和数据集统计图像,例如标签.png。所有这些都位于您的目录中,通常为 .

我们为希望在下面的 YOLOv5 培训中获得最佳结果的用户整理了一份完整的指南。

  • 每个类的图像。建议每类≥ 1500 张图像
  • 每个类的实例数。建议每个类≥ 10000 个实例(标记对象)
  • 图像多样性。必须代表已部署的环境。对于现实世界的用例,我们建议使用一天中不同时间、不同季节、不同天气、不同照明、不同角度、不同来源(在线抓取、本地收集、不同相机)等的图像。
  • 标签一致性。必须标记所有映像中所有类的所有实例。部分标记将不起作用。
  • 标签准确性。标签必须紧紧包围每个对象。对象与其边界框之间不应存在空格。任何对象都不应缺少标签。
  • 标签验证。在火车起点上查看以验证您的标签是否正确显示,即参见示例马赛克。
  • 背景图像。背景图像是没有对象的图像,这些对象被添加到数据集以减少误报 (FP)。我们建议大约 0-10% 的背景图像来帮助降低 FP(COCO 有 1000 张背景图像供参考,占总数的 1%)。背景图像不需要标签。

mmdetection预训练权重 预训练权重是什么_数据集

像 YOLOv5x 和 YOLOv5x6 这样的较大模型在几乎所有情况下都会产生更好的结果,但有更多的参数,需要更多的 CUDA 内存来训练,并且运行速度更慢。对于移动部署,我们建议使用 YOLOv5s/m,对于部署,我们建议使用 YOLOv5l/x。请参阅我们的自述文件表,了解所有型号的完整比较。

mmdetection预训练权重 预训练权重是什么_YOLO_02

  • 从头开始。推荐用于大型数据集(即 COCO、Objects365、OIv6)。传递您感兴趣的模型体系结构 yaml 以及一个空参数:

在修改任何内容之前,请先使用默认设置进行训练,以建立性能基线。train.py 设置的完整列表可以在 train.py 参数解析器中找到。

  • Epochs。从 300 个纪元开始。如果这在早期过度拟合,那么您可以减少 epoch。如果在 300 个 epoch 之后没有发生过拟合,则训练更长时间,即 600、1200 等 epoch。
  • Image size。COCO 以 的原始分辨率进行训练,但由于数据集中存在大量小对象,因此它可以从更高分辨率的训练中受益,例如 。如果有许多小对象,则自定义数据集将受益于本机或更高分辨率的训练。最佳推理结果是在运行训练时获得的,即,如果您训练,您还应该在 进行测试和检测。
  • Batch size。使用硬件允许的最大容量。小批量会产生较差的批次规范统计,应避免使用。
  • Hyperparameters。默认超参数位于 hyp.scratch-low.yaml 中。建议先使用默认超参数进行训练,然后再考虑修改任何超参数。通常,增加增强超参数将减少和延迟过拟合,从而实现更长的训练和更高的最终 mAP。减少损耗分量增益超参数将有助于减少这些特定损耗分量的过拟合。有关优化这些超参数的自动化

为所有支持的导出格式运行 YOLOv5 基准测试(速度和准确性),专业提示:导出到 TensorRT 以获得高达 5 倍的 GPU 加速(可见如下平台)

导出格式列表:

如下三个平台表现:

Usage:

git clone https://github.com/ultralytics/yolov5 -b update/bench_gpu # clonecd yolov5 pip install -qr requirements.txt coremltools onnx onnxruntime-gpu openvino-dev # install pip install -U nvidia-tensorrt --index-url https://pypi.ngc.nvidia.com # TensorRT python utils/benchmarks.py --weights yolov5s.pt --img 640 --device 0

Colab Pro+ V100 High-RAM Results (Google 产品)

Colab Free T4 Results

Ultralytics Hyperplane A100

注意:TensorRT 导出固定为 FP16。

到此这篇预训练权重和训练权重(mmdetection预训练权重)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • console是什么口(console口是网口吗)2025-03-22 19:45:10
  • msvcp140.dll丢失的解决方法win7旗舰版(msvcp140.dll丢失是什么原因)2025-03-22 19:45:10
  • msvcp140.dll无法继续执行代码(vcomp140.dll,无法继续执行代码)2025-03-22 19:45:10
  • codepen官网(codev官网)2025-03-22 19:45:10
  • win10dhcp怎么关闭(win7dhcp检测怎么关闭)2025-03-22 19:45:10
  • c++解析pcap文件(c解析pcap文件)2025-03-22 19:45:10
  • cnn什么意思网络用语(cnn意思是什么)2025-03-22 19:45:10
  • tcp工具 安卓(tcp协议工具)2025-03-22 19:45:10
  • 带圈圈的序号1到30(带圈圈的序号1到30excel怎么打)2025-03-22 19:45:10
  • c++单向链表逆序(如何实现一个高效的单向链表逆序输出)2025-03-22 19:45:10
  • 全屏图片