开发者

超越YOLOv5,1.3M超轻量,高效易用,目标检测领域这一个就够了?

开发者 https://www.devze.com 2023-01-24 14:27 出处:网络 作者:如何学C
目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸、车辆、商品、缺陷检测等场景中有着出色的表现,也是文本识别、图片搜索、视频分析、目标跟踪等复合技术的核心模块,应用场景可谓是遍地开花。

目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸、车辆、商品、缺陷检测等场景中有着出色的表现,也是文本识别、图片搜索、视频分析、目标跟踪等复合技术的核心模块,应用场景可谓是遍地开花。

各界开发人员对高精度、高效率的目标检测算法和便利高效的开发、配置方式的追求是终极的。然而,该行业缺乏全面兼顾高性能算法、便捷开发、高效培训和完善部署的开源目标测试项目。百度飞桨端到端目标检测开发套件PaddleDetection重磅升级为2.0版本后,终于全面兼顾业界开发者的需求,成长为中国产业实践中目标检测领域一柄重器。

让我们先来概览一下PaddleDetection2.0本次升级内容:

一、全明星算法阵容:

新增超越YOLOv4、YOLOv5 的PP-YOLOv2,1.3M 超超超轻量目标检测算法PP-YOLO Tiny,全面领先同类框架的RCNN系列算法,以及SOTA 的Anchor Free算法:PAFNet(Paddle Anchor Free)

二、全面功能覆盖:

除全系列通用目标检测算法外,额外覆盖旋转框检测、实例分割、行人检测、人脸检测、车辆检测等垂类任务。

三、易用性全面提高:

全面支持动态图开发、压缩、配置等全过程方案,大大提高了用户开发的易用性,加快了算法产业的应用落地速度。

图1paddledection2.0明星通用目标检查模型的性能

本篇也详细解读了paddledection2.0的升级内容,初步体验了该检查重器的杀伤力:

一、更好的算法

1.PPP-YOLOv2,比YO4、YOLOV4更强!

自去年PP-YOLO成为产业实践的最佳目标检测模型以来,随着PaddleDetection2.0的发布,PP-YOLO也发布了v2版本。继续v1版本的理念,PP-YOLOv2在产业实践中需要考虑算法的精度和速度,PP-YOLOv2(R50)mAP从45.9%达到49.5%,与v1相比提高了3.6个百分点,FPS达到了106.5FPS使用RestNet101作为骨架网络,PP-YOLOv2(R101)的mAP达到50.3%,比同等精度的YOLOv5x快15.9%。

不需要比较眼花缭乱的目标检查算法,使用PP-YOLOv2即可!

图2、图2、图2、图2、图2、图2、图2、图2、图2、图2、图2、图2、图Tiny,1.3M,比YOLO-Fastest、NanoDet轻!

随着物联网的快速发展,端芯片配置轻量化深度学习算法的需求越来越强烈,基于此,PaddlDettion2.0经过深度优化,推出了体积仅为1.3M的超轻量目标检测算法PP-YOLOTiny。如下表所示,在cocoval2017数据集中测试中,输入尺寸320px版本,mAP达到20.6,单张预测延迟10.83ms(92.3FPS),输入尺寸416px版本,mAP达到22.7,单张预测延迟15.48ms(64.6FPS)。它比YOLO-Fastest和NanoDet。

图3PP-YOLOTiny性能

3.RCNN系列算法全面超越同类开发工具!

除YOLO系列外,PaddleDetection2.0还提升了目标检测的基础两个阶段系列算法-RCNN。表1可以清楚地看到RCNN系列模型在PaddleDetection培训,比mmDetection和Detectron2更短的时间内获得更高的精度。

表1:RCNN系列模型在PaddleDetection、mmDetection和Detectron2开发套件下,在COCO 2017 val集上的mAP对比结果

  4. SOTA Anchor Free算法:PAFNet(Paddle Anchor Free)amp; PAFNet-Lite

相较于SSD、RCNN等系列各种Anchor-Based算法,Anchor-Free算法拥有更少的超参、更易配置、对多尺度目标检测效果更好等优点,但也存在检测结果不稳定、训练时间长等问题,是近些年科研领域的热点方向。飞桨当然一直紧跟全球科研动向,基于TTFNet进行多维度的优化,推出了在COCO数据集精度42.2,V100预测速度67FPS, 处于anchor free领域SOTA水平的PAFNet(Paddle Anchor Free)算法!同时提供移动端轻量级模型PAFNet-Lite,COCO数据集精度达到23.9,麒麟990芯片延时26ms。

图 4 PAFNet网络结构

  5. 旋转框检测算法S2ANet

在一般的的目标检测项目中,我们通常使用水平矩形框为检测框对目标进行框定。在产业场景中,如质量检查和遥感图像,目标通常是在任何方向排列和高宽比差异较大的情况下,在使用水平矩形框架时,会有大量空白的非目标区域,并且会丢失目标的方向信息,例如图5的精度不能满足业务需求。旋转框的目标检测算法可以很好地解决这样的问题,在检测四边形矩形框的同时可以获得旋转角度。PaddleDetection2.0本次升级增加了性价比高的旋转框检测算法-S2ANet,开发人员可以直接采用或进一步开发。

图5传统检测效果图6训练S2ANet旋转框检测效果

到目前为止,Paffffdledection包括19种共计231种模型算法,其中动态图70种,静态图161种。其中包括PP-YOLO、RCNN、PAFNet系列等明星算法,复盖通用目标检查、面部检查、行人检查、车辆检查、旋转框检查、实例分割任务,由于飞行框架和PaddleDetection套件本身的设计,算法训练的效率也超过了同类开发工具

  二、更好的易用性

1. 动态图开发,灵活调试代码

PaddleDetection 开发者_JS百科2.0基于PaddlePaddle 2.0.1版本,默认使用动态图进行开发,在这种模式下,每次执行一个运算,可以立即得到结果,而不是事先定义好网络结构再执行。用户还可以快速获取网络结构、各层输入输出、对应梯度信息等,对应快速调整。这样用户可以更快地组织代码,更容易地调整程序。

  2.更便捷的安装方式

除了传统的git clone方式,PaddleDetection 2.0这次还新增了whl包的发布,用户可以直接通过pip install的方式安装,由此可以通过import ppdet的方式调用PaddleDetection 2.0下的API快速完成自己的检测任务。

三、训练、压缩、部署全流程打通

为了进一步加速深度学习算法的产业落地,PaddleDetection 2.0动态图顺畅打通了算法的全流程部署。

图7 PPDet全流程方案

在完成模型训练过程中或之后,PaddleDetection2.0方便支持开发者使用PaddleSlim对算法进行量化、蒸馏、裁剪等压缩优化,并支持快速将模型由动态图转化为静态图,实现模型的高效多平台预测部署。

1.模型压缩能力

为了满足开发者对计算量、模型体积、运算速度等的终极追求,在PaddleDetection2.0动态图模型下,在PaddleSlim的基础上,可以根据PadleSlim追加多种模型的压缩能力,包括裁剪、量化、蒸馏、蒸馏共同战略的压缩方案从下表可以看出,量化战略给模型带来1.7%的精度提高,同时体积压缩3.71倍,速度提高1.46倍!采用蒸馏裁剪的联合战略,在精度几乎没有损伤的情况下,体积压缩了3.05倍,加速了1.58倍!

表3:根据YOLOv3-MobileNetv1模型进行模型压缩的效果比较

2.top预测配置能力

得益于飞桨预测库系列产品的Paddlenference、Paddlelite和PaffffdleServing的能力,Paddledtection2.0支持开发人员快速在Linux、Windows、News、Veten等多个系统中,同时提供了主流预测方法和计算法。另外,适应TensorRT,支持TensorRT动态尺寸输入和TensorRTINT8的量化预测,全面支持用户加速硬件。

表4:Teslav100上各主流算法预测速度对比

小结:

本次Paddledtion2.0重磅升级,为开发人员提供目标检测领域的新开发体验,mapp50.3的P-YOLOv2超越YOLOv4、YOLOV5、1.3M超轻量PP-YOLOLOTin超越YOF领域的新开发体验动态图的升级和全过程方案的开通大大提高了用户开发的易用性。无论你是学术科研人员还是产业开发人员,无论你是刚入门的萌新,还是已经成为大神,PaddleDetection2.0都能更快地进行算法实验,获得高性能的目标检测算法,投入产业实用。

如此精心制作的高水平产品,期待业界开发者参与共同建设!

课程预告

百度桨帮助您快速、深入、全面了解目标检测技术,5月13日、14日特别开设目标检测2日直播课程。资深研究开发工程师教授多年炼丹经验,配套真正的工业落地场景案例,最先进的优化方式、训练技术、优化技术和工业配置方案,决不能错过!感兴趣的学生可以参加QQ群1136406895,了解更多课程和产品动态。

0

精彩评论

暂无评论...
验证码 换一张
取 消