首页>动态>正文
环球快看点丨YOLO系列算法精讲:从yolov1至yolov5的进阶之路(超详细硬核内容)
2023-02-13 11:12:12    来源:哔哩哔哩

物体检测作为计算机视觉领域的热门方向,在学术界和工业界可谓是遍地开花,而Yolo系列则可以称为该方向的经典算法,从YoloV1到YoloV7的更新迭代,Yolo算法给我们带来了很多的惊喜和灵感。面试人工智能岗位,Yolo模型的出镜率也是非常的高,今天我们就来捋一捋Yolo那些值得关注的改进点。

资料已经整理好了,文末附下载方式!以下是详细内容介绍~ 

YoloV1以单阶段端到端的模型让人眼前一亮,检测问题转换成回归问题,预测速度可达到实时要求。模型采用grid cell的网格负责制,每个网格预测两个候选框,再结合置信度、NMS策略得到最终输出结果,损失函数分为四部分。 

存在的问题主要有两方面:


【资料图】

一是:每个cell只预测一个类别,如果目标重叠则会漏检;

二是:由于boundingbox的限制,对小目标或是新的宽高比的目标检测效果较差。

YoloV2在V1基础上做了很多改进: 

(1)采用Darknet-19作为新的骨干网络,小卷积核节省参数;

(2)舍弃Dropout和FC层,加入BatchNormalization,稳定收敛;

(3)输入更高分辨率的图像,并且支持multi-scale多尺寸图像;

(4)借鉴了二阶段算法的anchor策略,通过聚类获取与数据集相匹配的anchor尺寸;

(5)相对于grid cell做位置预测,模型更容易收敛;

(6)passthrough策略融合细粒度特征助力小目标检测;

YoloV2在网络结构上减少了参数量,从无穷回归到有穷回归的策略降低学习难度,但特征融合的方式仍不能有效改善密集、小目标检测,也不支持多标签的分类。

YoloV3在网络结构上做出了更好的改进,特征提取的更细致,特征融合更紧密,同时提供了更多的机会去适应不同尺寸的目标框检测。

(1)设计了三个尺度的输出头,有利于检测不同大小的目标框

(2)引入残差连接,堆叠更多的层来提取特征

(3)采用全卷积网络,加入特征金字塔的融合策略,特征重复利用

(4)9个先验框,3个输出头分别对应三组不同比例的anchor,有效的提升了对小目标物体的检测,同时有利于提高检测的召回率。

(5)使用logistic激活函数代替softmax,对每一个类别做二分类,支持多标签的分类。

YoloV3对小目标检测的性能改进提升显著,但相对来说网络较复杂,对于嵌入式部署仍有难度,损失函数的设计欠缺考虑中心点和长宽的整体性,整体性能还有上升空间。

YoloV4在数据和网络设计两个层面,站在巨人的肩膀上借鉴了很多技巧,促使模型性能提升明显,并且很好的控制了参数量,单个GPU即可完成训练和消融实验。

(1.1)马赛克数据增强:对4张图片做随机缩放、裁剪、排布的方式进行拼接,既扩充数据量,又增加小样本数量,进一步支撑解决小目标检测的问题,同时一次处理4张图片也降低对batch的要求,省显存。

(1.2)自对抗训练SAT(Self-adversarial-training):通过引入噪音点来增加学习的难度,让神经网络反向更新图像,对图像做改变扰动,然后在这个图像上训练,得到鲁棒性更强的模型。

(1.3)DropBlock:之前的Dropout是随机失活一个点,现在是随机失活一个区域,是一种效果更显著的防止过拟合的正则化方法

(1.4)Label Smothing:假如正常分类标签是0和1,标签平滑则是让其变为0.05和0.95,主要目的是防止过拟合,使用标签平滑后最终的分类可视化效果是类内更紧密,类间更分离。

(1.5)CIOU损失:同时考虑重叠面积、中心点距离、长宽比三因素

(1.6)Soft-NMS:传统的非极大值抑制是将IOU超过阈值的候选框都删除掉,这种状态下如果遇到两个物体重叠出现,效果就大打折扣,Soft-NMS是秉持“做人留一面,日后好相见”的态度,不直接剔除,而是降低置信度得分,是一种更加通用的算法。

(2.1)backbone从YOLOV3的DarkNet53变为CSPDarkNet53

(2.2)SPPNet(Spatial Pyramid Pooling):用不同的池化核大小和步长来实现最终的输入特征维度一致,允许在各种尺寸下训练网络,同时特征融合也增加感受野。

(2.3)CSPNet(Cross Stage Partial Network):直观上来看是残差模块的二级嵌套,将浅层的特征图在通道维度一分为二,一部分经走正常小残差特征提取模块,另一部分则经过跨阶段层次结构,直接与小残差特征提取模块的输出进行合并,相对比简单的多个小残差模块的堆叠,这种方式丰富了梯度信息的组合,减少冗余计算量,同时提高模型的学习能力。

(2.4)SAM (Spatial Attention Module):空间注意力机制,让模型学习注意力权重特征图做优化,取消了池化操作,相对可以提高速度。

(2.5)PAN:双向的特征金字塔融合路径,不仅自上而下,同时自下而上,通过上采样和下采样实现concat的拼接,而不是add的拼接,充分结合浅层和高层特征。

(2.6)Mish激活函数:相对常用的Relu激活函数,其上方无界、下方有界,非单调性、无线连续性和平滑度都更加优秀,虽然增加了一定的计算量,但效果会有所提升。

YoloV4可以说是集百家之大成者,将学术界比较流行的改进技巧都融入到自己的模型中,每个改进的小方向都有很好的移植性,无论是对工作还是写论文都是很好的启发。下一篇将继续更新YoloV5到YoloV7的迭代改进亮点。

最后文章含“人工智能学习精选学习大礼包”资料已打包好~免费领取方式

关注UP主“ 唐宇迪教你学AI”

直接发送 “大礼包”

还有一种免费领取方式

看评论区

关键词: 目标检测 特征提取 激活函数

环球快看点丨YOLO系列算法精讲:从yolov1至yolov5的进阶之路(超详细硬核内容)

物体检测作为计算机视觉领域的热门方向,在学术界和工业界可谓是遍地开花,而Yolo系列则可以称为该方向的经典算法,从YoloV1到YoloV7的更新迭2023-02-13

“塑造文艺复兴”,多纳泰罗雕塑杰作来到伦敦

“塑造文艺复兴”,多纳泰罗雕塑杰作来到伦敦,伦敦,雕塑家,洛伦佐,多纳泰罗,文艺复兴2023-02-13

视焦点讯!各省将试点紧密型城市医疗集团

国家卫健委等6部门近日印发《紧密型城市医疗集团建设试点工作方案》,将在每个省份选择2至3个设区的市(直辖市的区),统筹区2023-02-13

全球热门:实体店获客越来越难,如何不花一分钱,让客户持续爆满??

你好,我是林叫兽。今天要和你分享的主题是:实体店获客越来越难,如何不花一分钱,让客户持续爆满??案例解析:我们都知道,健身房是一种服2023-02-12

送病人礼物适合送什么 环球简讯

一束鲜花和水果是不错的选择,如果是女朋友,那么探望病人适合送什么花。下面为大家介绍一些送病人的礼物,一起来看看吧。营养2023-02-12

【全球聚看点】6或者6的倍数_6的倍数有哪些我

1、6  12   18   24    30   36  42  48  54   60   62023-02-12

刚上场就进球!18岁多特小将吉滕斯抽射近角得手:焦点报道

多特vs不莱梅第67分钟,施罗特贝克禁区内将球横传,刚替补罗伊斯登场1分钟的吉滕斯小角度抽射近角得手,打进本场比赛首粒进球。多特暂1-0不莱2023-02-12

客流观察|佛山、东莞地铁2023年1月客流月报

客流观察|佛山、东莞地铁2023年1月客流月报2023-02-11

麻辣烫的做法家常做法视频_麻辣烫的做法家常视频教程

1、热锅放入油、姜、蒜,放入花椒、辣椒翻炒,如果很辣可以多放些花椒、辣椒。2、加入两茶匙麻辣豆瓣菜,翻炒出香味。加入肉汤2023-02-11

鞍山:五社联动助力服务一老一小

我们来体验一下如何做好有效沟通,请各位拿起手中的纸巾,大家闭上眼睛,跟我的提示将纸巾对折再对折,对折四次后在纸巾的右上角撕掉一个角,2023-02-11

海贼王1074话卡普继续放鸽子,战黑胡子悬念依旧,网友却普遍悲观-今头条

海贼王1074话目前全图情报已经更新,里头看点满满,其中薇薇顺利逃出玛丽乔亚是海米最振奋的点,娜美、罗宾、斯图西、波尼的奇异服装也让海米2023-02-11

精彩看点:脑肿瘤有治吗_早期脑部肿瘤能治好吗

1、有很多早期脑瘤是可以治疗好的,尤其是良性脑瘤发现得早,治疗的概率更大。2、因为早期发现的良性脑肿瘤体积比较小,生长比2023-02-11

环球视讯!售价历史新低!80KM续航小刀电动车直降1200元

小刀电动车60V20AH铅酸石墨烯轻便两轮摩托车成人男女电摩电瓶车当前活动价3899元,领取3499元减700元叠加1499元减500元优惠券,折合到手价低至2023-02-11

针式打印送货单格式_针式打印机送货单尺寸|动态焦点

1、针式打印机一般不用去设置,直接将送货单格式设置好后,放入对应大小的纸张,直接去打印就可以我们使用的货管家送货单打印软2023-02-11

世界热讯:淘宝店铺买卖交易平台有哪些风险?出售安全吗?

淘宝店铺买卖交易平台是给有需要进行店铺购买和出售的朋友们准备,当然,这类平台对于商家们来说也还不够放心,所以,大家也想了解下目前这些2023-02-11

学生给老师认错送什么-焦点快播

学生给老师认错送这些,老师在学生之间的关系里,他很喜欢看书的样子,我觉得送老师一本有意义的书是最好的礼物了。送给老师一份2023-02-10

禁用触摸板怎么设置_禁用触摸板

1、如何关闭和禁用Win10笔记本触摸板2、笔记本在办公或者不经常移动的时候,一般都是外接鼠标。毕竟鼠标比笔记本自带的触控板操作起来更方便。2023-02-10

快女微电影_关于快女微电影的介绍 今日报

快女微电影,关于快女微电影的介绍很多人还不知道,现在让我们一起来看看吧!1、快女微电影之曼陀罗,属于一部影视作品,该作品2023-02-10

从企业主视角看项目管理

有些企业的业务特点是呈现鲜明的按项目方式进行工作,有些企业的业务特点是鲜明的永续经营方式。今天咱们主要谈前者。(1)按照PMP来说,项目2023-02-10

每日消息!快消品怎么做品牌推广?

什么是快消品?快消品是指使用寿命短暂,消费速度较快的消费品。随着现代生活节奏加快,快消品融入到我们的生活中,在我们身边,随处可见快消2023-02-10

去外地看朋友带什么礼物

去外地看朋友带的礼物,不管是什么,只要是你去,就得挑一份,最好是一份,不要买,因为是你去了,就不需要去,带点礼品之类的,2023-02-10

世界微资讯!这款花哨的24000网络卡车露营车已准备好冒险

世界各地的人们都对特斯拉Cybertruck及其所有潜力感到兴奋。随着生产和发布日期定在2023年,我们开始看到更多2023-02-10

全球快资讯:九州缥缈录内容介绍

九州缥缈录内容介绍,《九州缥缈录》主要内容是讲述在九州时期,对于国家以及地盘的划分进行争夺。主要人物吕归尘、姬野、羽然等人生活在“九2023-02-10

世界最资讯丨华泰证券(06886):“23华泰G5”票面利率为3.39%

智通财经APP讯,华泰证券(601688)(06886)发布公告,根据《华泰证券股份有限公司2023年面向专业投资者公开发行公司债券(第四期)发行公告》,华泰证2023-02-10

Mysteel:16家新能源车企1月销量环比下降

2月10日,据乘联会消息,2023年1月中国新能源乘用车零售销量达到33 2万辆,同比下降6 3%,环比下降48 3%。据Mysteel统计,截至2月10日,12023-02-10