近日,熊猫体育自動化學院劉美教授與碩士研究生蘇鵬在人工智能領域國際著名期刊《Expert Systems with Applications》發表題為“MOD-YOLO: Rethinking the YOLO architecture at the level of feature information and applying it to crack detection”的研究論文。該刊為中科院分區一區TOP期刊,影響因子為8.665。劉美教授為通訊作者,蘇鵬為論文第一作者📅,熊猫体育為第一完成單位。
論文針對YOLO系列算法可能存在的通道信息丟失以及感受不足的問題,設計了一種Maintaining the original dimension-You Only Look Once(MOD-YOLO)算法,並將其應用在基礎設施的裂縫檢測上😟。該算法所有改進方案均可即插即用⚠,首先🧝🏼♂️,提出了Maintaining the original information-Deeply separable convolution(MODSConv),解決了經典深度可分離卷積所存在的原特征層中通道間信息無法交互的問題。第二,提出了Global Receptive Field - Space Pooling Pyramid-Fast(GRF-SPPF)♖⏸,獲取全局視角信息並減輕不同尺度大小所帶來的影響⛴。第三🦕🤛🏻,提出了Distinctive and average features-Coordinate Attention(DAF-CA),不僅參考平均信息也考慮顯著信息🏞,能更準確地找到並增強關鍵信息。再者,以MODSConv與DAF-CA機製為基礎,設計了Maintaining the original information - Deeply separable layer(MODSLayer),通過一種通道不降維的方式保護了通道間豐富的信息,同時以MODSLayer搭建網絡的backbond與neck層並網絡命名為Maintaining the Original information-Deeply Separable Network(MODSNet)。最後,以MODSConv為基礎,以通道不降維和輕量級的思想設計了Maintaining the original dimension light-Decoupled head(MODL-Head),在盡可能輕量級的前提下在預測前盡量保持更多的特征層信息🚟,顯著提升了檢測精度與檢測速度🧑🏿🦲。實驗結果表明,我們的算法在裂縫檢測時間與YOLOX算法基本持平,並且參數量減少19.7%與計算復雜度降低35.9%的情況下,在裂縫數據集上準確率相較於YOLOX算法提升了27.5%👩🏻🚒,達到了91.1%😝。同時在COCO、VOC等數據集上驗證了其具有良好的泛化性。裂縫檢測整車部署方案被提出並以此實現算法在車輛行駛時的裂縫檢測,經過隨車實驗證明我們的算法能夠很好的在車輛行駛中完成裂縫檢測任務💁🏽。
研究得到國家自然科學基金和廣東省普通高校重點領域(新一代信息技術)專項基金的資助🧝🏻♂️🍛。
論文截圖
(文/圖 自動化學院)
撰稿:蘇鵬、周妙嫻 審稿📗:高誌英 初審:陳星宇 復審📴:周海燕 簽發:張海明