近日,大華股份基于深度學(xué)習(xí)算法的圖像語(yǔ)義分割技術(shù),刷新了KITTI語(yǔ)義分割競(jìng)賽(The KITTI Semantic Segmentation Evaluation)全球最好成績(jī),取得語(yǔ)義分割排行榜第一名,超越其他一流AI公司和頂尖的學(xué)術(shù)研究機(jī)構(gòu),這標(biāo)志著大華股份在語(yǔ)義分割領(lǐng)域處于領(lǐng)先水平。
大華股份DH-MDS算法取得KITTI Semantic Segmentation排行榜第一名
(網(wǎng)址: www.cvlibs.net/datasets/kitti/eval_semseg.php)
大華股份已建成用于算法訓(xùn)練的超大規(guī)模計(jì)算中心和數(shù)據(jù)中心,重點(diǎn)研究并商用化多個(gè)領(lǐng)域算法,已形成核心競(jìng)爭(zhēng)力。 2017年大華股份在場(chǎng)景流、光流和文字識(shí)別檢測(cè)等領(lǐng)域分別取得第一;2018年在2D車輛目標(biāo)檢測(cè)、MOT跟蹤、行人重識(shí)別等國(guó)際競(jìng)賽中分別取得第一;2019年初,在實(shí)例分割國(guó)際競(jìng)賽中取得第一。本次在語(yǔ)義分割算法領(lǐng)域再次取得新突破。
關(guān)于KITTI:
KITTI數(shù)據(jù)集由德國(guó)卡爾斯魯厄理工學(xué)院和豐田美國(guó)技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國(guó)際上最大的計(jì)算機(jī)視覺(jué)算法評(píng)測(cè)數(shù)據(jù)集之一。數(shù)據(jù)集用于評(píng)測(cè)立體圖像(Stereo)、光流(Optical Flow)、視覺(jué)測(cè)距(Visual Odometry)、物體檢測(cè)(Object Detection)和跟蹤(Tracking)、道路分割(Road)、語(yǔ)義分割(Semantics)等計(jì)算機(jī)視覺(jué)技術(shù)在車載環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場(chǎng)景采集的真實(shí)圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個(gè)行人,且存在不同程度的遮擋與截?cái)唷?/P>
語(yǔ)義分割:
語(yǔ)義分割是指將計(jì)算機(jī)輸入圖像的每個(gè)像素分類為所屬對(duì)象類別的過(guò)程。它不僅是計(jì)算機(jī)視覺(jué)的基本任務(wù),同時(shí)在自動(dòng)駕駛、機(jī)器人場(chǎng)景理解以及虛擬現(xiàn)實(shí)方面有著非常重要的應(yīng)用。
在KITTI語(yǔ)義分割任務(wù)中,需要把各種場(chǎng)景下的汽車、行人、道路、摩托車、自行車、交通標(biāo)志、建筑物和植被等19類物體準(zhǔn)確分割出來(lái)。同時(shí),訓(xùn)練集只提供200張數(shù)據(jù),屬于小樣本學(xué)習(xí)。
本次國(guó)際比賽,大華股份為提升語(yǔ)義分割精度,汲取了圖像分類、單目標(biāo)分割和全像素語(yǔ)義分割等先進(jìn)算法的優(yōu)點(diǎn),構(gòu)建了基于多位置和通道特征的全局關(guān)注機(jī)制,并采用遷移學(xué)習(xí)和增量學(xué)習(xí)方法,有效提升了算法的分割精度。
該競(jìng)賽語(yǔ)義分割效果
輸入圖像1
分割結(jié)果1
輸入圖像2
分割結(jié)果2
在大華實(shí)際產(chǎn)品和未來(lái)產(chǎn)品中的應(yīng)用
❖車道線分割:
車道線分割并疊加顯示
❖機(jī)器人場(chǎng)景理解及語(yǔ)義地圖構(gòu)建:
大華園區(qū)圖像
大華園區(qū)分割結(jié)果
免責(zé)聲明:本文來(lái)源于大華股份,本文僅代表作者個(gè)人觀點(diǎn),本站不作任何保證和承諾,若有任何疑問(wèn),請(qǐng)與本文作者聯(lián)系。