近日,大華股份基于AI的場景流估計算法和光流估計算法再次取得突破性成果,各項指標再次刷新了KITTI Sceneflow、KITTI Flow兩項競賽的全球最好成績:場景流和光流的3像素錯誤率指標分別為5.06%、3.79%,指標均創(chuàng)歷史新高,持續(xù)保持領(lǐng)先水平。
大華股份AI取得KITTI Sceneflow排行榜第一
(來源: http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php)
大華股份AI取得KITTI Flow排行榜第一
(來源:www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow)
場景流算法可同時估計場景中物體的三維位置與三維運動矢量,光流是場景流映射到二維圖像坐標系的投影,應(yīng)用價值廣泛。為提升場景流估計精度,大華AI團隊優(yōu)化了一系列算法模塊。首先,基于yolact++網(wǎng)絡(luò)進行實例分割,從場景中分割出行人、車輛、自行車等前景目標,然后基于最新架構(gòu)的GANet計算初始視差圖,得到更精細的視差圖,在使用RAFT網(wǎng)絡(luò)得到精細光流圖,最后通過多閾值融合等策略,進一步優(yōu)化場景流估計結(jié)果。
在測評中,場景流和光流算法的效果和計算結(jié)果如下:
▲輸入圖像
▲T0時刻視差圖
▲經(jīng)光流映射后的T1時刻視差圖
▲T1時刻到T0時刻的光流圖
▲場景流誤差圖
該項技術(shù)已在大華雙目攝像機、全景攝像機等設(shè)備中得到應(yīng)用,提升多目攝像機的目標深度數(shù)據(jù)計算、目標行為分析等算法性能;同時,該技術(shù)也成功應(yīng)用于AR融合領(lǐng)域,實現(xiàn)單個及多個攝像機圖像的AR語義融合應(yīng)用,極大提升了行業(yè)解決方案的用戶體驗。
雙目攝像機行為檢測應(yīng)用場景
▲雙目圖像圖
▲視差圖
▲光流圖(目標三維運動矢量)
AR語義融合應(yīng)用場景
▲真實圖像
▲AR語義融合,增強目標類別、位置、運動矢量等信息
近年來,在算法商業(yè)化落地方面,大華積極應(yīng)用主導(dǎo)個性化AI方案敏捷交付,構(gòu)建人工智能端到端研發(fā)的全鏈路能力,實現(xiàn)AI從基礎(chǔ)能力到算法研發(fā)到產(chǎn)業(yè)化應(yīng)用落地,構(gòu)建了圍繞視圖智能、3D智能、多維智能、控制智能等核心算法體系,實現(xiàn)了在各業(yè)務(wù)領(lǐng)域的人工智能算法、產(chǎn)品與解決方案的全面覆蓋,賦能百行百業(yè)。
大華面向用戶需要開放全棧能力,賦能行業(yè)生態(tài),并在實戰(zhàn)中持續(xù)積累人工智能核心技術(shù),針對全場景理解、小規(guī)模數(shù)據(jù)、泛化能力、多任務(wù)學(xué)習(xí)和AutoML等人工智能的技術(shù)挑戰(zhàn),開展實踐探索,并已取得實戰(zhàn)應(yīng)用成果。
未來,大華股份將繼續(xù)推動AI技術(shù)與各行業(yè)場景的深度融合,充分發(fā)揮科技創(chuàng)新對百行百業(yè)可持續(xù)發(fā)展的支撐引領(lǐng)作用,推動AI等新一代技術(shù)的普及與落地,賦能百行百業(yè)數(shù)字轉(zhuǎn)型升級。
關(guān)注微信公眾號 |
免責(zé)聲明:本文圖文素材來源于大華,本文僅代表作者個人觀點,本站不作任何保證和承諾,若有任何疑問,請與本文作者或提供稿件商家聯(lián)系。如涉及到侵權(quán),請聯(lián)系我們及時刪除。