上面是一段實(shí)時(shí)目標(biāo)識(shí)別的演示, 計(jì)算機(jī)在視頻流上標(biāo)注出物體的類別, 包括人、汽車、自行車、狗、背包、領(lǐng)帶、椅子等。今天的計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)可以在圖片、視頻中識(shí)別出大量類別的物體, 甚至可以初步理解圖片或者視頻中的內(nèi)容, 在這方面,人工智能已經(jīng)達(dá)到了3 歲兒童的智力水平。這是一個(gè)很了不起的成就, 畢竟人工智能用了幾十年的時(shí)間, 就走完了人類幾十萬(wàn)年的進(jìn)化之路,并且還在加速發(fā)展。道路總是曲折的, 也是有跡可循的。在嘗試了其它方法之后, 計(jì)算機(jī)視覺(jué)在仿生學(xué)里找到了正確的道路(至少目前看是正確的) 。通過(guò)研究人類的視覺(jué)原理,計(jì)算機(jī)利用深度神經(jīng)網(wǎng)絡(luò)( Deep Neural Network,NN)實(shí)現(xiàn)了對(duì)圖片的識(shí)別,包括文字識(shí)別、物體分類、圖像理解等。在這個(gè)過(guò)程中,神經(jīng)元和神經(jīng)網(wǎng)絡(luò)模型、大數(shù)據(jù)技術(shù)的發(fā)展,以及處理器(尤其是GPU)強(qiáng)大的算力,給人工智能技術(shù)的發(fā)展提供了很大的支持。本文是一篇學(xué)習(xí)筆記, 以深度優(yōu)先的思路, 記錄了對(duì)深度學(xué)習(xí)(Deep Learning)的簡(jiǎn)單梳理,主要針對(duì)計(jì)算機(jī)視覺(jué)應(yīng)用領(lǐng)域。
標(biāo)簽:
深度神經(jīng)網(wǎng)絡(luò)
目標(biāo)檢測(cè)
上傳時(shí)間:
2022-06-22
上傳用戶: