DXVA 規(guī)范 DXVA 是微軟為DVD/Video硬件加速而提供的API, 用于顯卡的驅(qū)動設(shè)計,此規(guī)范詳細(xì),對于顯卡驅(qū)動設(shè)計人員以及DVD播放器應(yīng)用程序設(shè)計人員有很大幫助
上傳時間: 2014-01-13
上傳用戶:chenjjer
在cycloneII里實現(xiàn)對FFT的硬件加速,包括所有的說明和源碼
上傳時間: 2015-12-30
上傳用戶:qq21508895
密碼算法AES,DES,IDEA,MD5等的基本理論和硬件加速方案,對算法進(jìn)行fpga硬件加速的優(yōu)點(diǎn)等
上傳時間: 2013-12-12
上傳用戶:xaijhqx
Linux操作系統(tǒng)的著名硬件加速繪圖API軟件。可以利用網(wǎng)卡提供的硬件加速功能完成繪圖,速度比傳統(tǒng)的framebuffer要快。
上傳時間: 2016-09-01
上傳用戶:努力努力再努力
初中計算機(jī)優(yōu)秀論文-嵌入式MP3解碼器中Huffman算法的硬件加速
標(biāo)簽: Huffman MP3 計算機(jī) 嵌入式
上傳時間: 2014-01-01
上傳用戶:ztj182002
HEG是一個易用的強(qiáng)大的硬件加速2D游戲引擎 他完全具備了具有開發(fā)商業(yè)質(zhì)量的2D游戲的中層引擎,使開發(fā)變得簡單,快速!
上傳時間: 2017-08-31
上傳用戶:shinesyh
純硬件加速電路應(yīng)用,有效節(jié)省單機(jī)片成本,高效可靠
上傳時間: 2021-10-28
上傳用戶:
人臉自動識別技術(shù)是模式識別、圖像處理等學(xué)科的一個最熱門研究課題之一。隨著社會的發(fā)展,各方面對快速有效的自動身份驗證的要求日益迫切,而人臉識別技術(shù)作為各種生物識別技術(shù)中最重要的方法之一,已經(jīng)越來越多的受到重視。對于具有實時,快捷,低誤識率的高性能算法以及對算法硬件加速的研究也逐漸展開。 本文詳細(xì)分析了智能人臉識別算法原理,發(fā)展概況和前景,包括人臉檢測算法,人眼定位算法,預(yù)處理算法,PCA和ICA 算法,詳細(xì)分析了項目情況,系統(tǒng)劃分,軟硬件平臺的資源和使用。并在ISE軟件平臺上,用硬件描述語言(verilog HDL)對算法部分嚴(yán)格按照FPGA代碼風(fēng)格進(jìn)行了RTL 硬件建模,并對C++算法進(jìn)行了優(yōu)化處理,通過仿真與軟件算法結(jié)果進(jìn)行比對,評估誤差,最后在VirtexII Pro FPGA 上進(jìn)行了綜合實現(xiàn)。 主要研究內(nèi)容如下: 首先,對硬件平臺xilinx的VirtexII Pro FPGA 上的系統(tǒng)資源進(jìn)行了描述和研究,對存儲器sdram,RS-232 串口,JTAG 進(jìn)行了研究和調(diào)試,對Coreconnect的OPB總線仲裁機(jī)理進(jìn)行了兩種算法的比較,RTL 設(shè)計,仿真和綜合。利用ISE和VC++軟件平臺,對verilog和C++算法進(jìn)行同步比較測試,使每步算法對應(yīng)正確的結(jié)果。對軟硬件平臺的合理使用使得在項目中能盡可能多的充分利用硬件資源,制板時正確選型,以及加快設(shè)計和調(diào)試進(jìn)度。其次,對人臉識別算法流程中的人臉檢測,人眼定位,預(yù)處理,識別算法分別進(jìn)行了比較研究,選取其中各自性能最好的一種算法對其原理進(jìn)行了分析討論。人臉檢測采用adaboost 算法,因其速度和精度的綜合性能表現(xiàn)優(yōu)異。人眼定位采用小塊合并算法,因為它具有快速,準(zhǔn)確,弱時實的特點(diǎn)。預(yù)處理算法采用直方圖均衡加平滑的算法,簡單,高效。 識別算法采用PCA 加ICA 算法,它能最大的弱化姿態(tài)和光照對人臉識別的影響。 最后,使用Verilog HDL 硬件描述語言進(jìn)行算法的RTL 建模,在C++算法的基礎(chǔ)上,保證原來效果的前提下,根據(jù)FPGA 硬件特點(diǎn)對算法進(jìn)行了優(yōu)化。視頻輸入輸出是人臉識別的前提,它提供FPGA 上算法需要處理的數(shù)據(jù),預(yù)處理算法在C++算法的基礎(chǔ)上進(jìn)行了優(yōu)化,最大的減少了運(yùn)算量,提高了運(yùn)算速度,16 位計算器模塊使得在算法實現(xiàn)時可以根據(jù)系統(tǒng)要求,在FPGA的ip 核和自己設(shè)計的模塊之間選擇性能更好的一個來調(diào)用,F(xiàn)IFO的設(shè)計提供同步和異步時鐘域的數(shù)據(jù)緩存。設(shè)計在ISE和VC++軟件平臺同時進(jìn)行,隨時對verilog和C++數(shù)據(jù)進(jìn)行監(jiān)測和比對。全部設(shè)計模塊通過仿真,達(dá)到預(yù)定的性能要求,并在FPGA 上綜合實現(xiàn)。
上傳時間: 2013-07-13
上傳用戶:李夢晗
人臉識別技術(shù)繼指紋識別、虹膜識別以及聲音識別等生物識別技術(shù)之后,以其獨(dú)特的方便、經(jīng)濟(jì)及準(zhǔn)確性而越來越受到世人的矚目。作為人臉識別系統(tǒng)的重要環(huán)節(jié)—人臉檢測,隨著研究的深入和應(yīng)用的擴(kuò)大,在視頻會議、圖像檢索、出入口控制以及智能人機(jī)交互等領(lǐng)域有著重要的應(yīng)用前景,發(fā)展速度異常迅猛。 FPGA的制造技術(shù)不斷發(fā)展,它的功能、應(yīng)用和可靠性逐漸增加,在各個行業(yè)也顯現(xiàn)出自身的優(yōu)勢。FPGA允許用戶根據(jù)自己的需要來建立自己的模塊,為用戶的升級和改進(jìn)留下廣闊的空間。并且速度更高,密度也更大,其設(shè)計方法的靈活性降低了整個系統(tǒng)的開發(fā)成本,F(xiàn)PGA 設(shè)計成為電子自動化設(shè)計行業(yè)不可缺少的方法。 本文從人臉檢測算法入手,總結(jié)基于FPGA上的嵌入式系統(tǒng)設(shè)計方法,使用IBM的Coreconnect掛接自定義模塊技術(shù)。經(jīng)過訓(xùn)練分類器、定點(diǎn)化、以及硬件加速等方法后,能夠使人臉檢測系統(tǒng)在基于Xilinx的Virtex II Pro開發(fā)板上平臺上,達(dá)到實時的檢測效果。本文工作和成果可以具體描述如下: 1. 算法分析:對于人臉檢測算法,首先確保的是檢測率的準(zhǔn)確性程度。本文所采用的是基于Paul Viola和Michael J.Jones提出的一種基于Adaboost算法的人臉檢測方法。算法中較多的是積分圖的特征值計算,這便于進(jìn)一步的硬件設(shè)計。同時對檢測算法進(jìn)行耗時分析確定運(yùn)行速度的瓶頸。 2. 軟硬件功能劃分:這一步考慮市場可以提供的資源狀況,又要考慮系統(tǒng)成本、開發(fā)時間等諸多因素。Xilinx公司提供的Virtex II Pro開發(fā)板,在上面有可以供利用的Power PC處理器、可擴(kuò)展的存儲器、I/O接口、總線及數(shù)據(jù)通道等,通過分析可以對算法進(jìn)行細(xì)致的劃分,實現(xiàn)需要加速的模塊。 3. 定點(diǎn)化:在Adaboost算法中,需要進(jìn)行大量的浮點(diǎn)計算。這里采用的方法是直接對數(shù)據(jù)位進(jìn)行操作它提取指數(shù)和尾數(shù),然后對尾數(shù)執(zhí)行移位操作。 4. 改進(jìn)檢測用的級聯(lián)分類器的訓(xùn)練,提出可以迅速提高分類能力、特征數(shù)量大大減小的一種訓(xùn)練方法。 5. 最后對系統(tǒng)的整體進(jìn)行了驗證。實驗表明,在視頻輸入輸出接入的同時,人臉檢測能夠達(dá)到17fps的檢測速度,并且獲得了很好的檢測率以及較低的誤檢率。
標(biāo)簽: FPGA 人臉檢測 系統(tǒng)設(shè)計
上傳時間: 2013-07-01
上傳用戶:84425894
H.264/AVC是ITU-T和ISO聯(lián)合推出的新標(biāo)準(zhǔn),采用了近幾年視頻編碼方面的先進(jìn)技術(shù),以較高編碼效率和網(wǎng)絡(luò)友好性成為新一代國際視頻編碼標(biāo)準(zhǔn)。 本文以實現(xiàn)D1格式的H.264/AVC實時編碼器為目標(biāo),作者負(fù)責(zé)系統(tǒng)架構(gòu)設(shè)計,軟硬件劃分以及部分模塊的硬件算法設(shè)計與實現(xiàn)。通過對H.264/AVC編碼器中主要模塊的算法復(fù)雜度的評估,算法特點(diǎn)的分析,同時考慮到編碼器系統(tǒng)的可伸縮性,可擴(kuò)展性,本文采用了DSP+FPGA的系統(tǒng)架構(gòu)。DSP充當(dāng)核心處理器,而FPGA作為協(xié)處理器,針對編碼器中最復(fù)雜耗時的模塊一運(yùn)動估計模塊,設(shè)計相應(yīng)的硬件加速引擎,以提供編碼器所需要的實時性能。 H.264/AVC仍基于以前視頻編碼標(biāo)準(zhǔn)的運(yùn)動補(bǔ)償混合編碼方案,其中一個主要的不同在于幀間預(yù)測采用了可變塊尺寸的運(yùn)動估計,同時運(yùn)動向量精度提高到1/4像素。更小和更多形狀的塊分割模式的采用,以及更加精確的亞像素位置的預(yù)測,可以改善運(yùn)動補(bǔ)償精度,提高圖像質(zhì)量和編碼效率,但同時也大大增加了編碼器的復(fù)雜度,因此需要設(shè)計專門的硬件加速引擎。 本文給出了1/4像素精度的運(yùn)動估計基于FPGA的硬件算法設(shè)計與實現(xiàn),包括整像素搜索,像素插值,亞像素(1/2,1/4)搜索以及多模式選擇(支持全部七種塊分割模式)。設(shè)計中,將多處理器技術(shù)和流水線技術(shù)相結(jié)合,提供高性能的并行計算能力,同時,采用合理的存儲器組織結(jié)構(gòu)以提供高數(shù)據(jù)吞吐量,滿足運(yùn)算的帶寬要求,并使編碼器具有較好的可伸縮性。最后,在Modelsim環(huán)境下建立測試平臺,完成了對整個設(shè)計的RTL級的仿真驗證,并針對Altera公司的FPGA芯片stratixⅡ系列的EP2S60-4器件進(jìn)行優(yōu)化,從而使工作頻率最終達(dá)到134MHz,分析數(shù)據(jù)表明該模塊能夠滿足編碼器的實時性要求。
標(biāo)簽: DSPFPGA H264 264 AVC
上傳時間: 2013-07-24
上傳用戶:sn2080395
蟲蟲下載站版權(quán)所有 京ICP備2021023401號-1