獨(dú)立的神經(jīng)網(wǎng)絡(luò)DSP IP核心揭開面紗
Cadence設(shè)計(jì)系統(tǒng)推出了Cadence ten二氧化硅視覺C5 DSP,這是第一個(gè)獨(dú)立的、獨(dú)立的神經(jīng)網(wǎng)絡(luò)DSP IP核心,用于視覺、雷達(dá)/激光雷達(dá)和熔斷傳感器應(yīng)用,具有高可用性神經(jīng)網(wǎng)絡(luò)計(jì)算需求。
針對汽車、監(jiān)視、無人機(jī)和移動(dòng)/可穿戴市場,Vision C5 DSP提供1TMAC/sec的計(jì)算能力,可以運(yùn)行所有的神經(jīng)網(wǎng)絡(luò)計(jì)算任務(wù)。
隨著神經(jīng)網(wǎng)絡(luò)越來越深入和復(fù)雜,計(jì)算要求也越來越高。與此同時(shí),神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)也在不斷變化,新的網(wǎng)絡(luò)不斷出現(xiàn),新的應(yīng)用和市場不斷涌現(xiàn)。這些趨勢推動(dòng)了對高性能、通用的神經(jīng)網(wǎng)絡(luò)處理解決方案的需求,這種解決方案不僅需要很少的電力,而且還可以高度編程,以保證未來的靈活性和更低的風(fēng)險(xiǎn)。
神經(jīng)網(wǎng)絡(luò)DSP與神經(jīng)網(wǎng)絡(luò)加速器
在汽車、無人機(jī)和安全系統(tǒng)中,基于攝像機(jī)的視覺系統(tǒng)需要兩種基本類型的視覺優(yōu)化計(jì)算。首先,使用傳統(tǒng)的計(jì)算攝影/成像算法增強(qiáng)來自攝像機(jī)的輸入。其次,基于神經(jīng)網(wǎng)絡(luò)的識(shí)別算法對目標(biāo)進(jìn)行檢測和識(shí)別。現(xiàn)有的神經(jīng)網(wǎng)絡(luò)加速器解決方案是附加在成像DSP上的硬件加速器,神經(jīng)網(wǎng)絡(luò)代碼分為在DSP上運(yùn)行一些網(wǎng)絡(luò)層和向加速器釋放卷積層。這種組合是低效的,消耗了不必要的權(quán)力。
作為一個(gè)專門的神經(jīng)網(wǎng)絡(luò)優(yōu)化的DSP架構(gòu),視覺C5 DSP加速了所有的神經(jīng)網(wǎng)絡(luò)計(jì)算層(卷積,完全連接,匯聚和標(biāo)準(zhǔn)化),而不僅僅是卷積函數(shù)。這使主視覺/成像DSP能夠獨(dú)立運(yùn)行圖像增強(qiáng)應(yīng)用程序,而vision C5 DSP則可以執(zhí)行推理任務(wù)。通過消除神經(jīng)網(wǎng)絡(luò)DSP與主視覺/成像DSP之間的額外數(shù)據(jù)運(yùn)動(dòng),視覺C5 DSP提供了比競爭神經(jīng)網(wǎng)絡(luò)加速器更低的能量解決方案。它還為神經(jīng)網(wǎng)絡(luò)提供了一個(gè)簡單的單處理器編程模型。
“我們的許多客戶目前都處于艱難的境地,無法為一款產(chǎn)品選擇一個(gè)神經(jīng)網(wǎng)絡(luò)推理平臺(tái),而這款產(chǎn)品可能需要幾年甚至更長時(shí)間才能上市,”Cadence公司ten二氧化硅營銷高級總監(jiān)史蒂夫·羅迪(Steve Roddy)說。在嵌入式系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)處理器不僅要消耗低功耗,而且在每個(gè)圖像上都要快速,而且它們還應(yīng)該是靈活的和未來的證明。所有當(dāng)前的替代方案都需要不需要的權(quán)衡,而且很明顯需要一個(gè)新的解決方案。我們將視覺c5dsp架構(gòu)為一個(gè)通用的神經(jīng)網(wǎng)絡(luò)DSP,易于集成和非常靈活,同時(shí)提供比CNN加速器、gpu和cpu更好的功率效率。
嵌入式視覺聯(lián)盟的創(chuàng)始人杰夫·比爾說:“在現(xiàn)實(shí)世界的設(shè)備中,深度學(xué)習(xí)的應(yīng)用是巨大的和多樣化的,計(jì)算需求是具有挑戰(zhàn)性的。”“特殊的可編程處理器,如Vision C5 DSP,可以在成本和功率敏感的設(shè)備中部署深度學(xué)習(xí)。”
視覺C5 DSP的特點(diǎn)和性能
Vision C5 DSP在一個(gè)獨(dú)立的引擎中提供了出色的神經(jīng)網(wǎng)絡(luò)性能:
area提供了非常高的深度學(xué)習(xí)內(nèi)核的計(jì)算吞吐量
1024 8位mac或512 16位mac,在8位和16位分辨率下都有出色的性能
具有128位、8位或64位、16位SIMD的VLIW SIMD體系結(jié)構(gòu)
為多核設(shè)計(jì)架構(gòu),使多teramac解決方案能夠在很小的空間內(nèi)實(shí)現(xiàn)
集成iDMA和AXI4接口
使用與Vision P5和P6 dsp相同的經(jīng)過驗(yàn)證的軟件工具集。
與市面上可用的gpu相比,在著名的AlexNet CNN性能基準(zhǔn)中,Vision C5 DSP快了6倍,在Inception V3 CNN性能基準(zhǔn)中快了9倍
Vision C5 DSP是一種靈活的、可驗(yàn)證的解決方案,支持可變內(nèi)核大小、深度和輸入維度。它還適用于幾種不同的系數(shù)壓縮/解壓縮技術(shù),并且可以隨著新層的發(fā)展而添加對新層的支持。相比之下,由于可重用性更有限,硬件加速器提供了一個(gè)剛性的解決方案。
Vision C5 DSP還附帶Cadence神經(jīng)網(wǎng)絡(luò)映射工具集,它將利用一套人工優(yōu)化的神經(jīng)網(wǎng)絡(luò)庫功能,將任何經(jīng)過Caffe和TensorFlow等工具培訓(xùn)的神經(jīng)網(wǎng)絡(luò)映射到Vision C5 DSP的可執(zhí)行和高度優(yōu)化的代碼中。
撥碼開關(guān)http://www.zzycbxg.cn/page/productlist/list-102-1.html |