国产又黄又猛又粗又爽的A片动漫,强吻亲胸揉胸膜下刺激视频,男女无遮挡吃奶gift动态图,巨胸喷奶水WWW冈哺乳期

【技術(shù)分享】云邊AI實現(xiàn)

日期:2023-11-07 作者:潤欣科技 返回列表

云邊AI的必然

云邊AI是指把AI大模型和算法在云端訓(xùn)練和優(yōu)化后,部署到邊緣設(shè)備上運行,從而將AI能力融入終端設(shè)備。在前期的AI發(fā)展中,云端計算平臺憑借其強大的計算能力和能夠集中存儲和處理大規(guī)模數(shù)據(jù)的特點,發(fā)揮了重要的作用,但隨著邊緣計算和物聯(lián)網(wǎng)技術(shù)的興起,云邊AI替代云端AI會成為一種趨勢和必然。

邊緣計算能夠?qū)⒂嬎愫痛鎯δ芰Ω咏鼣?shù)據(jù)來源和終端設(shè)備,極大地減少了數(shù)據(jù)傳輸和延遲,減少了網(wǎng)絡(luò)壓力提高了響應(yīng)速度,這使得在邊緣設(shè)備上實施AI算法和決策成為可能。并且,一些敏感數(shù)據(jù)和隱私數(shù)據(jù)可能不適合直接上傳到云端進行處理。通過在邊緣設(shè)備上進行處理,可以減少數(shù)據(jù)在傳輸過程中的風(fēng)險,提升數(shù)據(jù)的隱私和安全性。此外,物聯(lián)網(wǎng)技術(shù)的興起意味著越來越多的設(shè)備將與互聯(lián)網(wǎng)連接,并產(chǎn)生海量的數(shù)據(jù),處理這些分布在各個邊緣節(jié)點的數(shù)據(jù),借助邊緣計算和物聯(lián)網(wǎng)技術(shù),減輕了網(wǎng)絡(luò)帶寬和云端服務(wù)器的負荷的同時也降低了對網(wǎng)絡(luò)環(huán)境的依賴,使得終端設(shè)備執(zhí)行AI能力更加的高效和可行。因此,云邊AI替代云端AI是必然的趨勢,并將在未來的AI發(fā)展中成為眾多企業(yè)的首選。

云邊AI的硬件承載

談到AI的硬件承載,我們首先需要了解的是和AI芯片性能相關(guān)的重要指標。在這里,我們重點講解四個指標參數(shù)。

首先是算力,算力是評估芯片性能和效率的重要指標,常見的算力單位包括每秒浮點運算數(shù) FLOPS和每秒萬億次運算數(shù)TOPS,更低的有MOPS,即每秒執(zhí)行的百萬次操作數(shù)。

其次是神經(jīng)網(wǎng)絡(luò)性能,跟軟件算法架構(gòu)、硬件加速器以及參數(shù)數(shù)量有關(guān),選擇合適的軟件算法架構(gòu)可以提高神經(jīng)網(wǎng)絡(luò)的性能,例如CNN適用于圖像處理任務(wù)、RNN適用于序列數(shù)據(jù)處理,硬件加速器(如GPU、TPU、NPU等)可以提高神經(jīng)網(wǎng)絡(luò)的計算性能和效率,參數(shù)數(shù)量可以衡量模型的復(fù)雜性和容量,合適的參數(shù)數(shù)量可以優(yōu)化神經(jīng)網(wǎng)絡(luò)的性能和預(yù)測結(jié)果。

再次是能效比,指性能和功耗之間的關(guān)系,較高的能效比表示芯片能夠在相同計算性能下消耗較少的能量,減少了能源消耗和發(fā)熱問題。比如運算功耗2 TOPS/W表示該芯片將能夠以每瓦特2 TOPS的速度進行計算。

最后是存儲的容量和帶寬,高存儲帶寬可以加快數(shù)據(jù)傳輸和訪問速度,提高芯片的整體性能,而大容量的可以支持更復(fù)雜的模型和數(shù)據(jù)集。比如在芯片內(nèi)嵌MCRAM存儲架構(gòu),通過將多個存儲芯片匯總到一個統(tǒng)一的接口上,實現(xiàn)了存儲容量的擴展和高帶寬的訪問。

11111.png

AI應(yīng)用的硬件適配

AI應(yīng)用對芯片的選擇根據(jù)具體應(yīng)用的需求和算法的特點進行權(quán)衡和決策,綜合考慮處理能力、能效、存儲、并行處理能力以及可編程性等因素,可以包括CPU、NPU、GPU、DSP、FPGA等。CPU適用于處理串行任務(wù)和邏輯操作。NPU是專門用于處理神經(jīng)網(wǎng)絡(luò)計算的芯片,可以提供高效且低功耗的深度學(xué)習(xí)計算能力。GPU是具備較強并行處理能力的芯片,適用于對大規(guī)模數(shù)據(jù)進行并行計算的AI任務(wù),例如深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理。DSP適用于音頻、語音處理和移動設(shè)備等嵌入式AI場景。而FPGA則適用于高性能計算、加速器設(shè)計和優(yōu)化以及快速原型開發(fā)等需要定制硬件和高度靈活性的AI應(yīng)用。

為了更直觀地展示不同硬件和AI應(yīng)用的匹配性,本文隨機選了6款不同芯片的特性進行說明。

第一款芯片為通用CPU:“雙核Cortex-A7 SMP架構(gòu),每個內(nèi)核內(nèi)嵌NEON向量處理單元以及32KB的L1指令緩存和數(shù)據(jù)緩存,工作頻率最高可達1GHz,具有128位的AXI矩陣總線”。此芯片雖然帶有L1緩存和NEON指令集,但是緩存相對較小,只適合處理一些輕量級的任務(wù)和小型模型,1GHz的主頻和AXI矩陣總線在高速數(shù)據(jù)傳輸方面有優(yōu)勢,根據(jù)以上信息此款芯片適合較簡單的圖形處理任務(wù)、語音識別任務(wù),以及規(guī)模較小且計算需求相對較低文本分類或情感分析模型。

第二款芯片為低端NPU:“4個支持NT8(8位整數(shù))計算的Multiply-Accumulate單元,在12MHz的時鐘頻率下能夠提供96 MOPS的性能,同時帶有低功耗神經(jīng)網(wǎng)絡(luò)處理單元LP_NPU”。此芯片性能較低,不適合處理大型模型和算法,可用于低功耗、邊緣設(shè)備或嵌入式設(shè)備,用于處理輕量級的AI應(yīng)用,包括如圖像和視覺識別、語音和音頻處理、自然語言處理、智能物聯(lián)網(wǎng)控制等。

第三款芯片為第二款的升級版:“具有4.0~8.0 TOPS @ INT8的算力和20 TOPS/W的能效”。此芯片能效適合處理較大的神經(jīng)網(wǎng)絡(luò)模型和算法,特別是那些需要高計算密集度的任務(wù)。這樣的算力和能效可以應(yīng)對較為復(fù)雜的深度學(xué)習(xí)模型,如大規(guī)模的卷積神經(jīng)網(wǎng)絡(luò)(CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和生成對抗網(wǎng)絡(luò)(GAN)等。同時,高能效性能意味著處理器能夠以較低的功耗提供較高的計算性能,適合在資源受限的環(huán)境中運行大型模型和算法。所以此芯片可以用于圖像、語言、醫(yī)療影像以及自動駕駛和機器人相關(guān)的AI應(yīng)用。

第四款芯片為存算一體AI芯片:“0.5T OP/Sec,150萬參數(shù)@Int8,2TOPS/W的能效,MCRAM存儲系統(tǒng)?!贝诵酒m合一些較小規(guī)模的大模型和算法,特別是那些相對較簡單或計算需求較低的任務(wù),比如淺層神經(jīng)網(wǎng)絡(luò)處理、輕量級的目標檢測和圖形處理,以及嵌入式設(shè)備上的語音識別應(yīng)用等。

第五款芯片也為存算一體AI芯片:“1.6T OP/Sec,700萬參數(shù)@Int8,2TOPS/W的能效,MCRAM存儲系統(tǒng)?!贝诵酒m合一些特定類型的大模型和算法,特別是針對計算密集型任務(wù)的應(yīng)用,包括如大規(guī)模的深度神經(jīng)網(wǎng)絡(luò)模型、需要進行大量的計算操作的計算密集型任務(wù)、高精度數(shù)據(jù)處理和自動駕駛以及機器人等實時推理場景的應(yīng)用。

第六款芯片為中高端AI芯片:“5T OP/Sec,3000萬參數(shù)@Int8,8TOPS/W的能效,MCRAM存儲系統(tǒng)和KORU運算架構(gòu)?!贝丝钚酒懊娴男酒啾?,適合處理更大規(guī)模的大模型和算法,具備更高的計算性能,可以適用包括高分辨率圖像處理、大規(guī)模的語言模型、超大規(guī)模的目標檢測和圖像分割,以及深度學(xué)習(xí)等應(yīng)用。

邊緣AI芯片的發(fā)展

隨著邊緣智能設(shè)備需求的不斷增加,未來的邊緣AI芯片將迎來一個發(fā)展高峰。邊緣AI芯片的發(fā)展方向?qū)⒉豢杀苊獾爻尸F(xiàn)多元化的趨勢,這是由于終端設(shè)備和云端業(yè)務(wù)的差異性所決定的。邊緣AI芯片需要具備高效的計算能力和低功耗特性,同時需要有感知處理能力和數(shù)據(jù)加密能力,為了更好地實現(xiàn)云邊AI混合計算,邊緣AI芯片還需要具備穩(wěn)定可靠的通信和網(wǎng)絡(luò)連接能力,實現(xiàn)邊緣設(shè)備與云端的協(xié)同工作和數(shù)據(jù)共享任務(wù)。


返回列表
建昌县| 阳东县| 嘉祥县| 泾阳县| 汾西县| 准格尔旗| 句容市| 武宁县| 怀集县| 师宗县| 广宁县| 安乡县|