谷歌的研究團(tuán)隊(duì)公布了一項(xiàng)突破性技術(shù),旨在解決在移動(dòng)設(shè)備等資源受限平臺(tái)上運(yùn)行深層神經(jīng)網(wǎng)絡(luò)的挑戰(zhàn)。該技術(shù)旨在提高推理效率、降低延遲,并將模型尺寸縮小以適應(yīng)手機(jī)、物聯(lián)網(wǎng)節(jié)以及可穿戴設(shè)備等邊緣計(jì)算環(huán)境。\n\n核心創(chuàng)新點(diǎn)聚焦于模型壓縮與算法分布的平衡——使用一種創(chuàng)新的量化策略,通過對(duì)神經(jīng)元權(quán)重和輸出的精確分布模型估計(jì)來裁剪冗余參數(shù)同時(shí)減少推理過程中的數(shù)據(jù)功耗。初步的基準(zhǔn)測試在主流安卓設(shè)備上展示了其性能:相同圖像識(shí)別任務(wù)算力提升了數(shù)倍,單次預(yù)測耗電減少了近乎一半通常存儲(chǔ)使用的40-50百分也得到優(yōu)化。加之利用了新型稀疏架構(gòu)實(shí)時(shí)處理器加速的數(shù)據(jù)管線,“場景驅(qū)動(dòng)的任務(wù)個(gè)性化”“音頻識(shí)別本影優(yōu)化”很可能改變未來邊緣設(shè)備AI的內(nèi)核打造邏輯。\n未來隨著對(duì)該技術(shù)專利申請的描述逐漸清晰后-它有希望使資源貧乏還是CPU/內(nèi)存底端芯片同樣也可大規(guī)模深訓(xùn)深度學(xué)習(xí)實(shí)時(shí)回復(fù);直接在手機(jī)終端服務(wù)零之質(zhì)從面向公司通訊各用戶全向推理變?yōu)橥ㄓ脤?shí)用巨大進(jìn)化”。該早期計(jì)劃完全宣布同平全球發(fā)展有助于促使常強(qiáng)大AI泛化了”易便遍布一切民用必備交流方維度連網(wǎng)產(chǎn)物整合成了歷史拐點(diǎn).