星光智能一號 中國首款嵌入式神經網絡處理器芯片誕生
從 深藍 到Alphgo,人工智能如何發(fā)展?
人工智能經過了跌宕起伏的發(fā)展過程,從 深藍 對決國際象棋,到Alphago對戰(zhàn)圍棋九段李世石,人工智能都以勝者的姿態(tài)展現(xiàn)在世人面前。不過,兩次人機大戰(zhàn)背后的技術力量截然不同。第一次人機大戰(zhàn), 深藍 憑借的是超級計算機的運算速度,而第二次人機大戰(zhàn)中,Alphgo依靠的卻是模仿人腦的深度學習神經網絡。 然而,有一個問題擺在我們面前,深藍重達1270公斤,有32個CPU,而Alphago更是運行在一個龐大的服務器集群上,每下一盤棋的電費就高達3000元美金!
星光智能一號 芯片
深度學習只是大型服務器集群的專屬嗎?小型化設備能否集成深度學習系統(tǒng)?中星微國家重點實驗室給出的答案是:前端小型化設備也可以擁有人工智能。 中星微數(shù)字多媒體芯片技術國家重點實驗室執(zhí)行主任張韻東表示,神經網絡處理器(NPU)針對CNN(卷積神經網絡,Convolutional Neural Network)算法特性而設計的處理器內核,徹底顛覆了馮諾依曼架構而采用了 數(shù)據(jù)驅動 并行計算架構。 每個NPU處理器具有4個內核(NPU Core),每個內核有兩個數(shù)據(jù)流處理器(Dataflow Processor), 每個數(shù)據(jù)流處理器具有8個長位寬或16個短位寬的SIMD(單指令多數(shù)據(jù))運算單元。在一個時鐘周期內,NPU處理器可同時完成64個長位寬MAC運算或者128個短位寬MAC運算。
每個NPU處理器具有38G Ops的長位寬處理能力或者76G Ops的短位寬處理能力。 NPU的處理性能可以通過組成多核陣列來提升,也可以通過多芯片級聯(lián)的方式進一步擴展,以滿足更復雜的CNN網絡運算的性能需求。每個NPU處理器中同時還包含一個LW Processor(長字處理器),專門用于處理神經元網絡中的超越函數(shù)等復雜計算。另外,每個NPU處理器還具有256KB Level-2 Cache,以及整塊數(shù)據(jù)搬移(Block Data Access),片內數(shù)據(jù)共享(Data-sharing Between Processor Units),提升數(shù)據(jù)流的吞吐效率。并與軟件配合利用了稀疏數(shù)據(jù)優(yōu)化(Optimization for Sparse Data)等特性提高計算效率。NPU開發(fā)包提供可視化的數(shù)據(jù)流程圖優(yōu)化工具。NPU支持Caffe、TensorFlow等多種神經網絡框架, 支持AlexNet、GoogleNet等各類神經網絡。 張韻東介紹說,星光智能一號的誕生,將人工智能與大數(shù)據(jù)產業(yè)有機結合在一起,成千上萬個視頻監(jiān)控設備所產生的數(shù)據(jù),通過前端智能分析、后端深度挖掘,能夠產生巨大的社會效益和經濟價值。
文章編輯:CobiNet(寧波),本公司專注于電訊配件,銅纜綜合布線系列領域產品研發(fā)生產超五類,六類,七類屏蔽網線/屏蔽模塊及相關模塊配件,歡迎來電咨詢0574 88168918,78867.cn;
?2016-2019寧波科博通信技術有限公司版權所有浙ICP備16026074號