天博科技 天博IBM开发新芯片为AI提速:消除片外内存,灵感来自大脑—新闻—科学网 来源:天博企业 发表时间: 2024-04-02

于传统冯 诺伊曼架构下,计较以及存储分散。而北顶点芯片使存储单位于物理上尽可能靠近计较单位中的计较元件。北顶点芯片由256个计较单位构成,每一个计较单位都有内存,经由过程消弭片外内存,将计较与片上内存交叉于一路。这些计较单位以一种收集毗连于一路,设计灵感来自在人类年夜脑。

IBM研发的北顶点(NorthPole)处置惩罚器芯片可避开拜候外部存储器,提高计较威力,节省能源。

美国加利福尼亚州圣何塞的IBM研究职员开发了一种以年夜脑为灵感的计较机芯片,这款北顶点处置惩罚器芯片消弭了频仍拜候外部存储器的需要,于图象辨认使命中比现有架构更快,能源耗损更少。这注解计较以及内存可以年夜范围集成。相干研究10月19日揭晓于《科学》杂志。

北顶点芯片接纳神经推理布局,由简朴计较单位构成的多层阵列经由过程编程来辨认数据中的模式。底层吸收数据,例如图象中的像素;每个持续的层检测日趋繁杂的模式,并将信息通报给下一层;顶层输出成果,例如可以暗示图象含有猫、汽车或者其他物体的可能性。

于传统冯 诺伊曼架构下,计较以及存储分散。传统计较机芯片可以有用处置惩罚计较,但每一次计较时仍旧需要使用被称为RAM的外部存储器。是以无论处置惩罚器运转多快、机能多好,每一次履行运算时都需要把数据从存储器搬处处理器中,数据处置惩罚完再搬回到存储器。于以数据为主的AI计较之下,冯 诺伊曼架构的“存储墙”以及“功耗墙”应战凸显。论文合著者、IBM计较机项目师达门德拉 莫达(Dharmendra Modha)暗示,他曾经预计于这类架构上模仿人类年夜脑可能需要12个核反映堆的能源输出。

而北顶点芯片使存储单位于物理上尽可能靠近计较单位中的计较元件。北顶点芯片由256个计较单位构成,每一个计较单位都有内存,经由过程消弭片外内存,将计较与片上内存交叉于一路。这些计较单位以一种收集毗连于一路,这类收集的灵感来自在人类年夜脑皮层之间的白质毗连。

于不使用开始进工艺的环境下,北顶点芯片能耗是使用开始进技能的人工智能芯片的1/5。论文作者预计,假如北顶点芯片设计接纳开始进的打造工艺,其效率将是今朝设计的25倍。论文提到,“于ResNet50基准图象分类收集上,相对于在使用近似12纳米技能工艺的GPU, 北顶点实现了每一瓦FPS(每一秒传输帧数)的能量器量高25倍,每一个晶体管FPS的空间器量高5倍,延迟时间器量低22倍。”

不外,据《天然》杂志报导,纵然是北顶点芯片�첩224兆内存对于在年夜型言语模子来讲也是不敷的,好比谈天呆板人ChatGPT如许的言语模子,纵然于最精简的版本中也要占用几千兆的数据。并且该芯片只能运转预先编程的神经收集,这些神经收集需要于零丁的呆板上提早练习。但论文作者暗示,北顶点芯片架构可能于速率要害型运用中有效,好比主动驾驶汽车。

出格声明:本文转载仅仅是出在流传信息的需要,其实不象征着代表本消息网不雅点或者证明其内容的真实性;如其他媒体、消息网或者小我私家从本消息网转载使用,须保留本消息网注明的“来历”,并自大版权等法令义务;作者假如不但愿被转载或者者接洽转载稿费等事宜,请与咱们联系。/天博

上一篇:天博如何将中医药说明白、讲清楚?—新闻—科学网 下一篇:天博南开团队开发基于细胞的一氧化氮气体分子递送系统—新闻—科学网