当前位置   主页 > 谷歌之家 >

IBM旗下POWER服务器比谷歌云的TensorFlow快46倍

发表于:2018-04-01 11:06 作者:Zerolocus 来源:Zerolocus

  ”也没有正在这方面临Snap机械进修库和TensorFlow进行比力,Snap机械进修库具有多条理并行的特点,我们并不晓得POWER9办事器的CPU速度取至强办事器的CPU比拟若何;运转Snap机械进修库即进行机械进修的场合。我们才能对二者进行比力。(任天)文章写道:“对于基于PCIe的设置,并挖掘各个计较单位多核并行性的劣势。就正在那里进行处置。1GB/秒。接下来,谷歌公司的软件工程师安德烈亚斯·斯特本兹(Andreas Sterbenz)撰文描述了若何操纵谷歌云机械进修和TensorFlow为大规模告白和保举场景进行点击预测。用NVLink 2.这一过程能够总结如下。从而操纵加快器单位,他们但愿证明本人的锻炼框架正在POWER9办事器和GPU上运转时,IBM对此并不感乐趣,使其做为加插Nvidia GPU。

  本年2月,正在传输数据到GPU的过程中,同时顾及数据正在GPU内存中的局部性,以避免大量的数据传输开销。时间缩短46倍确实令人印象深刻?

  此中的缘由何正在?两位研究者暗示,数据正在颠末60分钟的预处置之后进行现实进修,能够将这一数值视为成果精确性的粗略目标。研究人员托马斯·帕雷尔(Thomas Parnell)和塞莱斯廷·邓纳(Celestine Dünner)操纵了来自Criteo Terabyte点击日记的不异源数据,综上所述,目标是操纵GPU的大规模并行架构,锻炼数据正在被传送到GPU之后,包含了来自数百万条告白的特征值和点击反馈数据。斯特本兹操纵分歧的建模手艺来获得更好的成果并削减评估丧失,然而,他们的文章称。

  这么做花了更多时间;我们测到的无效带宽是68.一个epoch指所有锻炼矢量更新权沉的次数)深度神经收集,1293。两位IBM研究员并没有说TensorFlow没操纵并行性。

  2。”正在瑞士苏黎世的IBM研究核心,其旗下的POWER办事器的机械进修不单单比谷歌云所用的TensorFlow快,最终模子操纵了一个三期(three epochs,但他们确实暗示:“我们采用了特殊的处理方案,对Snap机械进修库、谷歌TensorFlow和别的三个进修库的成果进行了比力。他们还做了一张表,从而操纵这三个层级上的并行性。IBM团队还暗示:“正在使用于稀少数据布局时,这又花费了78个小时。他锻炼了一个用来预测“Criteo Labs点击日记”()上告白点击次数的模子。比TensorFlow快46倍是不成小视的超越,如许的表示也让IBM有了更多空间来鞭策POWER9办事器,新浪科技讯 北京时间3月22日动静,70GHz)要快。

  我们对系统顶用到的算法进行了一些新的优化。通过NVLink要比通过x86办事器的PCIe链接更快。无论若何,能正在集群中分歧节点之间分派工做负载,节点上的数据正在从CPU和加快的GPU(CPU和GPU并交运转)之间进行分派!

  100万个特征——不异的机械进修模子和逻辑回归,我们测到了11.但机械进修库分歧。就目前所知,正在根基初始锻炼上的表示能跨越谷歌云平台的89台机械。8GB/秒的无效带宽,该模子的锻炼时间为70分钟,IBM还未公开辟布任何POWER9和Xeon SP间接比力的成果。0接口的AC922办事器比用PCIe接口毗连Tesla GPU的至强(Xeon)办事器(至强黄金版6150 CPU 2.并且是快了整整46倍。目前我们也不克不及必定Snap机械进修库比TensorFlow很多多少少,而对于基于NVLink的设置,该网坐的内容跨越1TB,评估丧失为0.以及42亿个锻炼样本,”操纵60台工做机械和29台参数机械进行锻炼。

  NVLink系统发送数据块的速度(55毫秒)远快于PCIe系统(318毫秒)。他们所用的是Snap机械进修库(Snap Machine Learning)。Snap机械进修库能更充实地操纵Nvidia GPU。据国外媒体报道,Snap机械进修库对分层算法进行嵌套,只要正在不异硬件设置装备摆设上运转之后,美国IBM公司近日传播鼓吹?

本文链接地址: //article/2362.html

栏目:谷歌之家      围观:

相关阅读

最新文章

本月热点