a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

浪潮开源项目Caffe-MPI取得最佳的加速比

 Caffe-MPI是首个集群并行版的Caffe深度学习计算框架,基于伯克利Caffe框架,由浪潮主导开发并已在Github上开源公布所有代码,其采用成熟的MPI技术对Caffe予以数据并行的优化,目标是解决深度学习计算模型训练的效率问题。
资讯频道文章B

  据悉,在2017人工智能计算大会(AICC)上,香港浸会大学副教授褚晓文发表了目前主流深度学习框架评测的主题报告,报告显示由浪潮牵头开发的开源项目Caffe-MPI,与其他主流框架相比取得了最佳的加速比,并在GoogLeNet网络模型中取得最佳性能。

  根据报告显示数据,由浪潮开发的Caffe-MPI 2.0,在4节点16块P40 GPU的计算集群上,采用Imagenet数据集。采用GoogLeNet模型(Batchsize=128)时,16卡的训练性能为5886张图片/秒,较单卡提升14.2倍;采用ResNet模型(Batchsize=32)时16卡训练性能为1372张图片/秒,较单卡提升15.34倍,扩展效率高达96%。Caffe-MPI超越了CNTK和MXNet,成为加速比最好的深度学习框架,也是在GoogLeNet模型下性能最好的深度学习框架。

  香港浸会大学副教授褚晓文表示,目前在测的所有深度学习框架中,浪潮Caffe-MPI展现出最好的加速比性能,相信对于所有需要将Caffe扩展到多机环境的用户,浪潮Caffe-MPI将是最好的选择。

  Caffe-MPI 2.0出色的加速比得益于在并行算法设计上的创新突破。Caffe-MPI设计了两层通信模式:节点内的GPU卡间通信及节点间的RDMA全局通信,通过调用NCCL 2.0实现。这种设计极大降低了网络通信的压力,并克服了传统通信模式中PCIE与网络之间带宽不均衡的影响,非常适合现在的高密度GPU服务器。

  同时,Caffe-MPI 2.0还设计实现了深层神经网络模型各层计算和通讯的异步,合并了多层待通信数据然后在到达一定量级时进行通信,有效避免了层内部数据量较小时的通信延迟。此外,Caffe-MPI 2.0还提供了更好的cuDNN兼容性,用户可以无缝调用最新的cuDNN版本实现更大的性能提升。这些设计细节使得Caffe-MPI 2.0能够在当前流行的深度学习框架下的集群训练中,实现近似线性的扩展。

  Caffe-MPI是首个集群并行版的Caffe深度学习计算框架,基于伯克利Caffe框架,由浪潮主导开发并已在Github上开源公布所有代码,其采用成熟的MPI技术对Caffe予以数据并行的优化,目标是解决深度学习计算模型训练的效率问题。

  2017人工智能计算大会(AI Computing Conference简称AICC)由中国工程院信息与电子工程学部主办、浪潮集团承办,旨是围绕AI当下需求及未来发展,从计算创新着眼,联合从事AI计算及应用的公司、用户、专家、开发者共同打造探讨促进AI计算的交流合作平台,推动AI产业的可持续发展。本次有海内外数十位知名专家围绕AI计算创新主题进行研讨报告,吸引了来自各行业的数千名专业人士参与。


参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

资讯是全球知名展览公司百科展览集团旗下的专业媒体平台,自1994年品牌成立以来,一直专注于安全&自动化产业前沿产品、技术及市场趋势的专业媒体传播和品牌服务。从安全管理到产业数字化,资讯拥有首屈一指的国际行业展览会资源以及丰富的媒体经验,提供媒体、活动、展会等整合营销服务。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈
Baidu
map