在2017年的NVIDIA GPU Technology Conference (GTC)中,NVIDIA推出了针对全新人工智能(AI)和高性能计算(HPC)打造的GPU计算架构Volta,并推出基于Volta的Tesla V100数据中心GPU。该公司称新产品的计算效能达120 Teraflops,相当于100个CPU的性能总和。
Volta是NVIDIA的第七代GPU架构,采用210亿个晶体管构建,并提供相当于100个CPU的深度学习功能。它比NVIDIA目前的GPU架构Pascal效能高出5倍,峰值的Teraflops效能则比两年前推出的Maxwell架构提高15倍。
该公司称,这个效能表现超过摩尔定律的预测4倍。
人工智能的需求正在各行各业快速展开。在汽车、医疗等行业,数据科学家和研究人员们更多地依赖神经网络来推动他们的技术进展,例如让自动驾驶车辆的运输更安全、提供新的智能客户体验,以及加强抗癌研究等。
“人工智能带来了智能的自动化,将推动自工业革命以来最大的一次社会进展。”NVIDIA创办人兼首席执行官黄仁勋指出,深度学习让计算器软件拥有学习能力,带来了突破性的人工智能,而Volta是NVIDIA数千名工程师花费三年时间开发的成果,目的是在各个行业都实现用人工智能改变生活的潜力。
剑指高性能数据中心
所有行业应用的基础--数据中心,也由于日渐复杂的网络,需要提供更强大的处理能力。他们需要有效的扩展,以支持快速采用高度准确的基于人工智能的服务,如自然语言虚拟助手以及个性化搜索和推荐系统。
今年以来数据中心对芯片的需求持续增长,第一季度NVIDIA的数据中心营收达到4.09亿美元,劲增48.4%,优于市场预期。尽管NVIDIA的数据中心营收和对手英特尔(Intel)相比仍有4-5倍以上的差距,但该公司认为其GPU架构在高性能计算领域优势远超过传统CPU。
NVIDIA表示,针对计算科学和数据科学应用,Volta提供了新的平台。通过将CUDA内核和新的Volta Tensor Core配置在统一架构中,采用单一Tesla V100 GPU的服务器可以替代搭载数百个CPU的传统HPC服务器。
截至目前,Tesla GPU已经应用在全球主要网络和云服务提供商,包括Alphabet的谷歌(Google)、脸书(Facebook)、IBM、微软(Microsoft)和阿里巴巴等。
为了加强数据中心应用,Tesla V100 GPU的搭载了640个Tensor内核,并在GPU架构中采用CUDA和Tensor配对的架构,在单一GPU中提供超级计算机的人工智能运算效能。而为了实现芯片内的高速互连,新的NVLink吞吐量也较上一代的NVLink提高二倍,以在GPU之间以及GPU到CPU之间提供高速通信能力。
另外,与三星(Samsung)合作开发的900GB/s HBM2 DRAM实现了比上一代GPU多出50%的内存带宽,可支持Volta在高性能计算应用中所需的计算吞吐量。