当地时间5月8-11日,英伟达在加州圣何塞举办了2017年的GPU技术大会(GTC2017)。英伟达CEO黄仁勋在大会上月公布了目前最先进设备的加速器NVIDIATeslaV100。
之后,英伟达研发博客又改版了一篇深度理解文章,剖析了TeslaV100背后的新一代架构Volta,其在获取了更佳的高性能计算出来反对之外,还减少了专门为深度自学所设计的TensorCore。在2017GPU技术大会(GTC2017)上,英伟达CEO黄仁勋月公布了新一代处理器架构Volta,以及用于新的架构的第一款设备——限于于深度自学任务的加速卡TeslaV100,英伟达将这块显示卡称作全球最先进设备的数据中心GPU。从语音辨识到训练虚拟世界助理展开大自然交流,从探测车道线到让汽车几乎自动驾驶,数据科学家们在技术的发展过程中正一步步登顶人工智能的新高度。
而解决问题这些日益简单的问题则必须日益简单的深度自学模型,为深度自学获取强劲的计算出来硬件是英伟达希望的目标。图1.TeslaV100加速卡含有VoltaGV100GPU,以及SXM2FormFactor。高性能计算出来设备(HPC)是现代科学的基础,从预测天气、发明者新药到找寻新能源,大型计算出来系统能为我们仿真和预测世界的变化。这也是英伟达在新一代GPU架构发售时自由选择优先公布企业级计算出来卡的原因。
黄仁勋在发布会上回应,全新的TeslaV100专门HPC和AI的融合而设计,同时使用了具备突破性的新技术。英伟达的新架构能否让GPU连上一个台阶?让我们随着TeslaV100一探到底。揭露新的架构与GPU特性Volta并不是Pascal的升级,而是一个全新的架构!——NVIDIA应用于深度自学研究副总裁BryanCatanzaro。
在NvdiaGTC2017第三天下午,NvidiaCUDA软件首席工程师LukeDurant与Nvidia首席构架师OliverGiroux展开了一个取名为InsideVolta的技术讲座,理解了Volta构架的设计。英伟达指出,硬件的可编程性正在驱动深度自学的发展。
谈及Volta对人工智能带给的影响时,英伟达副总裁BryanCatanzaro回应,“Volta获取大量的FLOP,基于Volta,人们就可以用于必须更好FLOP的模型。如今很多风行的模型都必须相当大的计算资源,例如卷积,我个人指出架构上将不会有一定的改向,既更好地来利用更好地利用我们有数的大量的FLOP。当然,构架的演化也不会经过一个‘达尔文’过程,最后最适应环境的会沦为终极形态”在本次GTC中,我们没看见联网移动末端芯片的身影或为移动末端人工智能计算出来性能提高展开的构架设计,关于这个问题,Volta设计团队回应,对于可以联网的设备,通过CPU融合GPU的混合云展开大量计算出来是必然趋势;而对于无法联网的应用于场景,SOC是更佳的自由选择。
TeslaV100:人工智能计算出来和HPC的助推器毫无疑问,全新的英伟达TeslaV100加速器是世界上性能最低的分段处理器,目的为计算出来量仅次于的HPC设备、人工智能和图形工作任务获取反对。它的核心GV100GPU包括211亿个晶体管,而芯片面积为前所未有的815平方毫米(TeslaGP100为610平方毫米)。
本文来源:BOB博鱼-www.qhdhbzs.com