英伟达 Tesla K20 2496核心 5GB_teslaK20_北京思腾创新科技发展有限公司

利用最新的 Kepler GPU - Tesla K20 GPU 加速器，用户的 Fermi GPU 加速代码将会更快地运行。全球最快的 Tesla K20 GPU 加速器具有动态并行机制与 Hyper-Q 等诸多创新特性，可令你的应用程序实现前所未有的速度提升。NVIDIA® Kepler 是全球最快、最高效的高性能计算 (HPC) 架构。凭借该架构，用户可实现 3 倍的性能。由于具备诸多创新的计算技术与特性，该架构可应用到更广泛的科学计算应用程序上，让应用程序开发者和研究人员能够更轻松地运用混合式计算。
在数据式增长的今天，普通的工作站处理器大量数据已经很吃力了，因为传统的CPU处理模式已经很难适应今天的大数据，于是产生了GPU，更有了最新的CPU+GPU的运算模式，大大加快了数据的处理速度，于是新型的工作站就出现了以下的CPU+显卡+运算卡的模式。
我们“北京思腾创新科技发展有限公司”为你提供专业的工作站解决方案，其中经典的搭配就是NVIDIA的Quadro　4000,Q5000，Q6000，K5000+NVIDIA的Tesla　C2050，C2075，K10,K20。其中高端工作站更是Quadro　K5000+Tesla　K20顶级搭配，轻松实现处理大数据。可应用与油藏模拟,　CAE　(结构分析),　分子动力学,　数值分析,　计算可视化　(光线追踪)。

英伟达测试Tesla　K20　GPU协处理器
英伟达对绝对性能一直没有给出明确的态度，但是我们预计，GK110在处理器核心上，以1GHz的时钟频率，有望提供每秒近2万亿次浮点运算的原始双精度浮点性能，而在单精度下可能达到每秒3.5万亿次浮点运算。这性能大概是特斯拉M20系列GPU协处理器所用的现有Fermi　GF110　GPU的三倍，也就是说相当于每瓦散热性能高出三倍。
早在今年5月英伟达透露其高端GK110图形芯片的一部分新功能时，这家公司声称，这款GPU即图形处理器的两项新功能：Hyper-Q和动态并行处理(Dynamic　Parallelism)有望帮助GPU更高效地运行，而CPU即处理器不会一直干预。如今英伟达在逐步透露用于服务器的特斯拉(Tesla)K20　GPU协处理器的一些基准测试结果，GK110预计会在今年晚些时候交付。
GK110　GPU芯片有时称为Kepler2，绝对是功能超强的怪兽：芯片代工厂台积电公司(TSMC)采用了非常热门的28纳米工艺，在一块晶片上蚀刻了超过71亿个晶体管。它采用了15个极致流式多处理器(SMX)处理单元，每个单元又有192个单精度CUDA(计算统一设备架构)核心，为每三个一组的CUDA核心添加了64个双精度浮点单元。这为你在GK110芯片上的最多2880个CUDA核心上提供了960个双精度浮点单元。
英伟达对绝对性能一直没有给出明确的态度，但是我们预计，GK110在处理器核心上，以1GHz的时钟频率，有望提供每秒近2万亿次浮点运算的原始双精度浮点性能，而在单精度下可能达到每秒3.5万亿次浮点运算。这性能大概是特斯拉M20系列GPU协处理器所用的现有Fermi　GF110　GPU的三倍，也就是说相当于每瓦散热性能高出三倍。
仅仅拥有更多的处理器核心提升不了性能。你还得更高效地利用这些核心;这时候，Hyper-Q和动态并行处理这两项功能正好可以派得上用场。
值得关注的是，这两项功能并未出现在GK104　GPU芯片上，这款芯片用在了英伟达已经交付给需要单精度浮点运算处理的客户的特斯拉K10协处理器上。特斯拉K10　GPU协处理器把两块GK104芯片放到一块PCI-Express卡上，在225瓦散热范围内提供了每秒4.58万亿次浮点的单精度运算能力——这个性能是Fermi　M2090协处理器的整整3.5倍。
许多超级计算机应用程序运行消息传递接口(MPI)协议，将工作调度分派到并行机器上，而Hyper-Q让GPU得以在处理MPI工作分配时，以一种更合作的方式与CPU协同运行。如果使用Fermi卡，GPU每次只有一个MPI任务由CPU调度分配，然后卸载给GPU。这显然是个瓶颈。
　
英伟达为Kepler　GPU增添的Hyper-Q功能
借助Hyper-Q，英伟达为GPU本身添加了一个队列，现在处理器可以同时把最多32个不同的MPI任务调度分派给GPU。没必要改动一行MPI代码，就可以充分利用Hyper-Q;CPU与GPU进行联系时，这项功能完全是自动发挥作用。
为了表明Hyper-Q的效果有多好(以及那些数千个CUDA核心不会无所事事)，英伟达的高级开发工程师Peter　Messmer拿来了名为CP2K的一些分子模拟代码。他在博客中表示，这种代码“对GPU来说向来一向很难处理的代码”，测试了在Hyper-Q功能先关闭，后开启的特斯拉K20协处理器上运行起来有多好。
正如Messmer解释的那样，当MPI进程被CPU限制于少量的工作时，MPI应用程序“出现了打折扣的性能提升”。CPU频繁接到任务，而GPU在许多时候处于闲置状态。而混合系统中的GPU提速幅度也不是很明显，你从这个基准测试中可以看出。这项测试把特斯拉K20协处理器放到配备16核心皓龙6200处理器的未来版克雷XK7超级计算机节点里面。
　
Hyper-Q为运行CP2K分子模拟的节点将性能提升了2.5倍。
就这个模拟864个水分子的特定数据集而言，增添CPU和GPU节点组合其实提升性能的幅度不是很大。如果是Hyper-Q功能没有开启的16个节点，你能获得12倍的性能(由于某种原因，英伟达的Y轴代表较之两个CPU+GPU节点的相对提速)。但

英伟达 Tesla K20 2496核心 5GB

详细说明

产品说明Explain

公司简介Content

卖家名片Cards

卖家名片

北京思腾创新科技发展有限公司

该供应商的其他产品

你可能感兴趣