利用最新的 Kepler GPU - Tesla K20 GPU 加速器,用户的 Fermi GPU 加速代码将会更快地运行。 全球最快的 Tesla K20 GPU 加速器 具有动态并行机制与 Hyper-Q 等诸多创新特性,可令你的应用程序实现前所未有的速度提升。NVIDIA® Kepler 是全球最快、最高效的高性能计算 (HPC) 架构。凭借该架构,用户可实现 3 倍的性能。 由于具备诸多创新的计算技术与特性,该架构可应用到更广泛的科学计算应用程序上,让应用程序开发者和研究人员能够更轻松地运用混合式计算。
在数据式增长的今天,普通的工作站处理器大量数据已经很吃力了,因为传统的CPU处理模式已经很难适应今天的大数据,于是产生了GPU,更有了最新的CPU+GPU的运算模式,大大加快了数据的处理速度,于是新型的工作站就出现了以下的CPU+显卡+运算卡的模式。
我们“北京思腾创新科技发展有限公司”为你提供专业的工作站解决方案,其中经典的搭配就是NVIDIA的Quadro 4000,Q5000,Q6000,K5000+NVIDIA的Tesla C2050,C2075,K10,K20。其中高端工作站更是Quadro K5000+Tesla K20顶级搭配,轻松实现处理大数据。可应用与油藏模拟, CAE (结构分析), 分子动力学, 数值分析, 计算可视化 (光线追踪)。
英伟达测试Tesla K20 GPU协处理器
英伟达对绝对性能一直没有给出明确的态度,但是我们预计,GK110在处理器核心上,以1GHz的时钟频率,有望提供每秒近2万亿次浮点运算的原始双精度浮点性能,而在单精度下可能达到每秒3.5万亿次浮点运算。这性能大概是特斯拉M20系列GPU协处理器所用的现有Fermi GF110 GPU的三倍,也就是说相当于每瓦散热性能高出三倍。
早在今年5月英伟达透露其高端GK110图形芯片的一部分新功能时,这家公司声称,这款GPU即图形处理器的两项新功能:Hyper-Q和动态并行处理(Dynamic Parallelism)有望帮助GPU更高效地运行,而CPU即处理器不会一直干预。如今英伟达在逐步透露用于服务器的特斯拉(Tesla)K20 GPU协处理器的一些基准测试结果,GK110预计会在今年晚些时候交付。
GK110 GPU芯片有时称为Kepler2,绝对是功能超强的怪兽:芯片代工厂台积电公司(TSMC)采用了非常热门的28纳米工艺,在一块晶片上蚀刻了超过71亿个晶体管。它采用了15个极致流式多处理器(SMX)处理单元,每个单元又有192个单精度CUDA(计算统一设备架构)核心,为每三个一组的CUDA核心添加了64个双精度浮点单元。这为你在GK110芯片上的最多2880个CUDA核心上提供了960个双精度浮点单元。
英伟达对绝对性能一直没有给出明确的态度,但是我们预计,GK110在处理器核心上,以1GHz的时钟频率,有望提供每秒近2万亿次浮点运算的原始双精度浮点性能,而在单精度下可能达到每秒3.5万亿次浮点运算。这性能大概是特斯拉M20系列GPU协处理器所用的现有Fermi GF110 GPU的三倍,也就是说相当于每瓦散热性能高出三倍。
仅仅拥有更多的处理器核心提升不了性能。你还得更高效地利用这些核心;这时候,Hyper-Q和动态并行处理这两项功能正好可以派得上用场。
值得关注的是,这两项功能并未出现在GK104 GPU芯片上,这款芯片用在了英伟达已经交付给需要单精度浮点运算处理的客户的特斯拉K10协处理器上。特斯拉K10 GPU协处理器把两块GK104芯片放到一块PCI-Express卡上,在225瓦散热范围内提供了每秒4.58万亿次浮点的单精度运算能力——这个性能是Fermi M2090协处理器的整整3.5倍。
许多超级计算机应用程序运行消息传递接口(MPI)协议,将工作调度分派到并行机器上,而Hyper-Q让GPU得以在处理MPI工作分配时,以一种更合作的方式与CPU协同运行。如果使用Fermi卡,GPU每次只有一个MPI任务由CPU调度分配,然后卸载给GPU。这显然是个瓶颈。
英伟达为Kepler GPU增添的Hyper-Q功能
借助Hyper-Q,英伟达为GPU本身添加了一个队列,现在处理器可以同时把最多32个不同的MPI任务调度分派给GPU。没必要改动一行MPI代码,就可以充分利用Hyper-Q;CPU与GPU进行联系时,这项功能完全是自动发挥作用。
为了表明Hyper-Q的效果有多好(以及那些数千个CUDA核心不会无所事事),英伟达的高级开发工程师Peter Messmer拿来了名为CP2K的一些分子模拟代码。他在博客中表示,这种代码“对GPU来说向来一向很难处理的代码”,测试了在Hyper-Q功能先关闭,后开启的特斯拉K20协处理器上运行起来有多好。
正如Messmer解释的那样,当MPI进程被CPU限制于少量的工作时,MPI应用程序“出现了打折扣的性能提升”。CPU频繁接到任务,而GPU在许多时候处于闲置状态。而混合系统中的GPU提速幅度也不是很明显,你从这个基准测试中可以看出。这项测试把特斯拉K20协处理器放到配备16核心皓龙6200处理器的未来版克雷XK7超级计算机节点里面。
Hyper-Q为运行CP2K分子模拟的节点将性能提升了2.5倍。
就这个模拟864个水分子的特定数据集而言,增添CPU和GPU节点组合其实提升性能的幅度不是很大。如果是Hyper-Q功能没有开启的16个节点,你能获得12倍的性能(由于某种原因,英伟达的Y轴代表较之两个CPU+GPU节点的相对提速)。但
北京思腾创新科技发展有限公司创立于2005年4月,公司位于首批国家电子信息产业园——北京中关村信息产业基地核心地区。公司汲取了中关村成熟的IT文化沉淀,整合人力技术等优质资源.拥有雄厚的技术实力和客户储备,以客户需求为基础,充分掌握产品特性,为供应商提供灵活设计方案,为客户提供从传输到接入领域全面的解决方案。
公司凭借对IT市场的准确定位,和多年积累的实施与服务经验,在逐步巩固自身实力的同时,奉行与用户共同发展的宗旨,通过与国内外知名品牌厂商的代理合作,为能够提供高品质产品及其综合解决方案不懈努力。目前已拥有一批稳定的忠实客户.建立了自己的成功案例库.
公司站在发展的高度看市场,时刻关注新产品上市,掌握服务器市场的最新动态,并力求将最新,最适合的产品推荐给用户.公司代理推广国内外各品牌的服务器、工作站、存储系统,同时代理知名品牌的服务器配件.通过诚信高效的经营代理,与各厂家总代建立了理想的合作关系。依托各厂家、总代的资源优势并组合本公司在服务器行业积累数年的销售、技术、服务经验,坚信可为广大用户提供专业、高品质的服务。公司以用户需求为导向,执行深入的产品设计与专业的服务支持.经过数年的业内积累,公司已拥有完善的产品结构、专业的方案解决能力和技术支持能力,在大容量数据存储、及通用服务器与存储应用等方面拥有完整的产品线和完善的的技术支持,能为客户提供面向不同应用层面的服务器和存储解决方案,有最科学的性价比优势。
为了方便客户对公司产品的选择了解,公司还人性化的对每款产品配置了详细的图片资料介绍,以提高客户对产品的认知度,从而选择最适合自己的产品.而且公司已形成一整套完善的管理和良好的售后服务体系,并赢得了客户的高度信赖!
公司目前拥有专业高效的团队,成熟的市场渠道,良好的企业声誉。我们将竭诚为各界客