供应 NVIDIA TESLA K20 GPU 运算卡
NVIDIA給出的3倍雙精度浮點性能不知是跟GF110顯卡還是跟GF110核心的Tesla加速卡做的比較,GF110的單精度浮點能力為1.58TFLOPS,顯卡中的雙精度為單精度的1/ 4,也就是0.4TFLOPS,但是GF110核心的Tesla卡雙精度能力可達單精度1/2,大約是0.8TFLOPS。
如此一來,如果以顯卡為基礎,GK110的雙精度浮點性能大約是1.2TFLOPS以上,如果是Tesla卡的3倍,那就是2.4TFLOPS以上,鑑於後者已經超出之前傳聞的2TFLOPS的能力, GK110的雙精度浮點能力應該是1.2TFLOPS或更高 。
Tesla K20配置了6pin+8pin供電接口
核心面積和TDP未知,不過K20配備的是6pin和8pin供電接口,最大TDP不會超過300W。 晶體管數量也是一個70億,準確點說是71億。
◆ GK110並行計算技術介紹
顯卡規格方面的信息基本就是這麼多了,再來看一下NVIDIA為GK110所增加的新技術吧。
Dynamic Parallelism(動態並行)
GK110架構的首要目標之一就是使程序員更方便地調用GPU強大的並行計算能力 。 傳統的模式下,GPU每次操作都需要CPU的參與,而Dynamic Paralleliom的存在使得GPU接收數據時會動態刷新線程而無需CPU參與。 由於內核有了獨立載入工作負載的能力,動態並行技術允許程序直接在GPU上運行。
這項技術的好處就是可以降低編程的複雜性,原本需要200-300行代碼才能完成的工作在GK110顯卡上只需要30行就可以了。
Hyper-Q
上一項技術強調的是簡化操作,是給CPU減負,而Hyper-Q則是增加了CPU同時載入工作的核心數,是在提升=高CPU的利用率,避免CPU過多的閒置。
Fermi架構中CPU只能同時運行一個MPI(Message Passing Interface消息傳遞接口)任務,但是在GK110架構中CPU同時運行的MPI任務數多達32個。
傳統的MPI任務主要基於多核CPU應用,與GPU強大的並行計算能力相比,CPU處理的MPI任務量實在是太小了,往往會帶來虛假的GPU依賴性,導致GPU的性能無法有效利用, Hyper-Q大幅提高了CPU可以分配給GPU的MPI任務量,如果同時傳遞32個任務給GPU,那麼理論性能會達到Fermi架構的32倍,實際應用中雖然不會這麼誇張,但是優化調度之後GPU的並行計算能力還是會有改善。
GPU Direct
GPU Direct直連是NVIDIA官方PDF中沒有提
*您的姓名:
*联系手机:
固话电话:
E-mail:
所在单位:
需求数量:
*咨询内容: