|
协同计算加速架构
创新性引入GPU计算单元,突破了传统单一的计算单元,采用Intel最新Nehalem/Westmere处理器核心与NVIDIA Tesla加速计算技术的协同,让CPU和GPU各司其职,CPU主要承担更加擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职计算密集型、高度并行的计算工作,使得计算资源合理的分配,计算力被充分释放,计算性能达到从几倍到几百倍的增长。特别强调的是,协同计算加速架构不是对传统技术路线的否定,而是一种补充和辅助,更加淋漓尽致地发挥GPU的优势,最终帮助用户在某些特定应用领域中大大缩短解决问题的时间或提高解决问题规模。
大规模并行计算处理核心
相比较于仅能有很少线程同时工作的多核CPU而言,GPU的特性是可以同时执行数千个线程,这将令我们的系统能处理更多的信息流。例如在游戏、动漫渲染中,由于GPU的计算是一种特殊的计算任务,即所计算的每一个像素之间不需要(或者用方法使它不需要)考虑先后顺序,那么如果有了上百万个线程,就可以让所有的像素同时渲染,这样所有的像素就可以在一个像素的时间内计算完成。目前Tesla处理单元支持448个处理器核,峰值处理速度达每秒1万亿次浮点运算,通过协同可扩展架构,根据用户的需求可以增加GPU的数量,通常应用加速比都在1个到2个量级。
协调处理单元间高速IO交换技术
每个设备都有自己的专用连接, GPU不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率。相对于传统PCI总线在单一时间周期内只能实现单向传输,PCI-E的双单工连接能提供更高的传输速率和质量,它们之间的差异与半双工和全双工类似。浪潮“倚天”采用了PCI-E 2.0 16×,带宽达到16GB/s。
采用Intel最新的QPI技术
为了更好的发挥CPU和GPU的协同效应,浪潮“倚天”桌面超级计算机采用了Intel 公司的QPI(Quick Path Interconnect)技术,可以实现高达6.4GT/s的传输速率,使通信更加迅捷。QPI总线实现了多核处理器内部的直接互联,在多处理器作业下,每颗处理器可以互相传送资料,并不需要经过芯片组,从而大幅提升整体系统性能。随着Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心的出现,QPI架构的优势将进一步发挥出来。
优秀的编程环境
CUDA(Compute Unified Device Architecture)通用并行计算架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。并且支持其它语言,包括FORTRAN以及C++。
用于GPU并行应用开发的标准C语言
快速傅里叶转换(FFT)以及基本线性代数子程序(BLAS)的标准数字库
专用CUDA驱动器,用于GPU和CPU之间快速数据传输计算
CUDA驱动程序与OpenGL和DirectX图形驱动程序可以实现互操作
支持Linux 32/64位,Windows XP 32/64位以及Mac 操作系统
目前数以千计的软件开发人员正在使用免费的CUDA软件开发工具来解决各种专业以及家用应用程序中的问题。这些应用程序从视频与音频处理和物理效果模拟到石油天然气勘探、产品设计、医学成像以及科学研究,涵盖了各个领域
浪潮拥有强大的GPU应用研发、移植团队
创新组建CPU+GPU混合架构应用团队
解决混合架构集群的管理调度问题
融合CPU和GPU的计算能力
提炼应用迁移到混合架构的方法论
特别声明:
- 浪潮会尽全力为您提供准确、全面的信息,但对信息中可能出现的错误或遗漏不承担责任;
- 产品图片仅供参考,请以销售实物为准;
- 详细的技术规格和供货情况,请向浪潮当地经销商查询,如有变化,恕不另行通知。
-
若您想获得更加详细的产品技术参数和价格请拨打800-860-6708
|