为什么要统一流处理器？流处理器数量是什么意思？

流处理器这个名词第一次出现在人们的视线中还要上溯到2006年12月4日，NVIDIA在当天正式对外发布新一代DX10显卡8800GTX，在技术参数表里面，看不到惯常使用的两个参数：Pixel Pipelines(像素渲染管线)和Vertex Pipelines(顶点着色单元)，取而代之的是一个新名词：streaming processor，中文翻译过来就是流处理器(也有叫SP单元的，一个意思)它的作用就是处理由CPU传输过来的数据，处理后转化为显示器可以辨识的数字信号。

流处理器的作用

流处理器是直接将多媒体的图形数据流映射到流处理器上进行处理的，有可编程和不可编程两种。流处理器可以更高效的优化Shader引擎，它可以处理流数据，同样输出一个流数据，这个流数据可以应用在其它超标量流处理器当中，流处理器可以成组或者大数量的运行，从而大幅度提升了并行处理能力。实际效果体现在去除物体边缘的锯齿现象，以及各种特效的渲染速度。

流处理器的诞生

为了实现DX10提出的GPU内部单元实现统一渲染、可编程、可调用的要求，提高GPU的使用效率，把Pixel Pipelines(像素渲染管线)和Vertex Pipelines(顶点着色单元)统一起来成为streaming processor(流处理器)。

流处理器的效果

每个流处理器当中都有专门高速单元负责解码和执行流数据。片载缓存是一个典型的采用流处理器的单元，它可以迅速输入和读取数据从而完成下一步的渲染。由于NV和AMD的显卡流处理器架构不同，一般情况下看起来NV的显卡流处理器要少于AMD的，不过有等效公式1个NV显卡流处理器等效于4到5个AMD显卡的流处理器，可以通过等效方式进行大约的估算对比两家之间的显卡。

流处理器数量是：流处理器单元是统一架构GPU内通用标量着色器的称谓。流处理单元直接影响处理能力，因为流处理单元是显卡的核心。流处理单元个数越多则处理能力越强，一般成正比关系，但这仅限于NVIDIA自家的核心或者AMD自家的核心比较范畴。NVIDIA和AMD的流处理单元比较不可采取近似比较，实际上AMD的应该叫流处理器单元，它每5个单元配一个数据收发的，这才是一个完整的流处理器，这样算一个流处理器。而NVIDIA的1个流处理单元却只有1个单元。这是A卡与N卡的构造区别。形象点说，这个流处理单元相当于神经元，神经元越多大脑越发达，流处理单元越多显卡处理性能也就越强。

分类：

在进入统一渲染架构时代后，提高Shader运行频率与效率是NVIDIA主导的设计思路，而AMD则维持庞大的流处理器数量。两种思路各有优劣。1、N的优势和A的劣势N卡的GPU中每个流处理器都具有完整的ALU(算术逻辑单元)功能，在发出一条操作指令时每个流处理器都能充分工作。而A卡的GPU中每个流处理器的5个流处理单元都是固定的，不能拆开重组，如果在处理纯4D指令的时候，每个流处理器只能处理一条4D指令，有一个流处理器单元闲置，但却无法加入其他组合来共同工作。简单地说，一个指令任务派发下来的时候，N卡的GPU是需要1个“人”独立工作即可完成。而A卡的GPU则需要5个“人”。结组工作才能完成ATI的人数虽然多，但这5个“人”中有可能会有4个“人”闲置，因为这4个“人”不具有独立完整的ALU功能，不能执行函数运算，浮点运算和Multipy运算。2、N的劣势和A的优势ATI的设计也有其显著的特点——浮点运算能力强大。也就是说如果单纯比拼显示核心在浮点运算上的能力的话，可能ATI则要强一些，在GPGPU(通用图形处理器)项目应用比较多的科学计算方面，理论上能适应GPU和CPU融合的趋势。

结论：

简单的说，流处理器是完成显卡渲染功能的基本单位。对于同一代显卡来说流处理器数量直接反应了显卡的性能。 N卡和A卡的流处理器效能并不相等(同样性能下N卡的流处理器数量要少很多)，不能通过简单的数量对比判断性能高低。

为什么要统一流处理器？流处理器数量是什么意思？

相关推荐