卡皇是这样诞生的 深入剖析AMD Radeon HD7970
西域IT网 【成都评测】作者:西域IT网 作者:西域IT网 旭旭 编辑:旭旭 时间:01-09序
拥有28nm的优势无疑令外界对Radeon HD 7970充满期待,不仅仅是因为它是第一款28nmGPU,而且它是南方群岛家族当中第一款产品,也是第一款产品采用GCN架构。这种期待让Radeon HD 7970发布充满压力,因为Radeon HD 7970不仅仅要拿出强悍的游戏性能,作为首款GCN架构产品,Radeon HD 7970更要来证明自己是GPU计算领域强有力的竞争者。Radeon HD 7970是否能不辜负大家期待?让我们来看看...
AMD GPU参数对比 | ||||
|
HD 7970 |
HD 6970 |
HD 6870 |
HD 5870 |
流处理器 |
2048 |
1536 |
1120 |
1600 |
纹理单元 |
128 |
96 |
56 |
80 |
ROPs |
32 |
32 |
32 |
32 |
核心频率 |
925MHz |
880MHz |
900MHz |
850MHz |
显存频率 |
1.375GHz |
1.375GHz |
1.05GHz |
1.2GHz |
显存位宽 |
384-bit |
256-bit |
256-bit |
256-bit |
显存容量 |
3GB |
2GB |
1GB |
1GB |
FP64 |
1/4 |
1/4 |
N/A |
1/5 |
晶体管数量 |
43.1亿 |
26.4亿 |
17亿 |
21.5亿 |
芯片工艺 |
TSMC 28nm |
TSMC40nm |
TSMC40nm |
TSMC40nm |
价格 |
$ 549 |
$ 350 |
$ 160 |
—— |
Radeon HD 7970显卡拥有诸多第一。第一款使用28nm GPU,第一款支持Direct3D 11.1,第一款AMD南方群岛家族产品,第一款采用AMD GCN图形核心架构。所有这些属性结合起来,使Radeon HD 7970显卡不同于AMD以前任何一款显卡产品。
作为AMD南方群岛家族旗舰产品,Radeon HD 7970采用AM完整规格Tahiti核心,内建2048个流处理器,基于SIMD GCN架构。有了这么多的流处理器,再加上一个384bit GDDR5显存总线,Tahiti晶体管数量再创新高就毫不奇怪,晶体管总数量达到43.1亿。采用台积电28nm High- K制程工艺,裸片尺寸达到365平方毫米,仅略小于AMD 40nm Cayman GPU的389平方毫米。
Radeon HD 7970核心工作频率定在925MHz,浮点运算能力达到3.79TFLOPs,VLIW4架构的6970浮点运算能力是2.7TFLOPs。Radeon HD 7970采用位宽更大的384bit GDDR5内存总线,主频1.375GHz(5.5GHz数据速率),内存带宽高达264GB/s,超过了6970 的176GB/s。
这些功能单位加入其它元素,包括8 个ROP分区,每时钟周期可以处理32个ROPs,128个纹理单分布到32个CU计算单元当中,(C一个固定功能管线包含AMD第9代几何引擎。当然,所有这些硬件通常需要消耗相当的电力,但幸运的是28nm工艺所带来的进步,得以实时监控显卡消耗的电力。 AMD没有提供公版功耗具体数字,,但我们估计它在220瓦左右,具有绝对的250瓦PowerTune限制。同时闲置功耗非常低,得益于AMD进一步研发省电技术,显卡典型的闲置功耗只有15瓦,搭配AMD新的ZeroCore电源技术,闲置用电量下降到微不足道的3瓦。
和Radeon HD 5870和4870发布价格相比,7970的价格没有那么有攻击性,厂商建议零售价将是4299~4599元人民币,这次性能和价格都比较往上走,而不是通过便宜的制造成本优势,积极进行削价竞争。随着时间推移,AMD需要把7970价格下调,但他们为7970定出的价格,的确反应该卡的GPU性能王座地位。
1月9日之后,AMD将逐步推出南方群岛家族产品,和之前的Evergreen和北方群岛产品类似,AMD公司计划在2012年推出多款南方群岛产品,因此,7970仅仅是一个开始。
|
2011冬季GPU价格比较 |
|
AMD |
价格 |
NVIDIA |
|
750美元 |
GeForce GTX 590 |
Radeon HD 6990 |
700美元 |
|
Radeon HD 7970 |
549美元 |
|
|
500美元 |
GeForce GTX 580 |
Radeon HD 6970 |
350美元 |
GeForce GTX 570 |
Radeon HD 6950 2GB |
250美元 |
|
|
240美元 |
GeForce GTX 560 Ti |
Radeon HD 6870 |
160美元 |
|
全新的GCN架构
NVIDIA和AMD在产品发布大约6个月前,都已经开始向开发者显露自己的架构。这与CPU发布非常相似,即提前数月公开披露是体系结构的基本原则。这种公开披露非常有必要,因为计算开发管线(具体而言,HPC)更多着重为一个特定架构优化代码,以最大限度地提高性能,而图形开发在相当程度上仍然由API主导,因此要做到这点,计算开发者需要尽快尽可能多地了解新架构。
VLIW架构非常适合图形工作,但它差在计算工作。 VLIW架构在高指令级并行(ILP)应用当中有很好发挥,大多数像素操作和颜色分量渠道都是独立寻址。事实上,在AMD推出Cayman时候,发现VLIW5架构下,着色程序平均槽利用率为3.4,显示大多像素或其他数据类型的着色操作是可以一起安排和调度。
VLIW的硬件特征显示,为了VLIW架构工作,工作量需要很好地映射到架构上。简单的ALU不能处理复杂的操作,这些复杂操作对VLIW架构只有坏处,复杂操作因为依赖性或者其它冲突,无法让调度器进行安排。正如我们所看到,图形操作可以完美映射到VLIW上,这是为什么自像素着色出现以来,GPU一直在使用VLIW。在VLIW当中,即使图形操作没有达到完美的利用率也没关系,因为VLIW采用密集型设计。
当谈到计算工作量,VLIW架构就开始捉襟见肘。 “计算”涵盖了广泛的工作负载和算法,图形算法可以硬性规定,但计算工作量可以覆盖几乎任何东西。一方面,如密码散列等计算工作可以很好的映射到VLIW架构。另一方面,也有大量无法很好映射到VLIW架构的计算工作,甚至有的计算工作同时包含高度串行和高度并行的工作量。
Cayman的VLIW4架构
因此,只要处理高度并行工作,VLIW架构是ok的,但使用VLIW作为计算架构,那么就会限制CPU所擅长的工作。因此,你想处理一个更广泛的计算负载,你需要一个更通用的架构,这是AMD所面对的局面。
但是,AMD在已经拥有成功的图形GPU事业,为什么还要追寻计算业务?长期来看,GCN是AMD Fusion战略重要组分,但在短期内有一个更简单的答案:因为他们不得不追寻计算业务。
2011年第三季度, NVIDIA专业解决方案业务(Quadro +Tesla)营业收入9500万美元,营业额2.3亿美元,NVIDIA的消费GPU业务营业收入为1.46亿美元,但营业额有6.44亿美元,显然,专业产品有更高的利润率,是业务量不断增长的市场,特别是GPU计算方面。目前NVIDIA和AMD在独立GPU市场平分秋色,但只有NVIDIA在专业市场大赚钞票。对于AMD GPU业务来说,它不再满足只注重图形,AMD需要一块较大的专业市场,好在未来生存和茁壮成长。因此,我们就看到了GCN横空出世。
通用文章评论