西域IT首页 > 显卡 > 评测 > 卡皇是这样诞生的 深入剖析AMD Radeon HD7970
微博关注

卡皇是这样诞生的 深入剖析AMD Radeon HD7970

西域IT网 【成都评测】作者:西域IT网 作者:西域IT网 旭旭 编辑:旭旭 时间:01-09

   拥有28nm的优势无疑令外界对Radeon HD 7970充满期待,不仅仅是因为它是第一款28nmGPU,而且它是南方群岛家族当中第一款产品,也是第一款产品采用GCN架构。这种期待让Radeon HD 7970发布充满压力,因为Radeon HD 7970不仅仅要拿出强悍的游戏性能,作为首款GCN架构产品,Radeon HD 7970更要来证明自己是GPU计算领域强有力的竞争者。Radeon HD 7970是否能不辜负大家期待?让我们来看看...

AMD GPU参数对比

 

HD 7970

HD 6970

HD 6870

HD 5870

流处理器

2048

1536

1120

1600

纹理单元

128

96

56

80

ROPs

32

32

32

32

核心频率

925MHz

880MHz

900MHz

850MHz

显存频率

1.375GHz

1.375GHz

1.05GHz

1.2GHz

显存位宽

384-bit

256-bit

256-bit

256-bit

显存容量

3GB

2GB

1GB

1GB

FP64

1/4

1/4

N/A

1/5

晶体管数量

43.1亿

26.4亿

17亿

21.5亿

芯片工艺

TSMC 28nm

TSMC40nm

TSMC40nm

TSMC40nm

价格

$ 549

$ 350

$ 160

——

    Radeon HD 7970显卡拥有诸多第一。第一款使用28nm GPU,第一款支持Direct3D 11.1,第一款AMD南方群岛家族产品,第一款采用AMD GCN图形核心架构。所有这些属性结合起来,使Radeon HD 7970显卡不同于AMD以前任何一款显卡产品。

    作为AMD南方群岛家族旗舰产品,Radeon HD 7970采用AM完整规格Tahiti核心,内建2048个流处理器,基于SIMD GCN架构。有了这么多的流处理器,再加上一个384bit GDDR5显存总线,Tahiti晶体管数量再创新高就毫不奇怪,晶体管总数量达到43.1亿。采用台积电28nm High- K制程工艺,裸片尺寸达到365平方毫米,仅略小于AMD 40nm Cayman GPU的389平方毫米。

卡皇是这样诞生的 深入剖析AMD Radeon HD7970

    Radeon HD 7970核心工作频率定在925MHz,浮点运算能力达到3.79TFLOPs,VLIW4架构的6970浮点运算能力是2.7TFLOPs。Radeon HD 7970采用位宽更大的384bit GDDR5内存总线,主频1.375GHz(5.5GHz数据速率),内存带宽高达264GB/s,超过了6970 的176GB/s。
 
    这些功能单位加入其它元素,包括8 个ROP分区,每时钟周期可以处理32个ROPs,128个纹理单分布到32个CU计算单元当中,(C一个固定功能管线包含AMD第9代几何引擎。当然,所有这些硬件通常需要消耗相当的电力,但幸运的是28nm工艺所带来的进步,得以实时监控显卡消耗的电力。 AMD没有提供公版功耗具体数字,,但我们估计它在220瓦左右,具有绝对的250瓦PowerTune限制。同时闲置功耗非常低,得益于AMD进一步研发省电技术,显卡典型的闲置功耗只有15瓦,搭配AMD新的ZeroCore电源技术,闲置用电量下降到微不足道的3瓦。

    和Radeon HD 5870和4870发布价格相比,7970的价格没有那么有攻击性,厂商建议零售价将是4299~4599元人民币,这次性能和价格都比较往上走,而不是通过便宜的制造成本优势,积极进行削价竞争。随着时间推移,AMD需要把7970价格下调,但他们为7970定出的价格,的确反应该卡的GPU性能王座地位。

    1月9日之后,AMD将逐步推出南方群岛家族产品,和之前的Evergreen和北方群岛产品类似,AMD公司计划在2012年推出多款南方群岛产品,因此,7970仅仅是一个开始。

 

2011冬季GPU价格比较

 

AMD

      价格

NVIDIA

 

750美元

GeForce GTX 590

Radeon HD 6990

700美元

 

Radeon HD 7970

549美元

 

 

500美元

GeForce GTX 580

Radeon HD 6970

350美元

GeForce GTX 570 

Radeon HD 6950 2GB

250美元

 

 

240美元

GeForce GTX 560 Ti

Radeon HD 6870

160美元

 

全新的GCN架构

    NVIDIA和AMD在产品发布大约6个月前,都已经开始向开发者显露自己的架构。这与CPU发布非常相似,即提前数月公开披露是体系结构的基本原则。这种公开披露非常有必要,因为计算开发管线(具体而言,HPC)更多着重为一个特定架构优化代码,以最大限度地提高性能,而图形开发在相当程度上仍然由API主导,因此要做到这点,计算开发者需要尽快尽可能多地了解新架构。

卡皇是这样诞生的 深入剖析AMD Radeon HD7970

    VLIW架构非常适合图形工作,但它差在计算工作。 VLIW架构在高指令级并行(ILP)应用当中有很好发挥,大多数像素操作和颜色分量渠道都是独立寻址。事实上,在AMD推出Cayman时候,发现VLIW5架构下,着色程序平均槽利用率为3.4,显示大多像素或其他数据类型的着色操作是可以一起安排和调度。

    VLIW的硬件特征显示,为了VLIW架构工作,工作量需要很好地映射到架构上。简单的ALU不能处理复杂的操作,这些复杂操作对VLIW架构只有坏处,复杂操作因为依赖性或者其它冲突,无法让调度器进行安排。正如我们所看到,图形操作可以完美映射到VLIW上,这是为什么自像素着色出现以来,GPU一直在使用VLIW。在VLIW当中,即使图形操作没有达到完美的利用率也没关系,因为VLIW采用密集型设计。

    当谈到计算工作量,VLIW架构就开始捉襟见肘。 “计算”涵盖了广泛的工作负载和算法,图形算法可以硬性规定,但计算工作量可以覆盖几乎任何东西。一方面,如密码散列等计算工作可以很好的映射到VLIW架构。另一方面,也有大量无法很好映射到VLIW架构的计算工作,甚至有的计算工作同时包含高度串行和高度并行的工作量。

Cayman的VLIW4架构

卡皇是这样诞生的 深入剖析AMD Radeon HD7970

    因此,只要处理高度并行工作,VLIW架构是ok的,但使用VLIW作为计算架构,那么就会限制CPU所擅长的工作。因此,你想处理一个更广泛的计算负载,你需要一个更通用的架构,这是AMD所面对的局面。

    但是,AMD在已经拥有成功的图形GPU事业,为什么还要追寻计算业务?长期来看,GCN是AMD Fusion战略重要组分,但在短期内有一个更简单的答案:因为他们不得不追寻计算业务。

    2011年第三季度, NVIDIA专业解决方案业务(Quadro +Tesla)营业收入9500万美元,营业额2.3亿美元,NVIDIA的消费GPU业务营业收入为1.46亿美元,但营业额有6.44亿美元,显然,专业产品有更高的利润率,是业务量不断增长的市场,特别是GPU计算方面。目前NVIDIA和AMD在独立GPU市场平分秋色,但只有NVIDIA在专业市场大赚钞票。对于AMD GPU业务来说,它不再满足只注重图形,AMD需要一块较大的专业市场,好在未来生存和茁壮成长。因此,我们就看到了GCN横空出世。

通用文章评论

ZOL成都笔记本报价:
戴尔笔记本 | 联想笔记本 | 惠普笔记本 | ThinkPad笔记本 | 神舟笔记本 | 索尼笔记本 | 华硕笔记本 | 三星笔记本 | 东芝笔记本 | 苹果笔记本
ZOL成都手机报价:
诺基亚手机 | MOTO手机 | 三星手机 | 索爱手机 | 黑莓手机 | 联想手机 | HTC手机 | IPHONE手机 | 魅族手机 | OPPO手机 | LG手机
ZOL成都数码相机报价:
佳能数码相机 | 索尼数码相机 | 三星数码相机 | 尼康数码相机 | 松下数码相机 | 理光数码相机 | 奥林巴斯数码相机 | 柯达数码相机