GPU当CPU使 AMD HD 7000显卡详细解析
此前大家都在猜测,AMD会不会在下一代HD 7000显卡上,使用全新的Graphic Core Next架构,不过近日,国外某网站泄露的消息,验证了AMD迫切希望赢得一场全面胜利的信心。HD 7000系列将会引入全新的Graphic Core Next架构(后文简称GCN),并且随同推土机处理器组成一个整容强大的天蝎平台。HD 7000系列除了全新Graphic Core Next架构以外,还采用了比GDDR5带宽高一倍的Rambus XDR2显存,它在功耗降低30%的情况下,带宽提升了一倍,达到最高256GB/s的带宽,以满足以后AMD CPU/GPU共享内存、显存协同计算的需要。
此次曝光了HD 7000系列8款显卡的型号、规格,其中New Zealand、Tahiti和Thames采用了新一代Graphic Core Next架构,而Lombok仍采用VLIW-4D老架构。让我们通过下表对具体情况进行下了解:
http://www.ppcn.net/wp-content/uploads/2011/09/AMD-HD-7000-Specifications.jpg
HD 7000 规格分析
首先我们看到,HD7000代号为Southern Islands,其中又分出4个小型号,按性能由强到弱依次为:New Zealand,Tahiti,Thames,Lombok。其中HD7990为HD6990的升级版,HD7970为HD6970的升级版,其他依次类推。那么这些升级版具体升级的是什么?让我们再来看下一张表:
http://www.ppcn.net/wp-content/uploads/2011/09/AMD-HD-7000-Specifications-02.jpg
以HD7970和HD6970来对比,在制作工艺上,由40nm升级到了28nm,SIMD阵列,流处理器数,GPU频率等均有大幅度提升,即使是略低一级的HD7950,各种规格也比HD6970高出不少。此外,HD7950在规格上高出HD6970的同时,功率也降低了40%,这对注重节能的朋友来说是一件好事。
具体来看最高端依然是双芯出场,代号New Zealand GCN HD 7990,它是基于两颗Tahiti XT/Pro核心,总共ALU数量将会达到4000以上,TDP在300W以上。随后是HD 7970和HD 7950。[*]HD 7970: 256bit/1000MHz/32CUs/2048ALUs/128TMUs/64ROPs/XDR2 8.0Gbps 256GB/S /190W TDP/ 2GB Memory[*]HD 7950: 256bit/900MHz/30CUs/1920ALUs/120TMUs/64ROPs/XDR2 7.2Gbps 230GB/S /150W TDP/ 2GB Memory
HD 7970(Tahiti XT)将会取代HD6970 (Cayman XT),并且会具备2048个SP,频率为1000Mhz,最大TDP功耗为190W,显存为2GB 8.0Gbps XDR2,带宽256GB/S。HD6970为1536个SP,频率为880Mhz
而HD7950 (Tahiti Pro)则是替代HD6950 (Cayman Pro),会具备1920个SP,频率为900Mhz,最大TDP功耗为150W,显存为2GB 7.2Gbps XDR2,带宽230GB/S。老的6950只有1408个SP,频率为800Mhz,显存带宽为160GB/s。
Thames XT/Thames Pro核心则分别是HD 7870和HD 7850,具体规格如下:[*]HD 7870: 950MHz/24SIMDs/1536ALUs/96TMUs/32ROPs/256bit GDDR5 5.8Gbps 186GB/S /2GB/ TDP 120W[*]HD 7850: 850MHz/22SIMDs/1408ALUs/88TMUs/32ROPs/256bit GDDR5 5.2Gbps 166GB/S /2GB/ TDP 90W
HD 7870(Thames XT)有1536个SP和HD6970等同,核心频率为950Mhz,32 ROP和2GB 256-bit GDDR5显存,带宽186GB/S。HD6870 (Barts XT)则有1120个SP,频率为900mhz,HD7870最大TDP功耗为120W。
HD 7850 (Thames Pro)将具备1408个Stream Processors,显存带宽166GB/s,实际为5.2GBps 2GB 256-bit显存,它将替代960SP Barts Pro核心HD6850(频率为775Mhz)
入门级则为:[*]HD 7670: 12SIMDs/768ALUs/48TMUs/16ROPs/900MHz/128bit/GDDR5 5.0Gbps 80GB/S /1GB/TDP 60W[*]HD 7570: 750MHz/12SIMDs/768ALUs/48TMUs/16ROPs/128bit GDDR5 4.0Gbps 64GB/s/1GB/50W TDP
当然依然采用VLIW4D结构的HD 7000显卡并不是一点改进都没有,它们改进了以下规格以提升效能:
-Multiple primitive pipelines for setup, etc.
-Real caching in L1, L2, separate color / z caches for graphics and atomics
-Concurrent tasks
-Out of order resource allocation
-ECC on srams and drams
预计HD7000系列显卡会在今年第四季度晚些时候推出,由于产能原因,我们推测7870 将会先出现,而更高端卡将会在明年上半年推出来,让我们共同期待吧。
Graphic Core Next GPU像CPU
“Graphic Core Next”是一个全新的GPU架构,AMD推出APU和异构计算显然已经让我们看到了AMD未来将会把GPU和CPU融合计算的思路,“Graphic Core Next”架构更是如此,甚至有可能未来AMD GPU会充当目前CPU的角色,那么究竟它如何实现CPU的功能的呢?接下来就让我们来分析分析。
http://www.ppcn.net/wp-content/uploads/2011/09/AMD-GPU-Architecture.jpg
首先需要分析AMD的技术背景和应用大环境,很明显AMD拥有图形技术,而在CPU技术方面处于弱势,如果能通过GPU技术弥补CPU弱势,会更容易取得竞争优势;而目前随着众多需要并行异构计算应用不断出现,CPU、GPU同时计算确实能够带来体验提升。
AMD Fusion开发者峰会(以下简称AFDS)上,微软此前就高调展示了自家对高性能并行计算的看法,他们宣称今年或明年将会推出针对Visual Studio和C++开放工具的C++ AMP (accelerated massive parallelism) 扩展程序。通过这个C++ AMP扩展程序,能够让程序员轻松调用CPU和GPU的异构并行计算性能。微软据称这个扩展程序未来将会公开,并且允许其他编译器集成它。
就像当年Intel 8086处理器可以搭配8087浮点处理器做协处理器使用,未来GPU的角色很有可能将会担当协处理器的角色,参与原本只有CPU才做的工作。
AMD下一代GPU可能用’graphics-enabled vector processor’(配图形功能的向量处理器)来形容更恰当,这比NVIDIA的Fermi GPU可能更过之而无不及。
AMD GPU/CPU将会不分你我
这个GPU具备X86内存寻址特性,换句话说就是可以和CPU一样调用系统内存,CPU通过MMU内存控制器访问内存,而GPU则是通过IOMMU实现内存调用。这种新技术允许系统设备在虚拟内存中进行寻址,也就是将虚拟内存地址映射为物理内存地址,让实体设备可以在虚拟的内存环境中工作,这样可以帮助系统扩充内存容量,提升性能。该技术可以通过搭配具备IOMMU的AMD 8系和9系主板来实现。
http://www.ppcn.net/wp-content/uploads/2011/09/AMD-GPU-Architecture-02.jpg
同时AMD下一代GPU还具备64bit x86指针、Page fault、地址转换缓存、分配内存的功能,操作系统将会同时为CPU、GPU内存调用全面服务。当然只是能够调用内存还不够,还需要让GPU能够接替原本CPU干的活,这方面我们看到了很多希望。
http://www.ppcn.net/wp-content/uploads/2011/09/AMD-GPU-Architecture-03.jpg
我们仔细总结AMD下一代GPU的架构特性:[*]每个计算单元CU将基于vector向量处理器、scalar具备协处理器和特殊图形硬件[*]每个计算单元CU将会具备4线程MIMD(用于多指令多数据计算)和64-op FMAD vector向量处理器单元(用于SIMD单指令多数据计算),并支持40路SMT多线程能力[*]每个计算单元CU将独占16KB L1 cache,并搭配64KB L2 cache(可以被别的CU和CPU共享)[*]可支持x86兼容寻址、指针、page faults、CPU/GPU共享L2 Cache和内存
http://www.ppcn.net/wp-content/uploads/2011/09/AMD-GPU-Architecture-04.jpg
很明显,GPU将会具备处理器的架构特点,那么它和处理器架构相似程度有多高呢?接下来就让我们来对比一下推土机的架构。
整体来说,AMD下一代GPU架构将会具备更多CPU架构的特点,并通过创新的共享内存、缓存平台创新,让GPU和CPU共同加速完成计算任务,也许未来CPU性能弱,通过GPU弥补也能比竞争对手要强。 功耗控制的不错 期待 GPU终结CPU ~~~~~~~~~~ 这功耗很亮啊。。希望N别马甲了。多做些实用点的吧。 GPU只拿来打游戏确实太浪费了,只是这个需要软件支持的技术要推广起来,以AMD的影响力,前途未卜啊... 看起来不错.显卡供耗下降不少啊.. 希望性能也不差吧 AMD果然不愧为PPT公司啊 好牛逼啊!简直牛逼的一塌糊涂啊! Rambus显存,INTEL都惹不起这公司,AMD居然去踩这个坑,真是勇气可嘉... xdr2 ram不是說是假的嗎....
支持amd 功耗這方面做得很好` 显卡又要换代了,不过现在的大部分游戏画面都没跟进,很多只是优化的差。。。。5850继续用 功耗很不错,等7990.。。。。。。。。。。。。 等实体发布再说吧,农企啊。。。显卡给点,我会一如既往的支持的。
7970的功耗咋么低吗? 拿出实物评测最好
当初5000系列狂吹DX11性能,结果还不是打自己脸.
6000系列时候6970秒杀580的报道有的是,结果呢? 看 上去功耗很给力啊
中端的 7850才90W的TDP 等推土apu- -。。。 那就是说不修改代码&不制定运行在那里,代码可以任意运行在gpu和cpu上,还是很方便的 木钱,买不起 还真有人会信? 不可能·····
AMD的研发实力没到这个份上不说
其二新品没上之前,AMD一贯的胡扯性能······· 期待ing{:3_154:} ATi的逆袭{:3_160:} AMD收购ATI又不是没目的的 本帖最后由 raistlinwang 于 2011-11-25 18:49 编辑
看这次开普勒表现怎么样了 性能肯定没大问题 开普勒比南岛后出 GTX680的性能肯定超过7970 再怎么说也要堆上去主要是功耗和温度问题 瘾威大 要环保啊
另外对AMD的驱动彻底失望了 交火 每次出新游戏都会出现问题而且相关修正补丁更新太慢 老滚5都出来半个月了 交火问题还没解决 虽然6990用单核心也够用了 但不能交火太TM不爽了 貌似AMD对玩家并不重视
MD 开普勒给力点我要转阵营了 真的来XDR2了..价格别太坑爹啊 如果GTX680能够超过699020%的性能我就换6990 看这次开普勒表现怎么样了 性能肯定没大问题 开普勒比南岛后出 GTX680的性能肯定超过7970 再怎么说也要堆上 ...
raistlinwang 发表于 2011-11-25 18:43 http://bbs.3dmgame.com/images/common/back.gif
是啊,那么长时间了,上古5还不能支持CF,现在一直用补丁,不过效果也还可以,某些地方帧数能翻倍了
页:
[1]
2