71540476 发表于 2015-5-20 12:37

HBM高带宽显存


{:3_93:}

就看這次amd變革引發的如何了
http://img1.mydrivers.com/img/20150520/s_e6122884a9da4fc686770e6c9de1975f.jpg首先是HBM显存的必要性。目前主流的显存规格是GDDR5,经过多年的使用和发展已经进入了瓶颈期,迫切需要新的替代技术。
对于任何半导体产品而言,性能和功耗都是一对矛盾体,包括显卡。如果显卡整体功耗限定,那么GPU、显存两部分就必须互相妥协,而如今GDDR5显存的规格越来越高,功耗也水涨船高,导致留给GPU的功耗空间减少,必然影响性能提升。
http://img1.mydrivers.com/img/20150520/s_370d336771b94c548ce1585c0b66baad.jpg一个关键问题就是显存带宽,它却决于显存的位宽和频率。位宽都是GPU决定的,太高了会严重增大GPU芯片面积和功耗,所以高端显卡一直停留在384/512位。同时,GDDR5的频率已经超过7GHz,提升空间不大了。
http://img1.mydrivers.com/img/20150520/s_caca810d4e9240319fe175d50b7e6272.jpg另外,GDDR5(包括以前的显存)都面临着“占地面积”的问题。一大堆显存颗粒围绕在GPU芯片周围,这已经是固定模式,GDDR5再怎么缩小也无法改变,而且已经不可能再继续大幅度缩小了。
http://img1.mydrivers.com/img/20150520/s_fda8b99ff2ba4166a7734cf0237a1545.jpg那么,将DRAM集成到SoC处理器内部如何呢?目前看得不偿失,性能、功耗、尺寸、工艺都是很大的限制,无法获得足够的效益,短期内还必须相对独立。
http://img1.mydrivers.com/img/20150520/s_eba4964503684f4bbc731311443e397a.jpg所以合理的下一步解决方案就是“中介层”(Interposer),让DRAM尽可能接近GPU芯片,封装在同一基板上,提高通信能力。
于是,AMD联合ASE、Amkor、联电等伙伴联合开发了第一个可以批量生产的中介层方案,用到了HBM显存上。
http://img1.mydrivers.com/img/20150520/s_90f7e95c76c94a6686ba29a622f8f5aa.jpg这就是AMD HBM方案的侧面剖视图。这一方案是基于AMD、海力士联合定义、研发的第一个完整规范和原型。
橙色部分就是HBM显存的Die,3D立体封装,多个Die(目前最多四个)垂直堆叠在一起,通过TSV硅穿孔和micro-bumps微凸点技术彼此连接。蓝色部分是逻辑Die,是一个内外通信接口。
注意,每一个HBM Die都垂直与底部的逻辑Die进行通信,彼此之间是没有任何联系的。
灰色部分是中介层(Interposer),是整个方案的通信员,将HBM显存与GPU(也可以是CPU/SoC)同构PHY物理层联系在一起,同时把它们都固定在封装基板上。
HBM显存本身是真正的3D封装,而整个方案是2.5D封装。
http://img1.mydrivers.com/img/20150520/s_517d4557c53f440baed82e775929ef70.png看这张更有立体感的图,可以更好地理解HBM的3D结构。
http://img1.mydrivers.com/img/20150520/s_fa032e791f824bcbbc7ed12ca5b40f29.jpgHBM如其名,最大的特点就是高带宽(确切地说是高位宽),目前已经可以做到单个颗粒1024-bit,GDDR5的足足32倍。显存带宽与位宽、频率都成正比,因此位宽上去了,频率就不用那么高了,HBM目前的有效频率仅仅1GHz,GDDR5的七分之一。
就这样,HBM每个堆栈的带宽可以突破100GB/s,GDDR5的四五倍。
更关键的是,HBM的电压要求仅仅1.3V,低于GDDR5 1.5V,更加的节能。
http://img1.mydrivers.com/img/20150520/s_a2ec722befa449aaa49639806171b42a.jpg带宽高了,功耗低了,能效自然非常突出,HBM每瓦特可提供35+GB/s的带宽,GDDR5则只能勉强超过10GB/s,高下立判。
http://img1.mydrivers.com/img/20150520/s_e73288134fe845b6bc7b9085e83070a0.jpghttp://img1.mydrivers.com/img/20150520/s_eb882f7739b043a18f627171bca505eb.jpg同时,HBM体积小巧,非常节省空间,四层堆叠的1GB HBM只需要5×7=35毫米,而且是围绕着GPU核心统一封装,不占用PCB电路板。
1GB GDDR5则需要24×28=672平方毫米,还得算上封装针脚,而且都是分布在PCB上的。
因此从GDDR5换到HBM,显卡的面积可以缩小一半以上,所以谍照曝光R9 390X非常短小是很合理的。
http://img1.mydrivers.com/img/20150520/s_a08dcfeb33304ef6a0a11d0b79cf2f2e.jpg


以下是热点问题解答:

问:HBM显存与GPU核心未来是否会完全整合到一起?

Joe Macri:肯定会的。现在它们是2.5D封装,是目前比较合理的解决方案。完全的3D整合封装我们还在研究之中。对于手机等应用领域来说,这样做会更适合(所占面积更小)。3D封装可以实现,但是成本会上升,性能上也不会带来大幅提升,或者其他明显的好处。

问:HBM显存会比GDDR5增加多少成本?

Joe Macri:这个不能具体说增加多少,但是有了HBM,我们可以推出更有价格竞争优势的显卡。

问:HBM是否也会用到中低端显卡上?

Joe Macri:会的。HBM和GDDR5类似,最初主要针对高端市场,之后慢慢就会覆盖到中端市场。HBM的普及速度还得看行业竞争。如果整个生态都用HBM,再加上它特有的能力,普及肯定会很快。

独家专访揭秘AMD显卡的大杀器!HBM高带宽显存

问:网传AMD会推出配备HBM显存的高性能计算APU,是真的吗?

Joe Macri:我们可以看到,APU正在越来越强大。对于AMD来说,GPU、APU都会使用HBM,这只是个时间问题。HBM其实并不仅限于显卡,高性能计算、超级计算机、通信基础设备、服务器、PC等等都可以用。

问:AMD率先使用了HBM,而新技术总是机遇与挑战并存,AMD是如何考虑的?

Joe Macri:AMD的一个原则就是,我们发现了问题,我们就要去解决问题,提供解决方案。比如说,我们把内存控制器集成到了处理器内部,我们推出了HSA异构系统架构。AMD喜欢创新,也不怕竞争对手复制。我们认为,推广HBM和当年我们推广GDDR5是一样的。

2011dm 发表于 2015-5-20 12:42

还是要看核心性能。

71540476 发表于 2015-5-20 12:44

http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_1.jpg正所谓师出有名,AMD首先解答了为什么要采用新的显存技术。目前主流显卡所采用的显存都是GDDR5,但AMD认为GDDR5很快就会遇到阻碍GPU性能提升的“拐点”,这种显存芯片的尺寸已经无法再缩小,更强的GPU也需要更大容量、更高带宽的显存,这时候就需要“堆料”。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_2.jpg以R9 290X为例,GPU核心周围总共有16颗GDDR5芯片,再加上VRM电压调节模块相应也要增大规模,占据了大量空间,此外功耗也在上升,带来的性能提升幅度也逐渐下滑,说GDDR5显存目前正在进入功耗/性能曲线的低效区域也不为过。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_3.jpghttp://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_7.jpgAMD表示他们早在7年前就已经预料到这种状况,并且开始研发解决方案。在历史上,芯片厂商会选择更先进的芯片工艺或者在芯片中集成功能来解决这个问题。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_4.jpg目前有3个解决问题的思路,一个是SoC芯片集成,一个是外部接口,还有一个是中介层。其中外部接口就是当前的形式,继续提升GDDR5速度的效果已经不甚理想了。SoC也并非理想的途径,因为受到尺寸和成本的限制,但考虑到性能、功耗、尺寸等因素上的需求,最终选择了折中的办法——中介层。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_5.jpgAMD携手ASE、Amkor和UMC联合研发了首个可大批量生产的中介层解决方案,也就是即将发布的R9 390X/R9 390所采用的HBM显存的存在形式。这种方案灵活度也挺大的,一方面可以让显存尽可能地接近逻辑核心,以获得极大的总线位宽和效率、简化通信和时脉,还允许集成不同的技术,未来的新显存技术也能集成到中介层上。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_8.jpg接下来再讲一下为此而打造的HBM显存。HBM是一种超低功耗内存芯片,具有超宽总线位宽,首个完整规范以及原型由AMD联手SK Hynix定制和研发。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_9.jpg这种显存由若干层高带宽内存Die垂直堆栈,各Die与最底层的逻辑Die均通过TSV穿透硅通孔和μbumps微凸点技术直接互连(没错,每一层都通过若干个通道直通逻辑Die,而不与其他Die通信),再通过同样的技术,经中介层与GPU通信。未来HBM推广到CPU或者SoC芯片上,也是同样的结构。
GDDR5虽然频率普遍已经达到了1750MHz(实际7000MHz以上),每个封装位宽为32-bit,带宽为28GB/s,每瓦带宽实测10.66GB/s。
而第一代HBM频率最高只有500MHz(实际工作频率1000MHz),但是每个封装的总线位宽高达1024-bit,带宽超过100GB/s,电压低至1.3V,每瓦带宽超过35GB/s,实测功耗降低50%以上。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_10.jpghttp://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_11.jpg再考虑到空间占用问题,1GB GDDR5需要4颗芯片,而HBM只要一颗7mm×5mm的小芯片,单位容量表面积减少94%,而且因为HBM是和逻辑核心集成在同一块基板上,可以节省更多的空间。虽然PPT上说的只是逻辑核心+显存占据的PCB面积,并非整张显卡PCB的面积,不过可以预见最终显卡也可以做得很短。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_12.jpghttp://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_13.jpg简单总结一下,采用中介层技术的第一代HBM显存,最重要的是它拥有远超DDR4、GDDR5或者LPDDR4的高带宽和性能,能耗比也高很多,此外由于单位容量表面积缩小94%、加上逻辑核心缩小50%以上,采用这种显存的旗舰显卡也可以做成“网卡”了。
http://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_14.jpghttp://img.expreview.com/news/2015/05/20/AMD_HBM_R9_390X_15.jpg

71540476 发表于 2015-5-20 12:44

2011dm 发表于 2015-5-20 12:42 static/image/common/back.gif
还是要看核心性能。

{:3_109:}

是啊

具體還是等出了再說吧

不過至少顯存這塊提升巨大了。。。。。。。。



wywwyw 发表于 2015-5-20 12:46

这已经超出了我的智商范围,看不懂...:funk:

b3030a 发表于 2015-5-20 13:01

当年也是amd先用d5这次再次领先, 老黄最晚明年必须跟进。

重返寂寞 发表于 2015-5-20 13:59

显存只是轮毂,决定本质的还是发动机

dripline 发表于 2015-5-20 15:39

不明觉厉.感觉就像是,老架构是洛杉矶,新架构是上海.一边是铺了一大片平房,一边是高楼林立.AMD在PCB板上盖楼.

3dmstradust 发表于 2015-5-20 17:04

{:3_91:}农企ppt

2011dm 发表于 2015-5-20 17:05

3dmstradust 发表于 2015-5-20 17:04 static/image/common/back.gif
农企ppt

{:3_161:}技术知识普及型的PPT还是能看下的。

3dmstradust 发表于 2015-5-20 17:22

2011dm 发表于 2015-5-20 17:05 static/image/common/back.gif
技术知识普及型的PPT还是能看下的。

{:3_99:}关键貌似农企就会做ppt了···

qingfengmingyue 发表于 2015-5-20 19:00

功耗必须解决 不然又回到了以前的N卡590480这2代显卡路子

funvivian 发表于 2015-5-20 19:02

神马时候出来苏姨给个痛快话吧.....

we6 发表于 2015-5-22 11:03

4G 显存 是硬伤!!我等下代了!先关注一下 目前 游戏没有不能跑的!~

fy4007 发表于 2015-5-22 13:56

农企的PPT总是那么66666啊

zhonghuaxm 发表于 2015-7-26 22:18

我怎么觉得现在的带宽已经绰绰有余了啊。。关键还是处理性能,容量和功耗。要那么大的吞吐带宽对于PC有什么意义?难道以后游戏1T一部?不敢想啊。。。得看固态硬盘的发展了,机械是绝对更不上啊这个

酸菜包子 发表于 2015-7-27 19:43

又开始发表PPT了,速度提升产能。我对肥鸡已经饥渴难耐了!!{:3_63:}
页: [1]
查看完整版本: HBM高带宽显存