继辉煌的K8和质朴的K10架构之后,AMD的推土机模块化多核CMT架构承载了他们新的希望。然而,自2011年发布以来,AMD的CMT架构已经成为一片废墟。虽然AMD升级了四代模块化架构,如Piledriver、Steamroller和挖掘机,但FX系列处理器已经升级了。现在AMD在重压之下,依然专注于高性能服务器市场,他们的芯片被钉在了全新的X86架构Zen上。从最近曝光的Zen架构核心图,可以确认AMD这次彻底放弃了模块化多核设计,回归传统。
AMD的Zen架构已经实践了很多年,但是我们对它知之甚少。之前我们只知道AMD会像推土机一样放弃CMT模块多核,回归传统SMT同步多线程。前几天有网友在Plant3dnow论坛上曝光了AMD的官方PPT,这是在5月份AMD的会议上才发布的。它令人印象深刻地列出了Zen架构的内核设计,并将其与当前的Exavator挖掘机架构进行了比较。
要了解这两种架构的区别,读者可以参考我们之前对推土机架构的分析:AMD复仇之剑,推土机推土机预览和前瞻。在前面AMD模块化多核设计的讲解中,这种架构最明显的设计就是两个整数单元搭配一个灵活的浮点单元。整数单元有自己的解码器和调度器,而浮点单元是共享的。AMD之所以采用这种设计,是因为日常应用中80%的运算都是整数运算,只有20%是浮点运算。当时AMD还在搞APU融合计算,他们希望浮点运算转向能力更强的GPU。
理想丰满,现实骨感。可惜AMD的想法在现实中并没有充分发挥优势,推土机的实际性能也不强。此外,AMD当时还在使用32nm SOI技术,Globalfoundries缺乏先进工艺的顽疾也加剧了推土机的失败。此外,AMD的FX处理器由于功耗高、发热高、性能差,从此沉寂。
AMD的模块化架构采用灵活的浮点单元设计。
现在AMD又带着Zen回来了,不再采用模块化设计,而是回到了整数单元浮点单元的传统设计。当然,每个单元的功能不再是以前的样子了。例如,“挖掘机”架构中的浮点单元是128位,而Zen架构中的浮点单元是256位,这将支持英特尔的AVX 2.0指令。
而且,AMD的FP单元具有很高的灵活性。此前,推土机架构的两个128位浮点单元可以组合执行256位指令,而Zen架构的两个256位单元理论上可以执行512位指令,达到了英特尔Skylake处理器的水平。
AMD可能会在下个月初的分析师会议上宣布Zen架构的更多细节,所以我们将拭目以待。
Zen architecture预计今年年底上市,但产品可能要等到明年。之前曝光的Zen架构的16核APU和32核服务器芯片看起来也很强大。希望禅宗建筑不要像推土机一样好。
其实我们这次可以对禅持谨慎乐观的态度。首先,参与禅宗建筑研发的设计师吉姆黑仔是技术牛。他之前负责AMD的K7和64位K8处理器的研发,之后去苹果参与苹果A4/A5处理器的研发。第三,推土机的失败也是因为GF技术的失败,当时还在用32nm SOI技术,但是Zen架构会用GF的14nm FinFET技术,用的是三星的14nm许可证,成熟度比GF本身好很多开发者_开发问答。2016年,英特尔的主流技术也是14nm 3D晶体管技术。虽然他们的设计不同,但AMD最终可以使用与英特尔相同一代的半导体技术。
精彩评论