回顧AMD模塊化架構這6年走過的路
武林高手修煉的一定境界往往會覺得高處不勝寒,因為能跟他匹敵的對手越來越少,哪怕雙方正反立場不同,英雄豪杰也會惺惺相惜。Intel現在高端處理器市場上少了AMD這個對手,他們會懷念雙方你爭我奪的“美好時光”嗎?
本文引用地址:http://www.104case.com/article/201701/343151.htm
如果往前數10多年,AMD憑借K8“大錘”處理器也是闊過的,Intel當年在奔騰4時代被AMD“教做人”,充分體驗到了“高分低能”的感覺。但是Intel對AMD來說是巨無霸一般的存在,即便是AMD處理器叫好又叫座,Intel公司CPU一哥的地位依然無人動搖,而且他們有足夠的實力翻盤,Core處理器橫空出世之后,Intel重新逆轉了對AMD處理器的性能優勢,在K8之后AMD推出的K10處理器遭遇了bug及制程的雙重困擾,整體表現要比K8平庸多了,眼睜睜看著Intel華麗轉身。
作為一家營收不足Intel公司1/10的“小公司”,AMD公司的斗志以及創新精神讓人敬佩,在HT總線、DDR內存、多核處理器等技術上敢為人先,而在64位X86指令集上更是讓Intel低頭認輸,直到現在這個勝利都是AMD最為驕傲的成績之一。因此在K10架構之后,AMD嘔心瀝血研發的”推土機“模塊化架構讓玩家產生了極大的期待,筆者當年在推土機架構前瞻一文中希望AMD能借該架構實現對Intel的復仇,重現K8的輝煌。
但是,最后的結果大家現在都知道了,推土機架構處理器就像是跳水運動員一樣,起點很完美,但入水時浪花太大而撲街,實際表現不盡如人意。這次高開低走也讓AMD心灰意冷,推土機架構在桌面市場小幅升級到第二代Piledriver打樁機架構之后就草草結束FX處理器更新,后面兩代架構只在Kaveri及Carrizo兩代APU上出現,桌面版到現在為止差不多5年沒升級了。

AMD模塊化架構推出了四代,后面兩代只用于APU
從2011年FX-8150發布到2015年Carrizo APU問世,AMD的模塊化架構一共出了Bulldozer推土機、Piledriver打樁機、Steamroller壓路機及Excavator挖掘機四代,其中前兩代用于FX及APU處理器,2012年之后AMD就不再升級FX系列的架構了(產品型號倒是有升級),Steamroller壓路機及Excavator挖掘機只有APU上才有用,制程工藝也只從32nm升級到28nm,而Intel在這幾年中一直升級了SNB、IVB、Haswell、Broadwell及Skylake等處理器,制程工藝也從32nm一路升級到22nm、14nm及最新的14nm Plus。
今天我們來回顧下AMD模塊化架構6年來走過的路,無論大家對它以往的評價如何,現在都不重要了,因為我們都知道它已經是過去時了,AMD即將在Q1季度推出Ryzen處理器,全新的Zen架構、14nm LPP工藝以及AM4平臺使得Ryzen更有吸引力,它身上也沒了“推土機”架構的影子,從內核到緩存都重新設計了。

AMD四代模塊化架構規格一覽
Bulldozer推土機:模塊化架構之始,AMD不走尋常路
AMD推的第一代模塊化架構就是Bulldozer推土機,以至于“推土機”都成了AMD整個模塊化架構的代名詞。在推土機問世之時,其架構確實有很多革命之處,包括全新的SSE5指令集、模塊化多核、彈性浮點單元等設計有其獨到之處,也有讓人耳目一新的感覺。

推土機開始使用模塊化多核架構設計
筆者在之前的分析文章中有過推土機架構的詳細分析,這里不再贅述架構設計,當時AMD對多核多線程的設計走的是物理多核,不同于傳統的SMT同步多線程,推土機的模塊化多核被稱為CMT物理多核,其設計意圖就是希望通過2個整數單元、1個共享浮點單元解決實際使用中整數多于浮點的過程,理論上這種設計要比SMT多線程更有效率。
推土機架構產品中,旗艦型號是FX-8150,號稱首款桌面8核處理器,頻率3.6-4.2GHz,支持DDR3-1866,8MB L3緩存,規格比Intel當年的SNB旗艦Core i7-2600K還要高,只不過125W TDP功耗高于后者的95W,畢竟核心數比SNB還是多了一倍。
但是在最終的性能表現上,推土機并沒有實現AMD的期待——2011年早些時候Intel推出了SNB處理器,在與SNB的對比中8核推土機除了在多線程上憑借核心多一倍略有優勢之外,單線程性能上被SNB處理器完勝,在延遲、內存帶寬等方面也不如Intel處理器。
更重要的是,AMD的推土機使用的是GlobalFoundries的32nm SOI工藝,雖然同期Intel SNB處理器也是32nm工藝,但8核推土機核心面積高達315mm2,晶體管數量才12億,Intel 4核SNB處理器核心面積216mm2,晶體管數量11.6億,而且后者還是包含GPU核心在內的。
最終的結果就是8核推土機架構在技不如人的情況下,發熱、功耗控制更是不如SNB處理器,而GF的32nm工藝產能、良率當時也不給力,多重因素制約下,推土機首發表現很難讓市場認可,消費者并不買賬,唯一值得“炫耀”的就是AMD FX-8150處理器價格只要200美元左右,比Intel 4核Core i7便宜50%左右,性價比是AMD僅存的優勢了。
Piledriver打樁機:AMD修補推土機,創高頻記錄
第一代模塊化架構推土機并沒有一鳴驚人,AMD在第二代模塊化架構“Piledriver”中對推土機架構做了修補,2012年10月份正式推出了Vishera平臺,AMD在此基礎上不僅推出了FX-8150的繼任者FX-8350,還衍生出世界首款5GHz處理器FX-9590,還有TDP降至95W的FX-8370E/8320E處理器。

AMD第二代模塊化架構Piledriver
相比第一代的Bulldorzer架構,Piledriver打樁機硬件單元變化不大,主要提升了一倍的L1 TLB單元、新增HW Divider硬件分配器、改善了S/L操作效率、提升了L2緩存效率及預測精度、優化了整數及浮點單元調度,增加了FMA4、BMI、CVT16、TBM等指令,整體上是對推土機架構小修小補,目的是提高架構效率,降低能耗。
從AMD資料來看,Piledriver相比Bulldozer架構減少了10%的動態功耗,同樣的電壓下大幅提升了CPU頻率空間,以FX-8350為例,同樣是在125W TDP下,其基礎頻率從FX-8150的3.6GHz增加到了4GHz,加速頻率4.2GHz。

Piledriver這一代中AMD同時在高頻率及低功耗上出擊
Piledriver架構效率的提升使得AMD在擴展新品上有了更多靈活性,TDP增至220W的情況下,他們推出了號稱世界首款5GHz頻率的FX-9590處理器,而同樣是8核配置下又推出了TDP降至95W的FX-8370E/8320E處理器。遺憾的是,AMD這兩波產品都沒有獲得市場認可,消費者并不買賬,AMD后面索性不再折騰FX系列處理器了,從Piledriver架構之后事實上放棄了FX產品線,新品升級都沒了。
除了略顯悲催的FX系列處理器之外,Piledriver還用在了Trinity APU上,第一代Llano APU因為時間關系沒趕上推土機架構,使用的還是K10架構CPU核心,Trinity直接上了第二代模塊化架構。用于APU的Piledriver架構砍掉了L3緩存,核心數也從8核降至4核,還增加了GPU核心,TDP功耗也降至100W以內。
AMD的第二代模塊架構Piledriver改善了推土機架構的效率、功耗,但并沒有根本性變化,并不足以扭轉AMD的困境,相反Intel當年推出了22nm工藝的IVB處理器,而且用上了FinFET工藝,GlobalFoundries的32nm SOI工藝即便成熟起來了,AMD跟Intel之間的性能、功耗差距實際上越來越大了。
評論