新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動(dòng)態(tài) > 回顧AMD模塊化架構(gòu)這6年走過的路

回顧AMD模塊化架構(gòu)這6年走過的路

作者：時(shí)間：2017-01-21 來源：超能網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

編者按：過去的幾年中AMD的“推土機(jī)”模塊化架構(gòu)高喊著革命口號(hào)出生，但并沒有把Intel拉下馬，反倒濺了自己一身血，AMD在高性能處理器市場(chǎng)沉淪了將近5年了。

　　武林高手修煉的一定境界往往會(huì)覺得高處不勝寒，因?yàn)槟芨车膶?duì)手越來越少，哪怕雙方正反立場(chǎng)不同，英雄豪杰也會(huì)惺惺相惜。Intel現(xiàn)在高端處理器市場(chǎng)上少了AMD這個(gè)對(duì)手，他們會(huì)懷念雙方你爭(zhēng)我奪的“美好時(shí)光”嗎?

本文引用地址：http://www.104case.com/article/201701/343151.htm

　　如果往前數(shù)10多年，AMD憑借K8“大錘”處理器也是闊過的，Intel當(dāng)年在奔騰4時(shí)代被AMD“教做人”，充分體驗(yàn)到了“高分低能”的感覺。但是Intel對(duì)AMD來說是巨無霸一般的存在，即便是AMD處理器叫好又叫座，Intel公司CPU一哥的地位依然無人動(dòng)搖，而且他們有足夠的實(shí)力翻盤，Core處理器橫空出世之后，Intel重新逆轉(zhuǎn)了對(duì)AMD處理器的性能優(yōu)勢(shì)，在K8之后AMD推出的K10處理器遭遇了bug及制程的雙重困擾，整體表現(xiàn)要比K8平庸多了，眼睜睜看著Intel華麗轉(zhuǎn)身。

　　作為一家營收不足Intel公司1/10的“小公司”，AMD公司的斗志以及創(chuàng)新精神讓人敬佩，在HT總線、DDR內(nèi)存、多核處理器等技術(shù)上敢為人先，而在64位X86指令集上更是讓Intel低頭認(rèn)輸，直到現(xiàn)在這個(gè)勝利都是AMD最為驕傲的成績(jī)之一。因此在K10架構(gòu)之后，AMD嘔心瀝血研發(fā)的”推土機(jī)“模塊化架構(gòu)讓玩家產(chǎn)生了極大的期待，筆者當(dāng)年在推土機(jī)架構(gòu)前瞻一文中希望AMD能借該架構(gòu)實(shí)現(xiàn)對(duì)Intel的復(fù)仇，重現(xiàn)K8的輝煌。

　　但是，最后的結(jié)果大家現(xiàn)在都知道了，推土機(jī)架構(gòu)處理器就像是跳水運(yùn)動(dòng)員一樣，起點(diǎn)很完美，但入水時(shí)浪花太大而撲街，實(shí)際表現(xiàn)不盡如人意。這次高開低走也讓AMD心灰意冷，推土機(jī)架構(gòu)在桌面市場(chǎng)小幅升級(jí)到第二代Piledriver打樁機(jī)架構(gòu)之后就草草結(jié)束FX處理器更新，后面兩代架構(gòu)只在Kaveri及Carrizo兩代APU上出現(xiàn)，桌面版到現(xiàn)在為止差不多5年沒升級(jí)了。

　　AMD模塊化架構(gòu)推出了四代，后面兩代只用于APU

　　從2011年FX-8150發(fā)布到2015年Carrizo APU問世，AMD的模塊化架構(gòu)一共出了Bulldozer推土機(jī)、Piledriver打樁機(jī)、Steamroller壓路機(jī)及Excavator挖掘機(jī)四代，其中前兩代用于FX及APU處理器，2012年之后AMD就不再升級(jí)FX系列的架構(gòu)了(產(chǎn)品型號(hào)倒是有升級(jí))，Steamroller壓路機(jī)及Excavator挖掘機(jī)只有APU上才有用，制程工藝也只從32nm升級(jí)到28nm，而Intel在這幾年中一直升級(jí)了SNB、IVB、Haswell、Broadwell及Skylake等處理器，制程工藝也從32nm一路升級(jí)到22nm、14nm及最新的14nm Plus。

　　今天我們來回顧下AMD模塊化架構(gòu)6年來走過的路，無論大家對(duì)它以往的評(píng)價(jià)如何，現(xiàn)在都不重要了，因?yàn)槲覀兌贾浪呀?jīng)是過去時(shí)了，AMD即將在Q1季度推出Ryzen處理器，全新的Zen架構(gòu)、14nm LPP工藝以及AM4平臺(tái)使得Ryzen更有吸引力，它身上也沒了“推土機(jī)”架構(gòu)的影子，從內(nèi)核到緩存都重新設(shè)計(jì)了。

　　AMD四代模塊化架構(gòu)規(guī)格一覽

　　Bulldozer推土機(jī)：模塊化架構(gòu)之始，AMD不走尋常路

　　AMD推的第一代模塊化架構(gòu)就是Bulldozer推土機(jī)，以至于“推土機(jī)”都成了AMD整個(gè)模塊化架構(gòu)的代名詞。在推土機(jī)問世之時(shí)，其架構(gòu)確實(shí)有很多革命之處，包括全新的SSE5指令集、模塊化多核、彈性浮點(diǎn)單元等設(shè)計(jì)有其獨(dú)到之處，也有讓人耳目一新的感覺。

　　推土機(jī)開始使用模塊化多核架構(gòu)設(shè)計(jì)

　　筆者在之前的分析文章中有過推土機(jī)架構(gòu)的詳細(xì)分析，這里不再贅述架構(gòu)設(shè)計(jì)，當(dāng)時(shí)AMD對(duì)多核多線程的設(shè)計(jì)走的是物理多核，不同于傳統(tǒng)的SMT同步多線程，推土機(jī)的模塊化多核被稱為CMT物理多核，其設(shè)計(jì)意圖就是希望通過2個(gè)整數(shù)單元、1個(gè)共享浮點(diǎn)單元解決實(shí)際使用中整數(shù)多于浮點(diǎn)的過程，理論上這種設(shè)計(jì)要比SMT多線程更有效率。

　　推土機(jī)架構(gòu)產(chǎn)品中，旗艦型號(hào)是FX-8150，號(hào)稱首款桌面8核處理器，頻率3.6-4.2GHz，支持DDR3-1866，8MB L3緩存，規(guī)格比Intel當(dāng)年的SNB旗艦Core i7-2600K還要高，只不過125W TDP功耗高于后者的95W，畢竟核心數(shù)比SNB還是多了一倍。

　　但是在最終的性能表現(xiàn)上，推土機(jī)并沒有實(shí)現(xiàn)AMD的期待——2011年早些時(shí)候Intel推出了SNB處理器，在與SNB的對(duì)比中8核推土機(jī)除了在多線程上憑借核心多一倍略有優(yōu)勢(shì)之外，單線程性能上被SNB處理器完勝，在延遲、內(nèi)存帶寬等方面也不如Intel處理器。

　　更重要的是，AMD的推土機(jī)使用的是GlobalFoundries的32nm SOI工藝，雖然同期Intel SNB處理器也是32nm工藝，但8核推土機(jī)核心面積高達(dá)315mm2，晶體管數(shù)量才12億，Intel 4核SNB處理器核心面積216mm2，晶體管數(shù)量11.6億，而且后者還是包含GPU核心在內(nèi)的。

　　最終的結(jié)果就是8核推土機(jī)架構(gòu)在技不如人的情況下，發(fā)熱、功耗控制更是不如SNB處理器，而GF的32nm工藝產(chǎn)能、良率當(dāng)時(shí)也不給力，多重因素制約下，推土機(jī)首發(fā)表現(xiàn)很難讓市場(chǎng)認(rèn)可，消費(fèi)者并不買賬，唯一值得“炫耀”的就是AMD FX-8150處理器價(jià)格只要200美元左右，比Intel 4核Core i7便宜50%左右，性價(jià)比是AMD僅存的優(yōu)勢(shì)了。

　　Piledriver打樁機(jī)：AMD修補(bǔ)推土機(jī)，創(chuàng)高頻記錄

　　第一代模塊化架構(gòu)推土機(jī)并沒有一鳴驚人，AMD在第二代模塊化架構(gòu)“Piledriver”中對(duì)推土機(jī)架構(gòu)做了修補(bǔ)，2012年10月份正式推出了Vishera平臺(tái)，AMD在此基礎(chǔ)上不僅推出了FX-8150的繼任者FX-8350，還衍生出世界首款5GHz處理器FX-9590，還有TDP降至95W的FX-8370E/8320E處理器。

　　AMD第二代模塊化架構(gòu)Piledriver

　　相比第一代的Bulldorzer架構(gòu)，Piledriver打樁機(jī)硬件單元變化不大，主要提升了一倍的L1 TLB單元、新增HW Divider硬件分配器、改善了S/L操作效率、提升了L2緩存效率及預(yù)測(cè)精度、優(yōu)化了整數(shù)及浮點(diǎn)單元調(diào)度，增加了FMA4、BMI、CVT16、TBM等指令，整體上是對(duì)推土機(jī)架構(gòu)小修小補(bǔ)，目的是提高架構(gòu)效率，降低能耗。

　　從AMD資料來看，Piledriver相比Bulldozer架構(gòu)減少了10%的動(dòng)態(tài)功耗，同樣的電壓下大幅提升了CPU頻率空間，以FX-8350為例，同樣是在125W TDP下，其基礎(chǔ)頻率從FX-8150的3.6GHz增加到了4GHz，加速頻率4.2GHz。

　　Piledriver這一代中AMD同時(shí)在高頻率及低功耗上出擊

　　Piledriver架構(gòu)效率的提升使得AMD在擴(kuò)展新品上有了更多靈活性，TDP增至220W的情況下，他們推出了號(hào)稱世界首款5GHz頻率的FX-9590處理器，而同樣是8核配置下又推出了TDP降至95W的FX-8370E/8320E處理器。遺憾的是，AMD這兩波產(chǎn)品都沒有獲得市場(chǎng)認(rèn)可，消費(fèi)者并不買賬，AMD后面索性不再折騰FX系列處理器了，從Piledriver架構(gòu)之后事實(shí)上放棄了FX產(chǎn)品線，新品升級(jí)都沒了。

　　除了略顯悲催的FX系列處理器之外，Piledriver還用在了Trinity APU上，第一代Llano APU因?yàn)闀r(shí)間關(guān)系沒趕上推土機(jī)架構(gòu)，使用的還是K10架構(gòu)CPU核心，Trinity直接上了第二代模塊化架構(gòu)。用于APU的Piledriver架構(gòu)砍掉了L3緩存，核心數(shù)也從8核降至4核，還增加了GPU核心，TDP功耗也降至100W以內(nèi)。

　　AMD的第二代模塊架構(gòu)Piledriver改善了推土機(jī)架構(gòu)的效率、功耗，但并沒有根本性變化，并不足以扭轉(zhuǎn)AMD的困境，相反Intel當(dāng)年推出了22nm工藝的IVB處理器，而且用上了FinFET工藝，GlobalFoundries的32nm SOI工藝即便成熟起來了，AMD跟Intel之間的性能、功耗差距實(shí)際上越來越大了。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>