英偉達研發主管:AI 是如何改進芯片設計的?
Dally 在今年的演講中稱:“我們有一個 300 人左右組成的小組,嘗試著去預測我們在英偉達產品方面的前景,我們就像是一盞遠光燈,想要把遠處的事物照亮。我們被松散地分成兩半。一半為 GPU 提供技術。它讓 GPU 自身更加完善,包括電路、VLSI 設計、架構網絡、編程系統,以及進入 GPU 和 GPU 系統的存儲系統。”
“英偉達研究團隊希望開發出能夠很好地使用 GPU 的軟件系統和技術。我們一直在推動計算機圖形技術,并且有三個不同的計算機圖形研究小組,同時還有五支不同的人工智能小組。現在使用 GPU 來運行人工智能是一項龐大的工程,并且規模不斷擴大。我們還有一個小組專門研究和生產機器人和無人駕駛汽車。”他說,“我們也有一些面向地理位置的實驗室,比如多倫多和特拉維夫人工智能實驗室。”
英偉達有時會從一些小組中挑選一些人來實行瘋狂的計劃,比如有一個小組開發出了英偉達的實時光線追蹤技術。
和以往一樣,Dally 的談話中有一些重復,但是也有一些新的內容。這個小組的規模,當然要比 2019 年大約 175 人有所增長,因為人們對無人駕駛系統和機器人的支持力度越來越大。Dally 說:“一年之前,英偉達把 Macro Pavone 從斯坦福大學挖來,領導他們新的無人駕駛汽車研發小組。”他并沒有過多提及 CPU 的設計,但無疑,這方面的工作也得到了強化。
以下是 Dally 對英偉達在設計芯片時越來越多地使用人工智能的評論的一小部分(略加編輯),并附上了一些支持的幻燈片。
利用圖神經網絡測繪電壓降“身為一名人工智能專家,我們當然想要利用人工智能來設計更好的芯片。我們有好幾種方法可以這樣做。第一條最簡單的途徑就是我們可以使用(與人工智能相結合)已有的計算機輔助設計工具。比如,我們可以測繪 GPU 里的電力消耗,并且可以預測柵極電壓會降低到什么程度——所謂的 IR 下降就是指電流乘以電阻壓降。用常規 CAD 軟件來做這件事要花上三個小時。”Dally 說道。
在 Dally 看來,這是一個迭代的過程,需要做的就是訓練一個人工智能模型,來獲得相同的數據。
“我們在一堆設計上這樣做,基本上就能將功率圖輸入,由此產生的推理時間僅需要三秒鐘。當然,如果把特征提取的時間算在內,這需要 18 分鐘。我們能夠很快地取得成果。在這個案例中,我們采用了圖神經網絡,而不是卷積神經網絡,我們這么做,就是要估算電路中各個節點的開關頻率,從而促進了前面例子中的功率輸入。”Dally 說,“我們可以在很短的時間內得到精確的功率估算,這要比傳統的方法快。”
Dally 表示自己最喜愛的工作之一就是利用圖神經網絡來預測寄生效應。在幾年前,他曾是一名電路設計師。以前,電路設計是一個非常反復的過程,你要繪制一副晶體管的原理圖,但是你并不清楚它的性能如何,直到布局設計師拿到這副原理圖,進行了布局,并提取了寄生器件,然后你才能進行電路仿真。
“你會回去修改你的原理圖(并再次通過)布局設計師,這是一個非常漫長的、反復的、非人道的、勞動密集型的過程。現在我們可以做的是通過訓練神經網絡來預測寄生效應,而無需進行布局。這樣,電路設計者可以非常快速地進行迭代,而不必在循環中進行手工布局的步驟。這里的圖表顯示,與基準真相相比,我們對這些寄生器件的預測非常準確。”
Dally 稱,AI 還可以預測路由擁堵情況,這對企業們的芯片布局至關重要。
正常的過程是,研發人員必須采取一個網表,通過布局和路由過程運行,這會非常耗費時間,通常要花上好幾天。雖然能夠了解擁堵情況,但會發現原來的布局還不夠完善。因此必須重新設計,用另一種方法來布局宏,這樣就可以避開那些紅色的區域(如下圖所示)。
這里有太多的線試圖通過一個特定的區域,有點像交通堵塞的車位。“我們現在能做到的就是不用再進行布局和路由了,我們可以利用這些網表,并且通過圖神經網絡,基本地預測哪里會出現擁堵,從而達到很高的精準度。”他說,“這還不夠完善,但是它表明了問題所在的區域,我們可以立即采取措施,快速地進行迭代,而無需進行完整的布局和路由。”
標準單元遷移的自動化Dally 表示,目前這些方法都是通過人工智能對人類的設計進行批判。真正讓人激動的是,將人工智能用于實際的設計。
Dally 舉了個例子,比如 NVCell 系統,該系統采用了模擬退火與強化學習相結合的方法來設計標準單元庫。每獲得一項新技術,比如從 7nm 轉向 5nm,就擁有了一個單元庫。Dally 說:“事實上,我們有數以千計的這種單元,并且必須用一套非常復雜的設計原則在新技術中進行重新設計。”
據 Dally 介紹,英偉達主要利用強化學習來布局晶體管。在過去,當晶體管被布局好之后,往往會出現大量的設計規則上的錯誤,就像電子游戲一樣。而這正是強化學習最拿手的。
“在 Atari 電子游戲中使用強化學習就是很好的范例。這就好比是一款 Atari 電子游戲,不過它是一款修復標準單元中設計規劃錯誤的電子游戲。我們可以用強化學習來修正這些設計規則中的錯誤,從而使我們可以在很大程度上實現一個標準單元的設計。”
如下圖所示,92% 的單元庫可以通過這款工具來實現,而不存在設計規則和電氣規則方面的錯誤。此外,還有 12% 的單元要小于人類設計的單元。“總體上來講,在單元復雜性方面,這款工具做出來的單元,與人類設計的單元相當,或者更好。”Dally 表示。
這對英偉達來說有個好處是可以節約很多人力資源。在過去,一個大約 10 人的小組需要花費一年的時間,來完成一個新的技術庫的移植。現在,可以使用多臺 GPU 運行幾天來完成。這樣,人類就能處理 8% 未自動完成的單元。“在很多案例中,我們最終能得到更好的設計。這樣可以解決人力,而且優于人類的設計。”
Dally 的演講還有很多關于英偉達研究開發的內容,英偉達的研究和開發主要集中在產品上,而非基礎科學。如果你感興趣的話,也可以了解下 Dally 在 2019 年、2021 年關于英偉達研究開發的演講。看完后你會發現,Dally 在研究開發工作和組織方面的描述并沒有什么改變,但是主題是不一樣的。
原文鏈接:
https://www.hpcwire.com/2022/04/18/nvidia-rd-chief-on-how-ai-is-improving-chip-design
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。