顯卡工作原理
首先我們應該了解一下顯卡的簡單工作原理:首先,由CPU送來的數據會通過AGP或PCI-E總線,進入顯卡的圖形芯片(即我們常說的GPU或VPU)里進行處理。當芯片處理完后,相關數據會被運送到顯存里暫時儲存。然后數字圖像數據會被送入RA罵死我吧AC(Random Access Memory Digital Analog Converter),即隨機存儲數字模擬轉換器,轉換成計算機顯示需要的模擬數據。最后RA罵死我吧AC再將轉換完的類比數據送到顯示器成為我們所看到的圖像。在該過程中,圖形芯片對數據處理的快慢以及顯存的數據傳輸帶寬都會對顯卡性能有明顯影響。
技術參數和架構解析
一、核心架構:
我們經常會在顯卡文章中看到“8×1架構”、“4×2架構”這樣的字樣,它們代表了什么意思呢?“8×1架構”代表顯卡的圖形核心具有8條像素渲染管線,每條管線具有1個紋理貼圖單元;而“4×2架構”則是指顯卡圖形核心具有4條像素渲染管線,每條管線具有2個紋理貼圖單元。也就是說在一個時鐘周期內,8×1架構可以完成8個像素渲染和8個紋理貼圖;而4×2架構可以完成4個像素渲染和8個紋理貼圖。從實際游戲效果來看,這兩者在相同工作頻率下性能非常相近,所以常被放在一起討論。
舉例來說,nVIDIA在發布GeForce FX 5800 Ultra的時候,對于其體系架構就沒有給出詳盡說明。后來人們發現官方文檔中提到的每個周期處理8個像素的說法,只是指的Z/stencil像素,其核心架構可以看作是GeForce4 Ti系列4×2架構的改進版本,其后發布的GeForce FX 5900系列也是如此。ATi的Radeon 9700和9800系列則具有完整的8條像素渲染管線。但是這些顯卡的性能基本上都處于一個檔次。
目前主流的中低端顯卡,基本上都是4×1架構或2×2架構,也就是單位周期只能完成4個紋理貼圖。而更高端的產品則擁有12×1架構甚至16×1架構。
二、核心工作頻率:
俗話說得好:“勤能補拙”。雖然高規格的架構擁有先天性的優勢,但是中低規格的核心架構通過提高工作頻率,也可以達到接近中高端產品的性能。
舉例來說,Radeon 9500PRO采用的是8×1架構,而Radeon 9600XT則只是4×1架構。不過采用0.15微米制造工藝的Radeon 9500PRO核心/顯存工作頻率是275MHz/540MHz,而采用0.13微米工藝的Radeon 9600XT則達到了500MHz/600MHz,核心頻率幾乎是前者的兩倍。因此在單位時間內,它們可完成的像素渲染和紋理貼圖工作量大致相當,因此性能處于同一水平。所以采用更先進制造工藝,擁有良好超頻性能的顯卡產品往往很受玩家歡迎。
三、顯存帶寬:
在大型3D游戲等應用中,顯卡的圖形芯片與顯存之間經常需要進行大量的數據交換。這時如果顯存的數據傳輸帶寬太低,就會嚴重制約數據的順利傳輸,導致圖形芯片時常處于“等米下鍋”的狀態,這也是對芯片性能的浪費。所以DIY玩家在超頻顯卡時,往往是將核心/顯存頻率一起提升,這樣就不容易讓顯存帶寬成為制約顯卡性能的瓶頸。64bit顯存位寬的顯卡之所以被玩家們所“鄙視”,也正是因為其顯存的數據傳輸帶寬大幅縮水。
除了前面提到的內容外,圖形芯片的處理效率以及驅動程序的優劣也都是影響顯卡性能的重要因素。
解讀顯卡性能
通過上面的介紹,我們應該不難從顯卡的技術參數中了解其實際性能。例如在真實游戲測試中,4×2構架的GeForce4 Ti 4200速度居然屢屢勝出采用4×1構架的GeForce FX 5600、5700以及Radeon 9600、9600PRO等中高端顯卡。只有GeForce FX 5700Ultra和Radeon 9600XT才略為挽回一點面子,不過它們的核心工作頻率比起GeForce4 Ti 4200幾乎翻了一番,售價也幾乎高出后者一倍。要不是無法支持DirectX 9特效限制了GeForce4 Ti 4200的施展空間,當今市場上的諸多中端顯卡都將面臨非常難堪的境地,也難怪4200能成為一代經典。而如果選擇4×1/2×2構架的顯卡產品,我們也可以通過超頻使其達到更好的性能。
評論