研華支持采用了 AMD Fusion APU 的豐富顯示應用
DirectCompute和OpenCL
本文引用地址:http://www.104case.com/article/125458.htmOpenCL和DirectCompute這兩種開創性的根據幫助開發人員從單線程標量軟件轉向了多相處數據并行軟件應用。自從AMD收購ATI的3年里,通過GPU硬件加速應用的開發人員所使用的根據也經歷了巨大變革。2007年以前,除了3D應用以外,開發人員的其它應用都局限在使用Radeon卡或FirePro加速器。然后,AMD首創推出了“CloseTo Metal”(CTM)接口為早期的GPU計算先驅們提供了一系列低階的專用接口,可用于開發GPU加速應用。
一年后,AMD擴大了GPU軟件工具包,發布了ATI Stream S D K 和 B r o o k+,是一種開源的類似于C語言的工具,可使用于計算任務的AMD GPU的使用更簡化。 2010年,Khronos Group發布了跨平臺標準進行并行計算的OpenCL,以及DirectCompute這一可輔助GPU計算應用的 Windows DirectX API。OEM目前在GPU計算中已經有了2個標準工具選項。DirectCompute的數據結構兼容DirectX 10和DirectX 11應用編程接口(APi)并簡化了向上述嵌入式應用添加GPU加速的進程。
不使用Windows的OEM也可以選擇OpenCL,尤其是已經采用相似OpenGL處理獨立顯卡的情況。OpenCL支持數據并行(如SIMD)和任務并行執行2種模式。它采用兼容 OpenGL API 的數據結構,因此可以簡化向 OpenGL 應用添加GPU計算加速的步驟。AMD的OpenCL編譯器支持Radeon 4000 和 5000系列GPU和多核 x86 處理器系列。
APU信號是集成的重大突破
AMD Fusion家族處理器采用了APU(加速處理單元),因為APU集成了CPU和離散GPU,在降低功耗的同時提升了圖形數據帶寬。
盡管APU的標量x86內核和SIMD引擎共享系統內存的共同路徑,AMD的第一代設計將該內存分為多個區域,一部分由運行x86內核的操作系統管理,其它區域由運行SIMD引擎的軟件管理。AMD供應商提供了高速區塊傳輸引擎,可在x86和SIMD內存分區之間移動數據。 與外圍框架緩存和系統內存之間的傳輸不同的是,這種傳輸從不會占用系統外部總線。軟件開發人員可在其它區塊執行數據傳輸的同時,對SIMD內存進行數據存取操作。 Insight 64預測將來APU架構將發展成為更加無縫內存管理模式,允許更高級的性能擴展。
AMD架構將x86核心和GPU核心集成到了耽擱芯片,以技術為主導的OEM即可將向量運算整合到之前受到傳統多核CPU計算性能限制的程序中。向量設計強調單指令多數據(SIMD)操作,旨在為計算密集型應用提供更優越的性能。
總體系統性能也因為添加了離散GPU而提高。至今為止,晶體管的數量限制主要源于授權的雙芯片解決方案。 APU的86 CPU核心和SIMD GPU引擎共享系統內存的公共路徑,可有效防止這些限制。經過多年的辯論后,已經明了的是雙方都是正確的;現在已經不是“非此即彼”,而是“既/又”的情形。一些在數值上密集的問題可交給并行算法,其他的則不需要。當優化后用于并行計算的設備不能以并行方式運算時,設備將做誒無效的標量處理器使用,且該設備的打過書并行計算都將專為空閑。 相反的,優化后用于標量計算的處理器在很多算法中不能進行并行計算,因此受到標量處理速度的限制。標量處理器每次在數據陣列中運行一個元素。向量處理器,例如用在高級GPU中的,則可以同時支持數十個、甚至數百個計算單元同時計算。
評論