如何實現高性能的DSP處理
DMA也可以與高速緩存聯合使用。通常,DMA傳輸首先將高速外設中的數據讀入到處理器的外部存儲器,數據高速緩存則將數據從外部存儲器讀入到處理器內部。進行這種操作通常需要使用“乒乓”緩沖器,一個緩沖區用于數據傳輸,另一個用于數據處理,圖2說明了這種操作方式。DMA控制器將數據傳輸到 buffer0時,處理器核則訪問buffer1,反之亦然。
圖2:DMA和高速緩存聯合使用時數據一致性的維護。
當聯合使用DMA和高速緩存時,維持DMA控制器讀入的數據與高速緩存中數據的一致性是很重要的,圖2說明了如何完成這一操作。當外設生成新的數據,DMA控制器則將數據放置在一個新的緩沖區,并產生中斷,通知處理器核可以處理這些數據。當處理器核處理該緩沖區數據前,與該緩沖區相應的高速緩存行被設為無效,從而強制高速緩存從主存儲器中取出數據,這樣就可以確保一致性。這種方法主要的缺點是它不能達到單一DMA模型的性能,這里DMA控制器采用將緩沖區的數據直接讀入內部存儲器的模式。
指令劃分
指令劃分(instruction partitioning)通常比較簡單。如果程序代碼能容納在內部存儲器中,只需要關閉指令高速緩存,直接把程序代碼映射到內部存儲器就可以獲得最大的效能。然而,多數應用程序代碼不能全部容納在內部存儲器中,所以必須打開高速指令緩存。
高速緩存容量通常小于外部存儲器,但這并不是一個問題,因為對于多數嵌入式軟件,“通常20%的程序代碼的運行時間占整個運行時間的80%”。大多數情況下,最耗時間的程序代碼都很小,足夠放置到高速緩存中,所以高速緩存器能夠充分發揮其作用。
為了提高性能,還可以使用指令的線鎖機制(line-locking mechanism),鎖定程序的最關鍵的部分代碼。如需要進一步提高性能,可以關閉指令高速緩存并采用“存儲器覆蓋”的機制代替,該機制使用DMA將程序代碼傳輸到一個存儲器塊,而同時在另一個存儲器塊上執行操作。
數據劃分
數據劃分通常沒有指令劃分那么簡單。和程序代碼劃分一樣,如果數據緩沖區可以被容納在內部存儲器中,你就沒有多余的工作。如果不是,首要任務就是要區分靜態數據(如用于查找表)和動態數據。數據高速緩存在靜態數據方面使用較好,而DMA通常在動態數據方面性能更佳。
即使使用了數據高速緩存,也通常需要設立一個外設DMA傳輸通道,將數據從外設傳輸到外部存儲器。如果采用了數據高速緩存,可以將這些數據讀入到內部存儲器,只要在訪問數據前使高速緩存的緩沖區無效即可。如果正在使用DMA,則可以建立DMA傳輸,將數據從外部存儲器讀入到內部存儲器。
評論