新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > TMS320C6678存儲器訪問性能(上)

        TMS320C6678存儲器訪問性能(上)

        —— TMS320C6678存儲器訪問性能
        作者: 時間:2015-06-27 來源:網絡 收藏

          摘要

        本文引用地址:http://www.104case.com/article/276392.htm

           有8 個C66x核,典型速度是1GHz,每個核有 32KB L1D SRAM,32KB L1P SRAM和512KB LL2 SRAM;所有 DSP核共享4MB SL2 SRAM。一個64-bit 1333MTS DDR3 SDRAM接口可以支持8GB外部擴展

          訪問性能對DSP上運行的軟件是非常關鍵的。在C6678 DSP上,所有的主模塊,包括多個DSP核和多個DMA都可以訪問所有的。

          每個DSP核每個時鐘周期都可以執行最多128 bits的load或store操作。在1GHz的時鐘頻率下,DSP核訪問L1D SRAM的帶寬可以達到16GB/S。

          DSP的內部總線交換網絡,TeraNet,提供了C66x核(包括其本地存儲器),外部存儲器,EDMA控制器,和片上外設之間的互連總共有10個EDMA傳輸控制器可以被配置起來同時執行任意存儲器之間的數據傳輸。

          本文為設計人員提供存儲器訪問性能評估的基本信息;提供各種操作條件下的性能測試數據;還探討了影響存儲器訪問性能的一些因素。

          1. 存儲器系統簡介

          有8個C66x核,每個核有:

          32KB L1D(Level 1 Data) SRAM,它和DSP核運行在相同的速度上,可以被用作普通的數據存儲器或數據cache。

          32KB L1P(Level 1 Program) SRAM,它和DSP核運行在相同的速度上,可以被用作普通的程序存儲器或程序cache。

          512KB LL2(Local Level 2)SRAM,它的運行速度是DSP核的一半,可以被用作普通存儲器或cache,既可以存放數據也可以存放程序。

          所有DSP核共享4MB SL2(Shared Level 2)SRAM,它的運行速度是DSP核的一半,既可以存放數據也可以存放程序。集成一個64-bit 1333MTS DDR3 SDRAM接口,可以支持8GB外部擴展存儲器,既可以存放數據也可以存放程序。它的總線寬度也可以被配置成32bits或16bits。

          存儲器訪問性能對DSP上軟件運行的效率是非常關鍵的。在C6678 DSP上,所有的主模塊,包括多個DSP核和多個DMA都可以訪問所有的存儲器。

          每個DSP核每個時鐘周期都可以執行最多128 bits 的load 或store操作。在1GHz的時鐘頻率下,DSP核訪問L1D SRAM 的帶寬可以達到16GB/S。當訪問二級(L2)存儲器或外部存儲器時,訪問性能主要取決于訪問的方式和cache。

          每個DSP核有一個內部DMA (IDMA),在1GHz的時鐘頻率下,它能支持高達8GB/秒的傳輸。但IDMA只能訪問L1和LL2以及配置寄存器,它不能訪問外部存儲器。

          DSP的內部總線交換網絡,TeraNet,提供了C66x核 (包括其本地存儲器) ,外部存儲器, EDMA控制器,和片上外設之間的互聯??偣灿?0個EDMA傳輸控制器可以被配置起來同時執行任意存儲器之間的數據傳輸。芯片內部有兩個主要的TeraNet模塊,一個用128 bit總線連接每個端點,速度是DSP 核頻率的1/3,理論上,在1GHz的器件上每個端口支持 5.333GB/秒的帶寬;另一個TeraNet內部總線交換網絡用256 bit總線連接每個端點,速度是DSP核頻率的1/2,理論上,在1GHz的器件上每個端口支持16GB/秒的帶寬。

          總共有10個EDMA傳輸控制器可以被配置起來同時執行任意存儲器之間的數據傳輸。它們中的兩個連接到256-bit, 1/2 DSP核速度的 TeraNet內部總線交換網絡;另外8個連接到128-bit, 1/3 DSP核速度的TeraNet內部總線交換網絡。

          圖1展示了TMS320C6678的存儲器系統??偩€上的數字代表它的寬度。大部分模塊運行速度是DSP核時鐘的1/n,DDR的典型速度是1333MTS(Million Transfer per Second)。

          

         

          圖1 TMS320C6678 存儲器系統

          本文為設計人員提供存儲器訪問性能評估的基本信息;提供各種操作條件下的性能測試數據;還探討了影響存儲器訪問性能的一些因素。

          本文對分析以下常見問題會有所幫助:

          1. 應該用DSP核還是DMA來拷貝數據?

          2. 一個頻繁訪問存儲器的函數會消耗多少時鐘周期?

          3. 當多個主模塊共享存儲器時,對某個模塊的性能會有多大的影響?

          本文中的大部分數據是在C6678 EVM(EValuation Module)板上測試得到的,它上面有64-bit 1333MTS的DDR 存儲器。

          2. DSP核,EDMA3,IDMA拷貝數據的性能比較

          數據拷貝的帶寬由下面三個因素中最差的一個決定:

          1. 總線帶寬

          2. 源端吞吐量

          3. 目的端吞吐量

          表1 總結了C6678 上C66x 核,IDMA 和EDMA 的理論帶寬。

          

         

          表1 1GHz C6678上C66x核,IDMA和EDMA的理論帶寬

          表2 總結了C6678 EVM(64-bit 1333MTS DDR)上各種存儲器端口的理論帶寬。

          

         

          表2 1GHz C6678上各種存儲器端口的理論帶寬

        存儲器相關文章:存儲器原理



        上一頁 1 2 3 下一頁

        關鍵詞: TMS320C6678 存儲器

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 库尔勒市| 华坪县| 鸡泽县| 长宁县| 太仓市| 随州市| 荆州市| 长寿区| 松潘县| 上林县| 罗源县| 磴口县| 定结县| 漳浦县| 贵南县| 南漳县| 芮城县| 通城县| 甘德县| 顺昌县| 阳新县| 景宁| 迁西县| 鄢陵县| 疏勒县| 平定县| 敦化市| 双流县| 柯坪县| 湾仔区| 平陆县| 门头沟区| 武乡县| 沿河| 和田县| 剑川县| 巴东县| 贵溪市| 秀山| 万州区| 灌云县|