新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > SAM4E單片機之旅——24、使用DSP庫求向量數量積

        SAM4E單片機之旅——24、使用DSP庫求向量數量積

        作者: 時間:2017-05-08 來源:網絡 收藏

          DSP(Digital Signal Processing,數字信號處理)中會使用大量的數學運算。Cortex-M4中,配置了一些強大的部件,以提高DSP能力。同時CMSIS提供了一個DSP庫,提供了許多數學函數的高效實現。

        本文引用地址:http://www.104case.com/article/201705/358888.htm

          這次就先做一個簡單的嘗試,求兩個向量的數量積。

          一、 硬件

            

        image

         

          MAC單元

          MAC(Multiply-ACcumulate,乘積累加),是DSP中常用的一種運算。Cortex-M4配置了一個32位的MAC單元,它能在1個周期里實現最高難度為32位乘32位再加64位的運算,或是兩個16位乘16位的運算。Cortex-M4支持的MAC指令如下,這些指令都能在1個周期內完成:

            

        image

         

          SIMD

          SIMD(Single Instruction Multiple Data,單指令多數據),可以提高DSP時的計算效率。這在Cortex-M3中不可用的。使用Cortex-M4的SIMD指令,可以在一個周期內并行地完成4個8位數的加減,或是2個16位數的加減。

          FPU

          FPU是Cortex-M4增加的可選的部件(配備了FPU)。其實現了單精度的浮點數運算,包括一些MAC運算:

            

        image

         

          二、 使用CMSIS的DSP庫

          CMSIS中,提供了一個DSP庫。這里對DSP中常用的數學運算做了很高效的實現。而對于Cortex-M4,其實現也針對SIMD進行了優化。

          在CMSISInclude文件夾中,頭文件arm_math.h 聲明了這些函數。而在CMSISLibGCC 中,有針對各平臺編譯好了的靜態庫文件。在CMSISDSP_LibSource 中,有DSP的實現源碼。

          而在使用arm_math.h 文件的過程中,需要根據目標平臺預定義宏ARM_MATH_CM4,ARM_MATH_CM3 或ARM_MATH_CM0 。而若需要使用FPU,則需要在設備頭文件(如sam4e16e.h)中將宏__FPU_PRESENT 的值定義為1。

          在AS6中,默認已經添加了DSP的支持。

          進入工程屬性的toolchain選項卡,可以在ARM/GNU C Complier的Directories中選擇編譯時搜索頭文件的路徑。AS6在建立工程時,就會一些需要的頭文件拷貝到工程目錄下,同時做好了路徑設置。比如AS6已經把arm_math.h 拷貝到下圖中方框指出的路徑了:

            

        image

         

          在ARM/GNU Linker的Libraries選項中,可以選擇鏈接時使用的庫以及庫的路徑。同樣,AS6已經把靜態庫文件拷貝到了工程目錄下,且設置好了文件:

            

        image

         

          在ARM/GNU C Complier的Symbols選項中,可以設置預定義的宏。可以在這里聲明說明DSP的目標平臺的宏ARM_MATH_CM4:

            

        image

         

          在設備頭文件件中聲明__FPU_PRESENT 的值。如果有FPU,則將該宏定義為1,否則定義為0。CMSIS已經做好了定義:

          //File: …srcASFsamutilscmsissam4eincludesam4e16e.h

          //Line: 266

          /**< 16E does provide a FPU */

          #define __FPU_PRESENT 1

          另外,如果不使用AS6提供的startup文件,或者需要在自己的代碼中使用FPU的話,還需要做額外的設置。相關內容在FPU的示例中做了說明。

          三、 簡單示例

          DSP庫里有計算向量數量積的函數。DSP庫的函數支持多種類型的定點數,且對于配備了FPU的部件,也支持浮點數。所以只需要簡單地調用下所需函數即可:

          // 向量為(0.0, 1.1, 2.2, ..., 16.5)

          const int VEC_SIZE = 16;

          float32_t vec[VEC_SIZE];

          for (int i = 0; i < VEC_SIZE; ++i)

          vec[i] = 1.1f * i;

          // 計算向量與自身的數量積

          float32_t result = 0;

          arm_dot_prod_f32(vec, vec, VEC_SIZE, &result);

          // result == 1500.4

          查看arm_dot_prod_f32() 的實現,發現其已經為了效率進行了循環展開。而查看另外一些有關定點數的運算,可以發現其實現已經使用了SIMD等特殊指令;有些甚至針對內存訪問的延遲進行了優化。不難看出,這個庫的實現進行了細致優化的。

          另外,除了基本的數學函數,DSP庫也實現了快速數學函數(三角函數、開平方等)、實數相關、矩陣運算、統計、濾波、變換(FFT等)、馬達控制等功能。arm_math.h 中,已經對各個函數的功能、參數意義等做了詳細的說明。



        關鍵詞: SAM4E

        評論


        技術專區

        關閉
        主站蜘蛛池模板: 定南县| 新宁县| 阿合奇县| 枝江市| 方正县| 祥云县| 肇东市| 永川市| 蓬溪县| 九龙城区| 浦东新区| 林州市| 江津市| 海丰县| 郯城县| 米易县| 自贡市| 柳州市| 来安县| 隆化县| 绥德县| 江北区| 临安市| 宣武区| 保山市| 徐州市| 陇川县| 长岛县| 关岭| 汨罗市| 灵台县| 邵阳县| 景东| 灯塔市| 浏阳市| 鲁甸县| 专栏| 宝清县| 绍兴市| 遂昌县| 宣城市|