新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 一種ASIC硬件圖像匹配最大互相關算法的設計和實現

        一種ASIC硬件圖像匹配最大互相關算法的設計和實現

        作者: 時間:2011-07-05 來源:網絡 收藏

          2.1 專用器件LS9501介紹

          LS9501[2]是西安微電子技術研究所根據的特點研制成功的一個高速[20M]二維具有3x3內核的卷積器,它的主要功能是可同時對9對象素值乘加運算,即:.LS9501的輸入是二維無符號8位的數據,輸出是無符號20位卷結果和二維串行移位無符號8位的圖像數據。其內部結構采用流水線并行技術,主要的功能單元有寄存器組、快速乘法器、加法器和控制電路,如圖2所示。電路中設置的兩組寄存器A和B由9個8位的移位寄存器構成,可存放9個圖像象素數據。9個快速乘法器可保證在每一個時鐘內同時進行9對圖像數據相乘。其工作原理為:向A寄存器輸入9個實時圖象素數據后,再向B寄存器輸入入九個基準圖像素數據,當9對象素值輸入完后,經過一定時間延遲,即可得到卷積結果。此后,如A寄存器的數據不變,B寄存器繼續輸入數據,則每輸入一個數據,即可獲得一個9個圖像象素數據卷積結果。如果將多個LS9501卷積器級連起來,可更多對象素數據的卷積運算。例如,將4個LS9501級連,可實現36對象素數據的卷積,但要將4個卷積器的結果加起來,才能得到最后的結果。為此,西安微電子技術研究所研制了級連加法器LS9502,它的功能是在60ns內將4LS9501的輸出結果求和。

          3 圖像計算機結構

          將4個卷積器LS8501和級連加法器LS9501組合起來作為TMS320C30數字信號處理器的快速協處理器部件,可組成高速的單DSP+多系統結構的嵌入式計算機,如圖3所示。其工作過程為:首先TMS320C30按一定次序把36個實時圖象素數據從實時圖存儲器中取出并輸入LS9501的A寄存器中,然后,從基準圖存儲中將基準圖像素數據輸入B寄存器。輸入36個基準圖像素數據后,經過一定時間延遲,即可讀出第一個36對圖像象素數據卷積結果。此后即建立起流水,每輸入一個基準圖數據可得到相應36對圖像象素數據卷積結果,直至對整個基準圖匹配計算完。當實時圖比較大時,可把實時圖分成若干子圖,然后對每一個子圖分別進行卷積運算,最后再把它們的結果加在一起。這樣,工作量的匹配計算任務由LS8501完成,TMS320C30將各個圖匹配結果進行累加,求值,并對卷器控制輸入8位灰度圖像數據。

          4 圖像匹配結果與討論

          在上述圖像匹配計算機中,采用美國TI公司的TMS320C30(33M)DSP芯片主為處理器,4片關并行的LS9501和級連加法器LS9502組成圖像匹配協處理器,外部圖像存儲器讀寫為零等待狀態。根據組成的計算機系統結構,把36x36的實時圖分成36個4x9的子圖,然后計算每一子圖與相應基準圖子圖卷積,最后把各個子圖卷積結果累加在一起。通過編寫TMS320C30匯編程序,對不同大小實時圖和基準圖進行搜索(即匹配所有(M-N+1)2個子圖)互相差匹配運算,運算結果匹配位置正確。匹配運算時間如表2所示(對基準圖像素數據預處理,不計運算時間)。

          表2 實時圖和基準圖匹配運算時間

        圖像大小運算時間/ms
        實時較基準圖由單DSP執行由DSP+ABIC執行
        36×36128×1283081623
        36×36150×1504645946

          從表2可看出,采用專用集成電路LS9501可大大加快圖像匹配運算速度,而且編程比較簡單,實現容易,實測結果令人滿意的。

          本研究為國家九五預研項目高速數字信號處理機技術的一部分,已通過國家驗收,并已應用于高速圖像計算機中。這一研究的成功使我們看到了打破西方禁售策略的簡單可行的方法。在實驗中我們發現LS9501具有非常大的提高其實時性的潛力,現分析如下:

          在實驗中發現,LS9501內部圖像數據移位寄存器時鐘和3級加法器寄存器時鐘不為同一時鐘,這使得卷積模塊的并行效率大為降低。如果將其改進為同一時鐘,那篤在圖3所示單機系統結構中,對(36x36)實時圖與(128x128)或(150x150)基準圖圖像匹配時間將分別為394ms和592ms,圖像匹配速度提高約1倍(軟件模擬)。另外在實驗的單機系統結構中,卷積模塊完全靠TMS320C30控制,其時鐘輸入依賴TMS320C30讀寫信號,而且TMS329C30對外部存儲器連續時讀寫信號不變化[1],必須加NOP指令以使讀寫信號變化。這樣LS9501的性能沒有得到完全發揮,而且TMS320C30也不能處理其它任務,二者依賴性太大,相互制約,并行度和實時性難以得到提高。卷積模塊發展為智能卷積處理器,那么結構右發展為主從式雙機計算機系統結構:主機為DSP,從機為卷積處理器。這種系統結構可使DSP與卷積器的依賴 性降到最低,提高任務級并行性,也可最大限揮LS9501的性能,從而提高圖像匹配的速度。在不增加單芯片實現的卷積規模條件下,開發更高速度的LS9501,同樣可提高圖像匹配的速度。不容質疑,提高單芯片實現的卷積規模必將較大地提高圖像匹配的速度。

          由實驗結構及以上分析可以預見,圖像匹配最大互的專用實現方法是一個簡單可行的方法,并具有很好的發展前景,完全可以開發體積小、成本低、速度與TI公司C6000系列高性能DSP的速度相比美的卷積處理器。


        上一頁 1 2 下一頁

        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 吉安市| 永春县| 方正县| 泾阳县| 河北区| 乌拉特中旗| 遂川县| 青龙| 于田县| 聊城市| 即墨市| 古田县| 滁州市| 进贤县| 阿巴嘎旗| 翁牛特旗| 台东市| 蓝山县| 宁波市| 汾阳市| 壶关县| 镇原县| 大冶市| 鄂伦春自治旗| 巴彦淖尔市| 长武县| 余干县| 策勒县| 建阳市| 巴中市| 霍林郭勒市| 色达县| 石景山区| 嘉禾县| 大竹县| 保定市| 临江市| 新巴尔虎右旗| 临桂县| 云安县| 西林县|