三維掃描儀:機器視覺簡介
三維掃描儀機器視覺是研究用計算機來模擬生物外顯或宏觀視覺功能的科學和技術。機器視覺系統的首要目標是用圖像創建或恢復現實世界模型,然后認知現實世界。機器視覺系統獲取的場景圖像一般是灰度圖像,即三維場景在二維平面上的投影。此時,場景三維信息只能通過灰度圖像或灰度圖像序列來恢復處理,這種恢復需要進行多點對一點的映射逆變換。在信息恢復過程中,還需要有關的場景知識和投影幾何知識。
三維掃描儀機器視覺是一個相當新且發展十分迅速的研究領域,并成為計算機科學的重要研究研究領域之一。機器視覺是在20 世紀50 年代從統計模式識別開始的,當時的工作主要集中在二維圖像分析和識別上,如光學字符識別、工件表面、顯微圖片和航空圖片的分析和解釋等。60 年代,Roberts (1965)通過計算機程序從數字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結構,并對物體形狀及物體的空間關系進行描述。Roberts 的研究工作開創了以理解三維場景為目的的三維機器視覺的研究。Roberts對積木世界的創造性研究給人們以極大的啟發,許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復雜的三維場景。于是,人們對積木世界進行了深入的研究。研究的范圍從邊緣、角點等待征提取,到線條、平面、曲面等幾何要素分析,—直到圖像明暗、紋理、運動以及成像幾何等,并建立了各種數據結構和推理規則。到了70 年代,已經出現了一些視覺應用系統。
70 年代中期,麻省理工學院(MIT)人工智能(AI)實驗室正式開設“機器視覺”(Machine Vision)課程,由國際著名學者B.K.P.Horn 教授講授.同時,MIT AI實驗室吸引了國際上許多知名學者參與機器視覺的理論、算法、系統設計的研究。David Marr 教授就是其中的一位。他于1973 年應邀在MIT AI 實驗室領導一個以博士生為主體的研究小組,1977 年提出了不同于“積木世界”分析方法的計算視覺(computational vision)理論,該理論在80 年代成為機器視覺研究領域中的一個十分重要的理論框架。
Marr 視覺計算理論立足于計算機科學,系統地概括了心理生理學、神經生理學等方面業已取得的所有重要成果。是三維掃描儀視覺研究中迄今為止最為完善的視覺理論。Marr建立的視覺計算理論,使計算機視覺研究有了一個比較明確的體系,并大大推動了計算機視覺研究的發展。人們普遍認為,計算機視覺這門學科的形成與Marr 的視覺理論有著密切的關系。Marr 視覺計算理論將整個視覺過程所要完成的任務分成三個過程,而獲得這些表示的過程依次稱為初級視覺、中級視覺和高級視覺,如圖1 所示。
Marr 視覺過程中的三個階段
補充的Marr 理論框架
評論