新聞中心

        EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 一種文檔圖像檢索算法設(shè)計和實現(xiàn)

        一種文檔圖像檢索算法設(shè)計和實現(xiàn)

        作者: 時間:2011-07-04 來源:網(wǎng)絡(luò) 收藏

          3 實驗結(jié)果與分析

          應(yīng)用上述方法進(jìn)行了實驗,數(shù)據(jù)為手寫體英文,數(shù)據(jù)采集分辨率為100 dpi,256級灰度,數(shù)據(jù)量為100幅。對不同的分別比較它們的相似度。圖7(b)、(c)、(d)是與圖7(a)的相似度分別為40.422 9、45.760 7和43.407 8的圖像。圖8(b)、(c)、(d)是與圖8(a)原圖像版面結(jié)構(gòu)相似的幾種圖像類型。圖9(b)、(c)、(d)是與圖9(a)原圖像版面結(jié)構(gòu)具有差異的幾種圖像類型。

          本文使用對100幅圖像兩兩進(jìn)行版面結(jié)構(gòu)的匹配,共有4 950種結(jié)果。實驗結(jié)果表明,兩種不同版面的能量差異最大的在340左右,如圖10所示。橫坐標(biāo)顯示的是100幅圖像兩兩匹配出現(xiàn)的情況的數(shù)目,可以取到的最大坐標(biāo)為4 950,縱坐標(biāo)為各匹配情況對應(yīng)的能量差異,最大值350。從圖中可以看出能量差異主要集中在50~200之間。

          各個能量點的頻數(shù)的直方圖如圖11所示,圖中橫坐標(biāo)為能量差異數(shù)據(jù),最大為340左右,提取到350。縱坐標(biāo)為取到各個能量的情況的數(shù)目的累加。從圖11可以更直觀地觀察到能量差異在50~200之間的數(shù)目最多。

          實驗結(jié)果表明:(1)圖像的版面結(jié)構(gòu)具有相對的穩(wěn)定性。(2)點匹配模式計算了最小距離,可有效表示圖像的文本行基本信息。(3)距離匹配較為簡單,使用了三個維度的一維距離,有較好的區(qū)分性。對距離計算統(tǒng)計表明,具有正態(tài)分布特性。(4)點匹配模式需進(jìn)一步進(jìn)行研究,的復(fù)雜度需進(jìn)一步降低,以進(jìn)行實時圖像處理。

          本文針對文檔圖像的方法進(jìn)行了研究,提出一種文檔圖像的新方法。分析了文檔圖像版面特性,使用分割方法確定文本行,將文本行進(jìn)行標(biāo)記,找出頁面的中心點坐標(biāo),中心點坐標(biāo)將文本行的長度作為權(quán)重考慮在內(nèi),得到相對坐標(biāo)。根據(jù)相對坐標(biāo)和文本行長度得到一個差異能量,根據(jù)差異能量來進(jìn)行匹配。并對該方法進(jìn)行了實驗和結(jié)果分析。本方法的優(yōu)點是,當(dāng)文檔的行出現(xiàn)傾斜和縮放時,不影響匹配的進(jìn)行。但需要進(jìn)一步降低所用的點匹配模式時間復(fù)雜度,以進(jìn)行實時圖像處理。



        絕對值編碼器相關(guān)文章:絕對值編碼器原理
        三維掃描儀相關(guān)文章:三維掃描儀原理

        上一頁 1 2 3 下一頁

        評論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 平昌县| 尖扎县| 靖远县| 资溪县| 秀山| 贵德县| 灵丘县| 巴彦淖尔市| 南丹县| 邵阳市| 高要市| 巴南区| 延寿县| 云和县| 西丰县| 荔波县| 平和县| 玛纳斯县| 建宁县| 大荔县| 金湖县| 广宁县| 墨江| 宁远县| 屏东市| 磐石市| 济阳县| 崇信县| 高雄市| 滦南县| 敖汉旗| 兖州市| 田林县| 马龙县| 庆城县| 德阳市| 诸城市| 津南区| 定结县| 乐陵市| 东辽县|