計(jì)算機(jī)視覺(jué)研究領(lǐng)域范文
時(shí)間:2024-01-12 17:49:30
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇計(jì)算機(jī)視覺(jué)研究領(lǐng)域,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
Abstract: This paper puts forward the camera calibration method in computer vision, through analysis of principle of computer vision, and analyzes the application of camera calibration methods in computer vision.
關(guān)鍵詞: 計(jì)算機(jī);視覺(jué);攝像機(jī);定標(biāo)
Key words: computer;visual;camera;scaling
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2013)24-0193-02
0 引言
在計(jì)算機(jī)技術(shù)快速發(fā)展的今天,人們?cè)絹?lái)越依賴于計(jì)算機(jī),計(jì)算機(jī)在人們的生活工作中占有重要的地位。計(jì)算機(jī)中的各種應(yīng)用層出不窮,廣泛應(yīng)用在各個(gè)領(lǐng)域,計(jì)算機(jī)視覺(jué)在攝像中的應(yīng)用為攝像機(jī)定標(biāo)方法提供了巨大的參考價(jià)值。由于人們對(duì)攝像機(jī)拍攝效果的要求,使得攝像機(jī)在不斷改革更新,攝像機(jī)的定標(biāo)方法是攝像機(jī)研究領(lǐng)域備受關(guān)注的話題。計(jì)算機(jī)視覺(jué)中攝像機(jī)的定標(biāo)方法是攝像機(jī)研究領(lǐng)域所推崇的,它受到了研究人員的高度重視。計(jì)算機(jī)視覺(jué)中攝像機(jī)的定標(biāo)方法呈現(xiàn)出了高質(zhì)量的攝像效果,極大地滿足了人們對(duì)攝像機(jī)攝像效果的要求。
1 計(jì)算機(jī)視覺(jué)投影原理
計(jì)算機(jī)視覺(jué)投影原理是利用光的折射現(xiàn)象,把視覺(jué)中呈現(xiàn)的影像投射到攝影機(jī)的屏幕上,形成了固定的圖像。在計(jì)算機(jī)視覺(jué)中攝影機(jī)的成像原理就是利用光的感應(yīng),通過(guò)對(duì)攝像機(jī)的焦距進(jìn)行調(diào)整,確定拍攝目標(biāo)在攝像機(jī)鏡頭中的位置,然后利用光的折射形成固定的圖像。在進(jìn)行攝像時(shí)調(diào)整焦距是非常關(guān)鍵的,焦距就是鏡頭與目標(biāo)之間的距離,這兩者距離的遠(yuǎn)近決定了攝像的效果。如果焦距太遠(yuǎn)的話,目標(biāo)成像就會(huì)非常小甚至是模糊。如果焦距太近的話,目標(biāo)成像會(huì)很大也會(huì)導(dǎo)致無(wú)法看清圖像,所以調(diào)整焦距是非常必要的,只有調(diào)好了焦距才會(huì)形成高質(zhì)量的圖像。
2 計(jì)算機(jī)視覺(jué)中的攝像機(jī)定標(biāo)方法
2.1 三維立體定標(biāo)法 攝像機(jī)的成像往往都是三維立體的,把圖形通過(guò)每個(gè)立體面詳細(xì)的表現(xiàn)出來(lái),以達(dá)到完美的效果。要想達(dá)到三維立體的效果在對(duì)攝像目標(biāo)的位置進(jìn)行確定時(shí),就要找出目標(biāo)的三維坐標(biāo)點(diǎn),以便接下來(lái)的攝像工作可以順利進(jìn)行。然后在圖像投影中找到對(duì)應(yīng)的三維坐標(biāo),這一步?jīng)Q定了整個(gè)攝像過(guò)程的設(shè)計(jì)方案。最后確定目標(biāo)在攝影鏡頭中的實(shí)際三維坐標(biāo),根據(jù)鏡頭中目標(biāo)的實(shí)際三維坐標(biāo)形成具體的圖像。三維立體定標(biāo)方法的操作原理就是把目標(biāo)的三維投影進(jìn)行分步成像,和實(shí)際成像效果相聯(lián)系,形成鏡頭中具體的三維圖像。在計(jì)算機(jī)視覺(jué)中把三維成像圖進(jìn)行處理,對(duì)三維定標(biāo)的參數(shù)進(jìn)行分析,找出最優(yōu)的三維成像方法,使攝像機(jī)呈現(xiàn)出高質(zhì)量的攝像效果。
2.2 平面定標(biāo)法 平面定標(biāo)法就是利用多個(gè)成像平面對(duì)目標(biāo)的位置進(jìn)行分析,選擇合適的成像平面對(duì)目標(biāo)進(jìn)行位置的確定。每個(gè)平面的成像都是不同的,由于每個(gè)平面的成像都是在運(yùn)動(dòng)的,所以應(yīng)該在攝像機(jī)與目標(biāo)之間的平面內(nèi)找到一個(gè)點(diǎn),來(lái)分析目標(biāo)與攝像機(jī)之間的成像規(guī)律,然后根據(jù)這一規(guī)律對(duì)目標(biāo)進(jìn)行定標(biāo),使攝像機(jī)中運(yùn)動(dòng)的目標(biāo)給人們帶來(lái)不一樣的感受。隨著目標(biāo)的不斷運(yùn)動(dòng),攝像機(jī)與目標(biāo)之間平面內(nèi)的點(diǎn)會(huì)越來(lái)越多,對(duì)物體的定標(biāo)會(huì)受到這些點(diǎn)的影響,物體定標(biāo)的準(zhǔn)確度也越來(lái)越高,為攝像機(jī)定標(biāo)提供了可靠的信息支持,會(huì)減少攝像機(jī)定標(biāo)的成本,提高了攝像的經(jīng)濟(jì)效益。相比三維立體定標(biāo)法,平面定標(biāo)的精確度更高,定標(biāo)所用的時(shí)間相對(duì)較短,所以平面定標(biāo)法在攝像研究領(lǐng)域中值得推廣。
2.3 雙平面定標(biāo)法 所謂的雙平面定標(biāo)法就是利用鏡頭與目標(biāo)之間的兩個(gè)平面的成像點(diǎn)來(lái)進(jìn)行定標(biāo),不需要成像平面上的光線通過(guò)平面中心,只要選取兩個(gè)平面之間任意兩點(diǎn)坐標(biāo)來(lái)對(duì)定標(biāo)參數(shù)進(jìn)行計(jì)算分析,得出具體的成像圖。這種定標(biāo)方式不受平面中心的影響可以在任意點(diǎn)上成像,減少了定標(biāo)參數(shù)的數(shù)量,提高了定標(biāo)的工作效率。但是由于雙平面定標(biāo)法只是任意選取兩平面上的點(diǎn),對(duì)定標(biāo)的精確度造成了一定的影響,使計(jì)算機(jī)對(duì)參數(shù)的運(yùn)算缺少可靠的數(shù)據(jù)支持,一定程度上降低了攝像機(jī)的成像清晰度,使計(jì)算機(jī)視覺(jué)中攝像機(jī)的定標(biāo)精度存在一定的偏差,呈現(xiàn)出來(lái)的具體圖像質(zhì)量相對(duì)比較差。
2.4 直線兩點(diǎn)定標(biāo)法 在三維立體和平面定標(biāo)法的基礎(chǔ)上,又進(jìn)一步研究了直線兩點(diǎn)定標(biāo)法,極大程度上滿足了人們對(duì)攝像效果的要求。直線兩點(diǎn)定標(biāo)法是利用定標(biāo)物與攝像機(jī)鏡頭之間的直線上的兩點(diǎn)進(jìn)行定標(biāo)。然后通過(guò)計(jì)算機(jī)視覺(jué)對(duì)這兩點(diǎn)的坐標(biāo)參數(shù)進(jìn)行分析,然后攝像機(jī)利用這些參數(shù)對(duì)攝像機(jī)的焦距進(jìn)行調(diào)整,確定物體的具置。在三維立體和平面定標(biāo)的基礎(chǔ)上對(duì)計(jì)算機(jī)視覺(jué)程序進(jìn)行改進(jìn)升級(jí),進(jìn)一步提高對(duì)物體定標(biāo)的精確度。對(duì)原有定標(biāo)方法進(jìn)行創(chuàng)新改進(jìn)得出了直線兩點(diǎn)定標(biāo)法使定標(biāo)參數(shù)的數(shù)量大幅度的下降,節(jié)省了很多的人工成本,攝像機(jī)的清晰度也會(huì)大大提高。
2.5 透視變換焦距的定標(biāo)法 透視變換焦距定標(biāo)法是通過(guò)分析鏡頭與目標(biāo)之間的距離,不斷調(diào)整兩者之間的距離使鏡頭里呈現(xiàn)出來(lái)的圖形清晰為止,然后就將現(xiàn)在的目標(biāo)設(shè)置為定標(biāo)物。由于這種定標(biāo)方法不用去分析具體的定標(biāo)參數(shù)被人們廣泛的應(yīng)用。隨著科技的發(fā)展現(xiàn)在的攝像機(jī)都有自動(dòng)調(diào)整焦距功能,不用人為的去調(diào)整焦距,使定標(biāo)物更快地呈現(xiàn)在鏡頭中,節(jié)省了大量的定標(biāo)時(shí)間,計(jì)算機(jī)的運(yùn)算速度也加快了。但是這種定標(biāo)方法也存在一定的缺陷,在實(shí)際操作如果不考慮攝像環(huán)境以及攝像鏡頭的變化,定標(biāo)的精確度會(huì)存在一定的偏差,導(dǎo)致鏡頭中的定標(biāo)物成像不清晰。
3 計(jì)算機(jī)視覺(jué)中攝像機(jī)定標(biāo)方法的應(yīng)用
3.1 在計(jì)算機(jī)視覺(jué)中攝像機(jī)的主動(dòng)定標(biāo) 計(jì)算機(jī)視覺(jué)中攝像機(jī)的定標(biāo)方法推動(dòng)了計(jì)算機(jī)技術(shù)在攝像機(jī)中的廣泛應(yīng)用。計(jì)算機(jī)視覺(jué)中攝像機(jī)的主動(dòng)定標(biāo)是計(jì)算機(jī)技術(shù)在攝像機(jī)中的顯著應(yīng)用。計(jì)算機(jī)技術(shù)使攝像機(jī)在定標(biāo)過(guò)程中主動(dòng)尋找定標(biāo)物,使焦距和視角很好地配合,充分發(fā)揮計(jì)算機(jī)視覺(jué)在攝像機(jī)中的成像原理,把定標(biāo)方法合理地運(yùn)用在攝像機(jī)主動(dòng)定標(biāo)過(guò)程中,使攝像機(jī)的清晰度得到大幅度地提升。
3.2 分層次進(jìn)行攝像機(jī)的定標(biāo) 隨著計(jì)算機(jī)技術(shù)在攝像機(jī)定標(biāo)中的不斷發(fā)展更新,攝影者喜歡分層次地進(jìn)行定標(biāo),把自己的觀點(diǎn)融入到攝像機(jī)定標(biāo)過(guò)程中,用自己的思維對(duì)定標(biāo)參數(shù)進(jìn)行分析,利用計(jì)算機(jī)視覺(jué)成像原理把定標(biāo)物直觀的反映在計(jì)算機(jī)上,以便更好的對(duì)定標(biāo)物進(jìn)行分析,以其中一個(gè)定標(biāo)物的成像平面來(lái)確定定標(biāo)物的具體成像圖,使攝像機(jī)鏡頭中的定標(biāo)物圖像可以更清晰。這種分層次的定標(biāo)使計(jì)算機(jī)技術(shù)可以更好的應(yīng)用在攝像機(jī)定標(biāo)過(guò)程中,呈現(xiàn)出高質(zhì)量的攝像效果。
4 總結(jié)
在計(jì)算機(jī)視覺(jué)中攝像機(jī)的定標(biāo)方法都是可行的,但各種方法都存在一定的缺陷,所以在實(shí)際應(yīng)用中還應(yīng)該根據(jù)攝影環(huán)境以及攝影機(jī)的質(zhì)量選擇最優(yōu)的定標(biāo)方法,保證定標(biāo)參數(shù)的準(zhǔn)確性,在鏡頭里呈現(xiàn)出清晰的成像。針對(duì)計(jì)算機(jī)視覺(jué)中攝像機(jī)定標(biāo)方法的缺陷,攝像機(jī)的研究領(lǐng)域應(yīng)該要不斷更新攝像機(jī)定標(biāo)方法,提高攝像機(jī)定標(biāo)的精確度,不斷滿足人們對(duì)攝像機(jī)清晰度的要求,呈現(xiàn)出清晰的攝像效果。
參考文獻(xiàn):
[1]邱茂林,馬頌德,李毅.計(jì)算機(jī)視覺(jué)中攝像機(jī)定標(biāo)綜述[J].自動(dòng)化學(xué)報(bào),2000(1).
[2]伍雪冬,蔣新華,李建興,黃靖.計(jì)算機(jī)視覺(jué)中傳統(tǒng)攝像機(jī)定標(biāo)方法綜述[J].福建工程學(xué)院學(xué)報(bào),2007(1).
篇2
關(guān)鍵詞:三目攝像機(jī);標(biāo)定;立體視覺(jué);外部參數(shù)
一、緒論
1.1研究的背景及意義
計(jì)算機(jī)視覺(jué)是當(dāng)今極為重要的學(xué)科之一,它在具有很強(qiáng)的挑戰(zhàn)性的同時(shí)又擁有廣泛的應(yīng)用前景和實(shí)用價(jià)值。計(jì)算機(jī)視覺(jué)以視覺(jué)理論為中心,以圖像處理、模式識(shí)別、計(jì)算機(jī)技術(shù)和生理學(xué)、心理學(xué)為基礎(chǔ),研究?jī)?nèi)容主要有兩個(gè)方面:一是開(kāi)發(fā)從輸入圖像數(shù)據(jù)自動(dòng)構(gòu)造場(chǎng)景描述的圖像處理系統(tǒng);二是理解人類視覺(jué)機(jī)理,用機(jī)器代替人去做人類難以達(dá)到或根本無(wú)法達(dá)到的工作[1]。
計(jì)算機(jī)視覺(jué)應(yīng)用的廣泛性體現(xiàn)在其不僅用于文字、指紋、面部、商標(biāo)以及圖像數(shù)據(jù)庫(kù)、檢測(cè)集成電路芯片、多媒體技術(shù)這些圖像方面,還應(yīng)用到機(jī)器人導(dǎo)航、工業(yè)檢測(cè)和產(chǎn)品的自動(dòng)裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識(shí)別以及重建上?,F(xiàn)如今,計(jì)算機(jī)視覺(jué)已經(jīng)應(yīng)用到機(jī)器人、地理、醫(yī)學(xué)、物理、化學(xué)、天文等各大的研究領(lǐng)域。
作為多個(gè)學(xué)科交叉與融合中心的計(jì)算機(jī)視覺(jué),攝像機(jī)是其研究的重要工具,而攝像機(jī)標(biāo)定又是計(jì)算機(jī)視覺(jué)研究的一個(gè)關(guān)鍵問(wèn)題,故攝像機(jī)的標(biāo)定越來(lái)越受到廣泛的重視。攝像機(jī)標(biāo)定是通過(guò)物體空間上的點(diǎn)與圖像中的對(duì)應(yīng)點(diǎn)的幾何關(guān)系,來(lái)確定攝像機(jī)的內(nèi)外參數(shù)的過(guò)程。標(biāo)定結(jié)果是否準(zhǔn)確影響著三維測(cè)量的精度和三維重建的結(jié)果,而且實(shí)時(shí)的標(biāo)定更能滿足自動(dòng)導(dǎo)航機(jī)器視覺(jué)的需要[2]。
伴隨著應(yīng)用的發(fā)展,攝像機(jī)廣泛地被應(yīng)用于三維立體的測(cè)量、視覺(jué)檢測(cè)、運(yùn)動(dòng)檢測(cè)等領(lǐng)域。由此,對(duì)攝像機(jī)標(biāo)定的精度要求也日益增加。攝像機(jī)標(biāo)定結(jié)果的優(yōu)劣影響了計(jì)算機(jī)視覺(jué)在各領(lǐng)域的應(yīng)用。攝像機(jī)標(biāo)定的準(zhǔn)確與否,對(duì)能否提高計(jì)算機(jī)視覺(jué)在各領(lǐng)域測(cè)量的準(zhǔn)確度有重要影響[3]。因此,研究攝像機(jī)標(biāo)定方法具有重要的理論研究意義和實(shí)際應(yīng)用價(jià)值。
1.2攝像機(jī)標(biāo)定技術(shù)研究的發(fā)展及現(xiàn)狀
攝像機(jī)有一個(gè)圖像平面和提供三維空間到圖像平面轉(zhuǎn)換的鏡頭。由于鏡頭會(huì)產(chǎn)生畸變,不能把這個(gè)轉(zhuǎn)化過(guò)程簡(jiǎn)單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實(shí)數(shù)據(jù),而其精確性則依靠于建立的模型及模型參數(shù)的準(zhǔn)確性。
首先進(jìn)行攝像機(jī)標(biāo)定工作的是加拿大的Deville,他于1910年建立實(shí)驗(yàn)室,使用多個(gè)瞄準(zhǔn)儀對(duì)他的“測(cè)量攝像機(jī)”(surveying camera)進(jìn)行標(biāo)定[4]。上個(gè)世紀(jì)三十年代后期,美國(guó)標(biāo)準(zhǔn)局發(fā)明了一種精確鏡頭,用來(lái)檢測(cè)攝像機(jī),同時(shí)將它用在攝像機(jī)標(biāo)定上。四十年代后期,該項(xiàng)工作得到進(jìn)一步加深,有了更多對(duì)高精度的需求和對(duì)易操作設(shè)備的需求。1955年,Carman出版了 《棋盤(pán)平面度的干涉測(cè)量和控制》,該書(shū)引起了社會(huì)各界對(duì)攝像機(jī)標(biāo)定的關(guān)注。二戰(zhàn)時(shí)期,隨著飛機(jī)的大規(guī)模使用,航空攝影與制圖興起,為得到更加精確的測(cè)量結(jié)果,對(duì)攝像機(jī)鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術(shù)發(fā)展最為迅速的時(shí)間段。在這期間,各種鏡頭像差的表達(dá)式逐步被提出并且得到普遍認(rèn)同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻(xiàn),他們導(dǎo)出了近焦距情況下給定位置處徑向畸變表達(dá)式并證明了近焦距情況下測(cè)量出鏡頭兩個(gè)位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達(dá)式成為后來(lái)各攝像機(jī)的標(biāo)定非線性模型的基礎(chǔ)。這段時(shí)間里,研究的重點(diǎn)是如何校正鏡頭與用何種方法補(bǔ)償鏡頭像差,這些研究對(duì)促進(jìn)各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡(jiǎn)便的攝像機(jī)標(biāo)定方法,該方法介于傳統(tǒng)標(biāo)定和自標(biāo)定之間,操作方便靈活,能夠得到不錯(cuò)的精度,滿足了眾多擁有桌面視覺(jué)系統(tǒng)的用戶在攝像機(jī)標(biāo)定方面的需求。
1.3本文的主要研究?jī)?nèi)容
本文的主要研究多個(gè)攝像機(jī)的標(biāo)定問(wèn)題。標(biāo)定主要是對(duì)攝像機(jī)內(nèi)外參的測(cè)量計(jì)算,利用這些參數(shù)對(duì)多個(gè)攝像機(jī)識(shí)別的物體尺寸進(jìn)行衡量并建立起多攝像機(jī)系統(tǒng)的數(shù)字環(huán)境。
論文的內(nèi)容包括:
第一章為緒論,介紹攝像機(jī)標(biāo)定相關(guān)的研究背景、國(guó)內(nèi)外研究現(xiàn)狀。
第二章為攝像機(jī)標(biāo)定理論基礎(chǔ):主要介紹標(biāo)定的坐標(biāo)系與待標(biāo)定的參數(shù)。
第三章提出本文的多攝像機(jī)標(biāo)定方法與實(shí)驗(yàn)過(guò)程。
第四章進(jìn)行全文的總結(jié)。
二、攝像機(jī)標(biāo)定方法研究
2.1攝像機(jī)標(biāo)定原理
攝像機(jī)通過(guò)透鏡將三維物體投影到--維圖像平面上,這個(gè)成像變換的過(guò)程稱為攝像機(jī)成像模型。攝像機(jī)成像模型有多種,最常用的為小孔成像模型。由于實(shí)際的攝像機(jī)鏡頭會(huì)發(fā)生一定的畸變,使得空間點(diǎn)所成的像不在線性模型描述的位置而會(huì)發(fā)生一定的偏移,為了能準(zhǔn)確的標(biāo)定攝像機(jī)參數(shù),標(biāo)定的過(guò)程中要考慮非線性畸變因子。
一般來(lái)說(shuō),得到標(biāo)定結(jié)果后要對(duì)其精度進(jìn)行評(píng)估,然而很難得到準(zhǔn)確的攝像機(jī)標(biāo)定參數(shù)真值作為參考,其中基于圖像坐標(biāo)和世界坐標(biāo)的絕對(duì)和相對(duì)誤差的評(píng)價(jià)方法應(yīng)用廣泛,本文將對(duì)這些方法的原理進(jìn)行探討。
2.2攝像機(jī)標(biāo)定坐標(biāo)系建立
首先定義了四個(gè)坐標(biāo)系,如圖1所示,圖像坐標(biāo)系的坐標(biāo)原點(diǎn)為O0,列與行由坐標(biāo)軸u和v表示;成像平面坐標(biāo)系的原點(diǎn)是攝像機(jī)光軸與圖像坐標(biāo)系的交點(diǎn)0l,x、y 軸分別與u、v 軸平行;在攝像機(jī)坐標(biāo)系中,坐標(biāo)原點(diǎn)0c即為在攝像機(jī)的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機(jī)光軸作為Zc軸,0c0l為攝像機(jī)焦距f;世界坐標(biāo)系是假想的參考坐標(biāo)系,可固定于場(chǎng)景中某物體上,用于描述攝像機(jī)的位置,由Xw,Yw,Zw軸組成。
圖(1)
2.3攝像機(jī)外部參數(shù)構(gòu)成
主動(dòng)視覺(jué)傳感器從在笛卡爾直角坐標(biāo)系中的運(yùn)動(dòng)表現(xiàn)為相應(yīng)的旋轉(zhuǎn)矩陣和平移矩陣,故攝像機(jī)外部參數(shù)表現(xiàn)為旋轉(zhuǎn)矩陣R和平移矩陣T,則攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的轉(zhuǎn)化關(guān)系可以表示成:
上式中(Xc,Yc,Zc)表示空間點(diǎn)在攝像機(jī)坐標(biāo)系下的坐標(biāo),(Xw,Yw,Zw)表示空間點(diǎn)在世界坐標(biāo)系下的坐標(biāo)。根據(jù)靶標(biāo)點(diǎn)在像空間坐標(biāo)系和物方空間坐標(biāo)系中的坐標(biāo),通過(guò)分解旋轉(zhuǎn)矩陣線性計(jì)算像空間坐標(biāo)系與物方空間坐標(biāo)之間的轉(zhuǎn)換參數(shù),即外方位元素(攝站參數(shù))[6]。
2.4各攝像機(jī)相對(duì)位置確定
三目攝像機(jī)擁有三個(gè)視覺(jué)傳感器,而三個(gè)傳感器之間的相對(duì)位置可通過(guò)已獲得的外部參數(shù)進(jìn)行確定。將三個(gè)攝像機(jī)坐標(biāo)系設(shè)置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內(nèi)容可知,這三個(gè)攝像機(jī)坐標(biāo)系與世界坐標(biāo)系的關(guān)系為:
i=(1,2,3)
由此我們可以得到任意兩個(gè)攝像機(jī)i,j的坐標(biāo)系轉(zhuǎn)換關(guān)系:
其中: = = i,j=1,2,3
三、攝像機(jī)標(biāo)定實(shí)驗(yàn)過(guò)程及結(jié)果
3.1實(shí)驗(yàn)系統(tǒng)介紹
實(shí)驗(yàn)中被用來(lái)標(biāo)定的是一個(gè)多攝像機(jī)系統(tǒng),攝像機(jī)標(biāo)定有關(guān)的基本參數(shù)、系統(tǒng)組成和開(kāi)發(fā)環(huán)境如下:
(1)硬件環(huán)境
標(biāo)定板、三目攝像機(jī)和圖像采集卡等。
(2)軟件環(huán)境
OpenCV開(kāi)源視覺(jué)庫(kù),它僅由一系列C函數(shù)和少量C++類構(gòu)成,為Python、MATLAB等語(yǔ)言提供了接口,在圖像處理和計(jì)算機(jī)視覺(jué)方面實(shí)現(xiàn)了很多通用算法。
3.2實(shí)驗(yàn)過(guò)程
本系統(tǒng)以棋盤(pán)格模板作為標(biāo)定模板。采用激光打印機(jī)打印棋盤(pán)格黑白方塊間隔紙,方塊邊長(zhǎng)為3cm,共6行9列,將打印紙固定在一塊平板上,作為標(biāo)定模板,如圖(2)。安裝三目攝像機(jī)系統(tǒng),調(diào)節(jié)固定好個(gè)攝像機(jī)位置,如圖(3)。手持標(biāo)定板在三目攝像機(jī)前方各個(gè)位置拍攝5組共15張各姿態(tài)的照片,利用Canny算子進(jìn)行像點(diǎn)灰度中心提取、同名像點(diǎn)匹配并解算出三個(gè)攝像機(jī)在標(biāo)定板坐標(biāo)系中的外部參數(shù)值。
3.3標(biāo)定結(jié)果
攝像機(jī)1:
R= T=
攝像機(jī)2:
R= T=
攝像機(jī)3:
R= T=
四、總結(jié)
隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,計(jì)算機(jī)視覺(jué)成為當(dāng)今熱門(mén)的研究課題,受到了廣泛關(guān)注。本文就如何在機(jī)器視覺(jué)的理論基礎(chǔ)上對(duì)三目視覺(jué)系統(tǒng)進(jìn)行標(biāo)定進(jìn)行了研究,討論了計(jì)算機(jī)視覺(jué)理論知識(shí),分析攝像機(jī)標(biāo)定原理以及標(biāo)定坐標(biāo)系的建立。同時(shí)通過(guò)計(jì)算機(jī)視覺(jué)知識(shí)的分析討論了基于三目視覺(jué)系統(tǒng)的攝像機(jī)標(biāo)定技術(shù),完成了三目視覺(jué)系統(tǒng)的外部參數(shù)標(biāo)定實(shí)驗(yàn)。三目攝像機(jī)測(cè)量系統(tǒng)外部參數(shù)的標(biāo)定能夠解決測(cè)量作業(yè)現(xiàn)場(chǎng)、測(cè)量控制場(chǎng)建立難的問(wèn)題,為快速地建立簡(jiǎn)單實(shí)用的控制場(chǎng)提供了方案,有一定的實(shí)用價(jià)值。
參考文獻(xiàn)
[1] 荊麗秋.雙目視覺(jué)系統(tǒng)標(biāo)定與匹配的研究與實(shí)現(xiàn)[D].哈爾濱工程大學(xué),2009.DOI:10.7666/d.y1489086.
[2] 馬頌德.計(jì)算機(jī)視覺(jué)―計(jì)算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,1998.
[3] 王榮一.攝像機(jī)標(biāo)定及關(guān)鍵技術(shù)研究[D].哈爾濱理工大學(xué),2011.DOI:10.7666/d.y2012483.
[4] Clarke T A,F(xiàn)ryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66
[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.
[6] 范亞兵,黃桂平,高寶華等.三目立體工業(yè)攝影測(cè)量系統(tǒng)外部參數(shù)的快速標(biāo)定[J].測(cè)繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013
篇3
關(guān)鍵詞:壁紙;計(jì)算機(jī)視覺(jué);灰度共生矩陣;紋理
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 11-0000-01
一、壁紙樣本特征參數(shù)的獲取
紋理是一種普遍存在的視覺(jué)現(xiàn)象,如木材表面、草坪、皮膚、織物、水波等都有各自的紋理特征,而紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的重要特征。壁紙大都仿制木材表面、皮膚、織物等物體,具有典型的紋理特征。因此,本文采用經(jīng)典的灰度共生矩陣法對(duì)壁紙進(jìn)行紋理特征參數(shù)的獲取。
數(shù)學(xué)定義:灰度共生矩陣是從圖像灰度為i的像元位置為(x,y)出發(fā),統(tǒng)計(jì)與其距離為d,灰度為j的像元(x+Dx, y+Dy)同時(shí)出現(xiàn)的頻度P(i, j, d,θ),數(shù)學(xué)表達(dá)為[1]:
P(i, j, d,θ)={[ (x, y), (x+Dx, y+ Dy) | f(x, y)= i;f(x+ Dx, y+ Dy)= j]} (1)
其中,θ為共生矩陣的生成方向,通常取0°、45°、90°、135°四個(gè)方向。Haralick等人由灰度共生矩陣提取了14個(gè)紋理特征參數(shù),分別為角二階矩、對(duì)比度、相關(guān)、熵、方差、均值和、方差和、逆差矩、差的方差、和熵、差熵、聚類陰影、顯著聚類、最大概率,依次標(biāo)為W1~ W14,表1列出了部分樣本的紋理特征參數(shù)。
二、實(shí)驗(yàn)樣本
實(shí)驗(yàn)樣本選用了壁紙樣本手冊(cè)中的8類樣本進(jìn)行實(shí)驗(yàn)測(cè)試,每類樣本包含100張初始樣本圖像,樣本庫(kù)共包含800張圖像(100×8),如圖2所示。為了便于進(jìn)行識(shí)別實(shí)驗(yàn),將樣本分成3部分,依次為:標(biāo)準(zhǔn)樣本集(70×8)、測(cè)試樣本集(30×8)。
三、實(shí)驗(yàn)分析
為了能真實(shí)地反映所獲取特征的識(shí)別能力,應(yīng)選擇相對(duì)簡(jiǎn)單的分類器,從而避免分類器差異對(duì)識(shí)別率的影響,因此,本研究選擇最近鄰分類器對(duì)壁紙樣本進(jìn)行識(shí)別。
觀察表2可見(jiàn),對(duì)壁紙測(cè)試樣本集的總體分類識(shí)別率為87.50%,獲得了較高的分類識(shí)別率。其中,對(duì)第5類板材樣本的識(shí)別率最低為750%,對(duì)第3類的識(shí)別率最高為100.0%,這也能夠反映出樣本自身的復(fù)雜程度和灰度共生矩陣特征參數(shù)對(duì)各類樣本的描述能力。
四、結(jié)論:
本文使用最近鄰分類器對(duì)壁紙測(cè)試樣本集合進(jìn)行分類,總體識(shí)別率為87.50%,表明灰度共生矩陣特征參數(shù)能夠有效描述壁紙的紋理特征,同時(shí)也表明采用計(jì)算機(jī)對(duì)板材進(jìn)行分類識(shí)別取代人工識(shí)別是基本可行的。
參考文獻(xiàn):
[1]莊軍,李弼程.一種基于灰度共生矩陣的文本圖像識(shí)別方法[J].計(jì)算機(jī)工程,2006,32(3):214-216
[2]王克奇,王輝,白雪冰.基于模擬退火算法和最近鄰分類器識(shí)別率的特征選擇方法[J].自動(dòng)化技術(shù)與應(yīng)用,2007,26(1):27-29
[3]楊彩霞.基于Gabor變換與最近鄰分類器的字符識(shí)別方法[J].西安文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2010,13(4):83-85
篇4
(上海大學(xué)通信與信息工程學(xué)院,上海200072)
摘要:運(yùn)動(dòng)目標(biāo)的檢測(cè)是數(shù)字圖像處理和模式識(shí)別的基礎(chǔ),也是計(jì)算機(jī)視覺(jué)研究的一個(gè)重要領(lǐng)域。以C#為主要研究工具,對(duì)基于相鄰幀差法及背景差分法的視頻目標(biāo)檢測(cè)算法進(jìn)行了研究,主要對(duì)其原理和算法進(jìn)行研究。最后利用以AForge.NET架構(gòu)類庫(kù),利用圖像灰度的絕對(duì)值是否大于設(shè)置的閾值實(shí)現(xiàn)了對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行檢測(cè),實(shí)驗(yàn)結(jié)果表明,采用該算法可以對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行較為精確的檢測(cè)。
關(guān)鍵詞 :運(yùn)動(dòng)檢測(cè);AForge.NET;幀差法;背景差分法
中圖分類號(hào):TN911.73?34 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004?373X(2015)17?0058?03
0 引言
由于微電子技術(shù)的發(fā)展與社會(huì)生活水平的提高及各種安防需求的增多,運(yùn)動(dòng)目標(biāo)檢測(cè)逐步成為當(dāng)前監(jiān)控系統(tǒng)研究領(lǐng)域的熱點(diǎn),更是計(jì)算機(jī)視覺(jué)領(lǐng)域中視頻跟蹤算法和識(shí)別技術(shù)的基礎(chǔ),該算法的檢測(cè)精度直接影響了后續(xù)的運(yùn)動(dòng)目標(biāo)跟蹤及識(shí)別效果。目前,運(yùn)動(dòng)目標(biāo)檢測(cè)領(lǐng)域比較常用的方法有:光流法、幀間差分法和背景差分法。
光流法是相對(duì)于觀察者的運(yùn)動(dòng)目標(biāo)造成的觀測(cè)目標(biāo)、表面或邊緣的運(yùn)動(dòng)[1]。但是該算法計(jì)算量比較大,并且存在抗干擾能力差,所以對(duì)于實(shí)時(shí)性要求較高的場(chǎng)合,該檢測(cè)算法在視頻運(yùn)動(dòng)檢測(cè)應(yīng)用中并不是特別的適用,目前在運(yùn)動(dòng)檢測(cè)中最常用的方法實(shí)際上是背景差分法[2]和幀間差分法[3]。
幀間差分法是一種通過(guò)對(duì)視頻圖像序列中相鄰兩幀作差分運(yùn)算來(lái)獲得運(yùn)動(dòng)目標(biāo)輪廓的方法,非常適用于存在多個(gè)運(yùn)動(dòng)目標(biāo)和攝像機(jī)移動(dòng)的情況[4]。由于該算法對(duì)光線及場(chǎng)景變化具有較強(qiáng)的抗干擾性,且無(wú)需獲得背景圖像,更新速度快,所以非常適用于實(shí)時(shí)性較強(qiáng)的應(yīng)用場(chǎng)合。但是該算法存在閾值難以確定的問(wèn)題,這個(gè)現(xiàn)象在低對(duì)比度灰度圖像序列別明顯,導(dǎo)致對(duì)目標(biāo)對(duì)象的完整區(qū)域提取不完整而產(chǎn)生空洞的現(xiàn)象。
背景差分法是采用圖像序列中的當(dāng)前幀和背景參考模型比較,來(lái)檢測(cè)運(yùn)動(dòng)目標(biāo)的一種方法,其檢測(cè)性能依賴于所使用的背景建模技術(shù)[5]。該算法可以實(shí)現(xiàn)緩慢的背景變化過(guò)程中對(duì)目標(biāo)進(jìn)行精確快速的分割,所以具有很強(qiáng)的適用性,然而對(duì)于突然的光照變化和背景擾動(dòng),對(duì)物體帶有影子的圖像分割出來(lái)的前景圖像可能帶有影子區(qū)域[6],為此可以通過(guò)建立實(shí)時(shí)更新的背景模型機(jī)制將前景區(qū)域分割出來(lái),就可以減少動(dòng)態(tài)場(chǎng)景變化對(duì)運(yùn)動(dòng)分割的影響[7]。
本文利用AForge.NET[8]架構(gòu)類庫(kù),在Microsoft VisualStudio 2010中分別實(shí)驗(yàn)了幀間差分法與背景差分法,并實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè)。實(shí)驗(yàn)結(jié)果表明,利用幀間差分法可以快速實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè),但是對(duì)于運(yùn)動(dòng)速度較慢的目標(biāo)檢測(cè)效果不是特別理想。為此,對(duì)于緩慢變化的運(yùn)動(dòng)目標(biāo)引入背景差分法,利用類庫(kù)中MoveTowards類建立實(shí)時(shí)有效的背景模型,有效地解決目標(biāo)低速運(yùn)動(dòng)識(shí)別率較低的問(wèn)題,提高了目標(biāo)檢測(cè)的準(zhǔn)確率。
1 AForge.NET 簡(jiǎn)介
AForge.NET是一個(gè)專門(mén)為開(kāi)發(fā)者和研究者設(shè)計(jì)的基于C#框架,包括計(jì)算機(jī)視覺(jué)與人工智能、圖像處理、神經(jīng)網(wǎng)絡(luò)、遺傳算法、機(jī)器學(xué)習(xí)、模糊系統(tǒng)、機(jī)器人控制等領(lǐng)域[9]。AForge.NET 是一個(gè)不斷完善和發(fā)展的計(jì)算機(jī)視覺(jué)和圖像處理庫(kù),目前的最新版本是2.2.5。
這個(gè)框架由一系列的類庫(kù)組成,主要包括有:
AForge.Imaging:日常的圖像處理和過(guò)濾器;
AForge.Vision:計(jì)算機(jī)視覺(jué)應(yīng)用類庫(kù);
AForge.Neuro:神經(jīng)網(wǎng)絡(luò)計(jì)算庫(kù)AForge.Genetic?進(jìn)化算法編程庫(kù);
AForge.MachineLearning:機(jī)器學(xué)習(xí)類庫(kù);
AForge.Robotics:提供一些機(jī)器學(xué)習(xí)的工具類庫(kù);
AForge.Video:一系列的視頻處理類庫(kù);
AForge.Fuzzy:模糊推理系統(tǒng)類庫(kù);
AForge.Controls:圖像,三維,圖表顯示控件。
2 檢測(cè)原理
幀差法及背景差分法主要原理就是圖像的差分技術(shù)。設(shè)在一個(gè)時(shí)間軸上相鄰時(shí)刻點(diǎn)ti 采集到的圖像幀分別為f (x,y,ti),ti + 1 采集到的幀為f (x,y,ti + 1),則可以得出:
//對(duì)兩幀數(shù)據(jù)差值進(jìn)行數(shù)據(jù)濾波
Bitmap tmp3 = erosionFilter.Apply(tmp2);
上面幾行代碼可以計(jì)算出當(dāng)前幀與上一幀這兩幀數(shù)據(jù)相差的像素?cái)?shù)據(jù),通過(guò)設(shè)定特定的閾值,就可以實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的報(bào)警功能。在本文所做的實(shí)驗(yàn)中,為了形象展示當(dāng)前幀與上一幀數(shù)據(jù)的差值數(shù)據(jù),把連續(xù)兩幀數(shù)據(jù)差值用過(guò)紅色高亮數(shù)據(jù)進(jìn)行顯示。實(shí)驗(yàn)結(jié)果表明,通過(guò)差幀法可以快速實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè),由于幀差檢測(cè)法存在閾值難以確定的問(wèn)題,特別是對(duì)于低速運(yùn)動(dòng)的運(yùn)動(dòng)目標(biāo),如果設(shè)定較低的閾值則存在誤觸發(fā)虛報(bào)的問(wèn)題,而對(duì)于設(shè)定的高閾值,因?yàn)榫哂休^低的檢測(cè)靈敏度,則存在漏警的問(wèn)題,實(shí)驗(yàn)結(jié)果如圖2所示。
為此,本文引入了背景差分法技術(shù),相對(duì)幀差檢測(cè)算法,該算法使用AForge.NET的MoveTowards類實(shí)現(xiàn)實(shí)時(shí)背景的建模,再通過(guò)當(dāng)前圖像幀與建模形成的背景幀數(shù)據(jù)進(jìn)行差分運(yùn)算,實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè)。該算法可以解決幀差檢測(cè)法閾值難以確定的問(wèn)題,可以實(shí)現(xiàn)低速運(yùn)動(dòng)目標(biāo)精確的定位與檢測(cè)。
背景差分法與幀間差分法的區(qū)別只是有了一個(gè)背景更新的過(guò)程,本文新背景的建立是通過(guò)AForge.NET視頻庫(kù)中類實(shí)現(xiàn),該類背景提取算法原理是當(dāng)前幀與前一個(gè)背景幀求加權(quán)平均得出當(dāng)前背景幀數(shù)據(jù)。背景差分法的具體算法流程如圖3所示。
背景差分法相關(guān)實(shí)現(xiàn)代碼如下:
// 初始化背景類
MoveTowards moveTowardsFilter = new MoveTowards();
// 把當(dāng)前幀復(fù)制給該類
moveTowardsFilter.OverlayImage = currentFrame;
// 通過(guò)前一幀與當(dāng)前幀建立新的背景
Bitmap tmp = moveTowardsFilter.Apply(backgroundFrame);
// 把原先老的背景去除掉
backgroundFrame.Dispose();
//把當(dāng)前計(jì)算出來(lái)的背景幀保存下來(lái),為下一背景幀計(jì)算做準(zhǔn)備
backgroundFrame = tmp;
背景差分法運(yùn)動(dòng)檢測(cè)算法的相關(guān)實(shí)驗(yàn)結(jié)果如圖4所示。
從圖4 可以看出,背景差分法具有更好的目標(biāo)輪廓,通過(guò)當(dāng)前幀與背景幀比較的運(yùn)動(dòng)檢測(cè)算法,可以很好地解決運(yùn)動(dòng)目標(biāo)低速運(yùn)行的問(wèn)題,可以較為精確地實(shí)現(xiàn)與運(yùn)動(dòng)目標(biāo)的檢測(cè)。所有背景差分法與幀差法相比,具有更高的檢測(cè)精度,非常適合工程中的應(yīng)用。
4 結(jié)語(yǔ)
本文利用AForge.NET 類庫(kù),分別采用幀差法及背景差分法對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行實(shí)時(shí)檢測(cè)。實(shí)驗(yàn)結(jié)果證明,利用AForge.NET可以實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè)功能,并且具有很強(qiáng)的實(shí)時(shí)性。幀差法可以快速地檢測(cè)運(yùn)動(dòng)目標(biāo),但是由于其特性決定了其對(duì)于低速運(yùn)動(dòng)目標(biāo)的檢測(cè)較背景差分法檢測(cè)靈敏度要低。本文只針對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行簡(jiǎn)單的檢測(cè),對(duì)于更進(jìn)一步的問(wèn)題將在后續(xù)工作中繼續(xù)研究。
參考文獻(xiàn)
[1] 陳銀,任侃,顧國(guó)華,等.基于改進(jìn)的單高斯背景模型運(yùn)動(dòng)目標(biāo)檢測(cè)算法[J].中國(guó)激光,2014(11):245?253.
[2] 紀(jì)青華,禹素萍.基于Surendra背景減除法和四幀差分法的目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014(12):242?244.
[3] 邱斌,干紅華,張亶.基于時(shí)空信息的運(yùn)動(dòng)目標(biāo)分割算法[J].激光雜志,2014(12):40?44.
[4] 柴池.基于背景差分和三幀差分的運(yùn)動(dòng)目標(biāo)檢測(cè)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(11):75?76.
[5] 黃素茵.基于視頻監(jiān)控運(yùn)動(dòng)目標(biāo)檢測(cè)算法研究[D].廣州:華南理工大學(xué),2013.
[6] 余啟明.基于背景減法和幀差法的運(yùn)動(dòng)目標(biāo)檢測(cè)算法研究[D].贛州:江西理工大學(xué),2013.
[7] 嚴(yán)曉明.一種基于改進(jìn)幀差法的運(yùn)動(dòng)目標(biāo)檢測(cè)[J].莆田學(xué)院學(xué)報(bào),2011(5):69?72.
[8] KIRILLOV A. AForge.NET framework [EB/OL].(2010?03?02)[2010?12?20]. http:// aforgenet. com.
篇5
關(guān)鍵詞:圖像內(nèi)容檢索; 紋理特征;視頻水??; 高壓縮; 魯棒性
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A
1 引 言20世紀(jì)70年代末期,基于文本的圖像檢索技術(shù)(textbased image retrieval)方興未艾。當(dāng)時(shí)流行的圖像檢索系統(tǒng)是將圖像作為數(shù)據(jù)庫(kù)中存儲(chǔ)的一個(gè)對(duì)象,用關(guān)鍵字或自由文本對(duì)其進(jìn)行描述。查詢操作是基于該圖像的文本描述進(jìn)行精確匹配或概率匹配。然而,完全基于文本的圖像檢索技術(shù)存在著嚴(yán)重的問(wèn)題。90年代初期,隨著大規(guī)模數(shù)字圖像庫(kù)的出現(xiàn),基于內(nèi)容的圖像檢索技術(shù)(contentbased image retrieval)應(yīng)運(yùn)而生。區(qū)別于原有系統(tǒng)中對(duì)圖像進(jìn)行人工標(biāo)注的做法,基于內(nèi)容的檢索技術(shù)自動(dòng)提取每幅圖像的視覺(jué)內(nèi)容特征作為其索引,如色彩、紋理、形狀等。此后幾年中,這個(gè)研究領(lǐng)域中的許多技術(shù)發(fā)展迅速,一大批研究性的或商用的圖像檢索系統(tǒng)被建立起來(lái)。這個(gè)領(lǐng)域的發(fā)展主要來(lái)歸功于計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步,在文獻(xiàn)[1]中有對(duì)這一領(lǐng)域的詳細(xì)介紹。
圖像特征的提取與表達(dá)是基于內(nèi)容的圖像檢索技術(shù)的基礎(chǔ)。從廣義上講,圖像的特征包括基于文本的特征(如關(guān)鍵字、注釋等)和視覺(jué)特征(如色彩、紋理、形狀、對(duì)象表面等)
兩類。由于基于文本的圖像特征提取在數(shù)據(jù)庫(kù)系統(tǒng)和信息檢索等領(lǐng)域中已有深入的研究,本文我們主要介紹視頻圖像視覺(jué)特征的提取和表達(dá)。并利用特征提取選定相應(yīng)幀,并在選定的特定幀中嵌入水印。
2 Tamura紋理特征
紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺(jué)特征[2]。它是所有物體表面共有的內(nèi)在特性,例如云彩、樹(shù)木、磚、織物等都有各自的紋理特征。
基于人類對(duì)紋理的視覺(jué)感知的心理學(xué)的研究,Tamura等人提出了紋理特征的表達(dá)[3]。Tamura紋理特征的六個(gè)分量對(duì)應(yīng)于心理學(xué)角度上紋理特征的六種屬性,分別是粗糙度(coarseness)、對(duì)比度(contrast)、方向度(directionality)、 線像度(linelikeness)、規(guī)整度(regularity)和粗略度(roughness)。其中,前三個(gè)分量對(duì)于圖像檢索尤其重要[4]。接下來(lái)我們就著重討論粗糙度、對(duì)比度和方向度這三種特征的定義和數(shù)學(xué)表達(dá)。
計(jì)算技術(shù)與自動(dòng)化2011年9月
篇6
關(guān)鍵詞 SIFT 尺度空間 圖像匹配 特征描述符
中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A
Research on the Simplified SIFT Feature Matching Algorithm
YIN Lihua[1], CHEN Yong[1], YANG Yuping[2]
([1] Chongqing Normal University, Chongqing 401331;
[2] Chongqing College of Electronic Engineering, Chongqing 401331)
Abstract For SIFT algorithm, for the matching problem of the classic descriptors for feature dimension is too high and lead to reduced efficiency, this paper presents a simplified SIFT feature matching algorithm, the first of the operator dimensionality reduction to improve the speed, then use two-way matching to eliminate errors together with the algorithm to ensure the accuracy of experiments and achieved good results, verify the feasibility of the method.
Key words SIFT; scale space; image matching; feature descriptors
0 引言
圖像匹配是同一場(chǎng)景在兩個(gè)不同視點(diǎn)下的圖像之間的對(duì)應(yīng)關(guān)系,是虛擬現(xiàn)實(shí)、計(jì)算機(jī)視覺(jué)等研究領(lǐng)域的一個(gè)熱點(diǎn),也是計(jì)算機(jī)視覺(jué)應(yīng)用,如深度恢復(fù)、攝像機(jī)標(biāo)定、運(yùn)動(dòng)分析以及三維重構(gòu)等研究的基本問(wèn)題。①總結(jié)起來(lái),圖像匹配算法大致分為:基于面積的方法、②基于比值的方法③等,但這些算法有著共同的缺點(diǎn)。本文提出一種簡(jiǎn)化的SIFT算法,通過(guò)減少特征描述符的維數(shù)來(lái)降低計(jì)算的復(fù)雜度,并采用雙向匹配增強(qiáng)匹配的精度。
1 SIFT算法研究
SIFT( scale invariant feature transform,即尺度不變特征變換)算法是David G.Lowe于1999年提出,2004年進(jìn)行了總結(jié)和完善的特征匹配算法,SIFT特征匹配算法共分為如下五個(gè)步驟:
1.1 尺度空間的形成。
Koendetink等人證明了高斯卷積核是實(shí)現(xiàn)尺度變換的惟一線性核,因此,一幅二維圖像的尺度空間可定義為:
() = ()* () (1)
式中:L為尺度空間,()為空間坐標(biāo), 則為尺度因子。 的值越小表示圖像越清晰,越大則表示圖像越模糊。為了提高尺度空間中被檢測(cè)關(guān)鍵點(diǎn)的穩(wěn)定性,采用了高斯差分尺度空間()。定義為兩相鄰尺度的高斯核差分,公式如下:
() = [ () ()]* () = () - () (2)
1.2 空間極值點(diǎn)的檢測(cè)
在中,為確保在尺度空間及二維圖像空間都能檢測(cè)到極值點(diǎn),每一個(gè)像素點(diǎn)(最頂層和最底層像素點(diǎn)除外)要和其上下兩層各9個(gè)及同層8個(gè)相鄰點(diǎn)進(jìn)行比較。并通過(guò)擬和三維二次函數(shù)來(lái)精確確定特征點(diǎn)的尺度和位置,同時(shí)去除對(duì)比度低的特征點(diǎn)和不穩(wěn)定的邊緣特征點(diǎn),以增強(qiáng)圖像匹配的穩(wěn)定性、提高抗噪聲能力。
1.3 特征點(diǎn)方向分配
為使算子具備旋轉(zhuǎn)不變性,統(tǒng)計(jì)特征點(diǎn)鄰域像素的梯度方向直方圖,以確定每個(gè)特征點(diǎn)的方向參數(shù)。
1.4 特征點(diǎn)描述器的生成
為了增強(qiáng)算子的抗噪能力,每個(gè)特征點(diǎn)選用16個(gè)種子點(diǎn)來(lái)描述,而每個(gè)種子點(diǎn)又有8個(gè)方向的向量信息,因此,每個(gè)特征點(diǎn)就能形成16共128維的SIFT特征向量。
1.5 特征匹配
SIFT算法選用歐式距離作為特征點(diǎn)的相似性度量函數(shù),設(shè)定一個(gè)閾值,當(dāng)距離小于這個(gè)閾值時(shí)就接受這一對(duì)匹配點(diǎn)。
2 簡(jiǎn)化的SIFT算法研究
2.1 簡(jiǎn)化算法的匹配步驟
經(jīng)典算法中,第三步的計(jì)算時(shí)間在整個(gè)算法中占了70%多,大大地降低了算法的速度,影響了實(shí)時(shí)性。為了改善這一狀況,將第二、三步合并,并在對(duì)特征點(diǎn)進(jìn)行描述時(shí),把原來(lái)的128維向量降為現(xiàn)在的12維向量。匹配步驟如下:
2.1.1 初步特征點(diǎn)的檢測(cè)(方法同原算法)
2.1.2 形成特征向量
(1)以初步檢測(cè)到的特征點(diǎn)為中心采用圓形窗體來(lái)確定需要統(tǒng)計(jì)的領(lǐng)域范圍,選取圓形窗口半徑為4.5s,在該窗體內(nèi)統(tǒng)計(jì)12個(gè)梯度方向。
(2)歸一化這12個(gè)梯度方向,以保證算子的光照不變性。用表示特征向量,即 = ,歸一化后得到:
(3)
(3)為保證算子的旋轉(zhuǎn)不變性,查找最大的梯度方向統(tǒng)計(jì)量。向左循環(huán)移動(dòng)整個(gè)向量序列,直至梯度方向統(tǒng)計(jì)量最大的元素移動(dòng)到序列的第一個(gè)元素。
2.1.3 特征匹配
為保證算法的精度,采用雙向匹配。即第一次匹配完后,記錄下成功匹配的坐標(biāo)對(duì),然后交換匹配對(duì)的坐標(biāo)位置,再匹配一次,如果這兩次匹配得到的坐標(biāo)對(duì)是一樣的,就接受這一對(duì)匹配點(diǎn)。
2.2 維數(shù)設(shè)定
簡(jiǎn)化算法中最重要的一步就是圓形窗口中維數(shù)n的設(shè)定,實(shí)驗(yàn)結(jié)果表明,當(dāng)<12時(shí),匹配效率隨著維數(shù)的增加呈指數(shù)級(jí)增加;反之,當(dāng)>12時(shí),匹配效率卻隨著維數(shù)的增加反而下降。由此可得,當(dāng) =12時(shí),匹配效率最高, =12即為所需確定的維數(shù)。對(duì)于匹配效率,定義為:
匹配效率 = (4)
3 仿真實(shí)驗(yàn)及結(jié)果
為了驗(yàn)證算法,在CPU為Intel Corei3 2.20GHz,內(nèi)存為2G的PC機(jī)上采用Matlab7.8軟件平臺(tái)進(jìn)行實(shí)驗(yàn)。為了證明算法對(duì)物體旋轉(zhuǎn)、遮擋和光照的魯棒性,在設(shè)計(jì)場(chǎng)景的時(shí)候?qū)⑽矬w任意擺放,在不同的光照條件下進(jìn)行實(shí)驗(yàn),部分效果及結(jié)果如圖表所示,其中圖1(a)為SIFT算法匹配圖像,圖1(b)為簡(jiǎn)化SIFT算法匹配圖像,表1為兩種算法匹配對(duì)比結(jié)果。
4 結(jié)論
總之,本文研究了經(jīng)典SIFT算法,并分析了算法的優(yōu)勢(shì)及其局限性,從匹配速度上加以了改進(jìn)。首先利用圓形窗口本身的旋轉(zhuǎn)不變特性對(duì)算法進(jìn)行降維,從原來(lái)的128維降為12維;其次采用雙向匹配提高匹配的精度,去除可能存在的不明顯誤匹配。將匹配結(jié)果同原SIFT算法進(jìn)行了比較,試驗(yàn)結(jié)果表明本文改進(jìn)算法比原SIFT算法在速度上有了很大的提高,同時(shí)在一定程度上也保證了精度。
注釋
① 孔曉東,屈磊,桂國(guó)富等.基于極約束和邊緣點(diǎn)檢測(cè)的圖像密集匹配[J].計(jì)算機(jī)工程,2004(20):178-179.
篇7
關(guān)鍵詞:視頻檢測(cè);蜂群算法;互信息
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:Here,a video object detection method based on an improved bee colony algorithm is presented.First,the maximum mutual information values of two images are obtained through optimization.Then,the best spatial matching parameters are acquired,and finally the target is detected through the three frame difference pared to the traditional algorithm,the proposed algorithm can restrain the residual background noise,and does not require the image pre-processing,feature selection and background updating,which reduce the complexity of the pared with the results based on the traditional bee colony algorithm,the effectiveness and reliability of the improved algorithm are demonstrated.
Keywords:video detection;bee colony algorithm;mutual information
1 引言(Introduction)
近年來(lái),科學(xué)技術(shù)的不斷發(fā)展以及人民生活水平的不斷提高使人類對(duì)生活質(zhì)量和本身的安全性保證需求愈來(lái)愈高。視頻監(jiān)控由于能形象、直觀地表示信息而被應(yīng)用于大部分公共場(chǎng)所。相比較傳統(tǒng)的視頻監(jiān)控,高端化的視頻監(jiān)控系統(tǒng)可通過(guò)計(jì)算機(jī)視覺(jué)、圖像處理等技術(shù)提取出人們感興趣的目標(biāo)信息圖像,然后對(duì)其進(jìn)行檢測(cè)、跟蹤、分類以及行為理解和描述等過(guò)程來(lái)判別監(jiān)控畫(huà)面中的情況,代表了未來(lái)視頻監(jiān)控產(chǎn)業(yè)的發(fā)展趨勢(shì)。視頻監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)主要有四個(gè)方面:目標(biāo)的檢測(cè),目標(biāo)的跟蹤,目標(biāo)的分類,行為的理解與描述。
視頻目標(biāo)檢測(cè)在人機(jī)交互、視頻監(jiān)控、交通視頻、視頻會(huì)議、客流量統(tǒng)計(jì)等許多方面都有非常重要的應(yīng)用,是當(dāng)今計(jì)算機(jī)視覺(jué)領(lǐng)域的研究熱點(diǎn)與難點(diǎn)之一。傳統(tǒng)的檢測(cè)算法[1]如背景差分法、相鄰幀差法、光流場(chǎng)法等已相對(duì)成熟,但存在不足:背景差分法對(duì)光線等外在因素的變化過(guò)于敏感,幀差法檢測(cè)目標(biāo)的完整性較差,光流場(chǎng)法的計(jì)算比較復(fù)雜且容易被外界噪聲干擾。因此,學(xué)者們提出了許多改進(jìn)算法,如背景移動(dòng)補(bǔ)償算法[2]、幀間差法與背景差分相結(jié)合的算法[3]等。
2 互相關(guān)信息(Mutual information)
互相關(guān)信息是一種具有測(cè)量圖像間的統(tǒng)計(jì)相關(guān)性作用的信息理論概念。它代表圖像間的重合區(qū)域,重合區(qū)域越多,互相關(guān)信息越大。當(dāng)兩幅圖像在幾何上完全重合時(shí)的互相關(guān)信息是最大的,稱為最大互信息。
假設(shè)有兩個(gè)隨機(jī)變量A和B,灰度值范圍為0―255,和分別是它們各自的概率密度函數(shù),表示它們之間的相關(guān)密度函數(shù)。那么隨機(jī)變量A和B的互相關(guān)信息表示如下:
由于聯(lián)合熵的值取決于邊緣熵與變換函數(shù),因此需要找出最優(yōu)變換函數(shù)對(duì)圖像進(jìn)行配準(zhǔn),以讓聯(lián)合熵最小,則此時(shí)的互相關(guān)信息為最大互信息。因?yàn)榛ハ嚓P(guān)信息是關(guān)于圖像全部像素的,所以帶來(lái)的計(jì)算量較大。小波變換為一種擁有多分辨率的時(shí)間――尺度分析方法,本文結(jié)合小波分解的方法,對(duì)配準(zhǔn)圖像進(jìn)行小波變換,主要包括平移和旋轉(zhuǎn),因此,通過(guò)對(duì)小波變換函數(shù)中平移和旋轉(zhuǎn)參數(shù)的最優(yōu)化以獲得最大互信息。
3 改進(jìn)蜂群算法(Improved bee colony algorithm)
所謂人工蜂群算法就是對(duì)蜜蜂行為加以模擬而提出的一種優(yōu)化算法。蜂群中出現(xiàn)群體智慧的最小搜索模型主要包括四個(gè)基本的組成要素:食物源、引領(lǐng)蜂、偵查蜂與跟隨蜂。
在蜂群算法中,優(yōu)化問(wèn)題的一個(gè)可能解就是一個(gè)食物源的位置,解的質(zhì)量(適應(yīng)度)就是食物源的花蜜數(shù)目。詳細(xì)過(guò)程如下:起先,生成具有個(gè)解(食物源)的初始種,其中的各個(gè)解――是一個(gè)維數(shù)為D(待優(yōu)化參數(shù)的數(shù)目)的向量;其次,所有的食物源都要被蜜蜂進(jìn)行反復(fù)(次數(shù)為MCN)搜尋:對(duì)應(yīng)的食物源(解)先被引領(lǐng)蜂在鄰域作一次搜尋,通過(guò)對(duì)比搜尋前后兩個(gè)食物源的花蜜數(shù)目后,選取適應(yīng)度相對(duì)高即花蜜數(shù)目大的食物源(解)來(lái)采蜜;結(jié)束搜尋以后,所有的引領(lǐng)蜂將食物源上花蜜數(shù)目的信息傳遞給跟隨蜂,跟隨蜂通過(guò)獲得的信息按照一定的概率選取食物源,即花蜜越多的食物源被選擇的可能性越大。而后,跟隨蜂為了選取更好的解也作一次與引領(lǐng)蜂相同的鄰域搜尋。
其中,,,以上和都是隨機(jī)選擇的,并且。在-1和1之間。
在蜂群算法中,通過(guò)次循環(huán)之后得不到改善的解要被丟棄,這里的“”便是算法中的一個(gè)關(guān)鍵的控制參數(shù)。假設(shè)是被丟棄的解,偵查蜂可以隨機(jī)生成一個(gè)新解對(duì)進(jìn)行代替。
以上表述可以看出,蜂群算法中的三個(gè)控制參數(shù)――食物源的數(shù)目、引領(lǐng)蜂的數(shù)目、跟隨蜂的數(shù)目(SN)是相等的。以上整個(gè)算法的核心包括三個(gè)部分:(1)引領(lǐng)蜂:鄰域搜索;(2)跟隨蜂:將搜尋范圍縮小后對(duì)鄰域作搜尋;(3)偵查蜂:隨機(jī)搜索。
因?yàn)槊鄯潆S機(jī)選擇鄰域個(gè)體,并且未考慮食物源之間的內(nèi)部聯(lián)系,致使收斂速度較為緩慢。為了提高收斂性能,提出改進(jìn)蜂群算法,將式(4)變化為
式中,―遺忘因子,代表搜尋其它食物源時(shí)對(duì)當(dāng)前食物源的記憶強(qiáng)度,并且為了使蜜蜂充分的利用鄰域個(gè)體的搜索信息從而更好地尋找到全局的最優(yōu)點(diǎn),在下一食物源的搜索過(guò)程中遺忘因子會(huì)動(dòng)態(tài)調(diào)整;―鄰域因子,確定信息共享的強(qiáng)度是根據(jù)鄰域個(gè)體食物源的優(yōu)劣來(lái)進(jìn)行的,在搜索后期為了使蜜蜂具有較強(qiáng)的全局尋優(yōu)能力,鄰域因子進(jìn)行動(dòng)態(tài)變化。為常量,以1為分界線,當(dāng)食物源質(zhì)量比蜜蜂當(dāng)前食物源質(zhì)量劣時(shí)取1,從而讓蜜蜂可以向高質(zhì)量的食物源移動(dòng)。
鄰域因子、遺忘因子中的參數(shù)、隨搜索進(jìn)程動(dòng)態(tài)變化如下:
式中,iter代表搜索步數(shù);、、與都是常量,取值在[0.1,1.5],且、。為了使蜜蜂迅速向最優(yōu)食物源區(qū)域移動(dòng),遺忘因子中的參數(shù)隨搜索進(jìn)程從逐漸下降至,取值范圍在[0.8,1];隨著搜索的進(jìn)行,鄰域因子中的參數(shù)從逐漸上升到,代表逐漸增大鄰域個(gè)體與當(dāng)前蜜蜂的信息共享強(qiáng)度,β取值范圍在[1,1.2]。
4 三幀差分法(Three frame difference method)
三幀差分法把相鄰三幀圖像當(dāng)作一組進(jìn)行差分,可以將實(shí)際運(yùn)動(dòng)目標(biāo)的輪廓完整的檢測(cè)出來(lái),具體算法如下:
(1)讀取圖像序列中的三幀圖像、、,依次計(jì)算出相連兩幀圖像的絕對(duì)差值灰度圖、,設(shè)置閾值T對(duì)差值圖像進(jìn)行二值化,提取運(yùn)動(dòng)目標(biāo)區(qū)域如下:
(2)通過(guò)邏輯“與”運(yùn)算提取和的交集,獲取運(yùn)動(dòng)目標(biāo):
5 計(jì)算分析(Calculation and analysis)
5.1 基于改進(jìn)蜂群算法的視頻目標(biāo)檢測(cè)算法流程
(1)首先通過(guò)小波變換將圖像映射到小波域。
(2)利用式(1)作為衡量標(biāo)準(zhǔn)進(jìn)行基于互相關(guān)信息的圖像配準(zhǔn)計(jì)算。
(3)采用改進(jìn)的蜂群算法優(yōu)化兩幅圖像間的互信息值,此算法通過(guò)迭代后將獲得最優(yōu)的小波變換平移參數(shù)與旋轉(zhuǎn)參數(shù)。
(4)最終依靠三幀差分法實(shí)現(xiàn)對(duì)圖像中運(yùn)動(dòng)目標(biāo)的增測(cè),使用矩形框?qū)⒛繕?biāo)進(jìn)行標(biāo)記,完成目標(biāo)檢測(cè)。
5.2 結(jié)果與分析
圖1和圖2分別為基于蜂群算法和改進(jìn)蜂群算法的視頻目標(biāo)檢測(cè)結(jié)果。從中可看出,基于蜂群算法檢測(cè)到的目標(biāo)范圍過(guò)大,而基于改進(jìn)蜂群算法檢測(cè)出的目標(biāo)范圍更加精確,也更能夠反映出真實(shí)情況。
6 結(jié)論(Conclusion)
本文在基于互相關(guān)信息進(jìn)行目標(biāo)檢測(cè)的基礎(chǔ)上,利用改進(jìn)的蜂群算法對(duì)兩幅圖像間的互相關(guān)信息進(jìn)行優(yōu)化,得到最大互信息值,進(jìn)而獲得最佳空間匹配參數(shù)并完成對(duì)圖像的空間配準(zhǔn),最后通過(guò)三幀差分法檢測(cè)出目標(biāo)。通過(guò)與傳統(tǒng)蜂群算法的結(jié)果對(duì)比,證明了改進(jìn)算法的有效性和可靠性。
參考文獻(xiàn)(References)
[1] 萬(wàn)纓,韓毅,盧漢清.運(yùn)動(dòng)目標(biāo)檢測(cè)算法的探討[J].計(jì)算機(jī)仿真,2006,23(10):221-226.
[2] 於時(shí)才,吳鍵.運(yùn)動(dòng)背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)方法[J].計(jì)算機(jī)仿真,2011,28(2):292-294.
[3] 朱明旱,羅大庸,曹倩霞.幀間差分與背景差分相融合的運(yùn)動(dòng)目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)測(cè)量與控制,2005,13(3):215-217.
[4] Teodorovi'c,Dell Orco.Bee colony optimization-a cooperative learning approach to complex transportation problems[M].In Proceedings of the 10th Ewgt Meeting,Poznan,13-16 September 2005.
作者簡(jiǎn)介:
仲 躍(1960-),男,碩士,高級(jí)工程師.研究領(lǐng)域:水利信息系統(tǒng)應(yīng)用開(kāi)發(fā).
楊 勁(1986-),男,碩士,工程師.研究領(lǐng)域:計(jì)算機(jī)圖形學(xué)和圖像處理.
顧 京(1985-),男,碩士,工程師.研究領(lǐng)域:信息系統(tǒng)建模與仿真.
篇8
關(guān)鍵詞:人臉修飾;頻域?yàn)V波;幾何表示;演化模型
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)22-0119-03
Abstract: With the popularity of digital cameras, mobile phones and other camera equipment, automatic face modification technology has become a research hotspot in the field of computer vision, digital image processing. In this paper, the framework and the new progress of automatic face modification technology are summarized. The algorithm based on frequency domain filtering, the algorithm based on geometric representation, and the algorithm based on age evolution model are summarized. The main algorithms are introduced and the advantages and disadvantages of various algorithms are also analyzed. Through the research on the practical problems in the domestic and international application, the challenge and the shortage of the automatic face modification technology are presented.
Key words: face modification; frequency domain filtering; geometric representation; evolution model
隨著圖像信息處理技術(shù)的不斷進(jìn)步,以及拍照設(shè)備的普及,人們對(duì)照片的處理需求不斷提高,尤其是針對(duì)面部圖像的修飾技術(shù)已成為電腦軟件和手機(jī)軟件的一個(gè)開(kāi)發(fā)熱點(diǎn),比如:美圖秀秀、人人-美顏美圖、光影魔術(shù)手等。這些軟件不要求用戶具有專業(yè)的圖像處理技術(shù),可以方便地實(shí)現(xiàn)美化照片的效果。
人臉自動(dòng)修飾與渲染是計(jì)算攝影領(lǐng)域中新的研究熱點(diǎn)。其主要關(guān)注人臉照片品質(zhì)的提高,更關(guān)注對(duì)人臉的某些屬性的處理,如:對(duì)人臉皺紋的去除、膚色的改善、光潔度的提高等。人們希望經(jīng)自動(dòng)修飾與渲染的照片,能夠符合視覺(jué)感知習(xí)慣、更具吸引力,改變傳統(tǒng)的攝影、圖像處理工作需繁復(fù)的人工操作的現(xiàn)狀。因此,在攝影、廣告設(shè)計(jì)、電影制作、數(shù)字娛樂(lè)、專業(yè)研究領(lǐng)域都有著廣泛的應(yīng)用前景。
本文對(duì)自動(dòng)人臉修飾技術(shù)的研究背景、研究現(xiàn)狀進(jìn)行了綜述,列舉了近幾年自動(dòng)人臉修飾技術(shù)的主要算法,以及算法的改進(jìn)、對(duì)比,最后對(duì)自動(dòng)人臉修飾技術(shù)發(fā)展趨勢(shì)、存在的問(wèn)題、下一步的研究方向進(jìn)行了闡述。
1 人臉修飾技術(shù)研究進(jìn)展
1.1 基于頻域?yàn)V波的方法
該算法可以實(shí)現(xiàn)圖像中高頻率瑕疵(如:皺紋、斑點(diǎn))的去除,進(jìn)而完成人臉的修飾,使處理后圖片看上去更白、更美觀,但該算法當(dāng)遇到大范圍皺紋、斑點(diǎn)等瑕疵時(shí)的處理效果不理想。
1.2 基于幾何表示的方法
此外還有一些修改人臉外形的算法,通過(guò)對(duì)面部輪廓和器官作適當(dāng)變形,使其更加貼近最優(yōu)臉型,達(dá)到優(yōu)化人臉的目的。但該類算法容易造成修改后的人臉對(duì)標(biāo)準(zhǔn)人臉的依賴,調(diào)整過(guò)大時(shí),容易造成人臉原來(lái)特征的丟失。
1.3 基于年齡演化模型的方法
基于年齡演化模型的算法通?;贔G-NET數(shù)據(jù)庫(kù)、MORPH數(shù)據(jù)庫(kù)開(kāi)展實(shí)驗(yàn)。FG-NET數(shù)據(jù)庫(kù)包含了82個(gè)人,年齡從0~69歲,共有1002張照片,為包含大的年齡跨度里面收集的照片直接采自被拍攝者的老照片,因此拍攝角度、環(huán)境、光照條件都不能一致,有的照片還有帽子、眼鏡等遮擋,年代很早的照片都是黑白照片,而且早期的照片,受拍照攝備所限,畫(huà)面不夠清晰。但FG-NET仍然是現(xiàn)有的人臉年齡數(shù)據(jù)庫(kù)中,唯一包含了0~18歲照片的數(shù)據(jù)庫(kù),而且照片反映的年齡跨度大、且密集。
MORPH數(shù)據(jù)庫(kù)是最大的、已公開(kāi)的縱向人臉數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含超過(guò)13000人的55000幅圖像,年齡跨度在16歲到77歲之間,并且該數(shù)據(jù)庫(kù)還在不斷擴(kuò)種中。MORPH數(shù)據(jù)庫(kù)除了包含人臉照片,還包含被拍照者的年齡、性別、種族、體重、身高等信息,可供面部分析、年齡分析、面部識(shí)別的研究使用。
現(xiàn)階段年齡相關(guān)的人臉數(shù)據(jù)庫(kù)還很不完善,人臉圖像的采集需要經(jīng)歷相當(dāng)長(zhǎng)時(shí)間的跟蹤拍攝,這需要相當(dāng)長(zhǎng)時(shí)間的積累,并且考慮包含不同種族、性別、地域的人臉照片。
在計(jì)算機(jī)視覺(jué)領(lǐng)域,年齡演化問(wèn)題是一個(gè)研究熱點(diǎn)?;谀挲g演化模型的自動(dòng)人臉修飾技術(shù)的關(guān)鍵是通過(guò)各年齡段的人臉照片構(gòu)建合適的年齡演化模型。
早期的基于年齡演化模型的自動(dòng)人臉?biāo)惴ㄖ?,結(jié)合了小波變換的內(nèi)容,如:參考文獻(xiàn)[3]中,Tidderman提出了通過(guò)小波變換建立特征向量,并針對(duì)不同年齡構(gòu)建合成人臉。實(shí)驗(yàn)結(jié)果表明,當(dāng)使用小區(qū)域邊緣強(qiáng)度加權(quán)來(lái)保留邊緣特征后,根據(jù)年齡進(jìn)行人臉修飾的效果更明顯。對(duì)這一算法進(jìn)一步改進(jìn),通過(guò)MRF模型在小波變換后進(jìn)行年齡演化過(guò)程中的人臉特征學(xué)習(xí),可以實(shí)現(xiàn)人臉的年輕化修飾、以及性別修改。實(shí)驗(yàn)結(jié)果表明,MRF模型比單純使用小波變換對(duì)人臉的修飾效果要好。
此外,還有根據(jù)生物學(xué)、遺傳學(xué)等領(lǐng)域的研究來(lái)建立年齡演化模型的方法。如:參考文獻(xiàn)[4]中,Ramanathan根據(jù)生物學(xué)中顱面骨的生長(zhǎng)規(guī)律,對(duì)0-18歲期間的人臉建立基于年齡影響的模型,融入人體測(cè)量學(xué)的方法,即:人臉不同部位在不同年齡段會(huì)有不同的生長(zhǎng)進(jìn)度,來(lái)提取不同年齡段人臉的特征。圖3顯示了側(cè)面人臉隨年齡增長(zhǎng)的模型,及對(duì)應(yīng)不同年齡跨度,產(chǎn)生的特征參數(shù)k。通過(guò)最優(yōu)化計(jì)算人臉成長(zhǎng)參數(shù)k,來(lái)實(shí)現(xiàn)不同年齡人臉比例的轉(zhuǎn)換,圖4顯示了參考文獻(xiàn)[4] 的實(shí)驗(yàn)結(jié)果。
針對(duì)成年人的年齡演化模型,如:參考文獻(xiàn)[5]中,Ramanathan考慮到人的衰老,主要體現(xiàn)在面部肌肉的彈性變差、皺紋的增加,提出了與年齡相關(guān)的形狀、紋理變化的模型,可以用來(lái)修飾人臉產(chǎn)生老化特征,如:額頭皺紋、眼角紋、嘴角紋等。實(shí)驗(yàn)通過(guò)將數(shù)據(jù)庫(kù)人臉按年齡分組,年齡跨度在10歲,如:21-30歲一組,31-40歲一組等,搜集的實(shí)驗(yàn)數(shù)據(jù)可以很好的反映隨年齡、性別、種族等變化而產(chǎn)生的形狀、紋理特征。
綜上,基于年齡演化模型的自動(dòng)人臉修飾技術(shù)先要對(duì)人臉數(shù)據(jù)庫(kù)按年齡分組,對(duì)不同分組提取特征,得到經(jīng)年齡演化修飾后的圖像。實(shí)驗(yàn)效果很大程度上依賴于人臉數(shù)據(jù)庫(kù),為了得到好的演化效果,需要使用年齡跨度大的人臉照片。
2 總結(jié)
本文總結(jié)了國(guó)內(nèi)外關(guān)于自動(dòng)人臉修飾技術(shù)的算法框架,主要針對(duì)基于頻域?yàn)V波的算法、基于幾何表示的算法、基于年齡演化模型地算法進(jìn)行了歸納,這些算法仍存在很大的改善空間,下一步研究可以考慮如下問(wèn)題:
1)自動(dòng)人臉修飾技術(shù)最重要的是保留人臉的個(gè)性化特征,不能在修飾后面目全非,因此如何在特征提取過(guò)程中盡量保留原照片的個(gè)性化特征,仍然需要繼續(xù)探討。
2)現(xiàn)階段的自動(dòng)修飾技術(shù),會(huì)使修飾的結(jié)果和方向趨于一致,如何使美化修飾過(guò)程具有一定的個(gè)性化是一個(gè)有待進(jìn)一步研究的問(wèn)題。
最后,為了使自動(dòng)人臉修飾技術(shù)的應(yīng)用更具有利用價(jià)值,在算法的改進(jìn)中不能只局限于現(xiàn)有的數(shù)據(jù)模型、年齡演化模型,可以跨學(xué)科地嘗試、引入新的模型方法,以期在更具有實(shí)用價(jià)值的指導(dǎo)下設(shè)計(jì)新的算法或改進(jìn)。
參考文獻(xiàn):
[1] 韓靜亮,趙曦,趙群飛,等.基于迭代多級(jí)中值濾波的人臉美化算法[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(5): 227-229.
[2] Leyvand T, Cohen-Or D, Dror G, et al., Data-driven enhancement of facial attractiveness, in ACM Transactions on Graphics(TOG), 2008: 38.
[3] Tidderman B, Stirrat B, Perrett D I, Towards realism in facial image transformations: Results from a wavelet mrf method, Computer Graphics Forum,2005, vol. 24: 449-456.
篇9
關(guān)鍵詞:智能;監(jiān)控技術(shù);安防;應(yīng)用
中圖分類號(hào):TB381 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):
引言
目前,傳統(tǒng)的視頻監(jiān)控系統(tǒng)已經(jīng)不能夠滿足快速發(fā)展的人類社會(huì)的需要,這就需要更加有效、更加智能的視頻監(jiān)控技術(shù)來(lái)滿足人們的需求。在視頻監(jiān)控里所說(shuō)的智能視頻技術(shù)一般是指:“自動(dòng)的分析和抽取視頻源中的關(guān)鍵信息?!蔽覀兛梢园褦z像機(jī)比作是人的眼睛,而智能視頻的系統(tǒng)和設(shè)備就好比是人用來(lái)思考的大腦。智能的視頻技術(shù)就是運(yùn)用強(qiáng)大的計(jì)算機(jī)數(shù)據(jù)的處理功能,高速的分析視頻畫(huà)面里的大量的數(shù)據(jù),將那些對(duì)用戶沒(méi)用的信息過(guò)濾掉,只留下一些關(guān)鍵的信息。
一、智能視頻監(jiān)控技術(shù)及的工作原理
智能視頻監(jiān)控是將計(jì)算機(jī)視覺(jué)技術(shù)引入到視頻監(jiān)控中而產(chǎn)生的,目前,智能視頻監(jiān)控已經(jīng)成為計(jì)算機(jī)視覺(jué)中一個(gè)重要的研究領(lǐng)域,從監(jiān)控?cái)z像頭開(kāi)始,包括運(yùn)動(dòng)對(duì)象提取、對(duì)象描述、對(duì)象跟蹤、對(duì)象識(shí)別和對(duì)象的行為分析,最后進(jìn)行預(yù)警或報(bào)警。
智能視頻監(jiān)控技術(shù)主要包括對(duì)視頻圖像序列自動(dòng)地進(jìn)行運(yùn)動(dòng)對(duì)象的提取、描述、跟蹤、識(shí)別和行為分析等方面的內(nèi)容。如果把攝像機(jī)看作人的眼睛,而智能視頻系統(tǒng)或設(shè)備則可以看作人的大腦。智能視頻監(jiān)控技術(shù)就是借助計(jì)算機(jī)強(qiáng)大的數(shù)據(jù)處理功能,對(duì)視頻畫(huà)面中的海量數(shù)據(jù)進(jìn)行高速分析,過(guò)濾掉監(jiān)控者不關(guān)心的信息,僅僅為監(jiān)控者提供有用的關(guān)鍵信息。智能視頻監(jiān)控以數(shù)字化、網(wǎng)絡(luò)化視頻監(jiān)控為基礎(chǔ),但又有別于一般的網(wǎng)絡(luò)化視頻監(jiān)控,它是一種更高端的視頻監(jiān)控應(yīng)用。智能視頻監(jiān)控系統(tǒng)能夠識(shí)別不同的物體,發(fā)現(xiàn)監(jiān)控畫(huà)面中的異常情況,并能夠以最快和最佳的方式發(fā)出警報(bào)和提供有用信息,從而能夠更加有效的協(xié)助安全人員處理危機(jī),并最大限度的降低誤報(bào)和漏報(bào)現(xiàn)象。其最終目的就是要使計(jì)算機(jī)能夠分析、描述和理解視頻畫(huà)面中的內(nèi)容。智能視頻監(jiān)控涉及到計(jì)算機(jī)視覺(jué)、圖像視頻處理和人工智能領(lǐng)域中的眾多核心技術(shù),是一個(gè)非常具有挑戰(zhàn)性的困難問(wèn)題。
二、智能視頻監(jiān)控技術(shù)的主要優(yōu)勢(shì)
視頻監(jiān)控技術(shù)的升級(jí)換代除了追求高壓縮比、高清,還在從普通的視頻移動(dòng)偵測(cè)向視頻分析邁進(jìn),具備更多面向特定應(yīng)用的智能(如防丟失、風(fēng)險(xiǎn)管理、商業(yè)管理等等)。智能視頻的本質(zhì)就是對(duì)于視頻圖片進(jìn)行一個(gè)數(shù)學(xué)上的分析處理,然后這個(gè)處理的結(jié)果為視頻的使用者提供一個(gè)決策和行動(dòng)的建議。以下是智能視頻監(jiān)控的主要優(yōu)勢(shì):
1、快速的反應(yīng)時(shí)間。毫秒級(jí)的報(bào)警觸發(fā)反應(yīng)時(shí)間。智能視頻監(jiān)控系統(tǒng)大大提高了報(bào)警的及時(shí)性,在事故發(fā)生的第一時(shí)間就會(huì)發(fā)出報(bào)警信號(hào),使得事件能夠在最短的事件內(nèi)得以解決。
2、更有效的監(jiān)視。針對(duì)廣場(chǎng)、旅游景點(diǎn)等重要領(lǐng)域的監(jiān)控范圍廣、人流量大,且極易發(fā)生應(yīng)急事件的問(wèn)題,要求高速球需具備速度快、精度高的特點(diǎn),在出現(xiàn)警情的情況下,能夠更快速、便捷的跟蹤目標(biāo)移動(dòng)物體,從而改變普通高速球的“被動(dòng)監(jiān)控”的現(xiàn)狀,實(shí)現(xiàn)“主動(dòng)監(jiān)控”。安保操作員只需要注意相關(guān)信息。
3、強(qiáng)大的數(shù)據(jù)檢索和分析功能。能提供快速的反應(yīng)時(shí)間和調(diào)查時(shí)間。智能視頻監(jiān)控系統(tǒng)能夠有效提高報(bào)警精確度,大大降低誤報(bào)和漏報(bào)現(xiàn)象的發(fā)生。智能視頻監(jiān)控系統(tǒng)的前端設(shè)備(網(wǎng)絡(luò)攝像機(jī)和視頻服務(wù)器)集成了強(qiáng)大的圖像。
4、有效擴(kuò)展視頻資源的用途。無(wú)論是傳統(tǒng)的視頻監(jiān)控系統(tǒng)還是網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng),其所監(jiān)控到的視頻畫(huà)面都只能應(yīng)用在安全監(jiān)視領(lǐng)域,而在智能視頻系統(tǒng)中,這些視頻資源還可以有更多的用途。
智能視頻監(jiān)控設(shè)備比普通的網(wǎng)絡(luò)視頻監(jiān)控設(shè)備具備更加強(qiáng)大的圖像處理能力和智能因素,因此可以為用戶提供更多高級(jí)的視頻分析功能,它可以極大的提高視頻監(jiān)控系統(tǒng)的能力,并使視頻資源能夠發(fā)揮更大的作用。
三、智能視頻監(jiān)控技術(shù)在安防領(lǐng)域的應(yīng)用
1、主要安防應(yīng)用類型
智能視頻監(jiān)控除具有一般的數(shù)字監(jiān)控系統(tǒng)的優(yōu)勢(shì)外,還具有實(shí)現(xiàn)24×7 h全天候可靠監(jiān)控、報(bào)警精確度高、響應(yīng)速度快、有效擴(kuò)展視頻資源的用途等特點(diǎn)。因此,隨著視頻監(jiān)控的普及以及監(jiān)控要求的提高,智能視頻監(jiān)控應(yīng)用范圍會(huì)不斷擴(kuò)大。智能視頻監(jiān)控的應(yīng)用主要分為安防類應(yīng)用和非安防類應(yīng)用。安防類應(yīng)用是目前市場(chǎng)上存在的主要智能視頻應(yīng)用,主要包括:
(1)高級(jí)視頻移動(dòng)偵測(cè):在復(fù)雜的天氣環(huán)境中(例如雨雪、大霧、大風(fēng)等)精確的偵測(cè)和識(shí)別單個(gè)物體或多個(gè)物體的運(yùn)動(dòng)情況,包括運(yùn)動(dòng)方向、運(yùn)動(dòng)特征等。
(2)人物面部識(shí)別:自動(dòng)識(shí)別人物的臉部特征,并經(jīng)與數(shù)據(jù)庫(kù)檔案的比較來(lái)識(shí)別或驗(yàn)證人物身份。
(3)遺留、遺棄物品檢測(cè):當(dāng)一個(gè)物體(如箱子、包裹、車輛、人物等)在敏感區(qū)域停留的時(shí)間過(guò)長(zhǎng),或超過(guò)了預(yù)定義的時(shí)間長(zhǎng)度就產(chǎn)生報(bào)警。典型應(yīng)用場(chǎng)景包括機(jī)場(chǎng)、火車站、地鐵站等。
(4)車輛識(shí)別:識(shí)別車輛的形狀、顏色、車牌號(hào)碼等特征,并反饋給監(jiān)控者??捎迷诒槐I車輛追蹤等場(chǎng)景中。
(5)人體行為分析:在目標(biāo)檢測(cè)分類的基礎(chǔ)上,利用人體的各種行為特征對(duì)其進(jìn)行各種行為的描述和分析,提取哪些危險(xiǎn)和有潛在危險(xiǎn)的行為,如打斗、搶奪和突然倒地等行為。
(6)物體追蹤:偵測(cè)到移動(dòng)物體之后,根據(jù)物體的運(yùn)動(dòng)情況,自動(dòng)發(fā)送PTZ控制指令,使攝像機(jī)能自動(dòng)跟蹤物體,在物體超出該攝像機(jī)監(jiān)控范圍之后,自動(dòng)通知物體所在區(qū)域的攝像機(jī)繼續(xù)進(jìn)行追蹤。
(7)入侵探測(cè):可感知設(shè)定區(qū)域內(nèi)突然出現(xiàn)和入侵的物體并及時(shí)報(bào)警。比如在戒備森嚴(yán)的軍事重地或銀行博物館等重要場(chǎng)所出現(xiàn)可疑人物等。
(8)擁擠檢測(cè):識(shí)別人群的整體運(yùn)動(dòng)特征,包括速度、方向等等,用以避免形成擁塞,或及時(shí)發(fā)現(xiàn)異常情況。典型的應(yīng)用場(chǎng)景包括超級(jí)市場(chǎng)、火車站等人員聚集的地方。
(9)物品被盜或移動(dòng)檢測(cè);當(dāng)監(jiān)控場(chǎng)景中的物體被盜和移動(dòng),算法將自動(dòng)檢測(cè)這種動(dòng)作,常用于貴重物品和關(guān)鍵設(shè)備的監(jiān)控。
(10)焰火檢測(cè):根據(jù)發(fā)生火情過(guò)程中煙火表現(xiàn)出的時(shí)一空特征進(jìn)行煙火的實(shí)時(shí)檢測(cè)。
2、應(yīng)用模式
智能視頻監(jiān)控技術(shù)具有2種應(yīng)用模式:
(1)與傳統(tǒng)的模擬視頻監(jiān)控系統(tǒng)結(jié)合使用,以突破傳統(tǒng)視頻監(jiān)控發(fā)展中遇到的瓶頸問(wèn)題。主要用于對(duì)已存在的模擬視頻監(jiān)控系統(tǒng)進(jìn)行智能化改造。選擇重點(diǎn)、高危監(jiān)控目標(biāo)和場(chǎng)所,針對(duì)該部分圖像進(jìn)行分析,選擇智能視頻服務(wù)器(IVS BOX)實(shí)現(xiàn)主動(dòng)監(jiān)控,同時(shí)將預(yù)警、警情實(shí)時(shí)發(fā)給模擬矩陣和DVR,完成快速切換和錄像。
(2)基于網(wǎng)絡(luò)的全數(shù)字化智能視頻監(jiān)控系統(tǒng)。該模式主要用于新建的數(shù)字化監(jiān)控系統(tǒng)中。同樣,選擇重點(diǎn)、高危監(jiān)控目標(biāo)和場(chǎng)所,直接在前端選擇智能視頻服務(wù)器(IVS BOX),實(shí)現(xiàn)主動(dòng)監(jiān)控,將預(yù)警、警情實(shí)時(shí)發(fā)給后端智能管理平臺(tái),完成快速切換和錄像。
3、實(shí)現(xiàn)方式
智能視頻監(jiān)控系統(tǒng)一般采用模塊化的設(shè)計(jì)方式,智能視頻分析模塊實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的自動(dòng)檢測(cè)、識(shí)別、跟蹤和報(bào)警,是實(shí)現(xiàn)智能視頻監(jiān)控的核心。該模塊可以部署在監(jiān)控系統(tǒng)的前端采集部分,也可以置于監(jiān)控中心。其產(chǎn)品形態(tài)可以是嵌入式DSP板卡的方式(板卡可以集成在視頻服務(wù)器、數(shù)字錄像機(jī)、攝像機(jī)等設(shè)備中),也可以是純軟件的方式。
智能視頻分析模塊接收上位機(jī)發(fā)送的告警規(guī)則設(shè)置;對(duì)固定攝像頭攝取的圖像內(nèi)容進(jìn)行高速分析與數(shù)據(jù)處理,實(shí)現(xiàn)目標(biāo)檢測(cè)和識(shí)別,對(duì)比預(yù)先設(shè)置的報(bào)警規(guī)則或用戶設(shè)定的條件給出預(yù)警、報(bào)警或處理結(jié)果。在發(fā)現(xiàn)威脅目標(biāo)并進(jìn)行報(bào)警的同時(shí),對(duì)目標(biāo)進(jìn)行自動(dòng)跟蹤。
結(jié)束語(yǔ)
智能化、數(shù)字化、網(wǎng)絡(luò)化是視頻監(jiān)控發(fā)展的必然趨勢(shì),智能視頻監(jiān)控的出現(xiàn)正是這一趨勢(shì)的直接體現(xiàn)。智能視頻監(jiān)控設(shè)備比普通的網(wǎng)絡(luò)視頻監(jiān)控設(shè)備具備更加強(qiáng)大的圖像處理能力和智能因素,因此可以為用戶提供更多高級(jí)的視頻分析功能,它可以極大地提高視頻監(jiān)控系統(tǒng)的能力,并使視頻資源能夠發(fā)揮更大的作用,其在安防領(lǐng)域的應(yīng)用也必將越來(lái)越來(lái)越廣泛。
參考文獻(xiàn):
[1]周永紅.智能視頻監(jiān)控技術(shù)及應(yīng)用[J].智能建筑與城市信息,2009,6.
[2]呂立波.淺析智能視頻監(jiān)控技術(shù)及其主要應(yīng)用[J].中國(guó)公共安全雜志,2009,5.
篇10
關(guān)鍵詞:字符提取;HALCON;機(jī)器視覺(jué);圖像處理
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):16727800(2017)004008003
0引言
我國(guó)專利申請(qǐng)量居世界前列,每年都有數(shù)以百萬(wàn)項(xiàng)專利申請(qǐng)。專利號(hào)是每個(gè)專利的唯一標(biāo)識(shí),數(shù)目繁多,統(tǒng)計(jì)工作量巨大,人工管理專利作業(yè)不僅效率低,還容易出錯(cuò)。因此,設(shè)計(jì)一種自動(dòng)識(shí)別專利發(fā)票上的專利申請(qǐng)?zhí)栂到y(tǒng)十分必要。本文以專利發(fā)票為實(shí)驗(yàn)對(duì)象,介紹一種票據(jù)字符提取系統(tǒng)。 隨著計(jì)算機(jī)技術(shù)和數(shù)字圖像處理技術(shù)的飛速發(fā)展,機(jī)器視覺(jué)廣泛應(yīng)用于生產(chǎn)生活中。視覺(jué)檢測(cè)技術(shù)作為機(jī)器視覺(jué)的重要研究領(lǐng)域,不僅能提高自動(dòng)化程度,還能顯著提升檢測(cè)的安全性與可靠性[1]。當(dāng)今幾乎所有需要人類視覺(jué)的場(chǎng)合都可以用機(jī)器視覺(jué)技術(shù)來(lái)代替,尤其對(duì)于需要快速、重復(fù)地從圖像中獲取精確信息的場(chǎng)合,機(jī)器視覺(jué)技術(shù)是實(shí)現(xiàn)計(jì)算機(jī)集成制造的基礎(chǔ)技術(shù)[23]。 HALCON是德國(guó)MVtec公司開(kāi)發(fā)的具有強(qiáng)大圖像處理功能的軟件,包含所有標(biāo)準(zhǔn)和高級(jí)的圖像處理方法,擁有非常完善的函數(shù)庫(kù),包括定位、匹配、識(shí)別等高級(jí)算法,能夠進(jìn)行圖像獲取、模板匹配、Blob分析、邊緣提取、測(cè)量、識(shí)別等[4],具有全面的視覺(jué)處理庫(kù)和應(yīng)用廣泛的機(jī)器視覺(jué)集成開(kāi)發(fā)環(huán)境。HALCON通過(guò)交互編程開(kāi)發(fā)應(yīng)用程序,或加入新的算子來(lái)實(shí)現(xiàn)視覺(jué)功能,是應(yīng)用效果最好的機(jī)器視覺(jué)處理軟件[2,5]。本文利用HALCON機(jī)器視覺(jué)技術(shù)設(shè)計(jì)并實(shí)現(xiàn)票據(jù)特定字符――專利申請(qǐng)?zhí)柕奶崛 ?/p>
1系統(tǒng)設(shè)計(jì)
基于機(jī)器視覺(jué)的專利收費(fèi)票據(jù)檢測(cè)系統(tǒng)需要對(duì)置物臺(tái)上的專利收費(fèi)票據(jù)進(jìn)行采集和識(shí)別,最終提取出申請(qǐng)?zhí)栕址I暾?qǐng)?zhí)栕址崛∠到y(tǒng)主要由電源光源部分、z像機(jī)傳感器單元、圖像采集單元和圖像處理操作平臺(tái)等構(gòu)成。通過(guò)調(diào)節(jié)器控制光源,攝像機(jī)傳感器和圖像采集單元由檢測(cè)元件控制。系統(tǒng)架構(gòu)如圖1所示。
系統(tǒng)流程如圖2所示。 申請(qǐng)?zhí)栕址崛∠到y(tǒng)中,用CMOS數(shù)字像機(jī)進(jìn)行圖像采集,圖像采集單元主要完成置物臺(tái)上整個(gè)票據(jù)圖像的獲取。圖像采集和處理是機(jī)器視覺(jué)系統(tǒng)的核心,攝像機(jī)獲取的圖像包含了需要的所有信息,圖像質(zhì)量的好壞將直接影〖HJ*3〗響系統(tǒng)檢測(cè)效率和精度,是整個(gè)機(jī)器視覺(jué)系統(tǒng)的關(guān)鍵。光源則影響整個(gè)圖像質(zhì)量,合適的光源能很好地區(qū)分目標(biāo)信息和背景信息,影響輸入圖像的質(zhì)量和至少30%的應(yīng)用效果[6]。根據(jù)應(yīng)用需求,系統(tǒng)光源采用LED光源。系統(tǒng)工作時(shí),采用檢測(cè)觸發(fā)抓拍方式獲取圖像,攝像機(jī)由檢測(cè)元件觸發(fā)控制。檢測(cè)元件由光電觸發(fā)器與反射板組成,它是一個(gè)反射型的觸發(fā)器。當(dāng)票據(jù)通過(guò)置物臺(tái)時(shí),信號(hào)強(qiáng)度會(huì)變化,檢測(cè)元件據(jù)此輸出控制信號(hào)來(lái)觸發(fā)攝像機(jī)拍攝圖像[7]。拍攝的圖像傳送到采集單元,再經(jīng)過(guò)像機(jī)數(shù)據(jù)接口傳輸?shù)綑C(jī)器視覺(jué)圖像庫(kù)中,利用軟件中的算子功能對(duì)圖像進(jìn)行相應(yīng)處理、識(shí)別和輸出。機(jī)器視覺(jué)軟件為HALCON 10.0。
2圖像處理技術(shù)
采用 OCR圖像處理方法檢測(cè)專利收費(fèi)票據(jù)申請(qǐng)?zhí)栕址CR指通過(guò)圖像處理和模式識(shí)別技術(shù)對(duì)光學(xué)字符進(jìn)行識(shí)別,用于閱讀和識(shí)別特定區(qū)域字符?;谀0鍣C(jī)制,針對(duì)不同票據(jù),定制不同的識(shí)別要素,專利票據(jù)為印刷票據(jù),因此采用OCR圖像處理方法對(duì)票據(jù)申請(qǐng)?zhí)栕址M(jìn)行提取,基本步驟為:獲取圖像預(yù)處理圖像分割圖像OCR匹配識(shí)別字符輸出結(jié)果。
2.1獲取圖像
圖像獲取由攝像機(jī)傳感器、檢測(cè)元件等硬件設(shè)備和HALCON軟件算子共同完成,HALCON軟件首先調(diào)用open_framegrabber算子訪問(wèn)圖像采集設(shè)備,再調(diào)用grab_image算子完成采集圖像,將采集得到的圖像加以保存,然后再調(diào)用read_image和dev_display把圖像顯示出來(lái)。票據(jù)圖像如圖3所示。
2.2預(yù)處理圖像
為使采集的圖像區(qū)域特征更加明顯,目標(biāo)信息更加突出,要經(jīng)過(guò)一系列預(yù)處理,主要有圖像增強(qiáng)、灰度值調(diào)節(jié)、濾波、填充縫隙、圖像分割等[7]。
2.2.1圖像增強(qiáng)與灰度值調(diào)整
調(diào)用emphasize算子,使發(fā)票上的信息顯示更為明顯。為了得到更清晰的申請(qǐng)?zhí)栕址?,需要將申?qǐng)?zhí)栃畔恼麄€(gè)票據(jù)復(fù)雜的背景中提取出來(lái),消除噪聲,以降低后續(xù)步驟難度。采用閾值分割,調(diào)節(jié)灰度值調(diào)用threshold算子,調(diào)節(jié)灰度值過(guò)后的圖像突出了申請(qǐng)?zhí)栕址畔?,?jiàn)圖4。
2.2.2填充縫隙與濾波 灰度值調(diào)整后的數(shù)字圖像仍存在許多噪聲,去除這些噪聲干擾,常采用數(shù)學(xué)形態(tài)學(xué)方法進(jìn)行去噪[8]。數(shù)學(xué)形態(tài)學(xué)有4個(gè)基本運(yùn)算:膨脹、腐蝕、開(kāi)運(yùn)算和閉運(yùn)算。數(shù)學(xué)形態(tài)學(xué)利用結(jié)構(gòu)元素作為探針不斷移動(dòng)圖像信息來(lái)了解圖像的結(jié)構(gòu)特征。為使圖像數(shù)字特征更為明顯,調(diào)用fill_up_shape和dilation_circle算子填充字符內(nèi)部的黑色部分;對(duì)深色部分進(jìn)行處理時(shí),調(diào)用形態(tài)學(xué)opening_circle算子以抑制雜波。為滿足申請(qǐng)?zhí)栕址珳?zhǔn)檢測(cè)提取要求,在圖像預(yù)處理階段需將灰度值調(diào)整、填充縫隙、濾波等3種處理方式相互協(xié)調(diào)使用。
2.3申請(qǐng)?zhí)柖ㄎ慌c分割圖像
申請(qǐng)?zhí)栕址ㄎ凰惴ㄊ钦麄€(gè)字符識(shí)別的核心,從專利票據(jù)可以看到許多數(shù)字組合,但是申請(qǐng)?zhí)柕奈粩?shù)是固定的,而且距離整個(gè)方框中心最近?;诖耍梢愿鶕?jù)申請(qǐng)?zhí)柕拈L(zhǎng)度定位申請(qǐng)?zhí)?,但最下排漢字會(huì)存在干擾,如圖5所示綠色部分。 通過(guò)申請(qǐng)?zhí)柕姆娇騼蓷l豎線定位中心,尋找距離中心較近目標(biāo),即為申請(qǐng)?zhí)栁恢茫?jiàn)圖5。HALCON主要程序如下:MiddleColumnSum:=0 for i := 1 to NumIntermediate2 by 1 MiddleColumnSum:=(Row22[i-1]+Row21[i-1])/2+MiddleColumnSum endfor MiddleColumn:= MiddleColumnSum/NumIntermediate2 **尋找與豎線中心坐標(biāo)最接近的目標(biāo),即為申請(qǐng)?zhí)杁evbig:=0 dev:=0 for i := 1 to NumIntermediate3 by 1 dev :=(Row22[i-1]+Row21[i-1])/2 if(dev>devbig) devbig:=dev n:=i endif endfor
確定申請(qǐng)?zhí)栁恢煤?,單?dú)分割提出申請(qǐng)?zhí)柌糠謭D像,見(jiàn)圖6,再應(yīng)用圖像處理技術(shù),對(duì)申請(qǐng)?zhí)栕址M(jìn)行分割。首先進(jìn)行圖像分割,通過(guò)對(duì)原始圖像進(jìn)行某種方式的分割處理,提取圖像的某些特征,最常用的方法是閾值分割[910]。經(jīng)過(guò)處理后,申請(qǐng)?zhí)栕址赡艽嬖谝恍┪⑿〉臄嗔眩藭r(shí)調(diào)用closing_circle算子以連接這些微小斷裂,減少誤識(shí)別。因?yàn)樯暾?qǐng)?zhí)栕址脚帕谐梢慌牛梢哉{(diào)用closing_rectanglel算子將申請(qǐng)?zhí)栕址谒椒较蚝喜⒊梢粋€(gè)整目標(biāo),調(diào)用connection算子把合并后的目標(biāo)區(qū)域轉(zhuǎn)換為一個(gè)個(gè)分離的對(duì)象,采用聯(lián)合與分割方法分開(kāi)字符,調(diào)用intersection算子和connection算子得到分割好的底滯枷?。具^(guò)以上步驟,整個(gè)申請(qǐng)?zhí)栕址旧夏軌蚯逦仫@示出來(lái),再使用sort_region算子將數(shù)字排列,調(diào)用region_to_bin算子把區(qū)域轉(zhuǎn)化成二值圖像,最后將圖像顯示出來(lái),結(jié)果如圖7所示。
2.4OCR匹配
在HALCON軟件中進(jìn)行OCR圖像處理和識(shí)別:根據(jù)申請(qǐng)?zhí)栕址卣鳎瑢⒔?jīng)過(guò)處理后的圖像與已知 “模板”進(jìn)行比對(duì),把置信度最高的值返回到class中,進(jìn)行自動(dòng)識(shí)別然后輸出結(jié)果。字符檢測(cè)提取 “模板”非常重要,它將決定最后匹配結(jié)果的精準(zhǔn)度。申請(qǐng)?zhí)栆话闶欠浅:?jiǎn)單的數(shù)字和字母組合,所以本系統(tǒng)采用HALCON自帶的OCR模板庫(kù)即可。但是如果想識(shí)別其它文字等符號(hào),則需要使用函數(shù)庫(kù),或者創(chuàng)建及訓(xùn)練ORC分類器,即建立相應(yīng)的“模板”。
2.5識(shí)別字符
采用模板匹配法識(shí)別字符。將待識(shí)別的字符逐個(gè)與建立好的模板字符匹配。識(shí)別過(guò)程就是利用模板,對(duì)要識(shí)別的對(duì)象進(jìn)行圖形處理,最后通過(guò)OCR模板匹配度算子得到結(jié)果。 首先調(diào)用read_ocr_class_mlp算子讀取分類文件,讀取 HALCON 自帶的 'Industrial_0-9A-Z.omc' 模板文件。do_ocr_multi_class_mlp算子將最終處理后得到的圖像與模板逐一匹配,得到匹配結(jié)果和匹配置信度,再調(diào)用smallest_rectangle1算子提取特征,得到該圖像上的字符方位,為后面定位操作提供參考。最后選擇一個(gè)起始位置顯示識(shí)別結(jié)果,這里要用到set_tposition 和write_string 兩個(gè)算子。程序運(yùn)行結(jié)果見(jiàn)圖8。
3結(jié)語(yǔ)
票據(jù)特殊字符人工提取不僅工作量大、速度慢,而且枯燥乏味,容易因疏忽導(dǎo)致錯(cuò)誤。本文將機(jī)器視覺(jué)技術(shù)應(yīng)用到專利票據(jù)申請(qǐng)?zhí)柼崛≈校軠?zhǔn)確識(shí)別出專利發(fā)票收據(jù)上的申請(qǐng)?zhí)?,?shí)現(xiàn)了自動(dòng)快速檢測(cè)提取,大幅降低了成本,提高了效率和準(zhǔn)確度。此技術(shù)還可識(shí)別增值稅發(fā)票等不同種類票據(jù),在財(cái)務(wù)管理等領(lǐng)域用途廣泛。
參考文獻(xiàn):[1]趙杰文,陳振濤,鄒小波.機(jī)器視覺(jué)實(shí)現(xiàn)方便面破損在線檢測(cè)的研究[J].微計(jì)算機(jī)信息,2007,23(10):238240.
[2]孫懷遠(yuǎn),廖躍華,周夫之,等.基于HALCON的藥品包裝瓶批號(hào)檢測(cè)技術(shù)研究[J].包裝工程,2008,29(8):7173.[3]彭曉輝.基于HALCON的IC卡噴碼符號(hào)識(shí)別技術(shù)研究與實(shí)現(xiàn)[D].廣州:廣東工業(yè)大學(xué),2006.
[4]肖海俊,葛廣英,姚坤,等.基于HALCON的噴碼字符識(shí)別技術(shù)的研究與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2015,38(15):9598.
[5]郭佳寅,岳秀江,吳雙,等.基于HALCON的乳制品箱體噴碼字符識(shí)別方法研究[J].制造業(yè)自動(dòng)化,2013(3):2122.
[6]楊莉,潘豐.基于機(jī)器視覺(jué)的硬盤(pán)磁體檢測(cè)系統(tǒng)設(shè)計(jì)[J].江南大學(xué)學(xué)報(bào):自然科學(xué)版,2012,11(5):505-508.[7]孫懷遠(yuǎn),楊麗英,周夫之.基于機(jī)器視覺(jué)技術(shù)的藥品瓶包裝在線檢測(cè)系統(tǒng)[J].自動(dòng)化與控制,2011(2):4650.[8]春霞,魏敏,唐正寧.基于數(shù)學(xué)形態(tài)學(xué)的印刷網(wǎng)點(diǎn)圖像分割方法[J].包裝工程,2007,28(6):14-15,36.
熱門(mén)標(biāo)簽
計(jì)算機(jī)畢業(yè)論文 計(jì)算機(jī)論文 計(jì)算機(jī)技術(shù)論文 計(jì)算機(jī)教育論文 計(jì)算機(jī)專業(yè)論文 計(jì)算機(jī)專業(yè)畢業(yè)論文 計(jì)算機(jī)教學(xué)論文 計(jì)算機(jī)基礎(chǔ)論文 計(jì)算機(jī)應(yīng)用論文 計(jì)算化學(xué)論文 心理培訓(xùn) 人文科學(xué)概論
相關(guān)文章
1計(jì)算機(jī)類專業(yè)開(kāi)展工程的思考
2高職院校計(jì)算機(jī)專業(yè)人才培養(yǎng)探析
4中職計(jì)算機(jī)教學(xué)應(yīng)用策略