一種有噪環(huán)境下的場(chǎng)景識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于一種場(chǎng)景識(shí)別方法技術(shù)領(lǐng)域,尤其屬于一種在有噪環(huán)境下的場(chǎng)景識(shí)別 方法技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] -般說來,場(chǎng)景分類可以看做是一種視角獨(dú)立的物體識(shí)別問題,一個(gè)場(chǎng)景是由一 系列的實(shí)體組成。例如,室內(nèi)場(chǎng)景會(huì)包含有椅子、桌子、人和書架,而這些事物的擺設(shè)也不是 固定不變的。對(duì)場(chǎng)景的準(zhǔn)確識(shí)別有助于解決很多實(shí)際應(yīng)用,比如基于內(nèi)容的圖像檢索,機(jī)器 人路徑規(guī)劃技術(shù)和圖像標(biāo)注,等等?,F(xiàn)如今,場(chǎng)景識(shí)別越來越受到了研究人員的關(guān)注。
[0003] 廣泛的研究表明特征提取后獲取的圖像特征維數(shù)很高,受限于計(jì)算資源,較高的 特征維度會(huì)影響RGB-D(結(jié)合彩色圖像和深度圖像(depth image))傳感器組成的場(chǎng)景識(shí)別 系統(tǒng)的實(shí)用性??v然現(xiàn)有的特征選擇技術(shù)可以使得高維特征變得更加簡潔和有效,但是現(xiàn) 有的特征選擇方法忽略了在樣本中混有大量噪聲的問題,然而,在實(shí)際的應(yīng)用中,由于系統(tǒng) 的復(fù)雜度問題和設(shè)備處理精度問題常常會(huì)摻雜很多的噪聲,那么現(xiàn)有的特征選擇算法的識(shí) 別效果就會(huì)有一定的局限性。
[0004] 經(jīng)檢索,已經(jīng)公開的場(chǎng)景識(shí)別方法專利經(jīng)檢索已有百篇以上,但是在有噪環(huán)境下 的場(chǎng)景識(shí)別方法為數(shù)不多,申請(qǐng)人結(jié)合柯西估計(jì)理論,形成流形柯西學(xué)習(xí)算法,達(dá)到了有噪 環(huán)境下對(duì)場(chǎng)景的準(zhǔn)確識(shí)別。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明詳細(xì)描述了 一種有噪環(huán)境下的場(chǎng)景識(shí)別方法和一種新的特征選擇算 法一一流形柯西學(xué)習(xí)算法。
[0006] 本發(fā)明采用如下技術(shù)方案實(shí)現(xiàn)。
[0007] -種有噪環(huán)境下的場(chǎng)景識(shí)別方法,包括以下步驟:1)利用傳感器獲取場(chǎng)景圖像,內(nèi) 含標(biāo)記的樣本;2)分別對(duì)場(chǎng)景的彩色圖像和深度圖像(depth image)進(jìn)行特征提取和特征 表達(dá),合并同一組的彩色圖像特征和深度圖像(depth image)特征;3)選擇特征選擇算法對(duì) 標(biāo)記的樣本用第2步得到的特征獲取特征選擇模型;4)采用分類器進(jìn)行分類。
[0008] 本發(fā)明所述的步驟1)是利用Kinect傳感器獲取場(chǎng)景圖像。
[0009] 本發(fā)明所述的步驟2)具體為,將所有圖像轉(zhuǎn)換成灰度圖,對(duì)圖像進(jìn)行縮放,然后對(duì) 彩色圖像和深度圖像(depth image)的局部塊上用尺度不變特征轉(zhuǎn)換(SIFT)方法提取特 征,再采用局部限制線性編碼(LLC)算法進(jìn)行特征表達(dá)。
[0010] 本發(fā)明所述的步驟3)特征選擇算法為流形柯西學(xué)習(xí)算法,具體步驟如下:
[0011 ]對(duì)于一個(gè)給定的樣本Xl屬于樣本集合X= [X1,X2,…Xn] eRDXN(這里N是樣本個(gè)數(shù), D是樣本的原始維數(shù),R代表在實(shí)數(shù)空間),其對(duì)應(yīng)的低維樣本yi屬于樣本集合Y=[yi,y2, ...y n]eRdxN(這里d是降維后的維數(shù)),找到K個(gè)最近鄰的同類和不同類的樣本~,···,氣"其 中,有h個(gè)是和 Xl同類的樣本,剩下的^個(gè)是和Xl不同類的樣本,其中Kiki+ks,分別用 }和{?,…表示這兩組樣本;對(duì)于整個(gè)Xi的局部塊表示為:
表示DX (ki+k2+l)維的線性空間),對(duì)
;在一個(gè)新得到的低維局部塊內(nèi), 達(dá)到同類樣本間的的距離足夠的近而不同類樣本間的距離足夠的遠(yuǎn),因此以上優(yōu)化函數(shù)表 示如下:
[0013] α是尺度因子,用來控制類內(nèi)樣本和類間樣本的影響;
[0014]定義一個(gè)系數(shù)向量coi:
[0016]利用定義的系數(shù)向量,(1)式就會(huì)被化簡成以下的形式:
[0022]因此,得到低維表達(dá)Yi = YSi,目標(biāo)函數(shù)⑵改寫為:
[0024]引入了柯西估計(jì)理論,來克服噪聲帶來的影響,(4)式變?yōu)橐韵碌男问剑?br>[0026] c是用來權(quán)衡噪聲的系數(shù);
[0027]由于存在Y = UTX關(guān)系,(7)式簡化為:
[0029]為了在低維的空間表示出來的樣本之間的距離較遠(yuǎn),對(duì)于每個(gè)樣本來說就表示 為:每個(gè)低維空間的樣本與所有樣本類中心的距離足夠的遠(yuǎn),表示為以下的目標(biāo)函數(shù):
[0032]為了避免發(fā)生過擬合的情況,加入了二范數(shù),那么整合所有上述的情況,就寫成以 下的目標(biāo)函數(shù):
[0034]這里的&和&是正則化系數(shù);
[0035] 為了使(8)有唯一解,申請(qǐng)人給定限定條件是UTU=I;投影矩陣U通過迭代的方法 和特征值的求解方法解出來。
[0036] 本發(fā)明的有益效果是在有噪環(huán)境下對(duì)場(chǎng)景進(jìn)行準(zhǔn)確識(shí)別,保證了在樣本混入噪聲 以后同樣也具有一定辨識(shí)能力;因此就改善了室內(nèi)場(chǎng)景數(shù)據(jù)集中混有噪聲情況下的性能。 [0037]下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明做進(jìn)一步解釋。
【附圖說明】
[0038]圖1為本發(fā)明技術(shù)方案的邏輯框架圖。
【具體實(shí)施方式】
[0039]見圖1,本發(fā)明的目的在于克服現(xiàn)有的結(jié)合彩色圖像和深度圖像(d印th iamge)傳 感器的室內(nèi)場(chǎng)景識(shí)別系統(tǒng)中沒有考慮噪聲影響的問題,提出了一種有噪環(huán)境下的場(chǎng)景識(shí)別 方法,包括以下步驟:1)利用Kinect傳感器獲取場(chǎng)景圖像;2)分別對(duì)場(chǎng)景的彩色圖像和深度 圖像(depth image)進(jìn)行特征提取和特征表達(dá),合并同一組的彩色圖像特征和深度圖像 (depth image)特征;3)采用流形柯西學(xué)習(xí)算法對(duì)標(biāo)記的樣本用第2步得到的特征獲取特征 選擇模型;4)采用支持向量機(jī)(SVM)分類器進(jìn)行分類。
[0040]所述的第一步利用Kinect傳感器獲取場(chǎng)景彩色圖像和對(duì)應(yīng)的深度圖像(depth image)〇
[0041 ]所述的第二步對(duì)第一步得到的彩色圖像和對(duì)應(yīng)的深度圖像(depth image)的特征 提取與特征表達(dá)和合并的過程如下:1)將所有圖像轉(zhuǎn)換成灰度圖,并通過一定比例對(duì)圖像 進(jìn)行縮放,使得其尺寸小于等于300X300個(gè)像素。2)對(duì)彩色圖像和深度圖像(depth image) 的局部塊上用尺度不變特征轉(zhuǎn)換(SIFT)方法提取特征,該局部塊的大小為16X16像素,相 鄰局部塊之間在圖像上水平或垂直有8個(gè)像素的重疊區(qū)域,局部塊上提取的尺度不變特征 轉(zhuǎn)換特征維數(shù)為128。3)采用LLC算法進(jìn)行特征表達(dá)。采用局部限制線性編碼(LLC)算法進(jìn)行 表達(dá)時(shí),需要對(duì)所有數(shù)據(jù)集上的局部塊進(jìn)行k均值(k-means)聚類,從而形成一個(gè)碼本(詞 典)Λ均值聚類算法隨意選擇第一個(gè)聚類中心,當(dāng)聚類中心在小范圍變化時(shí),迭代的終止。 假設(shè)在實(shí)施方案中碼本的數(shù)目為1024個(gè)。申請(qǐng)人在三層空間金字塔模型上進(jìn)行最大聚合, 該三層空間金字塔模型劃分為1X1,2X 2和4X4的子區(qū)域。對(duì)成對(duì)彩色圖像和深度圖像 (depth image)對(duì)來說,局部限制線性編碼(LLC)的特征長度都為(1+4+16) X 1024 = 21504。 最后將彩色圖像和深度圖像(depth image)分別得到的圖像特征進(jìn)行合并得到21504X2 = 43008維特征