日韩av无码中文无码电影-亚洲熟妇av一区-中文字幕无码乱码人妻系列蜜桃-人人妻人人爽人人澡欧美一区

名茶鑒別技術(shù)淺探

前言:本站為你精心整理了名茶鑒別技術(shù)淺探范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢(xún)。

名茶鑒別技術(shù)淺探

光譜預(yù)處理

由于光源強(qiáng)度的不均勻分布,使得光強(qiáng)弱的波段存在暗電流,采集得到的圖像信息包含很多的噪音,因此對(duì)高光譜圖像進(jìn)行矯正[4]。相同采集條件下,獲取白色標(biāo)準(zhǔn)圖像W和黑色校準(zhǔn)圖像B,最終得到相對(duì)圖像R,完成高光譜圖像矯正。圖2顯示了在408~1117nm范圍內(nèi)的不同像素的茶樣圖像的光譜曲線(xiàn)。在光譜維中,剔除700nm以下曲線(xiàn)值比較低和900nm以上噪聲較強(qiáng)的光譜曲線(xiàn)后,選取該范圍內(nèi)的圖像數(shù)據(jù);在二維圖像維中,將圖像數(shù)據(jù)通過(guò)ENVI重新采樣,最終對(duì)由287張波長(zhǎng)在700~900nm范圍內(nèi)且像素大小為650*811的碧螺春茶樣高光譜圖像三維數(shù)據(jù)塊進(jìn)行分析。

特征提取

高光譜三維圖像數(shù)據(jù)雖然可完全涵蓋研究對(duì)象的信息,但是每個(gè)樣本過(guò)大的數(shù)據(jù)量降低了后期數(shù)據(jù)處理的速度。相關(guān)性較大的相近波段圖像造成了數(shù)據(jù)塊中存在大量的冗余信息,所以需要在不丟失有效數(shù)據(jù)信息的前提下,選擇合適的算法降低數(shù)據(jù)塊的維數(shù)來(lái)消去冗余信息,以減少后期處理時(shí)間和增強(qiáng)識(shí)別結(jié)果的準(zhǔn)確性。主成分分析是將原始眾多具有一定相關(guān)性的變量信息按協(xié)方差最大的方向投影,得到幾個(gè)彼此相互獨(dú)立而且互不相關(guān)的綜合變量,并同時(shí)完成原始變量數(shù)據(jù)維數(shù)的降低和原始數(shù)據(jù)中冗余信息的消除。實(shí)驗(yàn)采用PCA來(lái)篩選特征波長(zhǎng)圖像。結(jié)合本PCA原理可知,原始茶樣圖像由各PCA圖像結(jié)合對(duì)應(yīng)方差的大小經(jīng)過(guò)線(xiàn)性組合而成;方差貢獻(xiàn)率數(shù)值的大小即決定了PCA圖像各自所體現(xiàn)原始圖像信息的比重;比較權(quán)重系數(shù)即可尋找到最能表征每個(gè)原始碧螺春茶樣信息的最佳PCA圖像[5]。經(jīng)過(guò)PCA后得到的前4個(gè)主成分圖像PC1,PC2,PC3和PC4,如圖3所示。通過(guò)對(duì)比可以看出,PC1在波長(zhǎng)范圍內(nèi)最能反映原始茶樣,它是由287個(gè)特定波長(zhǎng)處圖像和對(duì)應(yīng)權(quán)重系數(shù)的線(xiàn)性組合,順序選取前2個(gè)最大權(quán)重系數(shù)依次對(duì)應(yīng)763.36nm和791.17nm處的特征圖像。按照此流程,通過(guò)PCA分別優(yōu)選出所有茶樣這兩個(gè)波長(zhǎng)下的圖像作為對(duì)應(yīng)的特征圖像。灰度共生矩陣一直是重要的紋理統(tǒng)計(jì)分析方法之一。GLCM建立在對(duì)二維灰度圖像中各像素信息之間的二階組合條件概率密度函數(shù)的形象描述,它可以表述為在以灰度級(jí)i為始點(diǎn),θ方向相隔一定的像元距離d時(shí),出現(xiàn)特定灰度級(jí)j的概率,即為GLCM矩陣的像元,記為p(i,j,d,θ)。GLCM構(gòu)造的結(jié)構(gòu)統(tǒng)計(jì)和紋理特征從不同的角度反映研究對(duì)象圖像的灰度分布,信息的數(shù)量以及質(zhì)地粗糙等特性[6]。本實(shí)驗(yàn)針對(duì)每個(gè)茶樣優(yōu)選出2個(gè)特征波長(zhǎng)下的圖像,為了消去培養(yǎng)皿邊緣光線(xiàn)反光以及背景圖像的影響,以特征圖像的中心位置點(diǎn)為中心,選擇為400*400、包含茶葉信息的正方形圖像區(qū)域,以GLCM構(gòu)造的對(duì)比度(Contrast)、相關(guān)性、能量和均勻性4個(gè)統(tǒng)計(jì)量作為紋理特征值。在利用GLCM獲取紋理特征時(shí),不同構(gòu)造因子(如像元方向角θ和像元距離d)所得到的GLCM差別很大,進(jìn)而導(dǎo)致最終獲取的二次統(tǒng)計(jì)量也存在較大的差異:在討論像元方向角θ取值時(shí),由于茶葉平鋪于培養(yǎng)皿掃描的隨機(jī)和不均勻性,本實(shí)驗(yàn)采用固定像元方向角為0°的方法來(lái)消除其影響。不同的像元距離d決定了茶樣圖像GLCM中的兩個(gè)采樣像素點(diǎn)間的距離。紋理像元較大的粗紋理中,d與紋理像元的幅度相比較小,此時(shí)GLCM中的高灰度值的像元就集中在矩陣對(duì)角線(xiàn)周?chē)?而對(duì)細(xì)紋理而言,如果d與紋理像元的幅度大小差不多,此時(shí)GLCM中高灰度值的元素分布較均勻。由此需要針對(duì)不同的研究對(duì)象選擇合適的d,使得到GLCM構(gòu)成的紋理統(tǒng)計(jì)量能最好地描述所研究的對(duì)象[7]。利用MATLAB編制了提取GL-CM特征參數(shù)的程序,從所有數(shù)據(jù)中任選5張圖像分析其GLCM紋理特征參數(shù)并進(jìn)行比較,最終選取像元方向角θ=0°、所有參數(shù)數(shù)值最大時(shí)的d=4作為構(gòu)造GLCM的最佳像元距離。

模型建立與鑒別結(jié)果

SVM是按照間隔大小將低維空間非線(xiàn)性可分映射到高維空間,劃分成若干高維可分子集,建立結(jié)構(gòu)風(fēng)險(xiǎn)最優(yōu)化模型[8]。SVM可以通過(guò)出色的學(xué)習(xí)能力自動(dòng)尋找到對(duì)分類(lèi)有較強(qiáng)劃分能力的支持向量,構(gòu)造的分類(lèi)器可將各類(lèi)之間間隔距離達(dá)到最大限,其分類(lèi)準(zhǔn)確率可以達(dá)到很高[9]。因此,本文采用SVM作為模式識(shí)別模型,來(lái)對(duì)真?zhèn)伪搪荽翰铇覩LCM構(gòu)造的紋理統(tǒng)計(jì)信息進(jìn)行預(yù)測(cè)和判別。SVM核函數(shù)的引入,使其在算法復(fù)雜度不增加的情況下又具有了很高的學(xué)習(xí)機(jī)器非線(xiàn)性處理能力。研究最多的核函數(shù)有多項(xiàng)式核、徑向基核以及Sigmoid核函數(shù),但是徑向基核函數(shù)較Sigmoid的局部性強(qiáng),較多項(xiàng)式核的參數(shù)少、計(jì)算時(shí)間短[10]??紤]需要對(duì)真?zhèn)尾枞~樣本的快速鑒別,因此選取了徑向基核函數(shù)。核函數(shù)參量懲罰系數(shù)C和寬度δ對(duì)模型也會(huì)產(chǎn)生一定的影響,本實(shí)驗(yàn)采用交叉驗(yàn)證法對(duì)核函數(shù)的參量進(jìn)行優(yōu)化,結(jié)果模型識(shí)別效果最佳的徑向基核函數(shù)懲罰系數(shù)C=39.78,寬度參量δ=2.82。在每個(gè)茶樣的特征波長(zhǎng)下,對(duì)應(yīng)圖像構(gòu)成的8個(gè)GLCM紋理特征變量組成的訓(xùn)練集和預(yù)測(cè)集數(shù)據(jù)變量之間仍然存在一定的相關(guān)性,所以在模型建立之前,繼續(xù)采用PCA對(duì)數(shù)據(jù)進(jìn)行獨(dú)立的主成分分量提取,構(gòu)成基于RBF核函數(shù)的SVM模式識(shí)別的變量輸入;選擇合適的主成分?jǐn)?shù)對(duì)鑒別模型的建立也很重要。不同主成分?jǐn)?shù)對(duì)模型結(jié)構(gòu)的影響如圖4所示。由圖4可以看出:在主成分?jǐn)?shù)等于6之前,預(yù)測(cè)模型的判別率隨主成分?jǐn)?shù)的增加而升高;但當(dāng)主成分?jǐn)?shù)增加到6以后,再隨著主成分?jǐn)?shù)的增加,預(yù)測(cè)時(shí)判別率卻有下降的趨勢(shì)。圖4訓(xùn)練和預(yù)測(cè)模型的判別率與主成分?jǐn)?shù)關(guān)系比較后,最終選取訓(xùn)練預(yù)測(cè)集都最高的像元方向角θ為0°,像元距離d為4的前6個(gè)主成分特征變量作為SVM模型的輸入變量。表1為真?zhèn)尾铇颖镜挠?xùn)練和預(yù)測(cè)的結(jié)果。從表1可以看出,真?zhèn)纹凡栌?xùn)練集的誤判數(shù)為0,總體判別率為100%。預(yù)測(cè)集中,將一個(gè)真品碧螺春茶樣誤判為偽品茶,2個(gè)偽品茶樣誤判為真品茶樣,模型總體鑒別率為96.25%。結(jié)果表明,真?zhèn)纹凡铇予b別模型的識(shí)別率和穩(wěn)定性都達(dá)到一個(gè)很高的水平。實(shí)驗(yàn)中,偽品樣本誤判數(shù)高于真品是由不同采購(gòu)產(chǎn)地偽品茶樣本模仿真品碧螺春茶制作工藝的技術(shù)優(yōu)劣差別造成的,一些經(jīng)過(guò)優(yōu)良加工的偽品茶樣本和真品碧螺春茶樣本之間品質(zhì)指標(biāo)比較接近,這就會(huì)使模型的識(shí)別結(jié)果產(chǎn)生一定的誤差。

本文作者:蔡健榮韓智義作者單位:江蘇大學(xué)

文檔上傳者