半監(jiān)督偏最小二乘法在煙葉近紅外感官評價模型中的應用
發(fā)布時間:2019-08-24 來源: 短文摘抄 點擊:
1引言
半監(jiān)督學習是一種結合監(jiān)督學習與無監(jiān)督學習,利用少量的標注樣本和大量的未標注樣本進行訓練和分類,充分利用大量的無標識的訓練樣本來彌補有標識樣本的不足,以提高系統(tǒng)學習性能的方法。早在上世紀五六十年代就有人提出半監(jiān)督的思想,之后產(chǎn)生了自學習和自訓練的的概念\[1~3\]。近些年來,半監(jiān)督算法已成為機器學習領域的熱點\[4~7\],自訓練分類算法是其中經(jīng)常被用到的一種分類算法,該算法應用領域廣泛,以簡潔、高效著稱\[8~10\]。
近紅外光譜技術是質量控制的理想手段,在農業(yè)、食品、石油等領域, 特別是煙草行業(yè)的應用日益廣泛\[11,12\]。近紅外光譜分析中,建立可靠的定性和定量模型是對未知樣品做出準確預測的前提\[13\],使用大量代表性樣品建模是建立可靠近紅外統(tǒng)計模型的基礎\[14\]。應用近紅外光譜建立煙葉等復雜體系的分析模型中,與獲取大量樣品的近紅外光譜數(shù)據(jù)相比,對煙葉感官品質進行準確標定十分困難,而僅使用標定小樣品集建模或使用大量未準確標定樣品集建模結果均不理想。借鑒半監(jiān)督自訓練理念,本研究提出半監(jiān)督偏最小二乘(SSPLS)方法優(yōu)化模型,并應用此方法建立優(yōu)化近紅外煙葉感官質量模型,既解決了使用小樣品集建模的數(shù)據(jù)代表性問題,同時降低了感官評價不準確樣品對模型的影響。
熱點文章閱讀