![]()
沂蒙紅茶是山東特色名優(yōu)紅茶,屬于小葉種功夫紅茶,具有甜花香、紅翡湯、味甜爽的特點。萎凋是沂蒙紅茶加工中的重要工序,直接決定后續(xù)工序質(zhì)量與成品茶風(fēng)味特征,精準(zhǔn)判斷茶葉萎凋程度是確保紅茶品質(zhì)的關(guān)鍵。水分含量是萎凋過程中萎凋葉的重要變量,其變化能夠在一定程度上反映紅茶萎凋進(jìn)程,是評價紅茶萎凋程度的主要標(biāo)準(zhǔn),然而,現(xiàn)有的基于水分的紅茶萎凋程度檢測方式存在一些問題:1)人工評測萎凋葉水分,這種評價方法相對主觀且依賴人工經(jīng)驗,準(zhǔn)確性有待提升;2)理化方法測量萎凋葉水分,這種評價方法存在遲滯問題且并非無損檢測。因此,如何實現(xiàn)萎凋進(jìn)程中水分的準(zhǔn)確、快速和無損檢測,對于沂蒙紅茶的標(biāo)準(zhǔn)化、數(shù)字化生產(chǎn)具有重要意義。
近紅外光譜(NIR)能夠?qū)—H、O—H和N—H等化學(xué)鍵的含量進(jìn)行量化,實現(xiàn)對待測對象的定性、定量分析。在無損檢測中,NIR方法展現(xiàn)出了準(zhǔn)確、快速的顯著優(yōu)勢。許多研究者致力于將NIR測量方法與機器學(xué)習(xí)方法結(jié)合,應(yīng)用于茶葉各個生產(chǎn)階段中的水分檢測研究。例如,Sun Jun等將預(yù)處理方法、特征選擇算法與多元線性回歸(MLR)法結(jié)合,對茶葉NIR數(shù)據(jù)進(jìn)行分析,實現(xiàn)了對茶葉水分含量的預(yù)測;Shen Shuai等基于標(biāo)準(zhǔn)正態(tài)變量變換(SNV)方法、Elman神經(jīng)網(wǎng)絡(luò)(ENN)和主成分分析(PCA)方法,實現(xiàn)了對紅茶萎凋中水分變化預(yù)測;Sheng Xufeng等基于微型NIR和最小二乘支持向量機(LS-SVM)建立了對紅茶干燥工藝的水分預(yù)測模型,預(yù)測相關(guān)系數(shù)(rp)和預(yù)測均方根誤差(RMSEP)分別達(dá)到了0.969 6和0.001 6。
Wu Chenyuan等提出了4 種基于混合蟻群優(yōu)化算法的微波頻率信號優(yōu)選方法,借助自主研發(fā)的微波傳感系統(tǒng)實現(xiàn)了萎凋茶葉含水量的無損檢測,但其測量系統(tǒng)體積較大,較難直接應(yīng)用于茶葉的工業(yè)生產(chǎn)過程;Song Yan等提出了一種新型深度學(xué)習(xí)網(wǎng)絡(luò)DiSENet(denseinception spectral-SE attention network),對不同溫度下的茶葉NIR數(shù)據(jù)進(jìn)行學(xué)習(xí)以實現(xiàn)對綠茶水分的預(yù)測,但這種方法的對算力成本較高,不利于在實際生產(chǎn)過程中推廣。
綜上,當(dāng)前針對NIR技術(shù)在沂蒙紅茶萎凋過程檢測方面的生產(chǎn)應(yīng)用研究相對稀缺。針對山東沂蒙紅茶萎凋過程的量化分析問題,天津理工大學(xué)電氣工程與自動化學(xué)院的李昊洵、于曉*和山東省農(nóng)業(yè)科學(xué)院茶葉研究所的董春旺*等采集萎凋葉的NIR信息和萎凋水分信息,使用預(yù)處理方法和波段篩選方法對光譜數(shù)據(jù)進(jìn)行優(yōu)化,分別建立萎凋階段分類模型和萎凋葉含水量預(yù)測模型,實現(xiàn)對紅茶萎凋程度的快速、準(zhǔn)確、無損檢測,旨在為沂蒙紅茶標(biāo)準(zhǔn)化、數(shù)字化生產(chǎn)提供理論方法與數(shù)據(jù)支撐。具體流程如圖1所示。
![]()
1 沂蒙紅茶萎凋過程水分含量變化
如圖2所示,在萎凋過程中,萎凋葉水分質(zhì)量分?jǐn)?shù)基本分布在50%~70%之間,總體呈下降趨勢。萎凋前240 min水分含量快速下降,萎凋葉中游離水大量蒸發(fā),此階段失水量接近總失水量的一半;在萎凋開始的240~360 min水分含量變化較為平緩,萎凋葉中的游離水已經(jīng)基本散逸,部分成分的水解與葉梗水分?jǐn)U散導(dǎo)致了水分含量變化曲線的輕微波動;在360~600 min,萎凋葉的水分降低再次加速。根據(jù)沂蒙紅茶萎凋過程中的失水過程,本研究將整個失水過程分為3 個階段;萎凋前期(0~240 min)、萎凋中期(240~360 min)和萎凋后期(360~600 min),并嘗試通過分類模型實現(xiàn)對萎凋葉失水階段的判斷。
![]()
2 PCA及NIR解析
本研究對萎凋階段進(jìn)行PCA,結(jié)果如圖3a所示。對萎凋過程中采集的光譜進(jìn)行分時段平均處理,獲得各個時間段的NIR平均曲線,如圖3b所示。MI、MII、MIII分別代表萎凋前期、萎凋中期與萎凋后期。根據(jù)圖3可知,PC1對最終分類結(jié)果的方差貢獻(xiàn)率高達(dá)80.8%,可以代表原始數(shù)據(jù)的絕大部分信息。萎凋葉樣本點的空間分布較為集中,且隨萎凋時間延長在特征空間中定向移動,表現(xiàn)出空間上的聚集性與時間上的連續(xù)性。前者表明萎凋葉具有部分不變的特性,證明萎凋過程的連貫發(fā)生;后者表明萎凋前期、萎凋中期到萎凋后期的光譜數(shù)據(jù)特征存在差異,可以作為萎凋階段判別依據(jù)。
![]()
![]()
![]()
M1~M10分別代表了萎凋1~10 h以1 h為間隔獲取的萎凋葉NIR數(shù)據(jù)均值,表示紅茶萎凋程度不斷加劇。萎凋葉各時段光譜均值由相應(yīng)1 h內(nèi)采集的所有樣本光譜數(shù)據(jù)經(jīng)平均計算獲得。根據(jù)圖3b可知,隨著萎凋時間的延長,紅茶萎凋葉NIR光譜值也在變化,且在間隔時間為60 min時,光譜值就能產(chǎn)生較為明顯的變化,相鄰曲線能產(chǎn)生最高10%左右的吸光度變化。因此,通過光譜值變化對紅茶萎凋程度進(jìn)行判斷具備可行性。
本研究對便攜式微型光譜儀采集到的全體NIR信息進(jìn)行了繪制,如圖4a所示,在可見光區(qū)段和近紅外區(qū)段各有一處峰值。可見光部分在500~650 nm區(qū)間存在相對平緩峰值,由茶葉色素對紅光(大約660 nm)、藍(lán)光(大約430 nm)的吸收以及對綠光(大約550 nm)的反射產(chǎn)生。由于茶葉萎凋過程中的色素積累、顏色加深,此處峰值趨于平緩。在700~900 nm區(qū)間,曲線波段總體呈上升趨勢,這是因為葉片細(xì)胞中的空腔結(jié)構(gòu),與C—H鍵的4、5 級倍頻伸縮振動和N—H鍵、O—H鍵的4 級倍頻伸縮振動對應(yīng)。因此,隨萎凋過程的進(jìn)行,水分含量的變化導(dǎo)致O—H鍵含量的改變,進(jìn)而導(dǎo)致700~900 nm區(qū)間的吸光度變化。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
3 萎凋程度判別模型的建立
3.1 預(yù)處理方法優(yōu)選
對本研究使用5 種預(yù)處理方法降低由機器產(chǎn)生的噪聲和基線漂移對原始數(shù)據(jù)的干擾,提升模型分類、預(yù)測精度。為排除噪聲數(shù)據(jù)干擾,對340~392 nm波段進(jìn)行了剔除,預(yù)處理結(jié)果如圖4b~f所示。經(jīng)過S-G方法處理后,曲線噪聲明顯降低,相比原始光譜局部細(xì)節(jié)更加平滑;MSC、SNV和Z-score方法預(yù)處理后,相比原始光譜顯著凸顯了光譜形狀和吸收峰差異,有效校正了光譜數(shù)據(jù)基線。
為了直觀表示預(yù)處理過程對模型分類的改善效果,本研究借助RF算法的性能指標(biāo)變化對預(yù)處理算法優(yōu)化能力進(jìn)行量化,如表1所示。原始光譜數(shù)據(jù)訓(xùn)練獲得的RF分類模型在測試集上準(zhǔn)確率偏低,且模型存在過擬合。通過預(yù)處理方法對光譜數(shù)據(jù)進(jìn)行處理后,模型在測試集上的準(zhǔn)確率、精確率、召回率和F1分?jǐn)?shù)上有普遍提升,過擬合問題也得到緩解。
![]()
其中,Median filter方法在各種預(yù)處理方法中達(dá)到了最優(yōu)的分類效果,在訓(xùn)練集與測試集上均展現(xiàn)了較好的模型性能,說明了Median filter方法在提升模型分類性能方面的有效性。采用Median filter預(yù)處理的分類模型在精確率和召回率上表現(xiàn)最優(yōu),說明模型能夠?qū)崿F(xiàn)對萎凋階段的準(zhǔn)確分類;較高的F1分?jǐn)?shù)說明該模型能較好地平衡精確率和召回率,漏檢和錯檢可能性較低。
3.2 分類模型優(yōu)選
由于光譜和水分含量測定時存在大量線性或非線性因素,因此需要對分類模型進(jìn)行優(yōu)選以建立更加精準(zhǔn)的萎凋程度判別模型。本研究進(jìn)行了RF、SVM、RBF和CNN等模型的優(yōu)選。其中,RF模型采用5折交叉驗證,選取了20 個決策樹,以50為步長作尋優(yōu)處理,以多折平均分類錯誤率作為參數(shù)優(yōu)選依據(jù);SVM模型選擇RBF核,其結(jié)構(gòu)簡單、參數(shù)量少,同時能夠適應(yīng)光譜值與萎凋葉水分間的非線性關(guān)系,采用交叉驗證函數(shù)tunelsssvm對懲罰因子(c)和核函數(shù)參數(shù)(g)進(jìn)行參數(shù)優(yōu)化;RBF模型的擴散速度設(shè)置為100;CNN模型采用2×1尺寸的一維卷積核提取光譜特征,采用Adam梯度下降算法,初始學(xué)習(xí)率設(shè)置為0.001,學(xué)習(xí)率下降因子為0.1。以分類模型性能指標(biāo)量化判斷各分類模型與目標(biāo)任務(wù)的匹配度,結(jié)果如表2所示。除RF模型外,其他3 種模型均存在過擬合的情況,SVM在訓(xùn)練集與測試集準(zhǔn)確率均較低,且兩數(shù)據(jù)集分類準(zhǔn)確率差距較大;RBF在訓(xùn)練集表現(xiàn)良好,但在測試集表現(xiàn)最差,準(zhǔn)確率差值為0.138,在4 種模型中過擬合情況最嚴(yán)重;CNN模型過擬合程度較低,但在訓(xùn)練集與測試集各項性能指標(biāo)均低于RF模型。通過對比各參數(shù)說明RF模型具有較好的分類能力。
![]()
由圖5可見,絕大部分?jǐn)?shù)據(jù)集中于混淆矩陣對角線上,僅有少量樣本出現(xiàn)了分類錯誤情況,模型在訓(xùn)練集與測試集分別取得了99.9%和99.4%的分類準(zhǔn)確率,說明模型具有較好的分類能力。
![]()
4 萎凋程度判別模型的建立
4.1 預(yù)處理方法優(yōu)選
與萎凋程度判別模型類似,采用RF模型性能指標(biāo)評價預(yù)處理方法的有效性。如表3所示,針對本研究中光譜數(shù)據(jù),預(yù)處理方法對模型rc和rp提升較小,訓(xùn)練獲得模型存在較為明顯的過擬合情況。均方根誤差方面,預(yù)處理后數(shù)據(jù)除S-G方法外均在一定程度上降低了兩種均方根誤差;RPD方面,除S-G外,其他預(yù)處理方法對應(yīng)的預(yù)測模型均有相對明顯的提升,MSC、Median filter和Z-score方法對應(yīng)模型性能指標(biāo)較優(yōu),對預(yù)測模型有較好的優(yōu)化效果。
![]()
在幾種預(yù)處理方法中,Median filter方法較好地抑制了模型的過擬合,明顯降低了均方根誤差,相比原始數(shù)據(jù),其對應(yīng)模型的RPD提升了0.986。綜上所述,Median filter方法對預(yù)測模型性能的提升效果顯著優(yōu)于其他方法,因此,本研究選擇Median filter方法對NIR數(shù)據(jù)進(jìn)行預(yù)處理。
4.2 萎凋葉水分特征波段篩選和線性預(yù)測模型建立
基于預(yù)處理優(yōu)選結(jié)果,對SPA、BOSS和CARS等波段篩選算法進(jìn)行優(yōu)選,減少光譜數(shù)據(jù)維度,提升水分預(yù)測模型的運算效率和精度,借助RF模型性能指標(biāo)量化波段篩選優(yōu)化效果,結(jié)果如表4所示。相比僅進(jìn)行Median filter預(yù)處理的NIR數(shù)據(jù),經(jīng)過波段篩選后,數(shù)據(jù)特征維度降低,且模型的過擬合問題得到抑制,RPD也有所提升。其中,BOSS算法對應(yīng)預(yù)測模型的rc與rp差值僅為0.005,是3 種算法中對過擬合問題抑制最好的模型,其RPD也高于CARS和SPA,證明BOSS方法能夠高效篩選NIR數(shù)據(jù)特征,有效提升預(yù)測模型性能。
![]()
從表5、圖6可知,BOSS方法保存了41 個波段,且保留波段基本集中在400~500、700~900 nm兩個區(qū)間,其中430、660 nm附近波段能夠反映萎凋過程中色素積累導(dǎo)致的光吸收程度變化,間接反映萎凋葉水分變化;700~900 nm波段接近O—H基團倍頻波段,能夠通過O—H基團含量反映萎凋葉水分流失情況。特征波段篩選后RF模型性能指標(biāo)的提升能夠證明該方法的有效性。CARS方法與SPA方法保留了較多波段。CARS方法在400~500 nm波段篩選結(jié)果較為準(zhǔn)確,對可見光吸收度變化的反應(yīng)較為明顯,但在600 nm和900 nm附近保留冗余波段較多,相比BOSS方法,預(yù)測效率相對較低;SPA方法保留的特征波段數(shù)遠(yuǎn)高于其他兩種方法,但在700~900 nm波段忽略了大部分關(guān)鍵特征,導(dǎo)致對應(yīng)模型性能略遜于BOSS方法。
![]()
![]()
綜上,BOSS方法在有效減少NIR數(shù)據(jù)變量復(fù)雜度的同時提升了預(yù)測模型的性能,因此,本研究使用該方法完成波段篩選工作。
4.3 水分預(yù)測回歸模型優(yōu)選
針對預(yù)測模型進(jìn)行了PLSR、RF和SVR模型的優(yōu)選,PLSR的PCs數(shù)、RF的決策樹數(shù)量和SVR的c均由5折交叉驗證獲取。RF模型選取了20 個N值(50~1 000,步長50)作尋優(yōu)處理,以RMSEC作為參數(shù)優(yōu)選依據(jù);SVR模型基于MATLAB軟件中的Li-SVMLAB工具箱創(chuàng)建,與分類模型尋優(yōu)模式類似,進(jìn)行參數(shù)選擇和模型優(yōu)選,結(jié)果如表6、圖7a所示。RF與SVR兩種非線性模型的rc、rp和RPD均高于線性PLSR模型,而均方根誤差值均低于PLSR模型,說明非線性模型在處理水分預(yù)測問題過程中的可靠性優(yōu)于線性模型。在兩種非線性模型中,BOSSSVR模型表現(xiàn)出了更好的預(yù)測性能,其中rc為0.994、rp為0.984、RPD為4.485、RMSEC為0.730、RMSEP為1.198,當(dāng)RPD>2時,表明模型具有較好的預(yù)測能力,RPD可以證明模型具有良好的擬合效果。以標(biāo)簽含水量與模型預(yù)測的含水量分別為橫縱坐標(biāo)軸,對模型預(yù)測準(zhǔn)確性進(jìn)行了可視化分析。由圖7b可知,所有樣本點均分布于直線y=x附近,證明模型對萎凋葉水分含量的預(yù)測值基本接近標(biāo)簽值,具有較高的精準(zhǔn)度。
![]()
![]()
![]()
結(jié) 論
本研究基于實際生產(chǎn)過程中的NIR數(shù)據(jù)和水分?jǐn)?shù)據(jù),分別建立了萎凋階段判別模型和萎凋葉水分預(yù)測模型,實現(xiàn)了快速、準(zhǔn)確、無損的紅茶萎凋程度檢測。結(jié)果表明,基于Median filter預(yù)處理建立的RF萎凋階段判別模型在測試集的分類準(zhǔn)確率為99.4%;基于BOSS波段篩選與PCA降維處理的SVR水分預(yù)測模型rc為0.994、rp為0.984、RPD為4.485。本研究驗證了基于NIR技術(shù)投入沂蒙紅茶工業(yè)生產(chǎn)中質(zhì)量檢測環(huán)節(jié)應(yīng)用的可行性,可為沂蒙紅茶智能化萎凋水分實時無損檢測提供基礎(chǔ)理論支撐。
本研究建立的RF萎凋階段判別模型和BOSS-SVR萎凋葉水分預(yù)測模型能夠?qū)I(yè)生產(chǎn)環(huán)境下沂蒙紅茶的萎凋程度做出較為精準(zhǔn)的分類和預(yù)測,然而仍然存在以下不足:首先,本研究建立的兩種萎凋程度檢測模型并未通過不同地區(qū)的不同品種樣本進(jìn)行外部實驗驗證,在模型泛化性能上存在提升空間;其次,本研究建立的模型需要借助上位機完成分析預(yù)測工作,限制了檢測設(shè)備的應(yīng)用場景;最后,BOSS-SVR萎凋葉水分預(yù)測模型的預(yù)測誤差相對較高,仍存在提升空間。因此,未來可針對這些問題進(jìn)行更加深入的研究工作,通過外部驗證實驗以提升模型泛化能力、引入嵌入式設(shè)計豐富設(shè)備應(yīng)用場景、更換和改進(jìn)預(yù)測模型以提高預(yù)測精度,以期進(jìn)一步完善模型和預(yù)測設(shè)備。
引文格式:
李昊洵, 于曉, 董春旺, 等. 基于微型近紅外光譜的紅茶萎凋水分無損檢測方法[J]. 食品科學(xué), 2025, 46(24):304-312. DOI:10.7506/spkx1002-6630-20250707-051.
LI Haoxun, YU Xiao, DONG Chunwang, et al. Non-destructive detection of the moisture content of withered leaves for black tea based on micro-near infrared spectroscopy[J]. Food Science, 2025, 46(24):304-312. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-20250707-051.
實習(xí)編輯:魏雨諾;責(zé)任編輯:張睿梅。點擊下方 閱讀原文 即可查看全文。圖片來源于文章原文及攝圖網(wǎng)
![]()
![]()
為匯聚全球智慧共探產(chǎn)業(yè)變革方向,搭建跨學(xué)科、跨國界的協(xié)同創(chuàng)新平臺,由北京食品科學(xué)研究院、中國肉類食品綜合研究中心、國家市場監(jiān)督管理總局技術(shù)創(chuàng)新中心(動物替代蛋白)、中國食品雜志社《食品科學(xué)》雜志(EI收錄)、中國食品雜志社《Food Science and Human Wellness》雜志(SCI收錄)、中國食品雜志社《Journal of Future Foods》雜志(ESCI收錄)主辦,西南大學(xué)、 重慶市農(nóng)業(yè)科學(xué)院、 重慶市農(nóng)產(chǎn)品加工業(yè)技術(shù)創(chuàng)新聯(lián)盟、重慶工商大學(xué)、 重慶三峽科技大學(xué) 、西華大學(xué)、成都大學(xué)、四川旅游學(xué)院、北京聯(lián)合大學(xué)、 中國-匈牙利食品科學(xué)“一帶一路”聯(lián)合實驗室(籌)、 普洱學(xué)院 共同主辦 的“ 第三屆大食物觀·未來食品科技創(chuàng)新國際研討會 ”, 將于2026年4月25-26日 (4月24日全天報到) 在中國 重慶召開。
長按或微信掃碼進(jìn)行注冊
為系統(tǒng)提升我國食品營養(yǎng)與安全的科技創(chuàng)新策源能力,加速科技成果向現(xiàn)實生產(chǎn)力轉(zhuǎn)化,推動食品產(chǎn)業(yè)向綠色化、智能化、高端化轉(zhuǎn)型升級,由北京食品科學(xué)研究院、中國食品雜志社《食品科學(xué)》雜志(EI收錄)、中國食品雜志社《Food Science and Human Wellness》雜志(SCI收錄)、中國食品雜志社《Journal of Future Foods》雜志(ESCI收錄)主辦,合肥工業(yè)大學(xué)、安徽農(nóng)業(yè)大學(xué)、安徽省食品行業(yè)協(xié)會、安徽大學(xué)、合肥大學(xué)、合肥師范學(xué)院、北京工商大學(xué)、中國科技大學(xué)附屬第一醫(yī)院臨床營養(yǎng)科、安徽糧食工程職業(yè)學(xué)院、安徽省農(nóng)科院農(nóng)產(chǎn)品加工研究所、安徽科技學(xué)院、皖西學(xué)院、黃山學(xué)院、滁州學(xué)院、蚌埠學(xué)院共同主辦的“第六屆食品科學(xué)與人類健康國際研討會”,將于 2026年8月15-16日(8月14日全天報到)在中國 安徽 合肥召開。
長按或微信掃碼進(jìn)行注冊
會議招商招展
聯(lián)系人:楊紅;電話:010-83152138;手機:13522179918(微信同號)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.