2025/08/01 @國際
EasyDAM_V4 是由東京大學和北京工業大學團隊開發的自動化水果標記方法,利用深度學習與潛在空間模型強化表型特徵提取技術,顯著提升果實影像標記的準確性,並克服辨識跨物種果實的限制,為智慧農業的發展提供新的解決方案。
示意圖
傳統的水果偵測模型仰賴大量的人工進行標記,過程既耗時又耗力,且難以辨別外觀差異大的水果,當實際進入果園時,水果排列密集、樹葉遮擋等因素皆使得傳統偵測系統難以應用,突顯自動化、智慧標記系統的重要性。為解決此問題,日本東京大學及中國北京工業大學研究團隊,利用生成對抗網路模型(GAN model)開發一種新的自動化標記方法EasyDAM_V4。
EasyDAM_V4的核心是多維表型特徵提取技術,利用VGG16架構擷取果實形狀及質地特徵,再結合原有的可見光影像以增強GAN模型的輸入。此外,該方法導入新的多維度損失函數(multi-dimensional loss function),對形狀、紋理和顏色特徵的單獨損失分量進行調整和加權,強化果實圖像的轉譯使模型更能夠解讀及辨識。研究人員利用梨圖像作為源域,將該模型應用於火龍果、茄子和黃瓜影像標記,三者標記準確率分別為87.8%、87.0%和80.7%,顯著優於傳統的偵測方法,相關文獻發表於Horticulture Research期刊。
透過這項複雜的模型,能夠更精確擷取水果特徵並生成圖像,克服了以往無法辨別外觀差異較大的果實及多種果實的限制,為農業影像處理提供了強大的新工具,有望加速智慧農業的發展,實現更精準的產量預測及更高效的採收機器人,同時利用收集的高品質標記數據支援表型體學研究及育種決策。
資料來源
文章摘譯