:
意見回饋

以機器學習揭露植物功能性基因的秘辛

2019/03/29 @國際

以機器學習揭露植物功能性基因的秘辛

  陸生植物是長期在地表成功演化的生物,其所產生的化合物將直接或間接的影響植物對環境的適應與個體間的繁殖能力。植物體代謝產生的化合物稱作代謝物,可依其生合成的途徑進行分類。一般而言可將代謝途徑分為:泛物種存在並用以維持基本生理功能的初級代謝途徑(primary metabolism,或稱general metabolism,簡稱GM);以及存在種間特化並用以防禦或適應功能的次級代謝途徑(secondary metabolism),又由於其功能特化在不同的分類群間有所差異,因此次級代謝途徑又被稱作特化代謝途徑(specialized metabolism,簡稱SM)。植物產生的化合物在農業、醫療及生化等領域可能富含高經濟價值的潛力,以農業應用為例,許多抗病蟲害製劑或含費洛蒙成分的化學生物藥劑是提煉自特定植物的化合物,不但在施用上對環境友善,也使作物避免病蟲害的威脅。
  由於植物的基因體數據量龐大且存在種間差異,加上若分別以傳統植物生理與分子生物學研究某特定代謝途徑將是耗時的做法。為此,密西根州立大學(Michigan State University)的研究團隊採取不同的做法,研究團隊先以模式植物阿拉伯芥(Arabidopsis thaliana)的基因組數據進行研究,並以機器學習的方法,將3萬多個基因按代謝途徑分成GM或SM兩種。研究團隊表示,機器學習的方法就如同在電子商務中透過分析消費者的瀏覽模式,預測消費者潛在可能購買的商品,並以客製化的方式呈現廣告內容。利用新興機器學習的方法,研究團隊得以在未知功能的基因中,將基因依代謝途徑進行預測並分類,藉此一窺其可能扮演的角色。
  密西根大學的研究團隊完美的展現計算生物學與生物化學間跨域合作的研究模式,透過機器學習進一步預測基因的分類,將有助於候選基因的挑選。該研究也可進一部推廣到阿拉伯芥以外,用在其他的植物類群,藉此發現農業、醫療或工業用途的新興植物代謝化合物。
  該研究由美國國家科學基金會(National Science Foundation)提供資金方面的協助,最新研究成果已發表在著名期刊<Proceedings of the National Academy of Sciences>。

資料來源

: