福建农林大学:代谢组学结合机器学习构建武夷肉桂茶产地判别模型

发布者:周君玲发布时间:2023-03-17浏览次数:346

  武夷岩茶是中国传统名茶,以独特的“岩骨花香”而闻名中外。作为武夷岩茶的当家品种,肉桂香气辛锐持久,滋味浓强饱满,深受消费者青睐。前人曾用“臻山川精英秀气所钟,品具岩骨花香之胜” 来描述武夷岩茶得天独厚的自然环境和品质特征,足见产地对茶叶品质的重要影响。位于核心产区的正岩茶因品质卓越、岩韵明显,价格通常高于其他产区的岩茶。近年来,随着武夷岩茶市场的持续升温,一些商家以假乱真,以非正岩茶冒充正岩茶进行销售,严重损害了消费者利益和岩茶市场的健康发展。传统的武夷岩茶产地和品质评定主要依赖感官审评,存在主观性强、误差大的问题,因此客观、有效的茶品质数字化评价模型亟待建立。

  近日,福建农林大学海峡联合研究院俞晓敏课题组联合杨贞标课题组和园艺学院郝志龙课题组在npj Science of FoodQ1IF: 7.000)上在线发表题为“Metabolomics integrated with machine learning to discriminate the geographic origin of Rougui Wuyi rock tea的研究论文,评估了基于气相色谱-质谱联用技术、化学计量法和机器学习建立的产地判别模型应用于武夷肉桂茶产地溯源的可行性。海峡联合研究院园艺植物生物学及代谢组学中心的硕士生彭逸飞和讲师郑超博士为论文共同第一作者。

  该研究收集了174 个正岩和 159 个非正岩产区的肉桂茶样。利用顶空固相微萃取-气相色谱-飞行时间质谱对所有茶样的挥发性有机化合物(VOCs)进行测定。结合化学计量学分析,发现来自不同产地的肉桂茶在挥发性代谢谱上存在差别,其中6种酯类、5种烃类、3种酮类、3种醇类和2种杂环类物质在正岩和非正岩茶样中的相对含量呈显著差异。具有焙火香(如2-乙酰吡咯)和松木香(如松油醇)的VOCs在正岩茶样中含量较高,而具有果香和青气(如异戊酸己酯、己酸己酯、N-己酸(-2-己烯基)酯和丁酸苯乙酯)的VOCs则在非正岩茶样中含量较高。

  机器学习是人工智能的核心,在寻找共性和区分差异方面具有传统分类技术难以比拟的优势,在分析技术领域已被广泛应用。该研究利用 15 种机器学习算法对上述茶样中 176 VOCs进行了数据预处理、特征提取、模型训练、优化和验证,发现人工神经网络算法中的多层感知器 (Multi-Layer PerceptronMLP) 对肉桂茶产地进行分类的准确率高达 92.7%。此外,当仅使用 30 VOCs构建产地判别模型时,梯度提升(Gradient BoostingGB)算法获得了最高的准确率 (83.2%)

  综上所述,该研究解析了武夷岩茶“岩骨花香”形成的物质基础,为茶叶产地溯源提供了科学依据,也为其他有价值农产品的产地追踪提供了具有启发性的方法借鉴。该研究得到了国家自然科学基金、福建省现代农业(茶叶)产业技术体系科研项目和福建农林大学茶产业链科技创新与服务体系科研项目的资助。