您当前的位置:
首页 > 文献资料
所属专业:
分类准确率文献资料
-
代谢组学数据正态性对疾病分类准确性的影响
目的:探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用传统的非机器学习统计方法[Bayes 判别、Fisher 判别、偏小二乘判别分析(PLS-DA)]和机器学习方法[随机森林(RF)、支持向量机(SVM)]进行统计分析,比较分类准确率的变化;后用两个实例分析对模拟结果的合理性进行评价。结果代谢组学数据正态性对 Bayes 判别、Fisher 判别、PLS-DA 的分析结果影响较大,随着数据中服从正态分布的变量个数增加,分类准确率增大,而对 RF 和 SVM 基本没有影响。结论传统的非机器学习方法在统计分析过程中对数据正态性有一定的要求,而机器学习类的方法对数据正态性基本没有要求,且分类准确率一直保持较高的稳定状态。