首页 > 文献资料
-
基于流形学习的聚类方法在基因芯片表达谱分析中的应用
对基因芯片表达谱的聚类分析有助于发现共表达的基因,而共表达的特性往往是共调控基因所拥有的性质.因此,对基因表达谱的准确聚类将有利于更加准确地发现基因之间的调控关系.本研究使用机器学习中的等度规映射、局部线性嵌入、拉普拉斯特征根映射等流形学习方法处理基因表达谱数据,得到非线性降维后的数据.在此基础上应用K均值聚类、模糊聚类、自组织映射神经网络等聚类方法,根据给定的阈值,从酵母基因表达数据的382个聚类结果中得到了117 个共表达基因对,而从人类血清组织细胞的基因表达数据的132个聚类结果中得到了89个共表达基因对.使用的判别准则表明,基于流形学习的聚类方法与以往的方法相当,且能够被用以发现高维基因芯片表达数据中的低维的流形结构.
-
改进的局部线性嵌入算法在癌症基因表达数据降维中的应用
癌症基因表达数据具有高维、小样本的特点,对其进行维数约减十分有必要.传统的线性降维方法不能发现数据点之间的非线性关系,降维效果不好,因此,本文引入一种改进距离的多组权局部线性嵌入(DMLLE)算法对其进行降维.该算法采用一种改进距离来计算每个数据点的近邻点,为每一个近邻引入多组线性无关的局部权向量进行线性重构,通过小化重构误差得到高维数据在低维空间的嵌入结果.实验结果表明,DMLLE算法对癌症基因表达数据有很好的降维效果.