首页 > 文献资料
-
基于基因芯片数据的代谢网络重构及其应用
目的 基因组尺度的代谢网络重构提供了一种从系统层面深入观察生物体的方法,由此重构得到的网络是个体的“全基因组网络”.鉴于这种网络不能反映出不同环境条件下细胞内的动态变化过程,本文给出一种从基因芯片数据出发对生物体的实时“工作网络”进行重构的方法.方法 通过对基因芯片数据使用dChip软件计算探针的P-A call后可得到基因的表达谱,然后在所整合的多源数据库的辅助下经由“基因表达谱→酶→反应→代谢网络”的过程进行“工作网络”的自动化重构.结果 对来源于14种组织的182个干细胞样本进行工作网络重构的结果表明,所有干细胞之间具有较高的相似性,但不同组织来源的干细胞之间仍存在一定差异性.结论 以基因芯片数据为数据源的代谢网络重构方法可有效用于生物体的“工作网络”重构.
-
分块PCA提取细胞周期调控基因的研究
用主成分分析(PCA)方法处理基因表达微阵列数据能够实现基因选择、基因表达模式提取、基因分类等,有其独特的优点.然而,PCA方法却存在容易丢失重要信息的弱点.为了克服这一方法的弱点,提出分块PCA,并以此为基础形成一种提取细胞周期调控基因的新方法.通过理论分析和对酵母微阵列数据的仿真实验研究,表明这种方法可行、有效,能够全面地提取出隐含在方差较小变量中的细胞周期调控基因,并能够给予实验结果较好的生物意义解释,在微阵列数据处理中具有应用前景.
关键词: 主成分分析(PCA) 分块PCA 微阵列数据 细胞周期调控基因 -
基于微阵列数据研究RGS3与乳腺癌的预后关系
目的 基于微阵列数据研究G蛋白信号调节因子3(RGS3)与乳腺癌的预后关系,为乳腺癌的治疗提供潜在的靶点及预后参考因素.方法 通过Kaplan-Meier Plotter平台(http://kmplot.com/analysis/)的微阵列数据库分析RGS3高/低表达对不同类型乳腺癌以及伴有高复发危险因素乳腺癌10年、15年生存的影响.结果 根据10年、15年的随访数据,RGS3的高表达与基底样型乳腺癌的不良预后有关(P=0.032),并且与伴有高复发危险因素乳腺癌的不良预后密切相关,包括激素受体阴性(P=0.000)、HER-2过表达(P=0.004)、肿瘤组织学3级(P=0.009)、TP53阳性表达(P=0.046)和腋窝淋巴结转移阳性(P=0.005)等.结论 RGS34高表达与乳腺癌的恶性生物学特征有关,提示RGS3可以成为乳腺癌潜在的治疗靶点和有效的预后参考因素.
-
微阵列数据的多重比较
目的介绍阳性结果错误率(FDR)及相关控制方法在微阵列数据多重比较中的应用.方法用BH、BL、BY和ALSU四种FDR控制程序比较了3 226个基因在两组乳腺癌患者中的表达差异.结果四个程序在各自实用的范围内均将FDR控制在0.05以下,检验效能由大到小的顺序为:ALSU>BH>BY>BL.ALSU程序因引入m0的估计,更为合理,不仅提高了检验效能,同时又较好地控制了假阳性错误.结论在微阵列数据的比较中必须考虑FDR的控制,同时又要考虑提高检验效能.多重比较中,控制FDR比控制总Ⅰ型错误率(FWER)检验效能高,且更为实用.
-
判别分析驱动的微阵列数据的降维策略
目的 探究判别分析驱动的微阵列数据之降维策略.方法 3步降维策略.即首先采用"单变量检验FDR控制"结合"相关矩阵差值综合评分法"的预选维;其次采用PCA、PLS等方法作进一步降维;后用逐步判别的思想筛选.结果 以Alon等的结肠癌数据为例展示了该3步降维策略在判别分析过程中的应用,组内回代错误率为9.68%,弃一法交叉验证的错误率为11.29%.结论 本文提出的"初步选维→进一步降维→逐步判别筛选"的3步降维策略对于后续的微阵列数据判别分析是实用、可行的.
-
几种差异基因分析方法及筛选效果的比较
目的 比较六种差异基因筛选方法的使用效果及适用性.方法 用Monte-Carlo方法产生不同类型的模拟数据,分别用不同的方法计算、评价其优劣.结果 多数情况下SAM法和稳健t检验表现出了优的筛选能力,SAM-ROC法则表现出更好的稳定性.结论 几种方法都能够有效地用于基因筛选,但各自的适应条件不同,综合看SAM法是基因筛选的首选方法,随机森林方法则具有较大的研究价值.
关键词: 微阵列数据 基因筛选 Monte-Carlo模拟 -
差异表达驱动的微阵列数据降维策略
目的 探究差异表达驱动的微阵列数据之降维策略.方法 本文提出permutation检验和99.99%的下单侧可信区间相结合的策略用于"维度粗筛",Hotelling T2检验结合逐步筛选的策略用于寻求组间差异表达的"局部变量组合".结果 以"正常成年男子和精子运动能力低下者精子蛋白表达差异研究"之实例展示了该降维策略的实际应用效果,结果发现了"十个蛋白组合"在组间差异表达.结论 本文提出差异表达驱动的微阵列数据降维策略是实用可行的.
-
基于蒙特卡洛模拟分析不同基因集方法的效能
目的:探索差异表达基因集(DEGs)筛选的有效方法.方法:基于蒙特卡洛模拟比较Efron's GSA、SAFE、Globaltest、PCOT2等四种基因集方法在分析微阵列数据时的统计推断能力.结果:Globaltest和PCOT2两种基于模型构建的基因集方法在处理模拟微阵列数据时效能相当,Globaltest略优于PCOT2,而Effort's GSA、SAFE方法检验效能低下.结论:Globaltest是一种较有效的微阵列数据分析方法.
-
微阵列数据分析和错误发现率
目的:介绍微阵列数据的差异表达分析和基于错误发现率的多重假设检验.方法:通过t检验对一个关于前列腺癌的微阵列数据进行基因差异表达分析,采用BH程序进行错误发现率的控制和经验估计.结果:当错误发现率为0.05时通过BH程序得到21个差异表达基因;当以|t|≥3作为拒绝域时,得到105个基因,对应的错误发现率估计值为0.20.结论:相对传统的总体错误率,错误发现率更加适合于微阵列这种高维数据多重比较的错误控制;而且能同时控制或估计错误发现率.
-
错误发现率的经验估计和应用
目的:研究大规模数据中的密度、无效分布和错误发现率的经验贝叶斯估计和应用.方法:对2个微阵列数据的贝叶斯模型,采用Poisson回归方法估计密度函数,并在此基础上经验估计贝叶斯错误发现率和局部错误发现率.结果:基于Poisson回归方法的密度估计为无效分布和错误发现率的经验贝叶斯估计提供了恰当的方法选择.结论:大规模数据的平行结构使得对错误发现率和无效分布的估计变得可能.
-
错误发现率及其扩展和应用
目的:介绍多重假设检验中的错误发现率控制和在此基础上发展起来的q值和局部错误发现率.方法:将Benjamini和Hochberg(BH)控制程序、q值和局部错误发现率应用于一个前列腺癌微阵列数据的基因差别表达分析,控制和估计错误发现率.结果:当错误发现率为0.10时通过BH程序得到60个差别表达基因,q值小于0.10的有74个基因,局部错误发现率小于0.10的有31个基因.结论:高维数据多重假设检验中能同时控制或估计错误发现率,BH控制程序、q值和局部错误发现率的联合应用能提供更多的信息.
-
错误发现率和q值及其微阵列数据分析的应用
目的 介绍微阵列数据多重假设检验中错误率的控制方法.方法 采用错误发现率和q值控制微阵列数据差别表达分析中的错误发现.结果 将错误发现率和q值应用到一个白血病微阵列数据差别表达分析中,分别识别出1 201个和1 494个差别表达基因.结论 相对传统的总体错误率,错误发现率更加适合于微阵列这种高维数据多重比较的错误控制;由于考虑了零假设信息,q值比错误发现率的效率更高.