首页 > 文献资料
-
时间序列预测模型的贝叶斯统计分析
贝叶斯(Bayes)统计预测方法是一种以动态模型为研究对象的时间序列预测方法,其基本思想是将人们的经验信息作为已知条件结合到实际模型中,即利用模型信息、数据信息及先验信息(有关总体分布的未知参数的信息)来进行预测.由于结合了分析人员的主观经验及判断,因此可以利用模型监控和干预的方法,合理、科学地处理突发事件等异常情况,和传统的预测方法相比,克服了传统的静态模型难以处理突发事件的缺陷,具有灵活、易于适应外部变化的特点.本文以英国1969~1984年因车祸伤亡人数为资料,探讨贝叶斯统计预测方法在医学领域中的应用.
-
高维数据回归分析中基于LASSO的自变量选择
生物信息学背景下普遍存在着高维数据,所谓的“高维”即待估计的未知参数的个数是样本量的一个或几个数量级[1],例如Van't Veer(2002)[2]等学者收集的乳腺癌数据集共包括259例乳腺癌患者,25000个微阵列基因数据,研究变量个数25000远远大于样本量259,存在“高维”现象.传统的方法进行参数估计和统计推断的一个必要前提是待估参数的个数小于样本量,这样统计推断的结果才是稳定、可靠的.对于高维数据回归分析,经验研究表明自变量进入模型的顺序不同所得到的回归系数的估计方差亦不相同,甚至变异很大,提示估计结果不稳定,此时通常需要考虑其他变量选择策略.Fan等(2001年)[3]提出变量选择应该满足以下要求:(1)模型预测的准确性;(2)模型的可解释性,即模型中选择的自变量在专业上是合理的、科学的;(3)模型的稳定性,即数据集中数据微小的变动不会导致模型较大变动;(4)应尽量避免在假设检验中出现的偏倚;(5)应尽量控制计算的复杂度.以往提出的一些降维方法如聚类、偏小二乘法、主成分回归、岭回归、基于树的集成方法等都只能达到其中的部分目标:通过聚类得到的模型对于聚类算法过于敏感;偏小二乘法与主成分回归通常根据累计贡献率、特征根的大小、统计学意义等准则选取成分,所得模型虽结构简约、估计稳定,但估计是有偏的[4],同时所得到的主成分虽或有一定的实际意义,但是不能清晰地解释单个协变量的效应[5];岭回归虽能较好地处理变量间的多重共线性,但因它不能降低维度而无法提供一个稀疏的模型;基于树的集成方法则因调整参数过多,而导致结果的可解释性往往较差.
-
假设检验在卫生实践中的应用
随着卫生事业的迅猛发展,在卫生事业的各个领域,都在大量应用数理统计方法之一的假设检验.笔者重点讨论参数假设检验问题,即在进行总体检验时,总体分布形式已知,仅对总体的未知参数进行假设检验.
-
重视儿科的药物临床试验
儿童是一个极为特殊的群体,在这个具动力学成长特点的复杂群体里,药物治疗的太多未知参数等待进一步科学探索.