首页 > 文献资料
-
卡方自动交互检测法及其应用
卡方自动交互检测法(chi-squared automatic interaction detector,CHAID)早由Kass于1980年提出,其核心思想是:根据给定的反应变量和解释变量对样本进行优分割,按照卡方检验的显著性进行多元列联表的自动判断分组.利用卡方自动交互检测法可以快速、有效地挖掘出主要的影响因素,它不仅可以处理非线性和高度相关的数据,而且可以将缺失值考虑在内,能克服传统的参数检验方法在这些方面的限制,结果的解释也简单明了.现就卡方自动交互检测法及其应用进行探讨.
-
遗传距离方法在统计分析中的应用
在遗传流行病学研究中,经常会遇到要比较2个人群中不同等位基因频率的差别以及不同基因型、不同单倍型的差别等问题,如果等位基因为2个即双等位基因位点,则需比较的表格可以列成2×2表,而用4格表的统计方法来比较不同人群间的基因频率差别.这时,基因型的比较也可以用3×2表来计算,而单倍型则为4×2表.但是如果我们所研究的基因座位为一多等位基因位点,常用的列联表方式来统计2个人群,甚至更多群体间的差别则会出现因单元格过多,多个格子可能出现理论数小于5甚至为0的情况[1],无法得到满意结果.因此提出精确概率法,蒙特卡罗模拟方法等,还有学者提出通过计算遗传距离的方法进行率差别的统计学检验的方法.
-
《中国骨伤》杂志论文中存在的统计学错误辨析(8)
本文在前7期统计学错误辨析系列文章的基础上,继续对<中国骨伤>杂志2006年与2007年第8期所刊载的临床研究、基础研究和经验交流文章进行考察.由于之前的7篇文章中对于统计学的各个方面已经有了较为全面的说明,这里不再作整体性的讨论,而只是针对容易出现的一些问题给予强调,主要涵盖实验设计中的对照原则、重复测量设计的统计分析和不同类型列联表的分析.
-
定性资料统计分析错误辨析与释疑
通过揭示大量的生物医学科研中出现的定性资料统计分析方面的错误案例,说明重视识别定性资料列联表的类型、检查前提条件和考虑统计分析目的,对于合理选用定性资料统计分析方法是至关重要的.
-
对数线性模型在临床试验资料分析中的应用
目的 选择适合药物临床试验列联表资料分析方法,为药物的疗效、安全性和不良反应等提供科学依据.方法 利用对数线性模型,讨论多维列联表分析的优势.结果 与结论临床试验中经常接触到多维列联表的数据,对这类数据需采用特殊的方法进行分析处理.
-
医学论文中统计分析错误辨析与释疑--定性资料分析方法的合理选择(3)
一、采取简单压缩的方法将三维表降为二维表很多医学期刊论著中都采用简单压缩的方法将三维列联表降为二维列联表,例如有人觉得不便用一般的χ2检验处理表1资料(因为它包含3个定性变量,即接受护理地点、产前护理量和婴儿存活状况),故设法将接受护理地点这一定性因素消除掉,使之仅包含产前护理量和婴儿存活状况两个定性变量,以便采用一般χ2检验处理之.
-
本刊对统计学符号及统计学方法的要求
8按GB 3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写x珋(中位数仍用M );(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
本刊对统计学符号及统计学方法的要求
8按GB 3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写x珋(中位数仍用M );(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
本刊对统计学符号及统计学方法的要求
8按GB 3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写x珋(中位数仍用M );(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
本刊对统计学符号及统计学方法的要求
8按GB 3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写珋x(中位数仍用M );(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
本刊对统计学符号及统计学方法的要求
8按GB 3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写x珋(中位数仍用M );(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
本刊对统计学符号及统计学方法的要求
8按GB 3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写x珋(中位数仍用M );(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
本刊对统计学符号及统计学方法的要求
8按GB3358-82《统计学名词及符号》的有关规定书写,常用如下:(1)样本的算术平均数用英文小写x珋(中位数仍用M);(2)标准差用英文小写s;(3) t检验用英文小写t;(4)卡方检验用希文小写χ2;(5)相关系数用英文小写r;(6)概率用英文大写P ( P值前应给出具体检验值,如t值、χ2值、q值等)。关于资料的统计学分析:对于定量资料,应根据实验或调查设计类型和资料的条件选用合适的统计学分析方法,不能盲目套用t检验和单因素方差分析;对于定性资料,应根据实验或调查设计类型、列联表中定性变量的性质和分析目的选用合适的统计学分析方法,不能盲目套用χ2检验。
-
单向有序二维表的统计分析方法比较
目的 比较单向有序表的三种统计检验方法的功效.方法采用Monte Carlo模拟.结果 模拟结果显示CMH法和K-W秩和检验对分布位置差异的检验有较高的功效,而对分布离散程度的变异却无能为力.结论 分析单向有序表时应同时使用Pearson γ2和K-W秩和检验(或CMH法),并报告两种检验的统计结果.
-
列联表资料的关联强度
目的 探究行列数为2-4的各列联表Pearson列联系数的分布及其与相关系数的关系.方法 采用SAS 9.1.3软件模拟行列数分别为2-4,且行合计固定的各种列联表,计算相关系数和列联系数,绘制两者的散点图,描述其取值变化关系.结果 2×2列联表的相关系数和列联系数成曲线相关,但是其他情况下相关系数和列联系数的关系并非一一对应,此时通过相关系数划分列联系数的关联强度是不合适的.结论 对于2×2列联表,可以通过相关系数的强度范围近似定义列联系数的强度范围.当行列数多于2时,不能根据相关系数的强度范围定义列联系数的强度范围.
-
Ridit分析在SAS统计软件中的实现
R×C列联表表面上看似乎可以用χ2检验来处理,但χ2检验只能说明比较各组的构成不同,不能说明对比各组的效果优劣,而Ridit分析法则能适用于这一类资料的处理.
-
行列相关的测度
基本概念及方法行列相关也称为列联表相关,是由列联表所揭示的特殊类型的相关.列联表中的行和列分别代表两个分类变量.其中列代表第一个分类变量,行代表第二个分类变量.两个分类变量可以分别是无序分类变量如二项分类或多项分类变量,也可以是有序分类变量即等级资料.列联表中的数据一般为频数或例数.进行行列相关的测度有多种指标,这些指标称为列联系数.用英文大写字母R表示.它们的应用条件有所不同,其基本计算步骤及方法如下.
-
配对设计2×2列联表的精确检验方法及应用
配对设计在医学科研中应用很广泛.病例对照研究或者实验研究中有时会采用1:1匹配(match)设计来提高研究效率,控制混杂因素;或者在相同条件下同一受试者接受两种不同的处理,以评价两种处理是否有差异.当配对设计中所研究的变量为二分类变量时,常需要将数据整理成配对设计的2×2列联表,然后进行相应的统计学检验.对于配对设计的2×2列联表,目前大多数的国内医学统计书籍介绍McNemar卡方检验方法.但是此卡方检验的使用,需要满足正态近似的条件.当正态近似不满足时,此检验是不适用的,需要采用相应的精确检验方法[1~5].常用统计软件SPSS和SAS中已经给出精确检验方法,但目前国内医学书籍却较少介绍此方法.本文讨论了配对设计2×2列联表的精确检验方法,通过实例介绍精确检验的应用,并给出相应的SPSS和SAS程序.
-
对含有"零"格的二维列联表独立性的讨论
列联表是分类资料的一种常见的表现形式,对于完备的表,即每个格子均有非零的频数时,处理的方法有若干且为大多数实际工作者所熟悉,但是,当某些格子出现零时,如果为了套用完备表的方法,随便采用连续性校正或合并数据,以消除讨厌的零格,表面上可以顺利分析,实际上却掩盖了总体分布的真实情况,结果可能是不太合理甚至会造成矛盾的,而国内目前详细讨论含有零格表的书籍又很少,因此,本文根据含有"零"格的表的种类分别讨论有关独立性的估计和检验的问题,①对出现"抽样零"的不完备表,本文提出推广的条件极大似然估计的方法,弥补连续性校正的不足,②对含有"结构零"的不完备表,本文将文献中已有的方法进行整理,在实例部分,还指出SAS软件实现办法,便于不同习惯的工作者参考.
-
医学科研论文中列联表资料的统计方法及常见问题
文章概要介绍了科研论文中列联表资料的类型及统计方法.结合编辑工作的实践经验,列举了列联表资料统计分析中的常见问题:将X2检验视为分析列联表资料的万能工具;忽视对列联表中理论频数(T)的观察;对多个样本率或构成比比较的X2检验不彻底;对双向有序的列联表资料进行直线相关分析等,并逐一进行了解析,以期引起学术期刊编辑对列联表资料统计分析问题的重视,增强对科研论文的审鉴能力,进而促进我国医学学术期刊整体水平的提高.