您好,欢迎来到世旅网。
搜索
您的当前位置:首页医学统计学总结范文

医学统计学总结范文

来源:世旅网

1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之后呈现统计规律的现象。

2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。

3、变异:同质基础上各观察单位某变量值的差异。

数值变量:变量值是定量的,由此而构成的资料称为数值变量资料或计量资料,其数

值是连续性的,称之为连续型变量。

变量无序分类变量:所分类别或属性之间无顺序和程度上的差异分类变量:定性变量

有序分类变量:有顺序和程度上的差异

4总体和无限总体。

5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。样本代表性的前提:同质总体,足够的观察单位数,随机抽样。

统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。

6、概率:描述随机事件发生的可能性大小的一个度量。若P(A)=1,则称A为必然事件;若P(A)=0,则称A为不可能事件;随机事件A的概率为0<P<1.

小概率事件:若随机事件A的概率P≤α,则称随机事件A为小概率事件,其统计学意义为:小概率事件在一次随机试验中认为是不可能发生的。

统计描述

1、频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之分。后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如偏向数值大的一侧为负偏态分布。

2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。

均数:适用于正态或近似正态的分布的数值变量资料。样本均数用_表示,总体均数用μ

几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一组

观察值中不能同时有正值和负值。

中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。

3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。

全距:任何资料,一组中最大值与最小值的差。

四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。

方差和标准差:正态分布资料。标准差表示观察值的变异度的大小。

变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。

4、标准正态分布:对正态分布的/σ进行u的变换,u=/σ,则正态分布变换为μ=0,σ=1的标准正态分布,亦称u分布。u被称为标准正态变量或标准正态离差。两个参数:μ是位置参数,σ是形状参数。通常用N(μ,σ2)表示均数为μ,方差为σ2的正态分布,用N(0,1)表示标准正态分布。

常用估计医学参考值范围的方法有:

构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。

相对比:亦称比,是A、B2个有关指标之比,说明A为B的若干倍或百分之几。两个指

标可以性质相同,也可以性质不同。

应用相对数时的注意事项:

1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等的几个率,不能直接相加求其平均虑;4、比较相对数时应注意其可比性;5、对样本率(或构成比)的比较应遵循随机抽样,并做假设检验。

6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更具有可比性。

标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时。通常可从下列3种方法选用标准组:①以两组资料中任一组的年龄别人口数或构成比作为标准组;②以两组资料合并的各年龄组的人口数或构成比作为标准组;③以公认的或便于与他人资料比较的标准作为标准组。

7、统计表:

结构:由标题、标目、线条和数字构成。

编制统计表的要求:

①标题:概括表的内容,列于表的上方居中,应注明时间和地点;

②标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通常为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。

③线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线和底线应略粗些,表的左上角不宜用斜线。

④数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别用“”示,数字为0者要记作“0”,不应空项,为方便核实和分析,应有合计。

⑤备注:一般不列入表内,必要时可用“”标出,列于表下。

8、统计图:

①条图:用于相互对比关系的资料;

②圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成;③线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动的情况;

④直方图:表示连续性资料的频数分布;

⑤散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。

抽样分布与参数估计

抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数的估计,二是假设检验。

1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。

常用标准误_反映均数抽样误差的大小;用率的标准误σp反映率的抽样误差的大小;用

Possion计数的标准误反映其抽样误差的大小。

2、中心极限定理和正态分布推理:从正态分布N(μ,σ2)总体中以固定n随机抽取样本,样本均数_的分布仍服从正态分布,即使是从偏态分布总体中随机抽样,只要n足够大,_的分布也近似正态分布。样本均数的均数仍为μ,样本均数的标准差为_。

样本均数的抽样误差_(简称标准误)是反映均数抽样误差大小的指标。

_=σn用样本均数S作为σ的估计值,则s_=Sn3、t分布:将_看成变量值,那么可将正态变量进行u变换(uσ)后,也可将N(μ,2

_)变换成标准正态分布N(0,1)。常用s作为σ的估计值,统计量为t,此分布为t分布。_t曲线的形态变化与自由度v的大小有关。v越小,t值越分散,曲线越低

s_统计量t=

v=无穷大时,t分布即为u分布。

_估计总体均数;二是区间估计,亦称可信区间。

n12s_=sn

表示观察值的变异程度大小估计均数的抽样误差大小

s计算变异系数CV=100%估计总体均数可信区间_

确定医学参考值的范围进行假设检验

计算标准误

数值变量资料的假设检验

1、假设检验的原理:假设在一次抽样研究中得出了u≥1.96,则P≤0.05,此为小概率事件,依据“小概率事件在一次随机试验中认为是不可能发生的”的定理,可认为此样本不是来自该总体。

2、步骤:①建立假设和确定检验水准;假设有两种,一种是检验假设,常称无效假设或零假设,记为H0,假设样本所代表的总体参数与已知总体参数相等;另一种是备择假设,记为H1,是与H0相联系且对立的假设;检验水准,亦称显著性水准,是判断拒绝或不拒绝H0,也是允许犯Ⅰ型错误的概率,通常用0.05。

②选定检验方法和计算统计量③确定P值,做出推断结论。P值是指从H0所规定的总体中随机抽样时,获得等于及大于现有样本统计量的概率。

3、t检验:适用于:①样本均数与总体均数比较(σ未知且n<50或n<30);②成组设计的两小样本均数的比较(n1,n2均小于30或50);③配对设计的两样本均数比较。

应用条件:①当样本含量较小(n<50或n<30)时,要求样本来自正态分布总体;②用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。

4、单样本t检验:用于样本均数与已知总体均数的比较,研究目的是推断样本所代表的总体均数μ与已知总体均数μ0有无差别。统计量t=_μ0s/nv/p>

5、配对t检验:用于配对设计资料的两均数的比较。其研究目的是推断某种处理有无作用,或两种处理的效果有无差别。

配对设计类型有3种:①先将受试对象按配比条件配对,然后用随机分组方法将各对中的2个受试对象分别分配到不同的处理组;②同一对象分别接受2种不同处理;③同一对象处理前后。t=d

sd/n(d是差值的样本均数)v/p>

6、两样本t检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等。

_1_2

=S_1_2

_1_2sc2(11)n1n2

_1_2

s(n11)s(n21)11

n1n22n1n2

v=n1+/p>

7、单样本u检验:用于样本均数与已知总体均数比较,其研究目的同t检验。研究目的是推断样本所代表的总体均数μ与已知总体均数μ0有无差别。其统计量u=

_μ0s/n

8、两样本的u检验:用于完全随机设计的两样本均数的比较,两个样本来自两个总体,其研究目的是推断两样本所分别代表的总体均数是否相等。其统计量为:u=

_1_2_1_2

22s__s1/n1s2/n2

9、正态性检验和方差齐性检验:资料在做假设检验之前首先应该检验资料是否来自正态总体,并且它们的方差是否齐。10、两类错误:

Ⅰ型错误:拒绝了实际上成立的H0,即样本来自μ=μ0的总体,由于抽样的偶然性,按α=0.05检验水准拒绝了H0,接受H1。这类在假设检验中拒绝了原本正确的H0的错误称为Ⅰ型错误。,理论上犯Ⅰ型错误的概率为α,α值得大小视研究目的而定。通常设α=0.05。

Ⅱ型错误:不拒绝了实际上不成立的H0,即样本来自μ≠μ0的总体,由于抽样的偶然性,按α=0.05检验水准不拒绝H0,这类在假设检验中不拒绝原本不正确的H0的错误称为Ⅱ型错误。犯Ⅱ型错误的概率为β,它只有与特定的H1结合起来才有意义。

同时减少α和β的方法是增加样本含量为检验效能或把握度,即两总体确有差别时,按α水准能识别该差别的能力。0.95表示:若两总体确有差别,理论上平均100次抽样中,有95次能得出两总体有差别的结论。11、假设检验时应注意的事项:

①要有严密的抽样研究假设检验的前提

②正确选用检验方法:完全随机的设计的两数值变量资料比较时,若n小且方差齐,则选用两样本t检验;若方差不齐,则选用t检验或成组设计的两样本比较的秩和检验;若n1,n2均大于50,则选用两样本u检验。③正确理解“显著性”的含义

④对差别有无统计学意义的判断不能绝对化。

方差分析

1、基本思想:按研究目的和设计类型,将总变异的离均差平方和SS和自由度v分别分解成若干部分,并求得各相应部分的变异。其中的组内变异或误差主要反映个体差异或抽样误差,其它部分的变异与之比较得出统计量F值,由F值的大小确定P值,并作出推断,从而了解该因素对观测指标有无影响。

组内变异主要由个体差异所致,组间变异可能由两种原因所致:一是抽样误差,二是由于接受的处理不同。

2、总离均差平方和SS和自由度vSS总=(_ij_)=_2(_)2/n

i1j1k

v总/p>

3、组间离均差平方和SS组间,自由度v组间和均方MS组间k

SS组间=

i1(_ij)2j1nini(_)2nv组间S组间=SS组间v组间

4、组内离均差平方和SS组内,自由度v组内和均方MS组内SS组内=S组间v组内S组内=SS组内/v组内

多样本均数比较的方差分析的应用条件:①各样本是相互的随机样本;②各样本来自正态分布总体;③各总体方差相等,即方差齐。

5、完全随机设计资料的方差分析:亦称单因素的方差分析,可用于完全随机设计的多个样本均数比较的资料,研究目的是推断各个样本所代表的总体均数是否相等。

单因素方差分析的计算公式

变异来源SSvMSF

总变异_2/p>

组间变异i1k(_ij)2j1niniS组间v组间MS组间MS组内

组内变异S组S组内/v组内

C为校正系数C=(_)2/n

6、配伍组设计资料的方差分析:亦称两因素的方差分析,用于配伍组设计的多个样本均数比较的资料,其研究目的是推断各样本所代表的总体均数是否相等,但考虑了个体差异对试验效应的影响。

两因素方差分析的计算公式

变异来源SSvMSF

总变异_2/p>

处理组i1k(_ij)2j1bb

应用条件:

⑴各观察单位只能具有两种相互对立的结果

⑵已知发生某结果的概率为π,其对立结果的概率/p>

⑶n次试验是在相同的条件下进行的。

性质:μ=nπσ=nπ(1π)

若均数和标准差用率表示,则μp=πσp=(1π)/n

π未知时,用样本率P作为π的估计值,则Sp=p(1p)/n

总体率的估计:正态近似法:当样本含量n足够大,且样本率p不太小,如np与n均大于5时样本率p的抽样误差分布近似正态分布,可信区间为:/2Sp,p+uα/2Sp)

2、Poisson分布:对于二项分类变量,若某结果发生的概率很小,如π<0.05时,单位时间、人群、空间内“阳性”发生次数_(_=0,1,2,…)的概率可用Poisson分布概率函数来描述:P(_)=e(μ/_!)

P(_1)μ_

应用条件:π<0.05外,其余同二项分布。

分布的性质:

最少有k例阳性的概率:P(_≥k)=P(_)_)

正态近似法:当π0不太靠近0或1,且样本含量n足够大;或nπ0≥5且n)≥5时,二项分布接近正态分布。u=

Pπ0(01π0n

_nπ0nπ0(1π0)

最少有k例阳性的概率:P(_≥k)=P(_)_)

正态近似法:当μ≥20时,Poisson分布逼近正态分布。u=(_μ0)0

2在实际工作中,对于四个表资料,通常规定为:(1)当n≥40且所有的T≥5时,用检验的基本公式或四个表资料检验的专用公式;

当P≈α时,改用四个表资料的Fisher确切概率法。

本方法只适用于样本含量不太大的资料,它仅考虑了两种方法结果不一致的情况,而未考

虑样本含量n和两种方法一致的两种情况,所以当n很大且a与d的数值也很大,而b与c的数值相对较小时,即使检验统计结果有统计学意义,其实际意义也不大。

8、行列表资料的检验:只适用于多个样本率的比较,两个或多个构成比的比较以及双向无序分类资料的关联性检验。其基本数据由三种情况:

①多个样本率的比较时,有R行2列,称为R2表

②两个样本的构成比比较时,有2列C列,称为2C表

③多个样本的构成比比较以及双向无序分类资料关联性检验时,有R行C列,称为RC表。以上三种可统称为行列表资料

11、RC表的分类及检验方法的选择:

分类:双向无序、单向有序、双向有序属性相同和双向有序但属性不同四种。

⑴双向无序RC表:两个分类变量皆为无序分类变量,对于该资料:①如果研究目的为两个样本率(或构成比)的比较,可用行列资料的检验;②如果研究目的是分析两个分类变量之间有无关联性以及关系的密切程度时,可用行列表资料的检验以及Pearson列联系数进行分析。

⑵单向有序RC表:有两种形式:一种是RC表的分组变量是有序的,而指标变量是无序的;研究的目的通常是多个构成比的比较,可用行列表资料的检验进行分析。另一种是RC表中的分组变量是无序的,而指标变量是有序的,研究目的通常是多个等级资料的比较,可用秩和检验或Ridit分析。

⑶双向有序属性形同的RC表:两个分类变量皆为有序且属性相同,研究目的通常是分析两种检测方法的一致性,此时宜用一致性检验(或称K检验);也可用特殊模型分析方法。⑷双向有序属性不同的RC表:两分类变量皆为有序的,但属性不同,对于该资料:①如果研究目的是分析不同年龄组患者疗效见有无差别,可把它视为单向有序的RC表资料,选用秩和检验;②如果研究目的是分析两个有序分类变量间是否存在相关关系,可以用等级相关分析或Pearson积矩相关分析;③如果研究目的是分析两个有序分类变量是否存在线性变化趋势,可以用有序分组资料的线性趋势检验。

非参数检验

非参数检验的统计推断基础是比较分布而不是比较参数,所以不必考虑被研究对象的为何种分布以及分布是否已知。在实际工作中,对符合参数检验应用条件的资料,或经变量变换后符合参数检验应用条件的资料应首选参数检验;而不能满足参数检验应用条件的资料,应选用非参数检验。主要选择编秩的方法,比较统计变量T,而做出统计推断。

直线回归与相关分析

1、直线相关:如果两个随机变量中,当其中的一个变量由大到小的变化时,另一个变量也相

应的由大到小(后由小到大)的变化,并且相应变化的散点图在直角坐标系呈现直线趋势,则称这两个随机变量存在直线相关。

相关分析是研究变量和变量集合之间数量协同变化关系的密切程度和方向的统计方法。要求:两个变量_和Y都服从正态分布,严格说应服从双变量正态分布。

直线相关系数:用于说明具有直线相关关系的两个变量间的相关关系的密切程度和相关方向;亦称积差相关系数,总体的为ρ,样本的为γ。222

_的方差)(y的方差)_和y的协方差(__)(yy)(__)(yy)22l_yl__lyy

的取值1]之间。其意义如下:

⑴若0则_与Y存在直线相关关系;0为正相关;0为负相关;⑵越大,说明两变量间的相关关系越密切;⑶越小,说明两变量间的相关关系越不密切;⑷若1为完全相关;若0,则_和Y不存在相关关系。⑸01表示存在不同程度的线性相关关系:00.4为低度线性相关;

0.40.7为显著线性相关;0.71为高度显著线性相关。

相关分析的步骤:(在_与Y均服从双变量正态分布的情况下)

⑴绘制散点图:①呈线性趋势,计算相关性;②呈曲线趋势,进行曲线拟合;

③无任何趋势,不必分析。

⑵根据上述公式计算γ的值;

⑶相关系数的假设检验,由于抽样误差的存在,判断是否来自0的总体,常用t检验,公式:t0s22n2(或直接查t界值表)

⑷总体相关系数的区间估计:

当0时,从这样的总体中抽样,计算出的γ不服从正态分布,而进行反正切变换后,n较大时,Z近似服从均数为Z,方差为21的正态分布。n3

1(1)ln则Z的可信区间为(u21n3),u,对其进行(n3))e2z1

的变换,可以得出的可信区间。

直线相关分析的注意事项:

⑴计算相关系数时首先绘制三点图,判断两变量是否存在线性趋势;

⑵相关分析时要求_、Y均为随机变量,而不能用于事先界定_、Y的资料;

⑶相关分析时必须剔除异常点;

⑷相关分析要有实际意义,两变量相关,并不一定存在联系,可能是另外一种因素引起的;⑸分层资料不宜盲目的合并,进行相关分析;同时进行相关分析时,如果不能确定各层研究对象具有同质基础,不宜盲目合并。

⑹不能将假设检验中显著性大小理解为两变量相关程度的大小,后者是由相关系数的大小决定

2、等级相关:适用于不服从双变量正态分布或总体分布未知的资料,还可用于等级资料的相关分析。等级相关系数表示两个变量间相关系数的密切程度与相关方向。s

基本思想:对于不符合正态分布的资料或等级资料,将两个变量的原始观察值分别由小到大编秩,然后利用量变量的秩次计算相关系数。

3、直线回归:处理两个变量间线性数量依存关系的一种统计分析方法。

ab_y为应变量,给定_的y的条件均数的估计值;b为回归斜率,表示回归方程为:y

当自变量_每变化1个单位时,应变量y平均变化b个单位;a为截距,表示没有自变量_时其他因素对y的平均影响。

线性回归模型的前提条件:

⑴线性:应变量y的总体均数与自变量_呈线性关系;因此进行回归分析前应先绘制散点图;⑵:任意两个观察单位之间相互;

⑶正态性:对任意给定_的值,y均服从正态分布;该分布的均数是回归直线上与_值相对应的那点的纵坐标;

⑷等方差:自变量_的取值范围内,不论_取什么值,y都具有相同的方差。

直线回归分析的步骤:

⑴绘制散点图,通过观察散点的形态来判断线性假设是否成立;

⑵建立直线回归方程,即求出回归参数a和b;通常用最小二乘法估计参数,即要求残差平方和达到最小;

b(_i1

nni_)(yiy)

il_yl__(_

i1_)2

l___2(_)2n

ayb_l_y_y(_)(y)

⑶绘制回归线;注意:①不应超过_的实测值范围;②所绘制的直线必然通过

SS回归SS总

XXX)

⑹总体回归系数的区间估计:(bt

.sb,bt

⑺回归方程的应用:①利用回归方程进行预报;②统计控制。直线回归分析的注意事项:Ⅰ回归分析要有实际意义,注意变量之间的内在联系和规律,两变量之间还必须是因果关系;Ⅱ对资料的要求:一般y来自正态总体的随机变量,_可以是正态总体的随机变量,也可以是精确测量和严密控制的值;Ⅲ进行分析前应先绘制散点图;Ⅳ必须剔除一些异常点;

Ⅴ回归方程的适用范围不能随意外延。其适用范围一般以自变量取值范围为界。直线相关和回归的区别与联系:⑴区别:

①资料的要求不同:相关要求两个变量呈双变量正态分布;回归要求y服从正态分布,而_可以是精确测量和严格控制的变量;

②统计意义不同:相关反映的是两变量间的伴随关系,二者的关联程度如何,而回归反映的是两变量间的依存关系,即因果关系,或从属关系;

③分析的目的不同:相关分析的目的是描述两个变量间的相互关系,用r来反映这种关系的方向以及密切程度,而回归分析的目的是描述两个变量间的数量依存关系,从而进行统计预测和统计控制;

⑵联系:

①对于同一资料,r和b的符号一致,说明两变量间关系的方向;

②相关系数与回归系数的假设检验是等价的,对于同一样本,trtb,实际应用中只检验其

中之一即可;

③二者可以相互解释,相关系数的平方和等于回归平方和占总平方和的比例,即反映应变量y的总变异中归因于_的部分;

实验设计的概述

实验室研究:以动物或标本为研究对象

实验研究的分类临床试验:以人为研究对象

社区干预试验:以社区人群为研究对象,又称半试验性研究

处理因素

受试对象

实验效应

1、处理因素:研究者根据研究目的确定的,通过合理安排实验,从而科学的考察其作用大小

的因素;

非处理因素:对正确的评价处理因素的作用有一定的干扰,但研究者并不想通过本次实验考察

其作用大小的因素;

注意事项:

⑴要区分处理因素和非处理因素;主要依据研究目的来确定;⑵抓住实验中的主要因素,且因素的水平数不宜过多;⑶处理因素必须标准化,即保证处理因素在整个实验过程中始终如一,保持不变;

2、实验效应:通过观察指标来反映

⑴观察指标的基本原则:客观性;精确性(包括准确度和精确度,准确度是指测

值与真实值的接近程度,属系统误差;而精确度是指对同一变量重复观测时,观

测值与平均值的接近程度);灵敏性;特异性

3、实验设计的基本原则:对照,随机,重复,均衡

⑴对照:使实验组和对照组内的非处理因素基本一致,从而使处理因素的效应得以显示;对照组设计的三个条件:专设,同步,对等;

对照的形式:空白对照:不给对照组施加任何处理因素,临床试验中不宜用空白对照;实验对照:不给对照组施加处理因素,但施加某种实验因素;

标准对照:与现有的标准法或常规方法、公认的有效药物作对照;

自身对照:对照与实验在同一受试对象上进行;

相互对照:不单独设立对照组,而是2个或几个实验组相互对照;

历史对照:除了非处理因素影响较小的少数疾病外,一般不宜用此种对照;⑵随机:包括随机抽样与随机分配;

⑶重复:样本含量与四个因素有关:α,β,δ,σ,且均呈反变的关系。

⑷均衡:各组的受试对象除接受的处理因素不同外,其他影响实验的非处理因素要基本相同。

常用的实验设计方法

1、完全随机设计:亦称单因素实验设计,不考虑个体差异的影响,仅涉及1个处理因素,但可以有2个或2个以上的水平。将受试对象随机分配到处理组合对照组中,各组的例数可以相等或不等。分析方法同前。

2、配对设计和配伍组设计:先将受试对象按配比条件配成对子,再按随机化的原则把每对中的受试对象分配到实验组和对照组中。通常以影响实验效应的主要处理因素为配对条件。医学实验中的自身对照也是配对设计,但容易产生混杂影响,最好设立平衡对照。配伍组设计,亦称随机区组设计,是配对设计的扩大。

分析方法:

⑴配对设计:如果各对的观察值的差值服从均数为0的正态分布,用配对设计的t检验,否则用配对设计的秩和检验。

⑵配伍组设计:满足方差分析条件的用方差分析,不满足的经变量变换后也可以用,仍达不到要求的用配伍组设计的秩和检验。

3、交叉设计:是在自身配对设计基础上发展起来的双因素设计,该设计考虑了1个处理因素,此因素有两个水平(A,B),并且还考虑了2个与处理因素无交互作用的非处理因素对实验效应的影响。

适用条件及应注意的问题:

⑴处理因素只有2个水平(A,B),且2个非处理因素(实验阶段、受试对象)与处理因素之间无交互作用;

⑵两个实验阶段之间要安排一定的间隔时间,以便消除前一阶段治疗措施的残留效应,保证两个阶段的起始条件一样;

⑶两次观察的时间不能过长,处理效应不能持续过久;

⑷适用于病情较稳定,病程可以分阶段,短期治疗可见疗效的疾病;

⑸为消除患者的心理作用或防止研究者的暗示,一般多采用盲法。

分析方法:符合方差分析条件的应用方差分析,不符合的经变量变换后也可以用,仍达不到要求的用秩和检验。方差分析将总变异分为4部分:受试者间,阶段间,处理间和误差。

4、拉丁方设计:是按拉丁方阵的字母、行和列安排实验的三因素等水平的设计。考虑了3个因素对实验效应的影响。

基本要求:

⑴必须是3个因素的实验,且3个因素的水平数相等(若不等,以主要的处理因素的水平数为主,其他2个进行调整);

⑵3个因素是相互的,均无交互作用;

⑶各行、列和字母所得实验数据的方差齐;

设计步骤:

⑴根据主要处理因素的水平数确定基本型拉丁方;

⑵先将基本型拉丁方随机化,然后按随机化后拉丁方阵安排实验,随机化是通过拉丁方的任两行或任两列交换位置实现;

⑶规定行、列、字母所代表的因素或水平,通常用字母表示主要的处理因素;分析方法:可用方差分析,将总变异分为列间、行间、字母间和误差4部分。

5、析因实验设计:是一种将2个或多个因素的各水平交叉分组安排实验的设计,不仅可以检验各因素内部不同水平间有无差异,还可以检验2个或多个因素间是否存在交互作用。常用的设计模型有22析因实验设计、222析因实验设计和2232析因实验设计。分析方法:可以用方差分析。

22析因实验设计:将总变异分为A间、B间、交互作用(AB)和误差4部分。

222析因实验设计:将总变异分为A间、B间、C间、AB、AC、BC、ABC和误差8部分。

6、正交实验设计:正交表符号Ln(Km)的意义:符号L表示正交表;n表示该表有n行,须安排n次试验,m表示该表有m列,最多容许安排因素和交互作用的个数;K表示每列有1,2,…K个数字,即各因素的水平数。

在正交表中每列中不同数字出现的次数相等;任两列同一横行2个有序对数出现的次数相等。

分析方法:可用直观分析和方差分析处理,方差分析是将总变异分为各因素不同水平间,交互作用及误差等。

误差和偏倚

1、误差:

⑴随机误差:由随机因素引起的,具有随机、变化、不恒定的性质;在临床试验中随机误差是不可避免的,但可用统计学的方法估计其大小。

⑵非随机误差:分为系统误差和非系统误差

①系统误差:是在试验过程中产生的呈现一定规律性的误差,其产生的原因通常是可知的,应设法消除其影响,不能消除的估计其大小;

②非系统误差:是在试验过程中由于偶然的失误所造成误差,又称过失误差,应通过认真核对资料予以消除。

2、偏倚:在临床试验过程中,由于对某些非处理因素未加严格控制,致使这些非处理因素对试验效应产生干扰,此种干扰所造成的系统误差称为偏倚。偏倚只能控制但不能完全避免,严格遵守实验设计的基本原则是控制偏倚的重要途径。

可分为选择性偏倚、测量性偏倚和混杂性偏倚。

①选择性偏倚:是指由于纳入标准和排除标准不明确所造成的偏倚;为控制选择性偏倚,在临床试验的设计阶段应采取以下措施:

Ⅰ根据研究目的,严格规定受试对象的纳入标准和排除标准;

Ⅱ采用分层抽样的方法;

Ⅲ正确设立对照组,尽可能使所有影响处理因素效应的非处理因素在试验组和对照组保持均衡;

Ⅳ严格贯彻随机化原则。

②测量性偏倚:在临床试验的观察和测量阶段,由于观察者或受试对象的主客观原因,在对实验效应指标观察或测量时产生的偏倚称为测量性偏倚。

盲法:1)、单盲:受试者被盲,即观察者知道受试者分组情况,但受试者本人不知道。2)、双盲:受试者和观察者双方均不知道分组情况。3)、三盲:观察者、受试对象以及负责资料收集

和分析的人员均不了解分组情况。

③混杂行偏倚:由于某些非处理因素与处理因素混杂在一起,影响了实验效应的准确性,这些由非处理因素所致的偏倚为混杂性偏倚,简称混杂。控制偏倚措施:

Ⅰ在设计时要严格遵循随机分组的原则,使各组的非处理因素保持均衡,以防止混杂性偏倚;Ⅱ在分析时可通过分层分析或多因素分析,以控制混杂性偏倚。

回归系数的意义

1、多元线性回归分析中偏回归系数的意义:在其他自变量保持不变的条件下,自变量_改变一个单位是因变量Y的平均该变量。

流行病学意义:在其他因素不变的条件下,某因素改变1个单位时,疾病或死亡危险性的增加量。

2、Logistic回归分析中偏回归系数的意义:在其他自变量固定的条件下,第j个自变量每改变一个单位时Logit(p)的改变量。流行病学意义:在其他因素不变的条件下,暴露因素使疾病或死亡发生的改变量。

3、Co_回归模型中偏回归系数的意义:当其他协变量都不变时,_i每变化一个单位,相对危险度的自然对数(LnRR)变化i个单位。

流行病学意义:在其他因素不变的条件下,暴露组发病或死亡是非暴露组的倍数。

生存分析1、基本概念:

⑴随访资料:指对一批研究对象进行追踪观察所获得的有关其结局以及出现这种结局所经历的时间的方面的资料。

⑵起点事件:研究者根据研究目的所关心的某一事件的起点。

终点事件:研究者根据研究目的所关心的某一事件。不同的研究目的有不同的终点事件。生存时间:广义的生存时间是指从某个起始事件开始到某个终点事件的发生(出现反应)所经历的时间。也称为失效时间。

特点:①分布类型不宜确定;②生存时间的影响因素多而复杂且不宜控制。

⑶生存时间数据:根据研究对象的结局可分为两类:

①完全数据:观察对象在观察期内出现反应(终点事件),这时所记录到的时间信息是完整的;②截尾数据:又称为截尾值、删失数据、不完全数据,尚未观察到研究对象出现反应(终点事件)时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的。

截尾的原因主要有三方面:①失访:失去联系,观察期内由于搬迁或观察对象不配合的原因可造成失访;②退出:退出研究,如观察期内研究对象意外死亡,死于其他疾病,临时改变治疗方案等而中途退出研究;③停止:观察期结束时仍未出现结局。

⑷死亡概率:是指某单位时段期初的观察对象在该单位时段死亡的可能性大小:

q某单位时段内死亡数该时段期初观察人数

1若该时段内有删失,则分母用校正人口数:校正人口数期初观察人数删失数2

死亡率:指单位时间内研究对象的死亡频率或强度,即平均每千人(或万人、百人)中的死亡人数:

m1某单位时段内死亡数100%0平均人口数期末人口数)2该时段平均人口数

⑸生存概率:表示某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小,用p表示:p活满某时段的人口数1q该时段期初观察人数

若有删失,则分母用校正人口数。

生存率:指研究对象经历t个时段后仍存活的概率,及生存时间大于等于t的概率,用P(T≥t)表示。生存率随时间t的变化而变化,即生存率是相对于时间t的函数,称为生存函数,记为S(t):

①若前t个时段没有删失:S(t)p(Tt)t时段结束时仍存活的人数研究期初观察人数

②若观察期内有删失,假定观察对象在各个单位时段内是否生存的时间是相互的,其生存概率分别用p1,XXX,则S(t)p1XXXpjtjt

生存函数又称累积生存概率,即将时刻t尚存活看成是前t个时段一直存活的累计结果。⑹生存率曲线:以时间为横轴,生存率为纵轴绘制的曲线。

⑺中位生存期:也称半数生存期,当生存率为50%时所对应的时间,表示有且只有50%的个体可以活过这个时间。中位生存时间通常不等于生存时间的中位数,除非在这个时点之前没有删失值存在。⑻危险率函数:指t时刻尚存活的研究对象死于t时刻之后一瞬间的概率。

2、生存分析的基本思路:

⑴对资料的要求:①样本要有代表性,由随机抽样的方法获得,要有一定的数量;②完全数据所占的比例不能太少,即截尾值不宜太多;③截尾值出现的原因无偏性;④生存时间尽可能精确;⑤缺项要尽量补齐。

⑵选择合适的生存分析方法:

①非参数法:不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用的方法有乘积极限法和寿命表法;

②参数法:假定生存时间服从特定的参数分布,然后根据已知分布的特点对影响生存的时间进行分析,常用的方法有指数分布法、Weibull分布法、对数正态回归分析法和对数Logistic回归分析法等。

③半参数法:主要用于分析影响生存时间和生存率的因素,属多因素分析方法,其典型的方法为Co_模型分析法。

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- esig.cn 版权所有 湘ICP备2023023988号-3

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务