搜索
您的当前位置:首页回归分析在医学中的应用

回归分析在医学中的应用

来源:世旅网


毕 业 论 文

( 2014 届)

题 目回归分析在医学中的应用

学 院 数学计算机学院 专 业 数学与应用数学 年 级 2010级3班 学生学号 *********** 学生姓名 蔡慧

2014年 5月 8 日

指导教师 纳艳萍

毕业论文任务书

附表一

论文题目 学生姓名 指导教师姓名 回归分析在医学中的应用 蔡慧 纳艳萍 所学专业 所学专业 数学与应用数学 应用数学 选题方向 应用数学 班级 10级(3)班 职称 讲师 一、毕业论文基本要求(指导教师填写:包括学生论文应完成的基本环节及各环节要求、学生应遵循的学术规范、论文对本专业相关能力的训练要求等)。 1、所选论文题目具有一定的实际意义和理论价值. 2、认真学习回归分析的基本理论,搜索、查阅与论文有关的各种资料. 3、按规定程序认真撰写论文,按时完成初稿并提交论文. 4、论文的观点正确,内容充实,条理清楚,层次分明. 5、引用参考资料、信息及运算准确无误. 指导教师签名: 年 月 日 二、学生学术诚信承诺: 郑重承诺:本论文在选题、写作、修订完稿过程中将保守学术诚信之要,由本人在指导教师指导下独立完成;论文所使用的相关资料、数据、观点等均真实可靠,凡论文引用他人观点、材料均将注明出处,保证不剽窃或不正当引用他人学术成果。如有违反上述内容者,本人愿承担一切后果。 学生签名: 年 月 日 三、毕业论文合作者及分工: 独立完成 四、毕业论文进度安排 阶段 各阶段内容 1 2 3 4 5 起止时间 2013.12.1—2014.3.1 2014. 3.1—2014. 3.10 2014. 3.10—2014. 4.10 2014. 4.10—2014. 4. 20 2014.4.20—2014.5. 8 选择论文题目,查阅相关文献 撰写开题报告 论文初稿 论文修订稿 定稿 指导教师 检查签名

毕业论文开题报告

附表二 论文题目 学生姓名 回归分析在医学中的应用 蔡慧 专业 数学与应用数学 选题方向 应用数学 年级、班级 10级(3)班 一、选题的来源、目的、意义和基本内容 1来源:教师自命题 2目的和意义:学习并掌握回归分析的基本理论,研究回归分析在医学中的应用。 3基本内容:本文主要介绍了回归分析的主要内容,并对病人的血糖、血压、甘油三酯、胆固醇进行相关分析研究。 二、国内外研究综述 回归分析是一种处理变量间相关性的分析模型,近年来国内外许多专家学者对回归分析在医学中的应用做了深入的研究。刘颜和张明等利用回归理论分析了医学项目的评估[1];贺祥利用回归分析对科研管理进行评价[2]. 三、参考文献 [1]刘颜 ,饶从志等.回归分析在医学科技项目投入---产出评估中的应用[J].2002,15 [2]贺祥,周小平, 科研管理的综合评价方法[J]. 中华医学科研管理杂志,1998, 11( 1) : 59-60 [3]张明,科研人力投入------ 产出分析及评价[J]. 中华医学科研管理杂志, 1997, 10( 1) : 34-373 [4]刘颜, 曾楚华等. 越秀区居民接受防癌知识教育4 年效果的评价[J]. 癌症, 2000;19( 11) : 1036-1039 [5]朱敏,岳亮. 医院对临床医学本科毕业生评价的调查分析[J].时代教育(教育教学版).2009(06). [6]范金城,梅长林 数据分析[M].科学出版社,2002.1 [7]魏立力,马江洪等,概率论与数理统计[M].北京:科学出版社,2012.2 四、指导教师意见 指导教师签名 年 月 日 五、学院毕业论文领导小组审核意见 领导小组组长签名 年 月 日

毕业论文教师指导情况

附表三

回归分析在医学中的应用 蔡慧 专业 数学与应用数学 选题方向 应用数学 年级、班级 10级(3)班 论文题目 学生姓名 一、对论文选题及写作纲要的指导意见 指导教师签名: 年 月 日 二、对论文初稿的指导意见: 指导教师签名: 年 月 日 三、对论文修订稿的指导意见: 指导教师签名 年 月 日 四、对学生文献收集、分析及运用能力的综合评价 指导教师签名 年 月 日

毕业论文评价表

附表四

指导教师评语: 成绩: 签名: 年 月 日 评阅人评语: 成绩: 签名: 年 月 日 学科答辩小组评语: 成绩: 答辩小组组长签名: 年 月 日 学院答辩领导小组意见: 签名: 年 月 日 指导教师 评阅人 答辩小组 最终成绩 (占 %) (占 %) (占 %)

说明:指导教师、评阅人和答辩小组按百分制赋分,各项所占比重参考值分别为:40%、

20%、40%,各学院也可根据专业特点和要求自行调整,但必须在表中明确标识。最终成绩由教学秘书核计。

回归分析在医学中的应用

摘要:在处理测量数据的过程中,经常需要研究变量与变量之间的关系。变量

之间的关系一般分为两种。一种是完全确定关系,即函数关系;一种是相关关系,即变量之间既存在着密切联系,但又不能由一个或多个变量的值求出另一个变量的值。而回归分析方法是处理多个变量之间相互关系的一种数学方法,是数理统计常用方法之一。从分析测试的观点来看,回归分析的任务就是找出响应值y (因变量)与影响它的诸因素xi,(自变量, i = 1 ,2 ,3 , …n)之间的统计关系(回归模型)本文主要介绍了多元回归分析的主要内容并对病人的血压、血糖、胆固醇、甘油三酯进行相关分析研究。

关键字:回归分析 回归方程 因变量 自变量

Application of regression analysis in medicine

Abstract: The process of measurement data, often need to examine the relationship between variables and variables. The relationship between variables is generally divided into two kinds. Is a completelydetermine the relationship, namely the function relationship; one isrelated to the variables, both closely linked, but not by one or more ofthe value of a variable for the value of another variable. And the method of

regression analysis is a mathematical method of the relationship between multiple variables, is one of the common methods of mathematical statistics. From the point of view of analysis of test,regression analysis of the task is to find the response value (the dependent variable) and the factors affecting it, (variable, = 1, 2, 3,...)The statistical relationship between (regression model) this paper mainly introduces the main

content

of multiple

regression

analysisBlood

pressure, blood

glucose, cholesterol, triglyceride in patients of correlation analysis.

Keywords: Regression analysis Regression equation dependent variable Variables

目录

1 引言.................................................................... 7 2相关定义 ................................................................ 9 2.1回归分析的基本定义 .................................................... 9 2.2多元回归分析定义 ...................................................... 9 2.3多元回归分析的基本模型 ................................................ 9 2.3.1参数B的最小M乘估计 ............................................... 10 2.4一些非线性回归方程的线性处理方式 ..................................... 12 3多元线性回归分析在医学中的应用 ......................................... 14 4 结论................................................................... 20 参考文献................................................................. 20 谢辞..................................................................... 20

.1引言

回归分析是研究一个变量关于另一些变量的依赖关系的计算方法和理论基础, 其目的在于通过后者的已知或设定值去估计或预测前者的均值。它是处理变量之间相关关系的一种常用数学统计方法, 是最常用的数理统计方法,可以解决预测、控制、优化等问题。它在工农业生产和医学研究及国民经济的各个领域都有广泛的应用。回归分析种类包括线性回归分析和非线性回归分析。非线性回归是回归函数关于未知参数具有非线性结构的回归,但某些非线性回归模型可以化为线性回归模型处理。本文主要是运用多元线性回归的方法分析病人的血压、血糖、胆固醇甘油三酯进行相关分析,进而确定三者之间的函数关系。回归分析是一种传统的应用性较强的学习方法,是现代应用统计学的一个重要的组成部分,在各个科学领域都得到了相应比较广泛的应用。它不仅能够把隐藏在大规模原始数据群体中的重要信息挖掘出来,把握住数据在群体中的主要特征,从而得到变量间相关关系的数学表达式,利用数学概率统计知识对此关系进行分析,以此来判别其有效性,还可以利用关系式,由一个或多个变量值去预测和控制另一个因变量的取值情况,从而知道这种预测和控制所能够达到的程度,并进行因素的分析。

2相关定义

2.1回归分析的基本定义

通过利用这种统计关系在一定置信度下由各因素的取值去预测响应值的范围,在众多的预报变量中,判断哪些变量对自变量能够显著影响,哪些变量不能够显著影响;根据预报变量的给定值来估计和预测精度。常用的回归模型主要包括线性回归、非线性回归,前者又可分为一元线性回归、多元线性回归,后者分为可化为一元线性方程的回归方程,如指数函数、对数函数等,及可化为多元线性方程的回归方程,如多项式方程。传统的回归分析方法是对线性回归模型采用最小二乘法来拟合回归方程,然后计算相关系数进行显著性检验,而对于非线性方程,还要对自变量和因变量作适当的变换后,把非线性方程转化为线性方程,然后再用线性回归的方法处理非线性方程。通过这种传统的回归计算方法,尤其对于多元非线性方程的计算,求解过程比较繁琐,计算过程复杂。

2.2多元回归分析定义

在处理测量数据时,经常要研究变量与变量之间的关系。变量之间的关系一般分为两种。一种是完全确定关系,即函数关系;一种是相关关系,即变量之间既存在着密切联系,但又不能由一个或多个变量的值求出另一个变量的值。回归分析的任务就是用数学表达式来描述相关变量之间的关系。

2.3多元回归分析的基本模型

x1 x2 x3..... xp是p可以精确测量或可控制的变量。如果变量y与

x1 ,x2 ,x3..... ,xp之间的内在联系是线性的,那么进行n次试验,则可得n组数据:), i= 1,2,…,n

(

xi1 ,xi2 ,xi3..... ,xip它们之间的关系可表示为:

y1 b0 b1x11 b2x12 bpx1p1y2 b0 b1x21 b2x22 bpx2p2

b,b,b....by其中,012n是p+l个待估参数,i表示第i次试验中的随机因素对i

.......yn b0 b1xn1 b2xn2 bpxnpn

的影响。为简便起见,将此n个方程表示成矩阵形式:

YXB其中

Y(y1,y2...,yn)

B(b0,b1...,bp)

(1,2...,n)T上式便是p元线性回归的数学模型。

2.3.1参数B的最小M乘估计

为了求出多元线性回归模型中的参数

b0,b1...,bp,可采用最小二乘法,即在其

数学模型所属的函数类中找一个近似的函数,使得这个近似函数在已知的对应数据上尽可能和真实函数接近。

c0,c1,c2,,cp分别是

b0,b1...,bp的最小二乘估计,则多元回归方程(即

近似函数)为:

其中

c0,c1,c2,,cpyc0c1x1c1x2  cpxp

xi1,xi2,,xip叫做回归方程的回归系数。对每一组(

yi),

由回归方程可以确定一个回归值了

yi。这个回归值

yi与实际观测值

yi之差,反映

与回归直线

的偏离程度。若对所有的观测数据,yi与yi (I=1,

yiyc0c1x1c1x2  cpxp2, …,n)的偏离越小,则认为回归直线与所有试验点拟合得越好。全部观测值与回归值

yi的偏差平方和为:

ni2niQ(c0,c1,,cp)(yiyj)yic0c1xi1c2xi2...cpxip2

根据微分学中的极值原理

c0,c1,c2,,cp应是下列方程组的解:

通过整理可将上述方程组写成如下形式:

2nyic0c1xi1c2xi2...cpxip0in(y-c-cx-  -cx)0(j1,2,...,p)01i1pipi

即

nnnnnc0c1xi1c2xi2...cpxipyiiiiiinnnnn2c0xi1c1xi1c2xi2xi1...xipxipc2xi2yiiiiii.......................................nnnnn2c0xipc1xi1xipc2xi2xip...cpxipxipyiiiiii

上式也可以用矩阵表示为:

其中

c(c0,c1,c2,,cp)'1X'XC X'Y

,称为回归方程的系数矩阵,X'是X的转置矩阵。

X'X当X'X满秩时,逆矩阵存在,系数矩阵C可以表示为:

C X'XX'Y1

上式即为回归模型中参数B的最小二乘估计。至此,我们就得到了p元线性回归方程。建立回归方程的目的是要利用它来进行预报与控制。在实际问题中,事先并不能断定随机变量y与

x1,x2,,xp之间确有线性关系,在求解回归方程

前,线性回归模型只是一种假设,所以在求出线性回归方程之后,还需对其进行统计检验,给以肯定或否定的结论。

2.4一些非线性回归方程的线性处理方式

由于线性回归方程比较简单,所以在遇到非线性模型时,最好将其转换为线性模型。

(1)多项式模型

yxx2012 多项式模型为

3x3……2kxk

k对方程中的变量作如下变换

x1x1,

x2x3, …… ,

3xkxk,

则原方程变为

yxx202x……xk

就可用线性模型的方法处理。 (2)指数模型指数模型为:y=ae

方程两边取对数得:lnylnabxln 令

bx

0lna,*

ylny,

 则可得线性方程

*ln

yx01**

(3)幂函数模型幂函数模型为:

方程两边取对数得

yax1b1xb22

lnylnab1lnx1b2lnx2ln令

y b0*lny,

lna,

* x1lnx1,,

x*2lnx2,*

则幂函数模型就变为线性模型

ln

ybbxbx**01122**

4)成长曲线模型

成长曲线模型在经济、教育和心理研究中都非常有用,其数学表达式为:

y1(0

1ex)

y它就转化为线性模型:

*1yxe*x

y*01x*

3多元线性回归分析在医学中的应用

血液中糖份称为血糖,绝大多数情况下都是葡萄糖。体内各组织细胞活动所需的能量大部分来自葡萄糖,所以血糖必须保持一定的水平才能维持体内各器官和组织的需要。正常人在空腹血糖浓度为3.61~6.11mmol/L。空腹血糖浓度超过7.0mmol/L称为高血糖。血糖浓度低于3.61mmol/L称为低血糖,我们拿到的血液生化检查报告中一般写着:葡萄糖是我们身体必不可少的营养之一。人们摄入的食物如谷物、蔬果等,经过消化系统转化为单糖(如葡萄糖)进入血液,运送到全身细胞,作为能量的来源。如果一时消耗不了,则转化为糖原储存在肝脏和肌肉中,肝脏可储糖70~120克,约占肝重的6~10%。细胞所能储存的肝糖是有限的,如果摄入的糖份过多,多余的糖就会转变为脂肪。当食物消化完以后,储存的肝糖就会成为糖的正常来源,维持血糖正常的浓度。在剧烈运动或者长时间没有补充食物情况,肝糖也会消耗完。这时细胞将分解脂肪来供应所需的能量,正常情况下脂肪的10%为甘油,甘油能够转化为糖。脂肪的其它部分也可以通过氧化产生能量,但是他的 代谢途径和葡萄糖是不一样的。人类的大脑和神经细胞是需要糖来维持生存,必要时人体将会分泌激素,把人体的某些部分(如肌肉、皮肤等)摧毁,将会使其中的蛋白质转化为糖,以此来维持人的正常生存。人体的血糖是由于一对矛盾的激素调节的:他们是胰岛素和胰高血糖素,当感受到血液中的血糖低的时候,胰岛的A细胞就会分泌胰高血糖素,动员肝脏的储备糖原,释放入血液,导致血糖上升;当感受到血液中的血糖过高的时胰岛的B细胞会分泌胰岛素,这样就会促进血糖变成肝糖原储备或者是促进血糖进入组织细胞。 一般情况下高血压与高血脂常合并存在,两者之间不仅存在共同的代谢异常和遗传背景,实际上还有多种机制互相影响的。(1)血脂异常可损害动脉血管内皮功能,而动脉的收缩性很大程度上受血管功能内皮的调节。当血管内皮功能受损时,对动脉血压也将产生影响。Panza等研究证实高血压患者有内皮介导的血管舒张功能受损,这一缺陷可能对高血压患者阻力血管功能障碍起重要作用 ,,近年来研究表明,高血压病人存在多种细胞膜离子转运异常。血浆中的脂质变化可影响细胞膜脂质构成,进而影响细胞膜的理化性质,如膜的流动性、离子通道等。

高血压病人血清总胆固醇、甘油三酯、低密度脂蛋白胆固醇 都可以作用于细胞膜,使其通透性改变并与细胞Ca 2+ 内流呈正相关 。Ca 2+ 内流增加导致血管平滑肌收缩增强,外周血管阻力就会升高,形成高血压。(2)血浆甘油三酯(甘油三酯)升高,可通过多种途径产生致动脉粥样硬化作用:①甘油三酯被肝脂酶水解,生成sLDL,后者颗粒小、血浆清除速率慢、易被氧化修饰,与蛋白多糖结合能力强,易于通过动脉壁内皮细胞进入内皮下间隙与动脉壁蛋白多糖结合。氧化或蛋白多糖结合的sLDL被巨噬细胞摄取,后者转变成泡沫细胞,进而形成动脉粥样斑块。高甘油三酯时,通过sLDL生成增多而引起动脉粥样硬化。②甘油三酯降低HDL-C的水平,后者对动脉粥样硬化的形成起抑制作用。③高甘油三酯血症者糖耐量降低,存在胰岛素抵抗,促进动脉粥样硬化形成。动脉粥样硬化形成后,可因血管弹性降低、外周血管阻力增加等而影响血压,尤其是舒张压。(3)高甘油三酯血症可通过促进凝血、抑制纤溶等引起高凝状态,使血液粘滞性增高,血液流变学异常,进而增加外周阻力,引起血压升高。影响血压的因素固然较多,迄今业已明确的高血压致病因素有遗传、肥胖、高盐摄入、精神紧张、吸烟和过量饮酒等因素。流行病学研究已证实了血胆固醇水平和血压间存在正相关,并且血压与胆固醇之间的联系仅受体重指数和甘油三酯水平的影响,但是不受年龄、随机血糖、季节、运动量及社会经济状况的影响 。笔者通过对健康体检人群的甘油三酯与血压数据的回顾分析,发现血甘油三酯水平和血压之间同样具有正相关关系,但是这种关系在男性更为明显。本研究未排除胆固醇、血糖及体重因素等对血压的影响,在排除上述因素的作用后,血甘油三酯水平和血压之间仍然具有类似的正相关关系。

表一 血糖、胆固醇、甘油三酯、血压相关数据

血糖(3.6-6.2) 胆固醇 甘油三酯 血压 7.8 5.17 2.38 90.0 8.2 6.5 2.16 85.0

9.4 7.82 1.89 80.0 9.0 5.0 1.98 90.0 11.0 4.25 0.65 100.0 8.4 3.26 0.8 100.0 9.5 5.18 1.6 95.0 10.2 6.28 0.96 80.0 8.7 3.52 0.83 85.0 8.4 3.48 3.58 80.0 9.3 4.29 3.95 85.0 12.0 7.82 3.47 90.0 11.0 6.93 0.62 80.0 9.3 4.35 0.54 70.0 10.2 4.26 0.89 85.0 9.0 3.58 4.29 90.0 7.9 4.24 3.87 100.0 8.3 4.26 3.24 80.0 7.9 3.8 2.86 95.0 8.3 3.45 0.88 90.0 8.7 5.29 1.24 95.0 9.5 5.2 3.46 100.0 10.0 3.6 2.3 80.0

应用spss进行血糖、胆固醇、甘油三酯、血压之间的分析

/CELLRANGE=full

/READNAMES=on

/ASSUMEDSTRWIDTH=32767.

DATASET NAME DataSet1 WINDOW=FRONT. REGRESSION

/DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE

/STATISTICS COEFF OUTS CI BCOV R ANOVA COLLIN TOL CHANGE ZPP

/CRITERIA=PIN(.05) POUT(.10) /NOORIGIN

/DEPENDENT 血糖(3.66.2)

/METHOD=ENTER 胆固醇 甘油三酯 血压.

Regression

[DataSet1] Descriptive Statistics Mean 血糖9.217 (3.6-6.2) 胆固醇 甘油三酯 血压

Correlations

Pearson Correlation

血糖甘油三(3.6-6.2) 胆固醇 酯

.489 1.000 -.053 -.179 .009 .

-.215 -.053 1.000 .157 .162 .404

血压 -.138 -.179 .157 1.000 .265 .207

Std. Deviation N 1.1081 23 23 23 23 4.8491 1.37658 2.1074 1.25261 88.04 8.221 血糖

1.000

(3.6-6.2) 胆固醇 甘油三酯 血压

.489 -.215 -.138

Sig. (1-tailed) 血糖

.

(3.6-6.2)

胆固醇

.009

甘油三酯 血压 N .162 .265 .404 .207 23 23 23 23 . .237 23 23 23 23 .237 . 23 23 23 23 血糖23 (3.6-6.2) 胆固醇 甘油三酯 血压 23 23 23

Variables Entered/Removedb Variables Model Entered 1

血压, 甘油三酯, 胆固醇a

Variables Removed Method .

Enter

a. All requested variables

entered.

b. Dependent Variable: 血糖(3.6-6.2) Model Summary Change Statistics Model R 1 .525a Adjusted R Std. Error of R Square R Square Square the Estimate Change .275 .161 1.0151 .275 F Change df1 2.406 3 df2 19 a. Predictors: (Constant), 血压, 甘油三酯, 胆固醇 ANOVAb Model 1 Sum of Squares Regressio7.436 n Residual 19.577 Total 27.013 df 3 19 22 Mean Square F 2.479 1.030 2.406 Sig. .099a a. Predictors: (Constant), 血压, 甘油三酯, 胆固 醇 b. Dependent Variable: 血糖(3.6-6.2)

Coefficientsa Unstandardized Coefficients Model 1 胆固醇 血压 B (Constant) 8.001 .382 -.003 甘油三酯 -.165 2.617 .160 .175 .027 Standardized Coefficients t 3.058 2.389 -.941 -.121 Sig. .006 .027 .359 .905 .474 -.186 -.024 95% Confidefor B 2.524 .047 -.531 -.060 Std. Error Beta Lower Bounda. Dependent Variable: 血糖(3.6-6.2) Coefficient Correlationsa Model 1 Correlatio血压 ns 甘油三酯 Covariance血压 s 甘油三酯 血压 1.000 -.150 甘油三酯 -.150 1.000 .026 .000 .031 .001 胆固醇 .173 .026 1.000 .001 .001 .026 胆固醇 .173 .001 .000 胆固醇 .001 a. Dependent Variable: 血糖(3.6-6.2) Collinearity Diagnosticsa Variance Proportions DimenEigenvaluCondition (Constant甘油三Model sion e Index ) 胆固醇 酯 1 1 2 3 4 3.740 .206 .050 .004 1.000 4.256 8.643 32.013 .00 .00 .02 .98 .00 .05 .82 .12 .01 .91 .08 .00 血压 .00 .00 .04 .96 a. Dependent Variable: 血糖(3.6-6.2)

4 结论

本文主要介绍了学习并掌握回归分析的基本理论,最后研究回归分析在医学中的应用。并介绍回归分析的主要内容,并用spss对病人的血糖、血压、甘油三酯、胆固醇进行相关分析研究。

参考文献

[1]刘颜 ,饶从志等.回归分析在医学科技项目投入---产出评估中的应用[J].2002,15 [2]贺祥,周小平, 科研管理的综合评价方法[J]. 中华医学科研管理杂志,1998, 11( 1) : 59-60

[3]张明,科研人力投入------ 产出分析及评价[J]. 中华医学科研管理杂志, 1997, 10( 1) : 34-373

[4]刘颜, 曾楚华等. 越秀区居民接受防癌知识教育4 年效果的评价[J]. 癌症, 2000;19( 11) : 1036-1039

[5]朱敏,岳亮. 医院对临床医学本科毕业生评价的调查分析[J].时代教育(教育教学版).2009(06).

[6]范金城,梅长林 数据分析[M].科学出版社,2002.1

[7]魏立力,马江洪等,概率论与数理统计[M].北京:科学出版社,2012.2

谢辞

在本次毕业论文过程中,得到了指导老师的指导与支持.在此特别感谢指导老师的帮助。指导老师的悉心指导和大力支持,在总体结构的把握上给予了非常大的帮助,同时专业知识的细节工作上给予了耐心的指导,对于我顺利完成这次毕业论文起到了关键性的作用.我还要感谢我的母校,以及在大学四年生活中给予我关心和帮助的老师和同学,是他们教会了我专业的知识和做人的道理.通过这次毕业论文我还明白了作为一名数学专业的大学毕业生,我们要会的不仅仅是学习数学,更重要的是要有整体把握系统设计的能力.我会在以后的工作和学习中不断完善自己,为母校争光,为自己翻开辉煌的新篇章。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top