第一单元概述
1.研究设计应包括那几方面内容?
答:包括:专业设计和统计设计。
专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。
第二单元资料描述性统计
1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?
答:集中趋势的指标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。
描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。
2.变异系数和标准差有何区别和联系?
答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。2.单位不同:变异系数无量纲,标准差量纲和原指标一致。3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。
3.频数表的用途有哪些?
答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。
4.用相对数时应注意哪些问题?
答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。
第三单元医学统计推断基础
1.正态分布和标准正态分布的联系和区别?
答:联系:均为连续型随机变量分布。区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。
4.简述二项的应用条件?
答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。
5.简述Q-Q图法的基本原理?
答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。
第四单元参数估计与参考值范围的估计
1.均数的标准差和标准误的区别和联系?
答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能
通过统计方法来控制;而标准误则是指样本统计量的标准差,均数的标准误实质上是样本均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,间接反映了均数的抽样误差大小。
2.简述t分布和标准正态分布间的区别与联系?
答:t分布是进行小样本总体参数区间估计和假设检验的理论基础,t分布比标准正态分布的峰值低,且尾部翘的要高。此外随着自由度的增大,t分布逐渐趋近于标准正态分布,即为自由度趋于无穷时,t分布就是标准正态分布。
3.简述医学中参考值范围的含义和制定参考值范围的一般步骤?
答:含义:医学中把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。步骤:1.定义“正常人”,不同的指标“正常人”的定义也不同;2.选定足够数量的正常人作为研究对象;3.用统一和准确的方法测定相应的指标;4.根据不同的用途选定适当的百分界限,常用95%和99%;5.根据此指标的实际意义,决定用单侧范围还是双侧范围;6.根据此指标的分布决定计算方法,常用的计算方法有正态分布法、百分位数法。
第五单元t检验与单因素方差分析
1.I型错误和II型错误有何区别与联系,这两种错位有何实际意义?
答:I型错误是指实际上成立的H0所犯的“弃真”错误,其概率大小用α表示。II型错误则是指“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用β表示。当样本含量n确定时,α愈小,β愈大,反之亦然。意义:若在应用中要重点减少α,则取α=0.01;若在应用中要重点减少β,则取α=0.05,0.10,0.20甚至更高。
2.假设检验和区间估计有何联系?
答:联系在于可信区间亦可以回答假设检验的问题,在判断两个或多个总体参数是否相等时,假设检验和可信区间是完全等价的。
3.为什么假设检验的结论不能绝对化?
答:因为通过假设检验的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0是可能犯I型错误;接受H0时可能犯II型错误。因此不能在结论中使用绝对化字词如“肯定”等。
5.如何正确选取单侧或双侧检验?
答:单双侧检验首先应根据专业知识来确定,同时也应该考虑所要解决问题的目的。
1.若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;
2.在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验;
3.若研究者对低于或高于两种结果都关系,用双侧检验;若只关系其中一种可能,用单侧检验。一般认为双侧检验较保守和稳妥;单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。
6.两样本t检验的应用条件?
答:条件为:两样本相互独立的;所来自的总体为正态总体;两总体方差相等。
7.方差分析的应用条件?
答:条件是:1.各样本是相互独立的随机样本,均服从正态分布;2.相互比较的各样本的总体方差相等,即具有方差齐性。
第六单元列联表分析
1.R*C表的卡方检验中,对于理论频数太小的情况应如何处理?
答:处理方法:1.增加样本含量,以达到增大理论频数的目的,该方法为首先;2.根据专业知识,删除理论频数太小的格子所对应的行或列,可能损失样本信息或随机性,慎用;3.根据专业知识,将理论频数太小的格子所对应的行或列与性质相近的或邻列合并,使重新计算的理论频数变大,但要合并的合理;4.改用双向无序的R*C表的Fisher确切概率法,该方法计算复杂,需要SAS软件实现。
到此这篇数据特征分析的基本思路(简述数据特征分析的基本思路)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/sjkxydsj/83198.html