• 498.00 KB
  • 2022-04-29 14:02:45 发布

《医学统计学》复习资料与习题答案.doc

  • 35页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'教学提要(一)《医用统计学》基本概念1、变异:宇宙中的事物,千差万别,各不相同。即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。3、总体:即根据研究目的确定的同质的研究对象的全体。更确切地说,是性质相同的所有观察单位的某种变量值的集合。4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡等单位。6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。可分为二项式或多项式分类变量。7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。8、抽样误差:由于总体中各观察单位间存在个体差异,抽样研究中抽取的样本,只包含总体的一部分,因而样本指标不一定等于相应的总体指标,这种样本统计量与总体参数间的差别称为抽样误差。(二)统计工作的基本步骤1、设计:这是关键的一步。要求科学、周密、简明。2、搜集资料:要求完整、准确、及时。医学统计资料的来源主要有三个方面:(1)统计报表;(2)日常医疗工作的原始记录和报告卡片;(3)专题调查3、整理资料:核查资料;按性质或数量分组,拟定整理表。4、分析资料:包括指标的计算、统计图表的绘制,用统计方法如参数估计、假设检验等对资料作统计分析。(三)计量资料的分析1、平均数:用以描述同质计量资料频数分布的集中趋势,反映一组变量值的平均水平,是一组变量值的代表值。(1)算术均数:简称均数。用于描述对称分布(特别是呈正态分布)的变量值的平均水平。直接法:`x=Sx/n60 加权法:`x=S¦x/S¦=S¦x/n要点:频数表的制作(2)几何均数:用G表示。用于描述变量值呈等比数列,或呈对数正态分布或近似对数正态分布资料。直接法:G=Ö`x1x2×x3×××××××xn,G=lg-1(Slgx/n)加权法:G=lg-1(S¦lgx/S¦)(3)中位数和百分位数:中位数是一组从小到大顺序排列的变量值,位于中间位置的数值,亦称为位置平均数,代号为M。多用于描述偏态分布资料,或分布不明资料,或一端或两端无确定数值的开口资料的集中趋势。百分位数代号为PX,是一种位置指标。小样本资料中位数计算方法:当n为奇数时M=X(n+1/2)当n为偶数时M=[X(n/2)+X(n/2+1)]大样本资料中位数和百分位数计算方法:PX=L+I(n×x%-S¦L)2、变异指标(1)全距:R,亦称极差。即一组变量值中最大值与最小值之差。(2)标准差:是最常用来衡量变量值间离散程度的变异指标。总体标准差代号s,样本标准差代号s。运用:”用来描述正态分布资料的变异程度。当资料呈正态或近似正态资料时往往将均数与标准差同时写出:`X±S,表示均数的代表性。(3)变异系数:又称离散系数。代号为CV。CV=运用:比较均数相差悬殊的几组资料的变异程度;比较度量衡单位不同的几组资料的变异程度。3、正态分布及其应用(1)正态分布:是医学和生物学中最常见的总体频数分布,以均数为中心,对称,两侧逐渐下降,两端永远不与横轴相交。正态分布用N(m,s2)表示,为了应用方便,常对变量X作u=(X-m)/s变换,使m=0,s=1,则正态分布转换为标准正态分布(或呈U分布),用N(0,1)表示。特征:均数处最高;以均数为中心,左右对称;有两个参数:m和s;态曲线下的面积分布有一定规律:变量值范围正态曲线下面积(变量值出现的概率)m±1.0s68.27%m±1.96s95.00%m±2.58s99.00%(2)正态分布的应用:常用于估计频数分布情况;制定正常值范围。正常值:指正常人的各种生理常数。当资料呈正态分布时,最常用X±1.96S估计95%60 正常值范围,其含义是指绝大多数正常的变量值都在这个范围内,绝大多数是包括正常的80%、90%、95%和99%,最常用95%。4、均数的抽样误差和标准误(1)标准误的概念即样本均数的标准差,是说明均数抽样误差大小的指标。标准误愈小,表示抽样误差愈小,样本统计量对总体参数的估计愈可靠。(2)标准误的计算sx=s/Ö`n(总体标准误)sx=s/Ö`n(样本标准误)(3)标准误的应用表示样本均数的散布情形;估计总体均数的可信区间;进行假设检验5、t分布和总体均数的估计(1)t分布的概念对正态变量`X采用u=(`X-m)/sx变换,将N(m,sx2)变换为标准正态分布,即U分布,而实际中sx往往用sx来估计,这时对正态变量`X采用的不是U变换而是t变换,即t=(`X-m)/sx其结果也不是U分布而是t分布。(2)t分布的特征与标准正态分布相比有以下特征:a.二者都是单峰分布,以0为中心,左右对称;b.t分布的峰部较矮而尾部翘得较高,说明远侧的t值的个数相对较多,即尾部面积(概率P)较大。自由度u越小这种情况越明显,u逐渐增大时,t分布逐渐逼近标准正态分布;当u=¥时,t分布就完全成为标准正态分布了。(3)t界值t界值表,横标目为自由度u,纵标目为概率P,表中数字表示自由度为u,P为a(检验水准)时,t的界值,常记为ta,u。理论上单侧:P(t£-ta,u)=a,或P(t³ta,u)=a双侧:P(t£-ta,u)+P(t³ta,u)=a;P(-ta,u40,T>1b.校正条件:n>40,5>T>1(4)行´列表的c2检验(多个样本率或构成比的比较)a.c2值的计算:c2=n(A2/nRnC-1)b.注意事项:c2检验要求理论频数不宜太小,一般认为不宜有1/5以上格子理论数小于5,或有一个理论数小于1,处理办法有:增大一般含量,最好;删去理论频数太小的行或列;合并性质相近的行或列。等级资料宜用秩和检验。当结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的来说有差别,但不能说明它们彼此之间都有差别。(5)配对计数资料的c2检验a.H0:b=cb.c2=(b-c)2/b+c60 c.b+c<40,需校正,c2=(½b-c½-1)2/b+cd.u=1(五)统计表与统计图1、统计表(1)基本结构与要求:由标题、标目、线条、数字等组成a.标题:要求中心内容突出,必要时注明资料的时间、地点。b.标目:横标目:在表的左侧,是表的主语位置。纵标目:在表的上方,是表的谓语位置。c.线条:分顶线、底线、纵标目下面与合计上面的横线,斜线、竖线省略。d.数字:一律用阿拉伯数字。e.备注:列于表的下面,对表中标有(*)的数字加以描述。(2)种类a.简单表:被研究的事物只按一个特征或指标分组。b.复合表:被研究的事物按两个或两个以上相关联的特征或指标分组。2、统计图(1)基本要求:a.依据资料的性质选择适当的图形;b.要有标题,扼要说明资料的内容,必要时注明时间、地点;c.以纵轴和横轴为坐标的图形,横轴尺度自左而右,纵轴尺度自下而上,数量一律由小到大,并需等距标明。纵横坐标长度的比例一般为5:7。d.比较不同事物时,用不同的线条或颜色表示,要附图例说明。3、常用统计图(1)直条图:用相同宽度条形的长短.来表示资料数值大小比例关系,适用于按性质分组,各个独立的、无连续关系的统计图。(2)百分条图:适用于表达构成比的资料。(3)线图:用线条的上升和下降来表示某事物(或某现象)因时间或条件而变化的趋势。适用于连续性的变量资料。(4)直方图:用于表示连续变量的频数分布。常以横轴表示被观察现象,纵轴表示频数或频率,以各矩形(宽度为组距)的面积代表各组段的频数。(六)调查设计1、调查方法(1)普查(全面调查):将组成总体的所有观察单位全部加一调查。(2)抽样调查:从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征。(3)典型调查(案例调查):即在对事物作全面分析的基础上,有目的地选定典型的人、典型的单位进行调查。60 2、调查项目和调查表(1)分析项目:直接用于计算调处指标,以及分析时排除混杂因素影响所必须得分内容。(2)备查项目:便于核查、补填和更正而设置的,通常不直接用于分析。(3)调查表的格式:分为一览表和单一表。(4)随机抽样的方法:a.单纯随机抽样;b.系统抽样;c.整群抽样;d.分层抽样;根据抽样误差的大小,分层抽样<系统抽样<单纯随机抽样<整群抽样第十章线性相关与回归(LinearCorrelation&Regression)线性相关与回归第一节线性相关第二节线性回归第三节线性相关与回归的区别和联系第三节等级相关线性相关(linearcorrelation)一、线性相关的基本概念二、线性相关系数三、相关系数的显著性检验四、进行线性相关分析的注意事项一、线性相关的基本概念为直观地判断两个变量之间的关系,可在直角坐标系中把每对(Xi,Yi)值所代表的点绘出来,形成散点图。若一个变量X由小到大(或由大到小),另一变量Y亦相应地由小到大或由大到小,则两个变量的散点图呈直线趋势,我们称这种现象为共变,也就是这两个变量之间有“相关关系”。男青年身高与前臂长散点呈直线趋势,即男青年身材高,前臂亦长,说明身高与前臂长之间存在线性相关关系我们把这种关系称为直线相关。线性相关用于双变量正态资料。它的性质可由散点图直观地说明。散点图中点的分布即线性相关的性质和相关之间的密切程度,可分为以下几种情况:60 1.正相关2.负相关3.无相关线性相关系数在分析两个变量X与Y之间关系时,常常要了解X与Y之间有无相关关系,相关是否密切,是呈正相关还是负相关。相关系数就是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。皮尔森(Pearson)相关系数的计算公式为:相关系数r没有测量单位,其数值为-1≤≤+1相关系数的计算方法计算时分别可用下面公式带入相关系数r的计算公式中例10.160 从男青年总体中随机抽取11名男青年组成样本,分别测量每个男青年的身高和前臂长,身高和前臂长均以cm为单位,测量结果如下表所示,试计算身高与前臂长之间的相关系数。编号身高(cm)前臂长(cm)XYX2Y2(X)(Y)1170477990289002209217342726629929176431604470402560019364155416355240251681517347813129929220961885094003534425007178478366316842209818346841833489211691804988203240024011016543709527225184911166443174285612116合计18915008618532608122810相关系数的显著性检验与前面讲的其它统计量一样,根据样本资料计算出来的相关系数同样存在抽样误差。即假设在一个X与Y无关总体中作随机抽样,由于抽样误差的影响,所得的样本相关系数也常常不等于零。因此要判断两个变量X与Y是否真的存在相关关系,仍需根据作总体相关系数ρ是否为零的假设检验。常用的检验方法有两种:1.按自由度直接查附表11的界值表,得到P值。2.用假设检验法,计算统计量进行线性相关分析的注意事项⒈线性相关表示两个变量之间的相互关系是双向的,分析两个变量之间到底有无相关关系可首先绘制散点图,散点图呈现出直线趋势时,再作分析。⒉相关系数的计算只适用于两个变量都服从正态分布的情形,如果资料不服从正态分布,应先通过变量变换,使之正态化,再根据变换值计算相关系数。⒊依据公式计算出的相关系数仅是样本相关系数,它是总体相关系数的一个估计值,与总体相关系数之间存在着抽样误差,要判断两个事物之间有无相关及相关的密切程度,必须作假设检验。⒋相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,而两个事物之间的关系既可能是依存因果关系,也可能仅是相互伴随的数量关系。决不可因为两事物间的相关系数有统计学意义,就认为两者之间存在着因果关系,要证明两事物间确实存在因果关系,必须凭借专业知识加以阐明。60 相关是分析两个正态变量X与Y之间的互相关系。在相关分析中,分不清X与Y何者为自变量,何者为因变量。现在假设两个变量X、Y中,当一个变量X改变时,另一个变量Y也相应地改变,当这样的两个变量之间存在着直线关系时,不仅可以用相关系数r表示变量Y与X线性关系的密切程度,也可以用一个直线方程来表示Y与X的线性关系。根据大量实测数据,寻找出其规律性,寻求一个直线方程来描述两个变量间依存变化的近似的线性数量关系,即线性回归关系,这样得出的直线方程叫做线性回归方程。进行线性回归分析的注意事项⒈只有将两个内在有联系的变量放在一起进行回归分析才是有意义的。⒉作回归分析时,如果两个有内在联系的变量之间存在的是一种依存因果的关系,那么应该以“因”的变量为X,以“果”的变量为Y。如果变量之间并无因果关系,则应以易于测定、较为稳定或变异较小者为X。⒊在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量应该都服从正态分布),也可以是给定的量(I型回归模型,这时,与每个X取值相对应的变量Y必须服从正态分布),如果数据不符合要求,在进行回归分析前,必须先进行变量的变换。⒋回归方程建立后必须作假设检验,只有经假设检验拒绝了无效假设,回归方程才有意义。⒌使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围之外。第三节线性相关和回归的区别与联系⒈相关系数的计算只适用于两个变量都服从正态分布的情形,而在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,这时,与每个X取值相对应的变量Y必须服从正态分布)。⒉线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依存关系,是单向的。⒊如果对同一资料进行相关与回归分析,则得到的相关系数r与回归方程中的b正负号是相同的。⒋在相关分析中,求出r后要进行假设检验,同样,在回归分析中,对b也要进行假设检验。实际上,通过数学推导,对同一样本可以得出r与b互化的公式,同一样本的这两种假设检验也是等价的。因此,由于r的假设检验可以直接查表,较为简单,所以可以用其代替对b的假设检验。第四节等级相关如果观测值是等级资料,则可以用等级相关来表达两事物之间的关系。等级相关是分析X、Y两变量等级间是否相关的一种非参数方法。常用的等级相关方法是Spearman等级相关。与线性相关系数r一样,等级相关系数rs的数值亦在-1与+1之间,数值为正表示正相关,数值为负表示负相关。60 思考题与参考答案《数值变量资料的统计描述统计表与图》思考题1.描述单变量资料的统计描述指标分哪两类,分别包括哪些指标?2.试述平均数、标准差、变异系数的含意与用途。3.什么是医学参考值?如何制定95%的参考值范围?4.绘制统计表及统计图的原则与要求是什么?5.常见的统计图有哪几种?它们的适用条件是什么?《数值变量资料的统计推断》思考题1.标准差和标准误有何区别和联系。2.t检验和u检验的公式有哪些类型,在应用上有哪些异同?3.在统计推断过程中,如何区别单侧检验和双侧检验。4.可信区间和参考值范围有何不同?5.假设检验和总体均数区间估计有何不同?6.什么是一类错误与二类错误,有何关系?7.方差分析的基本思想是什么?8.描述t检验与F检验的适用条件。《分类变量资料的统计描述与统计推断》思考题1.常用的相对数指标有哪些?它们在计算和意义上有哪些不同?2.率的标准化的意义和基本思想是什么?3.试述率的标准误的意义和用途。4.试述检验的用途和各种检验的适用条件。5.列举R×C表检验的注意事项。6.为什么不能以构成比代替率?请联系实际加以说明。7.应用相对数时应注意哪些问题?《数值变量资料的统计描述统计表与图》思考题1、描述单变量资料的统计描述指标分哪两类,分别包括哪些指标?答:单变量资料的统计描述指标分:(1)集中趋势指标:包括算术平均数(简称均数)、几何均数、中位数与百分位数、众数、调和均数;(2)离散趋势指标:包括全距、四分位数间距、方差、标准差、变异系数。2、试述平均数、标准差、变异系数的含意与用途。答:1、平均数60 (1)含意:平均数是一类用于描述数值变量资料集中趋势(或平均水平)的指标,包括算术平均数(适用条件是资料呈正态分布或近似正态分布或对称分布)、几何平均数(适用于观察值非对称分布、其差距较大时,倍数关系或近似倍数关系)、中位数(适用于偏态分布、开口、分布不确定)、众数、调和均数。(2)用途:描述数值变量资料集中趋势,进行事物之间的分析比较。2、标准差(1)含意:指将方差开平方,取平方根的正值。反映资料的离散程度。(2)用途:①反映一组观察值的离散程度,标准差小,离散程度小,均数的代表性好;②用于计算变异系数;③计算标准误;④结合均值与正态分布的规律估计医学参考值的范围。3、变异系数(1)含意:是将标准差转化为算术均数的倍数,以百分数的形式表示。(2)用途:用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。3、什么是医学参考值?如何制定95%的参考值范围?答:医学参考值是指绝大多数正常人的各种生理、生化数据,组织或排泄物中各种成分的含量范围。制定95%的参考范围:从正常人总体中抽样;控制测量误差;判定是否需要分组确定参考范围;决定取单侧还是双侧;选定合适的百分界限;对资料的分布进行正态性检验;根据资料的分布类型选定适当的方法进行参考范围的估计。4、绘制统计表及统计图的原则与要求是什么?答:绘制统计表的原则:(1)重点突出,简单明了;(2)主谓分明,层次清楚;(3)数据准确,便于分析。基本要求:(1)标题:简明扼要说明表的中心内容,必要时注明研究事物现象发生的时间、地点等。标题一般写在表的正上方。(2)标目:横标目和纵标目。横标目列在表的左侧,表明被研究事物的主要特征;纵标目列在表的右上端,说明横标目内容的各项统计指标。标目的排列应有一定的次序。(3)线条:一般包括顶线、纵标目下线、合计上线、底线。(4)数字:表内数字一律用阿拉伯数字,同一指标的小数位数保留、单位、精度一致,上下位次对齐,表内不留空格。数据暂缺或未记录可用“…”,数据不可能得到用“—”,数据为“0”时则填0。(5)备注:一般不列入表内,必要时可用“*”,解释在表的下面。绘制统计图的原则:用几何图形的位置、大小、长短、面积等特征来表现数据信息,将数据形象化。与统计表相比,更直观。但只是粗略表达,只能做统计表的补充。基本要求:(1)标题:概括图的内容,应简明确切,一般置于图域的下方。一篇文献中有多幅统计图时,标题前应表注序号。(2)图域:长宽比例一般为7:5或5:7。(3)标目:一般在纵轴左侧和横轴下方(4)刻度:常用算术尺度和对数尺度,刻度值一般标注与纵轴外侧和横轴上侧。60 (5)图例:图例一般放在横标目下方,若空间较多可放在图域中。5、常见的统计图有哪几种?它们的适用条件是什么?答:常用统计图有:按图示形式有条图、直方图、百分条图、圆图、散点图、线图、统计地图以及在探索性分析时用的茎叶图、残差图、箱式图,判别分析的类别分布图,聚类分析的谱系图等。使用条件:(1)条图:适于彼此相互独立的现象间相同指标的比较。(2)圆图:用于表示全体各部分的构成情况,百分比的情况。(3)线图:适用于连续性变量或某一现象随另一现象变迁的情况。(4)半对数线图:用语表示事物现象发展变化的速度(相对比),常用语两个或多个事物现象在发展速度上的对比。(5)直方图:适用于某连续性资料的分布。(6)散点图:适用于双变量统计分析。(7)统计地图:用与显示不同地域事物数量的分布情况。《数值变量资料的统计推断》思考题1、标准差和标准误有何区别和联系。答:区别:①标准差是表示个体之间的变异度,其值越大,说明变异程度越大。标准差同时是表示观察值与样本均值之间的离散程度,标准差越大,说明离散程度越大,从而也说明均数反映平均水平代表性欠佳。②标准误即样本均数的标准差。表示样本均数之间的变异度以及样本均数与总体均数之间的离散度。标准误越大,均数的抽样误差就越大,说明样本均数与总体均数的差异越大。联系:即当样本例数n一定时,标准误与标准差呈正比;当标准差一定时,标准误与样本含量n的平方根成反比。2、t检验和u检验的公式有哪些类型,在应用上有哪些异同?答:t检验和u检验的公式类型如下:⑴样本均数与总体均数的比较:已知总体均数一般为理论值、标准值或经大量观察所得的稳定值。样本与总体均数比较的目的是推断样本所代表的未知的总体均数µ与µ0是否相同。用统计量t的计算公式:⑵配对资料的比较:用检验统计量t值公式:⑶两个样本均数的比较:①60 两个大样本均数的比较:当两个样本量较大(均>50)时,自由度足够大,可用u检验。公式为:②两个小样本均数的比较:推断μ1是否等于μ2,作与比较的t检验,公式为:在应用上的异同:t检验和μ检验通常用于两均数的比较。μ检验用于已知总体标准差情况下的样本均数与总体均数比较与大样本资料的两均数比较,要求资料服从对称或正态分布;t检验常用于样本例数n较小、总体标准差未知时样本与总体均数的比较,配对设计资料的比较与两个样本均数的比较。两样本均数比较时还要求所对应总体方差齐同,资料服从正态分布。3、在统计推断过程中,如何区别单侧检验和双侧检验。答:应事先根据专业知识和问题的要求,在实验设计时做出规定,而不能在计算出检验统计量后才确定。对同一份资料,单侧检验比双侧检验更易得到差别有显著性的结论。因此,在报告讨论时,应列出检验方法、检验统计量的值、检验水准和P值的确切范围,还要著名采用的是单侧检验还是双侧检验,然后结合专业做出结论。4、可信区间和参考值范围有何不同?答:可信区间反映区间包含总体均数的概率大小,即1-α大小,越趋近1越好;反映区间的长度,长度越小越好,即1-α一定,n越大精度越高。参考值范围是正常人指标测定值的波动范围,参考值范围在诊断方面可用于划分正常或异常。5、假设检验和总体均数区间估计有何不同?答:总体均数区间估计是从总体中做随机抽样,每个样本可以算得一个可信区间,如95%可信区间,意味着做100个可信区间,平均有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后用适当的方法根据样本提供的信息,推断假设应当拒绝或不拒绝,使研究者了解在假设的条件下,差异由抽样误差引起的可能性大小。6、什么是一类错误与而二类错误,有何关系?答:一类错误是统计学中将拒绝了实际正确的无效假设Ho,即“弃真”,放弃本来成立的Ho所犯的错误,概率α表示,常取α=0.05。60 二类错误是将接受了实际上错误的无效假设Ho,概率用β表示,在统计学中将1-β称为检验效能,即“取伪”接受本来不成立的Ho所犯的错。关系:一类误差认为规定,二类误差大小随一类误差增大而减小;增大样本量,可以同时减小两类误差。客观实际拒绝H0不拒绝H0H0成立第一类错误(α)判断正确(1-α)H0不成立判断正确(1-β)第一类错误(β)7、方差分析的基本思想是什么?答:将总变异分解成两个或多个变异,其中有一个是由随机误差引起的,而其他变异是由各自因素引起的。然后,比较各因素变异与误差引起的变异,评价由某种因素引起的变异是否具有统计学意义。总变异=组内变异+组间变异总变异:随机测量误差+个体变异+处理因素作用组内变异:随机测量误差+个体之间变异组间变异:随机测量误差+个体之间变异+处理因素作用F=组间变异均方/组内变异均方8、描述t检验与F检验的使用条件。答:t检验的使用条件:常用于样本例数n较小、总体标准差未知是样本与总体的比较,配对设计资料的比较和两个样本均数的比较。要求所对应的总体方差齐同,资料服从正态分布。F检验的使用条件:各样本来自正态分布的总体,且为相互独立的随机样本,各个样本所来自的总体相等。《分类变量资料的统计描述与统计推断》1、常用的相对数指标有哪些?它们的意义和计算上有和不同?(1)比例(构成比)意义:用以说明事物内部各组成部分所占的比重或分布情况。计算:构成比=事物内部某一组成部分的观察单位数/事物各组成部分观察单位总数(或×100﹪)(2)率意义:用以说明某现象发生的频率或强度。计算:一定时间内某现象发生率=一定时间内某现象实际发生的观察单位数/该时间段开始时的观察单位总数(3)比意义:两个有联系的指标之比。计算:比=甲指标计数/乙指标计数(或×100﹪)60 3、试述率的标准误的意义和用途。意义:由于抽样而引起的样本率与总体率之间或样本率之间的差异称为率的抽样误差,其大小用率的标准误来表示。用途:率的标准误反映抽样误差的大小,标准误越小,说明率的抽样误差越小,用样本推论总体时,可信程度越高。4、试述c2检验的用途和c2检验各种适用条件。c2检验的应用:1)两个或两个以上样本率之间差异有无显著性;2)两个或两个以上样本构成比之间差异有无显著性;3)两分类变量间有无相关关系;4)频数分布的拟合优度检验;5)实际频数与理论频数的吻合程度检验。c2检验的应用条件:1)n>=40,T>=5卡方检验2)n>=40,1>>。5、频数分布可分为和。6、和可全面描述正态分布的频数特征。7、若频数分布明显呈偏态分布,各观察值之间呈倍数关系,宜用反映其平均增减倍数。8、比较度量衡单位不同的各组资料的变异度,宜用指标。9、对于两组正态分布资料,且均数相近,度量单位相同,大,的代表性较差。10、正态分布的特征有:;;。11、正常值指。制定正常值范围的方法根据指标的而判断,可有法和。12、标准误是的标准差,与标准差的关系可用公式表示。13、对于相同的a值,越大,ta,u值,当u=¥,ta,u=。14、统计推断包括两个重要方面:和。15、假设检验的目的是推断。16、假设检验结果具有显著性意义,是根据而判定的,结论具有性。17、两样本均数比较的t检验,要求(1);(2)。18、两个或两个以上样本均数的比较,可用。应用时要求:(1)(2)(3)。19、假设检验时根据检验结果作判断,可能发生两种错误,第一类错误的概率为,第二类错误的概率为,同时减少两类错误的唯一方法是。20、构成比有两个特点:(1),(2)。21、率的标准化的目的是,常用的计算方法有和。22、率的标准误Sp=,是描述的统计指标。23、c2检验的基本思想是比较和的吻合程度,其基本公式是。24、c2的大小由和两方面因素决定。25、四格表c2检验的基本数据是两对和两对。26、四格表c2检验的基本条件是,当时,需用校正公式。27、配对计数资料c2检验的无效假设是,c2检验的公式是。60 28、统计表由、、和构成。编制统计表的总的原则是、、、。29、绘制统计表要求线条不宜过多,除有线和线以及线以外,其余如竖线、斜线均不宜有。30、统计图除圆图外,长宽比例一般以为宜,标题的位置是。31、频数分布的两个重要特征是和。32.总体标准差的含义是。33.1-α是指。34.三个样本率比较得到X2>X20.05,v,可认为。35.计数资料统计描述的主要指标有等。36.行X列表X2检验应注意,否则,则应增大样本量,。37.两率比较U检验应用条件是。38.率的标准误可应用于。39.几何均数是将原始变量值作变换,可使其成为分布,再按类似于算术均数计算公式作计算。40.今已知甲、乙两地肝癌死亡率相等,但甲地老年人比重较大,若要比较两地肝癌死亡率情况,需求。41.方差分析的基本思想是。42.方差分析的应用条件是。43.调查设计一般包括设计和设计,二者是紧密结合的。44.调查可分为和,后者又以和最为常用。45.调查项目包括和,前者直接用于,后者是为了。46.调查项目的答案有两种设计:和。47.资料的设计分组有两种方法,它们是和。48.实验设计的三个基本要素是、、。49.单纯随机抽样,估计总体均数所需样本数n时,需要实现确定、、。50.调查中系统误差的来源有、、、。51.调查研究又称,其特点、。52.概率是描述随机事件发生可能性的大小,用表示。随机事件发生概率在和之间。53.某市159名15岁女生体重均数`X=46.8Kg,标准差S=5.5Kg,估计本市15岁女生体重正常值应在。54.标准差的大小受的影响,标准误的大小受的影响。(三)是非题:卫生统计学研究的主要内容是社区医疗。60 随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不太可能发生。变异系数越大表示标准差越大。正态分布的特点有算术均数等于中位数。在假设检验中,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,则增大了第二类错误。率是说明某现象发生强度的指标。配对设计四格表资料比较两个率有无差别的无效假设是b=c.四格表资料的自由度为1。随着样本含量的逐渐加大,标准误与标准差则逐渐变小。10.只研究某一种药物预防、治疗某疾病时,可以不设置对照组。如果有少数几个数据比大部分数据大几百倍,这组资料就不宜计算算术均数。标准误越大,说明样本均数的抽样误差越大。两组计量资料的假设检验是否采用t检验,主要取决于样本含量。两个大样本(一般n>30例)均数的比较可用样本均数与总体均数差异的显著性检验。构成比可说明某种事物发生的可能性大小。x2值反映了实际数与理论数之吻合程度,如果假设成立,则A与T之差一般不会很大,因而P值也不会很大。两样本比较得P<0.05,此时一定可认为两总体率不同。2行3列X2检验,理论数不可小于5。行×列表x2检验,若1/5格子以上1c20.01,(3),可认为A.各总体率不等或不全相等B.各总体率均不相等C.各总体率均相等D.各样本率均不相等E.各样本率不等或不全相等27、用大样本估计总体率的95%可信区间的计算公式为A.p±1.96spB.p±1.96S`XC.p±1.96S`XD.p±1.96spE.p±t0.05,usp28、计算某年某病的发病率的分子是A.该年年初有该病人数B.该年年中有该病人数C.该年年末有该病人数D.该年平均患该病人数E.以上都不是29、计算某年总死亡率的分母是A.年初人口数B.年中人口数C.年末人口数D.年任意时刻人口数E.上年末人口数30、一组1000名女性乳腺癌患者,其中50例为孕妇,据此可推断A.孕妇易患乳腺癌B.孕妇不易患乳腺癌C.妊娠可诱发患乳腺癌D.乳腺癌与妊娠无关E.该组乳腺癌患者中5.0%是孕妇31、关于显著性检验,下列叙述哪项不正确A.资料须符合随机抽样的原则B.资料须具有可比性C.t检验条件必须两样本的方差不能相差太大D.相差有显著性说明比较的两样本来自不同总体E.相差有显著性说明比较的两总体差别较大32、以下哪种调查属于可作统计推断的范围A.普查B.抽样调查C.典型调查D.普查与抽样调查E.非全面调查33、比较某地区某年3种疾病的发病率,可绘制A.条图B.百分条图C.线图D.半对数线图E.直方图34、不同性质的统计资料,常用不同的统计图加以表达,一般来讲A.连续性资料宜用直条图B.连续性资料宜用园图或构成图C.按性质分组的资料宜用线图D.按质分组的资料宜用直方图或多边图E.以上都不对35、统计分析表有简单表和复合表两种,复合表是指60 A.有主词和宾词B.主词分成2个或2个以上标志C.宾词分成2个或2个以上标志D.包含2张简单表E.包含2张或2张以上简单表36、一个调查设计的指标是指A.调查表的调查项目B.调查表的备考项目C.调查表的调查项目和备考项目D.预期分析指标E.以上都不是37、已知某山区、丘陵、湖区婴幼儿体格发育有较大的差异,现需制定该省婴幼儿体格发育有关指标的正常值范围,调查设计最好采用A.单纯随机抽样B.分层随机抽样C.整群抽样D.机械抽样E.以上都不是38、不可计算中位数作为代表值的是A.正偏态分布B.负偏态分布C.分布类型未知资料D.一切非连续性资料E.变量值一端或两端无确定值39-40共用选择A.普查B.抽样调查C.典型调查D.病例对照研究E.定群研究39、了解某居民肝癌发病的真实水平,可采用40、估计某地肝癌的死亡率可采用(五)简答题1、均数、中位数和几何均数的适用范围有何异同?2、列出离散程度的指标,说出它们的应用条件。3、正态分布、标准正态分布与对数正态分布在概念和应用上有何异同?4、医学参考值范围的涵义是什么?确定的原则和方法是什么?5、说出标准差和标准误的联系和区别。6、简述t分布与u分布的联系与区别。8、可信区间和正常值范围有何不同。9、简述第一类错误与第二类错误的区别与联系。10、说出t检验、u检验的应用条件。11、列出常用相对数,并解释其作用。12、简述应用相对数应注意的问题。13、四格表资料与配对计数资料的c2检验有何不同?14、行´列表资料c2检验应注意什么?15、四格表资料的U检验和c2检验的应用条件有何异同?16、列出常用统计图,说出它们的应用条件。17、简述制作统计表和统计图的基本要求。18、说出两种变量类型及其含义。试举例说明。19、实验设计的原则有哪些?60 20、简述方差分析的基本思想。(六)计算分析题1、为了解大学生每月伙食费的支出情况,在北京某高校随机抽取了300名学生进行调查,得到样本数据如下:按月伙食费支出额分组(元)人数250以下10300~15350~20400~110450~90500~25550~20600以上10合计300计算大学生每月伙食费的算术平均数、中位数;计算大学生每月伙食费的标准差;说明大学生每月伙食费分布的特点。2、某公司职工收入情况如下:按收入额分组(元)职工数4000以下24000~75000~96000~77000~80005合计30计算该公司的月收入的算术平均数、中位数;计算该公司的月收入的标准差;说明该公司职工月收入分布的特点。3、某高校过去多次英语考试的成绩表明,男女和学生的平均成绩是相同的,在最近大二进行的一次英语考试中,随机抽取100名学生,其中女生为40人。女生平均成绩为78分,成绩的标准差为11分;男生平均成绩为76分,成绩的标准差为14分。请以95%的置信系数对男生与女生的平均成绩分别进行区间估计,并比较男、女生之间成绩有无差异(要求写出相关步骤及可能的结论,可以不计算结果)。4、某糖厂用自动包装机装绵白糖,标准重量500克60 ,假设白糖每包重量服从正态分布。某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。根据样本数据判断该日自动包装机是否正常?(显著性水平5%)。5、某公司向航天部门推销一种新电池,供通讯卫星在空中使用。目前所使用的电池的平均寿命为550小时,新电池的寿命只有超过此才可以使用。对新电池抽样100只,测得其平均寿命为565小时,标准差为200小时。试以5%的显著性水平进行假设检验,决定是否订货购买新电池。6、有一种电子元件,要求其使用寿命不得低于1000小时。已知这种元件的使用寿命服从标准差为100小时的正态分布。现从一批元件中随机抽查了25件,测得平均使用寿命为972小时。(1)在0.05的显著性水平下,检验这批电子元件是否合格?(2)假如上述样本平均寿命是对50件样品检查的结果,在其他条件不变的情况下,判断这批电子元件是否合格。7、为了确保出口产品质量,某进出口公司对一批出口挂钩进行了抽样调查。按合同规格这批出口挂钩平均最大承受拉力应大于10000公斤,已知标准差为2000公斤。出口一批不合格的产品会造成较大的损失。(1)若n=400,α=0.05,写出接受域和拒绝域;(2)若x=10310公斤,是否认为这批是合格的?8、近几年某地区大学生英语4级考试成绩的均值为73分,方差为22.05。2006年随机抽取了200名学生组成一个样本,样本均值为71.15分,当显著性水平为5%时,(1)2006年学生考试成绩与往年是否处于同一水平?(2)2006年学生考试成绩是否比往年有显著下降?所得结论与上述结论有无不同?这说明什么问题?9、龙化公司是专门从事防腐工程施工、防腐材料研究、开发、制造的专业化工工程公司。公司承担了西部原油成品油管道腐蚀管的制造工程。原生产线生产的防腐管的防腐层厚度在2.5mm之内。从国外引进一条专用生产线。技术人员对该生产线进行了现场调试。以检验防腐层的厚度是否能够超过原生产线生产标准。测试结果取得如下30个数据:2.652.862.572.682.762.782.862.682.762.692.782.652.742.862.362.632.622.782.672.762.72.772.712.742.562.762.682.592.732.12在5%的显著水平上能否得出引进生产线所生产的防腐管的防腐层厚度超过2.5mm的结论?10、对甲、乙两种品牌的手机充电电池充电后使用时间进行调查,各抽取10块电池得到样本数据如下(单位:小时):5961634955506358575439434140504552484638若根据以上信息判断甲品牌电池比乙品牌电池的使用时间长,这种判断的P值是多少?60 11、泰民是一家专门生产杀灭蟑螂药的高科技公司,其蟑螂杀灭效果在90%左右。泰民系列产品中有一种杀蟑粉剂,对蟑螂起到触杀的作用,是泰民组合杀虫防制方案的关键一环。因此对该产品质量的检验就成为生产工序的关键环节。最近销售部门反馈:有的老顾客反映药品重量好像比标准重量160克/瓶轻了。质检部门随即对近期杀蟑粉剂的生产情况进行复检。现调出对上月10日、20日、30日产品系统抽样得到的3箱共60瓶粉剂的检测报告,数据如下:161160162159158160159159159161160161157158160162160158160160159158161158162161160159158157159159159158159157161158161157160159162157159158160163160159161161162161158158160160157161在5%的显著水平上检验样本数据是否支持顾客的怀疑意见?12、某医药公司宣称其生产的一种新的降压药功效显著,随机抽取了15位高血压患者,并对他们服用该种新药前后的血压进行了测试,得到下列数据:服药前血压12013616098115110180190138128146157123119187服药后血压11812214399105180175205112136149156104101187假定服用该种降压药前后的血压服从正态分布,能否相信医药公司的广告是真实的(显著水平α=0.05)?13、某企业机构对A、B两个地区居民拥有电脑的情况进行了抽样调查。在A区调查的样本量为80家,其中有电脑的家庭占56家;在B区调查了100家,其中有电脑的家庭占51家。根据这些信息,有人认为A地区居民拥有电脑的比例高于B地区的。这个结论正确吗?14、一份研究报告认为女性与男性相比,更喜爱看春节晚会。在喜爱看春晚的人中,男性比例不足4成。电视台为了检验这一结论,从某市喜爱看春晚的人群中随机抽取400人进行了调查,其调查结果是:男性146人,女性254人。问当α=0.05时,调查结果是否支持该研究报告的观点?15、某企业生产工人分为早班和晚班两个班次。上月质量检验的结果是,从早班抽查样品100只,91只合格;从晚班抽查样品150只,128只合格。可否认为早班和晚班的生产质量有显著差异(显著性水平为5%)?16、设在某国际市场上购买中国生产的景泰蓝金笔的顾客占全部买金笔顾客总数的35%。现在又推销一种新型的景泰蓝金笔,随机抽取800名购买各种金笔的顾客进行调查,其中有320人购买了新式景泰蓝金笔。试在显著性水平为0.10的条件下,检验此种新型金笔是否较原产品有更高的竞争能力。60 17、某公司的营销部门的经理希望在广告费及销售额之间建立一个预测模型,从而可以国际公司的广告费的投入对其销售额进行预测。于是他收集了20家公司的年广告费及其销售额资料(单位:万元),见下表:广告费销售额广告费销售额广告费销售额广告费销售额12036330.17115012008.980068.7207021.557060.8150091000100.115901.444540110050150076.613235.543333.380010.98908.78111.74332090011.41000要求:画散点图,以确定广告费及其销售额之间关系的形态;用最小二乘法估计模型的参数;解释回归系数的经济意义;对回归系数进行检验;预测当某公司的年广告费为48万元时,其销售收入。18、对某市发动机制造行业进行了抽样调查,在抽样的10个厂家中,其产量和总成本的对应关系如下表所列:厂家产量(台)总成本(万元)1141429832322417165101665672220813149162010610X轴标示产量,Y轴标示总成本,绘制散点图;计算总成本与产量的相关系数;在显著性水平α=0.05下,对相关系数进行显著性检验;计算总成本与产量的回归方程,并解释回归系数b的具体意义。19、一种新产品推向市场的一定时期(比如说3个月或6个月)以后,顾客听说过这种产品的比率称为知悉率。提高新产品知悉率的主要手段是广告。一项研究对8种新产品的广告开支和知悉率做了调查,数据如下:消费者知悉率(%)广告支出额(万元)522021181010908060 6460644556374019X轴标示广告支出额,Y轴标示消费者知悉率,绘制散点图;计算广告支出额与消费者知悉率的相关系数;在显著性水平α=0.05下,对回归系数进行显著性检验;拟合消费者知悉率与广告支出额的回归方程,并解释回归系数b的具体意义;若广告支出额增加1万元,消费者知悉率可望增加几个百分点?20、从某大学全体教师中随机抽取16名教师,了解到他们的平均月收入为2000元,标准差为400元。假定该大学教师的月收入服从正态分布,试以95%的置信水平估计该大学教师的平均月收入。21、某公司负责人发现开出去的发票有大量笔误,并且断定错误的发票占20%以上。随机抽取400张发票,发现错误的发票有100张,试检验负责人判断的正确性(α=0.05)。22、在入户推销上有5种方法,某大公司希望比较这5种方法有无显著的效果差异,为此设计了一项试验,从应聘的且无推销经验的人员中随机挑选一部分人,将他们随机地分成5组,每一组用一种推销方法进行培训,培训相同时间后观察他们在一个月内的推销额,数据如下:组别推销额120.016.817.921.223.926.822.4224.921.322.630.229.922.520.7316.020.117.320.922.026.820.8417.518.220.217.719.118.416.5525.226.226.929.330.429.728.2假定每一组推销额都服从正态分布,且方差相同,试检验这五种方法的推销额有无差异?(选做)23、某市场调研公司要确定消费者对5种牌号矿泉水喜好是否相同。他们抽取100个消费者为简单随机样本进行调查,并认为消费者对5种牌号矿泉水的喜好没有区别。试检验调研人员的判断。(选做)矿泉水牌号ABCDE喜欢的人数271622181760 某市中心血站采集血清标本673例,检出乙肝核心抗体55例,其血型分布如下表。问不同血型的乙肝核心杭体阳性率有否差别?乙肝核心抗体的阳性率与血型关系血型检测数乙肝核心抗体阳性数阳性率(%)A221135.88B169169.47O235239.79AB4836.25合计673558.1725、某地测得9名健康人血清白蛋白分别为46、47、51、45、44、39、42、48、43(g/L)。求:①平均白蛋白;②标准差;③变率系数;④标准误;⑤该地健康人血清白蛋白的95%可信区间。26、某省医院肛肠科测定正常成年人外科学肛管(直肠末段提肛肌至肛缘)长度见下表,其分布呈正态。检验男、女的外科学平均肛管长度有否差别?试制订正常值。成年男、女的外科学肛管长度(cm)性别例数平均数标准差男8893.940.58女3114.300.5326某医师抽样调查了某山区部分健康成年人血红蛋白的含量,结果见表:某山区部分健康成年人血红蛋白的含量性别例数均数标准差标准值男40013.450.7114.02女22511.761.0212.47就上表资料:(1)有人认为女性血红蛋白的抽样误差大于男性?对否?为什么?(2)有人对该山区男、女性血红蛋白的平均值含量与标准值比较得:男:t=16.1,p<0.01,女:t=10.4p>0.01,请作分析。27、某营养学博士为研究牛奶有否增加身高作用,把16名儿童,配成8对(每对儿童年龄、性另、身高、体重及父母身高等情况,基本均衡)每对儿童的一个给予正常饮食,另一个正常饮食外每天增加500ml牛奶,隔6个月后测得其身高增加情况见下表。问牛奶有否增加身高的作用?增喝牛奶下正常进食儿童身高(cm)增加情况比较儿童对号正常进食儿童身高增加(cm)增喝牛奶儿童身高增加(cm)14.56.524.66.334.86.644.45.960 54.77.065.16.774.06.584.64.328、用两种不同剂量的电离辐射照射小白鼠,第一种剂量照射25只,在照射后14天内死亡14只;第二种剂量照射18只,同时期内死亡5只。(1)绘制分析模式表。(2)判断这两种剂量对小白鼠的致死作用是否相同。29、为了了解某乡钩虫病感染情况,随机抽查南500人,感染100人,女200人,感染80人,若全乡人口为10人,000,问:该乡钩虫病感染率是否有性别差异?若对该乡居民做驱钩虫治疗,至少需要按多少人准备药物?30.某市解放后白喉预防接种对于人群锡克氏测验反应情况及白喉患病和死亡影响观察整理某市传染病院(1950~1954年)白喉病例记录,用最后诊断为白喉之确诊病例6480例(此6480例占1951~1954年报告白喉总病例数的42.6%,及其中死亡22例)按病例记录上白喉预防接种情况的记载分为未接种,非全程接种,全程接种三组,如列于表5和表6.    表51950--1954年某市白喉住院病例按预防接种情况比较病例未受接种非全程接种全程接种年份总计病例数%病例数%病例数%19501248122097.8221.760.519511581142990.4875.5654.119521980173087.41075.41437.219531346115386.013217.8100.8195428923179.95017.382.8表61950--1954年某市白喉住院病例死亡人数按预防接种情况比较年份死亡  未受接种  非全程接种全程接种总数死亡人数 %死亡人数%死亡人数%1950656396.623.1001951504284.048.048.01952353291.412.925.760 1953644052.52335.911.019541010100.00000合计2248783.53013.473.1结论:“从表5及表6可以看出白喉预防接种不但可以减少发病,也可以减少死亡”.问题:1)对该文作者提出上述的结论你有和意见?2)你认为以上资料应如何整理分析,才能得出正确的结果?31、某地某年各年龄组身高资料如下:年龄组人数均数(cm)标准差(cm)1-2月10056.32.15-6月12066.52.23-3.5岁30096.13.15-5.5岁400107.83.3问:(1)上述资料是否表明6岁以下男童身高的均数和变异度随年龄增长而增加?(2)若以上各年龄组的身高均服从正态分布,估计上述300名3-3.5岁男童身高在95.0-100.0cm范围内有多少?并确定3-3.5岁男童身高的正常值。(3)估计3-3.5岁男童身高的总体均数可信区间。(4)若抽样调查100名某山区5-6月男童身高,得均数60.2cm,标准差3.0cm,山区5-6月男童身高是否与该地5-6月男童身高均数不同?(5)试将该组资料的均数绘制成相应的统计图。32.某地某年肿瘤普查资料整理如下表某地某年肿瘤普查资料年龄人口数肿瘤患者数构成比(%)患病率(1/万)0~63300019()()30~570000171()()40~374000486()()50~143000574()()60~30250242()()合计17502501492()()据上述资料(1)填充。60 (2)分析讨论哪个年龄组最易患肿瘤?哪个年龄组病人最多?33、为比较槟榔煎剂和阿的平驱绦虫的效果,对45名绦虫患者进行治疗,其结果如下,问两药疗效是否相同。两药疗效比较药物治疗人数有效人数槟榔煎剂2722阿的平1812合计453434、用两种不同剂量的电离辐射照射小白鼠,第一种剂量照射25只,在照射后14天内死亡14只;第二种剂量照射18只,同时期内死亡5只。(1)绘制分析模式表。(2)判断这两种剂量对小白鼠的致死作用是否相同。参考答案(二)填空1、设计、收集、整理、分析、设计2、统计描述、统计推断3、系统误差、随机测量误差、抽样误差、抽样误差4、分层、系统、单纯、整群5、正态、偏态6、均数、标准差7、几何均数8、变异系数9、标准差、均数10、以均数为中心对称、均数处最高、N(m,s)11、绝大多数正常人生理生化值、分布类型、正态分布法、百分位数法12、样本均数S`x=S/√`n13、自由度、越小、ta,g=1.9614、参数估计、假设检验15、样本统计量数与总体参数的差异由抽样误差引起的概率大小16、P、相对性17、正态、方差齐18、独立样本、正态、方差齐19、a、b、增大样本量20、某一部分的增大必然引起其他部分的减少、各部分之和等于121、消除内部构成不同对总率的影响、直接法、间接法22、Sp=√p(1-p)/n,样本率的离散度23、实际频数,理论频数,X2=S(A-T)2/T24、A-T、自由度25、实测阳性数、实测阴性数26、n>40和T³1、5>T³160 27、b=c、X2=S(b-c)2/(b+C)28、标题、标目、线条、数字。29、顶线、底线,纵标目下线30、5:7或7:5、底部中间31、集中趋势、离散趋势32.所有个体值对总体均数的离散程度33.可信度34.三个总体率不同或不全相同35.相对数36.不能有1/5以上的格子理论数T<5或有一格理论数T<1,或合理合并37.n足够大和p不太大或不太小38.总体率估计和假设检验39.对数、对数正态40.标准化率(三)是非题:1、错2、对3、错4、对5、错6、对7、对8、对9、错10、错(四)单选题1、B2、E3、D4、B5、C6、D7、C8、A9、C10、C11、D12、C13、D14、C15、D16、B17、D18、D19、E20、C21、D22、E23、E24、D25、C26、A27、D28、E29、B30、E31、E32、B33、A34、E35、B36、D37、B38、D39、A40、B希腊字母读音表60 序号大写小写英文注音国际音标注音中文注音1Ααalphaa:lf阿尔法2Ββbetabet贝塔3Γγgammaga:m伽马4Δδdeltadelt德尔塔5Εεepsilonep`silon伊普西龙6Ζζzetazat截塔7Ηηetaeit艾塔8Θθthetθit西塔9Ιιiotaiot约塔10Κκkappakap卡帕11Λλlambdalambd兰布达12Μμmumju缪13Ννnunju纽14Ξξxiksi克西15Οοomicronomik`ron奥密克戎16Ππpipai派17Ρρrhorou肉18Σσsigma`sigma西格马19Ττtautau套20Υυupsilonjup`silon宇普西龙21Φφphifai佛爱22Χχchiphai西23Ψψpsipsai普西24Ωωomegao`miga欧米伽60'