統(tǒng)計(jì)學(xué)的幾個基本概念
1.總體:根據(jù)研究目的確定的同質(zhì)的研究對象,其某項(xiàng)變量值的全體。
2.樣本:從研究總體中隨機(jī)抽取的一部分有代表性的個體(其某項(xiàng)變量值的全體)。
3.參數(shù):是由總體中個體值計(jì)算出來的用于描述總體特征的指標(biāo)。
4.統(tǒng)計(jì)量:是由樣本中個體值計(jì)算出來的用于描述樣本特征的指標(biāo)。
5.抽樣誤差:由個體變異產(chǎn)生,由抽樣引起的總體指標(biāo)(參數(shù))與樣本指標(biāo)(統(tǒng)計(jì)量)以及樣本指標(biāo)之間的差異。
6.變量:根據(jù)研究目的,對研究對象的某個或某些特征(研究指標(biāo)或項(xiàng)目)實(shí)施觀測,這些特征(指標(biāo)或項(xiàng)目)稱為變量。
7.概率:描述隨機(jī)事件發(fā)生可能性大小的數(shù)值(P),取值范圍0≤P≤1,P=0為不可能事件,P=1為必然事件,P≤0.05為小概率事件。
8.統(tǒng)計(jì)學(xué)中的資料可以分為:
(1)定量資料:也叫計(jì)量資料,如身高(cm)、體重(kg)等,有單位。
(2)定性資料:也叫分類資料,包括:①無序分類資料:a.二項(xiàng)分類資料(如性別:只有男、女兩類,互不相容);b.多項(xiàng)分類資料(如ABO血型:A、B、O、AB四種互不相容)。
、谟行蚍诸愘Y料:也叫等級資料,各類之間有程度的差別,“半定量”,如血清學(xué)檢查結(jié)果:——、±、+、++四級。
【進(jìn)階攻略】掌握這幾個統(tǒng)計(jì)學(xué)的概念,能夠判斷所給資料所屬類型。
【易錯易混辨析】統(tǒng)計(jì)工作中統(tǒng)計(jì)設(shè)計(jì)是最關(guān)鍵的一步,統(tǒng)計(jì)推斷中包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩部分。
練習(xí)題:
一、A1型選擇題
1.下列關(guān)于概率的說法,錯誤的是
A.通常用P表示
B.用于描述隨機(jī)事件發(fā)生的可能性大小
C.某事件發(fā)生的頻率即概率
D.在實(shí)際工作中,概率常難以直接獲得
E.某事件發(fā)生的概率P≤0.05時(shí),稱為小概率事件
2.用于推斷總體特征的樣本應(yīng)該是
A.從總體中隨機(jī)抽取的一部分
B.從總體中隨便抽取的一部分
C.總體中有價(jià)值的一部分
D.總體中便于測量的一部分
E.研究者認(rèn)為能代表總體特征的部分
3.計(jì)量資料的正確定義是指
A.每個觀察單位的觀測值都是絕對數(shù)的資料
B.每個觀察單位的觀測值都是相對數(shù)的資料
C.每個觀察單位的觀測值都是平均數(shù)的資料
D.每個觀察單位都有1個數(shù)值,無論該觀測值是絕對數(shù)、相對數(shù)還是平均數(shù)的資料
E.將每個觀察單位按某種屬性或類別分組,然后清點(diǎn)各組的觀測單位數(shù)得到的資料
【參考答案及解析】
1.【答案及解析】C。在現(xiàn)實(shí)中,隨機(jī)事件發(fā)生的概率往往是未知的,因此常用樣本中事件的實(shí)際發(fā)生率來估計(jì)概率,這種實(shí)際發(fā)生率稱為頻率。由于抽樣誤差的存在,頻率只是概率的估計(jì)值。當(dāng)觀測單位較少時(shí),用頻率估計(jì)概率是不可靠的。故選項(xiàng)C的說法錯誤。
2.【答案及解析】A。從總體中隨機(jī)抽取部分觀察單位作為樣本去推斷總體信息,這樣的樣本對總體才具有代表性。
3.【答案及解析】D。計(jì)量資料又稱數(shù)值變量,其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。
頻數(shù)與頻數(shù)分布
1.頻數(shù)表和頻數(shù)分布圖的主要用途
(1)揭示頻數(shù)分布的特征:從頻數(shù)表便于觀察離群值和異常值,還可以看出頻數(shù)分布的兩個重要特征:集中趨勢和離散趨勢。
(2)揭示頻數(shù)分布的類型,即對稱分布和偏態(tài)分布。
(3)便于發(fā)現(xiàn)極大或極小的可疑值。
2.偏態(tài)分布,又稱不對稱型分布,指頻數(shù)分布不對稱,集中位置偏向一側(cè)。若集中位置偏向數(shù)值較小的一側(cè),稱為正偏態(tài);若集中位置偏向數(shù)值較大的一側(cè),稱為負(fù)偏態(tài)。
【進(jìn)階攻略】全距就是極差,是全部數(shù)據(jù)中最大值與最小值之差。
練習(xí)題:
一、A1型選擇題
1.頻數(shù)表通常不用于
A.描述資料的分布類型
B.反映資料的集中趨勢
C.反映資料的離散趨勢
D.便于發(fā)現(xiàn)異常值
E.總體均數(shù)的假設(shè)檢驗(yàn)
2.頻數(shù)分布的類型有
A.對稱分布和偏峰分布
B.對稱分布和正態(tài)分布
C.正態(tài)分布和正偏峰分布
D.正態(tài)分布和負(fù)偏峰分布
E.正偏峰分布和負(fù)偏峰分布
3.頻數(shù)分布集中位置偏向數(shù)值較小的一側(cè)稱為
A.偏態(tài)分布
B.不對稱型分布
C.對稱分布
D.正偏態(tài)分布
E.負(fù)偏態(tài)分布
【參考答案及解析】
1.【答案及解析】E。頻數(shù)表和頻數(shù)分布圖的主要用途是:①揭示頻數(shù)分布的特征;②揭示頻數(shù)分布的類型;③便于發(fā)現(xiàn)極大或極小的可疑值。
2.【答案及解析】A。對稱分布是指頻數(shù)大部分集中在中間位置,左右兩側(cè)頻數(shù)較少,基本對稱,正態(tài)分布屬于此類型;偏峰分布包括正偏峰分布和負(fù)偏峰分布。
3.【答案及解析】D。偏態(tài)分布,指頻數(shù)分布不對稱,集中位置偏向一側(cè)。若集中位置偏向數(shù)值較小的一側(cè),稱為正偏態(tài);若集中位置偏向數(shù)值較大的一側(cè),稱為負(fù)偏態(tài)。
集中趨勢指標(biāo)
描述數(shù)值變量資料的集中趨勢指標(biāo)是平均數(shù)。統(tǒng)計(jì)中常用的平均數(shù)包括:算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)。
1.算術(shù)平均數(shù)簡稱均數(shù),適用條件:對稱分布,特別適用于正態(tài)或近似正態(tài)分布資料。
2.幾何均數(shù)(G)適用條件:觀察值呈倍數(shù)關(guān)系或?qū)?shù)正態(tài)分布,多用于描述抗體的平均滴度等。
3.中位數(shù)(M):是一組觀察值按由小到大的順序排列后,位于中間位置上的那個數(shù)值。適用條件:①變量值中出現(xiàn)個別特小或特大的數(shù)值;②資料的分布呈明顯的偏態(tài);③變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;④資料的分布不清。
【進(jìn)階攻略】對于正態(tài)分布資料,中位數(shù)等于均數(shù);對于對數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù);對于正偏態(tài)分布資料,中位數(shù)小于均數(shù);對于負(fù)偏態(tài)分布資料,中位數(shù)大于均數(shù)。
【易錯易混辨析】中位數(shù)計(jì)算方法,當(dāng)n為奇數(shù)時(shí),M=X(n+1)/2,當(dāng)n為偶數(shù)時(shí),M=(Xn/2+Xn/2+1)/2。要特別注意的是,必須先將數(shù)據(jù)進(jìn)行從小到大排序后再進(jìn)行計(jì)算。
【練習(xí)題】
一、A1型選擇題
1.一組觀察值如果每個值都同時(shí)增加或減少一個不為0的常數(shù),則
A.均數(shù)改變,幾何均數(shù)不變
B.均數(shù)改變,中位數(shù)不變
C.均數(shù),幾何均數(shù)和中位數(shù)都改變
D.均數(shù)不變,幾何均數(shù)和中位數(shù)改變
E.均數(shù),幾何均數(shù)和中位數(shù)都不變
2.表示兒童體重資料的平均水平最常用的指標(biāo)是
A.算術(shù)均數(shù)
B.中位數(shù)
C.幾何均數(shù)
D.變異系數(shù)
E.百分位數(shù)
二、A2型選擇題
1.由變量的6個值6,9,12,14,15,20計(jì)算中位數(shù)可得
A.3
B.4
C.12
D.13
E.14
【參考答案及解析】
一、A1型選擇題
1.【答案及解析】C。一組觀察值如果每個值都同時(shí)增加或減少一個不為0的常數(shù),則均數(shù)、幾何均數(shù)、中位數(shù)都改變。
2.【答案及解析】A。算術(shù)平均數(shù)簡稱均數(shù),均數(shù)適用于描述單峰對稱分布資料,特別是正態(tài)分布或近似正態(tài)分布資料的集中位置。
二、A2型選擇題
1.【答案及解析】D。中位數(shù)是將一組觀察值按大小順序排列后位次居中的數(shù)值。當(dāng)n為奇數(shù)時(shí),M=X(n+1)/2,當(dāng)n為偶數(shù)時(shí),M=(Xn/2+Xn/2+1)/2。本題共6個數(shù)值,為偶數(shù),所以中位數(shù)M=(X6/2+X6/2+1)/2=(X3+X4)/2=(12+14)/2=13。
離散趨勢指標(biāo)
描述定量資料離散程度常用的指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差及變異系數(shù)。
1.極差(R)=最大值——最小值,極差越大變異程度越大。當(dāng)兩樣本含量相差較大時(shí),不宜用極差來比較其變異程度。
2.四分位數(shù)間距(Q):Q=P75——P25。適用于任何分布類型的資料,主要和中位數(shù)一起描述偏態(tài)分布資料。
3.方差和標(biāo)準(zhǔn)差:是描述對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料變異程度的指標(biāo)。
4.變異系數(shù)(CV):標(biāo)準(zhǔn)差和均數(shù)之比,常用于比較度量衡單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。
【進(jìn)階攻略】方差的單位是觀察值原始單位的平方,標(biāo)準(zhǔn)差的單位與原始單位相同。
【易錯易混辨析】把每個變量值都增加或減少一個常數(shù),其均數(shù)也增加或減少一個常數(shù),但標(biāo)準(zhǔn)差不變。
【練習(xí)題】
一、A1型選擇題
1.下列關(guān)于方差和標(biāo)準(zhǔn)差的敘述,不正確的是
A.方差的單位與標(biāo)準(zhǔn)差的單位相同
B.方差的單位是標(biāo)準(zhǔn)差單位的平方
C.都用于描述定量資料頻數(shù)分布的變異程度
D.二者值越大,說明資料的變異程度越大
E.均適用于對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料
2.變異系數(shù)是
A.描述計(jì)量資料平均水平的指標(biāo)
B.描述計(jì)量資料絕對離散程度的指標(biāo)
C.描述計(jì)量資料相對離散程度的指標(biāo)
D.描述計(jì)數(shù)資料各部分構(gòu)成的指標(biāo)
E.描述計(jì)數(shù)資料平均水平的指標(biāo)
3.關(guān)于標(biāo)準(zhǔn)差,錯誤的一項(xiàng)是
A.反映全部觀察值的離散程度
B.最適用于對稱分布資料
C.反映了均數(shù)代表性的好壞
D.一定大于或等于零
E.不會小于算術(shù)均數(shù)
【參考答案及解析】
一、A1型選擇題
1.【答案及解析】A。方差和標(biāo)準(zhǔn)差均是描述對稱分布,值越大,說明資料的變異程度越大,方差的單位是觀察值單位的平方,在實(shí)際工作中使用不便,因此將方差開算術(shù)平方根得到標(biāo)準(zhǔn)差,故選項(xiàng)A不正確。
2.【答案及解析】C。變異系數(shù)簡記為CV,為標(biāo)準(zhǔn)差與均數(shù)之比,是描述計(jì)量資料相對離散程度的指標(biāo)。故C選項(xiàng)正確。
3.【答案及解析】E。標(biāo)準(zhǔn)差是描述對稱分布資料變異程度的指標(biāo),離散度越大其數(shù)值越大,它的大小與算術(shù)平均數(shù)無關(guān)。
標(biāo)準(zhǔn)誤及可信區(qū)間
1.標(biāo)準(zhǔn)誤:樣本均數(shù)的標(biāo)準(zhǔn)差叫樣本均數(shù)的標(biāo)準(zhǔn)誤,是標(biāo)準(zhǔn)差與樣本含量平方根的比值,反映的是抽樣誤差的大小,標(biāo)準(zhǔn)誤越大,抽樣誤差也就越大,樣本均數(shù)的離散程度高,與總體均數(shù)的差異程度越大。標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,與樣本含量的平方根成反比。
2.參數(shù)估計(jì)有兩種方法:點(diǎn)值估計(jì)和區(qū)間估計(jì)。
(1)點(diǎn)值估計(jì):直接用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。總體均數(shù)的點(diǎn)值估計(jì)就是直接用樣本均數(shù)去估計(jì)總體均數(shù)(就是把樣本均數(shù)看作是總體均數(shù))。缺點(diǎn):沒有考慮到抽樣誤差
(2)區(qū)間估計(jì):結(jié)合樣本統(tǒng)計(jì)量和標(biāo)準(zhǔn)誤可以確定一個具有較大概率(可信度)的包含總體參數(shù)的區(qū)間,該區(qū)間稱為總體參數(shù)的1——α可信區(qū)間(置信區(qū)間)。預(yù)先給定的概率稱為可信度,用1——α表示,常用的可信度為95%或99%。如沒有特別說明,一般取雙側(cè)95%。
3.可信區(qū)間的兩個要素
準(zhǔn)確度:反映在可信度上,可信度越大,準(zhǔn)確度越高。
精密度:精密度反映在可信區(qū)間的寬度上,寬度越小,精密度越高。
【進(jìn)階攻略】可信區(qū)間是一個開區(qū)間,不包括下限和上限兩個值。
【易錯易混辨析】均數(shù)的可信區(qū)間與醫(yī)學(xué)參考值范圍的區(qū)別:
、俸x不同:可信區(qū)間是按一定的概率100(1——α)%估計(jì)總體均數(shù)的可能范圍;醫(yī)學(xué)參考值范圍是指是總體中大多數(shù)個體值的估計(jì)范圍。
、谟猛静煌嚎尚艆^(qū)間估計(jì)總體均數(shù);醫(yī)學(xué)參考值范圍是判斷觀察對象的某項(xiàng)指標(biāo)是否正常。
【練習(xí)題】
一、A1型選擇題
1.同類定量資料下列指標(biāo),反映樣本均數(shù)對總體均數(shù)代表性的是
A.四分位數(shù)間距
B.標(biāo)準(zhǔn)誤
C.變異系數(shù)
D.百分位數(shù)
E.中位數(shù)
2.關(guān)于可信區(qū)間,正確的說法是
A.可信區(qū)間是總體中大多數(shù)個體值的估計(jì)范圍
B.95%可信區(qū)間比99%可信區(qū)間更好
C.不管資料呈什么分布,總體均數(shù)的95%的可信區(qū)間計(jì)算公式是一致的
D.可信區(qū)間也可用于回答假設(shè)檢驗(yàn)的問題
E.可信區(qū)間僅有雙側(cè)估計(jì)
3.總體率的99%可信區(qū)間是
A.99%的總體率分布的范圍
B.99%的樣本率分布的范圍
C.99%的樣本率可能所在范圍
D.99%的總體率的可能所在范圍
E.估計(jì)總體率在此范圍的概率為99%
【參考答案及解析】
1.【答案及解析】B。均數(shù)的標(biāo)準(zhǔn)差即均數(shù)的標(biāo)準(zhǔn)誤,可用來描述樣本均數(shù)的抽樣誤差,均數(shù)的標(biāo)準(zhǔn)誤越小,則說明均數(shù)的抽樣誤差越小。
2.【答案及解析】D。按一定的概率估計(jì)總體參數(shù)的可能范圍,該范圍稱為可信區(qū)間,可以用來估計(jì)總體均數(shù)。在假設(shè)檢驗(yàn)時(shí)常按95%置信度估計(jì)總體參數(shù)的可能范圍。
3.【答案及解析】E?傮w率的99%可信區(qū)間是估計(jì)總體率在此范圍的概率為99%,即此范圍有99%的把握包含總體率。所以答案選E。
t分布和假設(shè)檢驗(yàn)
1.t分布特征
(1)單峰分布,以0為中心,左右對稱;
(2)自由度越小,峰部越矮,而尾翹得越高;
(3)當(dāng)自由度增大時(shí),t分布逼近u分布(標(biāo)準(zhǔn)正態(tài)分布),當(dāng)自由度無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布;
(4)t分布是一簇曲線,自由度不同,曲線的形狀不同。
2.假設(shè)檢驗(yàn)步驟
(1)建立假設(shè),確定檢驗(yàn)水準(zhǔn):假設(shè)有兩種,一是無效假設(shè)或稱零假設(shè)H0;二是備擇假設(shè)H1。
(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量;
(3)確定P值:將P值與預(yù)先規(guī)定的檢驗(yàn)水準(zhǔn)相比,做出推斷結(jié)論。當(dāng)P≤α?xí)r,拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義;當(dāng)P>α?xí)r,不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義。
【進(jìn)階攻略】檢驗(yàn)假設(shè)針對總體,而不是樣本。進(jìn)行假設(shè)檢驗(yàn)時(shí),應(yīng)同時(shí)寫出H0和H1,H1為備擇假設(shè),它的內(nèi)容反映了檢驗(yàn)的單、雙側(cè)。
【練習(xí)題】
一、A1型選擇題
1.下列關(guān)于t分布特征的敘述,錯誤的是
A.t分布為單峰分布
B.t分布曲線是一簇曲線
C.以0為中心,左右對稱
D.自由度越大,t分布曲線的峰部越低,尾部越高
E.自由度為無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布
2.在對兩個樣本均數(shù)作假設(shè)檢驗(yàn)時(shí),若P>0.1,則統(tǒng)計(jì)推斷為
A.兩總體均數(shù)的差別有統(tǒng)計(jì)學(xué)意義
B.兩樣本均數(shù)的差別有統(tǒng)計(jì)學(xué)意義
C.有0.9的把握度認(rèn)為兩總體均數(shù)無差別
D.犯二類錯誤的概率為0.1
E.兩總體均數(shù)的差別無顯著性
3.比較兩藥療效時(shí),下列可作單側(cè)檢驗(yàn)的是
A.己知A藥與B藥均有效
B.不知A藥好還是B藥好
C.己知A藥與B藥差不多好
D.己知A藥不會優(yōu)于B藥
E.不知A藥與B藥是否有效
【參考答案及解析】
1.【答案及解析】D。t分布的特征為:自由度越小,曲線的峰部越低,尾部越高;隨著自由度的增大,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)自由度為無窮大時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布。故選項(xiàng)D敘述錯誤,本題選D。
2.【答案及解析】E。P>0.1,按α=0.1水準(zhǔn),不能拒絕H0,所以兩總體均數(shù)的差別無顯著性。
3.【答案及解析】D。已知A藥不會優(yōu)于B藥,只有低于B藥的一種可能,所以可作單側(cè)檢驗(yàn)。
單樣本t檢驗(yàn)
1.t檢驗(yàn)的應(yīng)用條件:①要求樣本來自正態(tài)分布總體;②兩樣本均數(shù)比較時(shí),還要求兩樣本所屬總體的方差相等(即方差齊性)。
2.單樣本t檢驗(yàn)?zāi)康模菏菢颖揪鶖?shù)與總體均數(shù)的比較,推斷未知總體與已知總體比較是否有差別。
【進(jìn)階攻略】掌握t檢驗(yàn)的應(yīng)用條件和計(jì)算公式,會用t界值表進(jìn)行判斷。
【練習(xí)題】
一、A1型選擇題
1.關(guān)于t界值表錯誤的一項(xiàng)是
A.雙側(cè)t0.10,20=單側(cè)t0.05,20
B.單側(cè)t0.05,20<雙側(cè)t0.05,20
C.雙側(cè)t0.05,20<雙側(cè)t0.01,20
D.單側(cè)t0.05,20>單側(cè)t0.05,15
E.單側(cè)t0.05,20<單側(cè)t0.05,15
2.比較某地區(qū)15歲兒童平均體重是否高于一般,宜采用
A.u檢驗(yàn)
B.t檢驗(yàn)
C.T檢驗(yàn)
D.χ2檢驗(yàn)
E.以上都不是
3.在樣本均數(shù)與總體均數(shù)差別的顯著性檢驗(yàn)中,結(jié)果為P<α而拒絕H0,接受H1,原因是
A.H0假設(shè)成立的可能性小于α
B.H1假設(shè)成立的可能性大小1——α
C.H0成立的可能性小于α且H1成立的可能性大于1——α
D.從H0成立的總體中抽樣得到樣本的可能性小于α
E.從H0不成立的另一總體中抽得此樣本的可能性大于1——α
【參考答案及解析】
一、A1型選擇題
1.【答案及解析】D。在同一自由度下,雙側(cè)概率為單側(cè)概率的2倍時(shí),所對應(yīng)的t界值相等。
2.【答案及解析】B。本題是正態(tài)分布資料樣本均數(shù)與總體均數(shù)的比較,所以應(yīng)該用單樣本t檢驗(yàn)。
3.【答案及解析】D。從H0成立的總體中抽樣得到樣本的可能性小于α,即P<α,說明是小概率事件,所以拒絕H0。
執(zhí)業(yè)醫(yī)師萬題庫下載丨微信搜"萬題庫執(zhí)業(yè)醫(yī)師考試"
相關(guān)推薦:
關(guān)注“萬題庫執(zhí)業(yè)醫(yī)師考試”微信,下載考前提分試卷!