三、問答題
1.簡述相關(guān)分析的步驟。
答:可繪制散點,發(fā)現(xiàn)有直線趨勢,進而計算相關(guān)系數(shù)r,以描述兩變量的線性關(guān)系。
2.簡述兩組比較的四格表資料χ2檢驗的條件。
答:當n>40,且所有T≥5時,用χ2檢驗的基本公式或四格表專用公式。
當n>40,但有1
若n≤40,或T≤1時,需用確切概率計算法。
3.舉例說明對合計率標準化的基本思想。
答:兩人群發(fā)病率、死亡率、出生率、病死率等的比較,常考慮人群性別、年齡等構(gòu)成的影響,需對率進行標準化。率標準化法的基本思想就是采用統(tǒng)一的標準人口構(gòu)成,以消除人口構(gòu)成不同對人群總率的影響,使算得標準化率具有可比性。
4.欲研究廣州市正常成年男子的血糖情況,在廣州市隨機抽取了200名正常成年男子進行調(diào)查,以此為例說明(敘述)同質(zhì)、變異、變量、變量值、總體與樣本這幾個概念。
答:同質(zhì)是指具有某些相同的特征,如本例中廣州市、正常成年、男子等幾個特征;這些同質(zhì)個體的全部就構(gòu)成了總體;每個個體間的差異如身高、血糖值不同就是變異;從總體中隨機抽取的個體組成一個樣本,如本例中的200人;他們的測量指標是變量,如血糖;每個個體的測量值叫變量值,如張三的血糖值。
5.舉例說明變異系數(shù)適用于哪兩種形式的資料,作變異程度的比較?
答:(1)度量衡單位不同的多組資料的變異度的比較。例如,欲比較身高和體重何者變異度大,由于度量衡單位不同,不能直接用標準差來比較,而應(yīng)用變異系數(shù)比較。
(2)比較均數(shù)相差懸殊的多組資料的變異度。例如,3歲兒童與20歲成年人身高差異的比較。
6.用兩種方法檢查已確診的乳腺癌患者120名,結(jié)果如下:
甲法 乙法
+ - 合計
+ 40 32 72
- 20 28 48
合計 60 60 120
試解釋表中數(shù)字32,20的意義。對該資料,可以進行哪些方面的統(tǒng)計分析?(不必計算)
答:32為甲法檢查為陽性而乙法檢查為陰性,20為甲法檢查為陰性而乙法檢查為陽性?梢赃M行配對設(shè)計下兩組頻數(shù)分布的χ2檢驗和分類變量的關(guān)聯(lián)性分析
7.舉例簡要說明隨機區(qū)組設(shè)計資料秩和檢驗的編秩方法。
答:隨機區(qū)組設(shè)計資料秩和檢驗的編秩方法為將每個區(qū)組的數(shù)據(jù)由小到大分別編秩,遇相同數(shù)據(jù)取平均秩次,按處理因素求秩和。
8.某地有5000名六年級小學生,欲通過隨機抽樣調(diào)查他們的平均身高。請簡述可以采用的抽樣方法之一及抽樣步驟。
答:根據(jù)α、β、γ和σ求出樣本例數(shù)N,按生長環(huán)境進行分層,如城鎮(zhèn),農(nóng)村。每層內(nèi)再按性別采用完全隨機抽樣或按學生班級整群抽樣。
9.簡述應(yīng)用相對數(shù)時的注意事項。
答:(1)構(gòu)成比與率應(yīng)用時不能相互混淆。
(2)樣本含量太小時,不宜計算相對數(shù)
(3)對各組觀察例數(shù)不等的幾個率,不能直接相加求其總率
(4)在比較相對數(shù)時應(yīng)注意資料的可比性
20.估計樣本例數(shù)的意義何在?需要確定哪些前提條件?
答:樣本含量估計充分反映了"重復"的基本原則,過小過大都有其弊端。
樣本含量過小,所得指標不穩(wěn)定,用以推斷總體的精密度和準確度差;檢驗的功效低,應(yīng)有的差別不能顯示出來,難以獲得正確的研究結(jié)果,結(jié)論也缺乏充分的依據(jù)。
樣本含量過大,會增加實際工作的困難,浪費人力、物力和時間?赡芤敫嗟幕祀s因素,從而影響數(shù)據(jù)的質(zhì)量。
實驗所需的樣本含量取決于以下4個因素:
(1)假設(shè)檢驗的第Ⅰ類錯誤的概率α
(2)假設(shè)檢驗的第Ⅱ類錯誤的概率β
(3)容許誤差δ
(4)總體標準差σ或總體概率π
編輯推薦:
國家 | 北京 | 天津 | 上海 | 江蘇 |
安徽 | 浙江 | 山東 | 江西 | 福建 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |