第四節(jié) 數(shù)據(jù)分析
考試目的:能夠應用有關方法進行調(diào)研數(shù)據(jù)的分析。
考試內(nèi)容:數(shù)據(jù)分析,包括:基礎統(tǒng)計分析和多元統(tǒng)計分析
一、基礎統(tǒng)計分析
(一)描述統(tǒng)計分析
在市場調(diào)研中,廣泛應用描述統(tǒng)計分析方法。
1集中趨勢的測度
集中趨勢是指一組數(shù)據(jù)向其中心值靠攏的傾向,測度集中趨勢就是確定數(shù)據(jù)一般水平的代表值或中心值。集中趨勢的測量有三個常用的指標:
(1)眾數(shù),是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。眾數(shù)的基本思想,是用來反映一組數(shù)據(jù)若存在聚中趨勢,則在數(shù)據(jù)的中心,變量值出現(xiàn)的頻數(shù)較高,眾數(shù)就是這一位置的代表值。眾數(shù)的一個突出特點是它不受極端數(shù)值的影響。
(2)中位數(shù),是一組數(shù)據(jù)排序后處于中間位置的變量值,是一組數(shù)據(jù)的中點,即高于和低于它的數(shù)據(jù)各占一半。
(3)均值,是集中趨勢的主要測度值,用于反映一組數(shù)值型數(shù)據(jù)的一般水平。根據(jù)情況的不同,均值在計算時有不同的形式,主要包括算術平均數(shù)、調(diào)和平均數(shù)和幾何平均數(shù)。
2.離散程度的測度
數(shù)據(jù)的離散程度是數(shù)據(jù)分布的另一重要特征,它是指各變量值遠離其中心值的程度,所以也叫離中趨勢。例如一次考試成績70-80是眾數(shù),但其他分數(shù)段均有,就是一個離散程度很高的數(shù)據(jù)。
離中趨勢是經(jīng)過綜合與抽象后對數(shù)據(jù)一般水平的概括性描述。離中趨勢的各種測度就是對數(shù)據(jù)離散程度的描述。
(1)極差,也稱全距,是一組數(shù)據(jù)中最大值與最小值之差。
極差是描述數(shù)據(jù)離散程度的最簡單的方法。例如一次考試成績最高分為100,最低0分,則極差就是100-0=100。
(2)平均差,也叫平均離差,是各變量值(Xi)與其均值( )離差絕對值的平均數(shù):
平均差反映了所有數(shù)據(jù)與均值的平均距離。平均差越小,說明數(shù)據(jù)離散程度越小。
(3)方差和標準差。方差是一組數(shù)據(jù)中各變量值與均值離差平方的平均數(shù)。方差的平方根叫標準差。方差與標準差是反映數(shù)值型數(shù)據(jù)離散程度最主要、最常用的方法。
根據(jù)總體數(shù)據(jù)和樣本數(shù)據(jù)計算方差及標準差時,計算公式略有不同。
式中Xi是數(shù)值序列中的單個數(shù)值,是這組數(shù)值的平均值,N是總體數(shù)值的個數(shù),n是樣本數(shù)值的個數(shù)。計算樣本方差與標準差時之所以與總體不同,是因為計算樣本方差或標準差時,是要把它作為總體方差或標準差的估計量,統(tǒng)計上對估計量要求滿足一些條件(一致性、無偏性、有效性),為滿足無偏性條件,樣本方差計算時,分母要用n-1,而不是n
3.相關分析
所謂相關分析,是研究現(xiàn)象之間是否存在某種依存關系,并對具體有依存關系的現(xiàn)象探討其相關方向以及相關程度,是研究隨機變量之間的相關關系的一種統(tǒng)計方法。變量之間的相關關系主要有線性相關和非線性相關、正相關和負相關等幾種形式。對兩個變量間線性相關程度的測量稱為簡單相關系數(shù)。
樣本相關系數(shù)定義公式為:
式中,r為樣本相關系數(shù),COVsy為協(xié)方差,Sx、Sy分別是變量x和y的標準差。相關系數(shù)r的取值范圍在-1-+1之間。
、賠=1或r=-1時,表明變量同的關系為完全正相關或完全負相關,這是兩種極端的情況,實際上表明兩個變量之間是線性關系;
、趓=0時,表明變量間不存在線性相關關系,可能是無相關,也可能是非線性相關;
、0
、-1
|r|愈接近于1,變量間相關程度愈高,|r|愈接近于0,相關程度愈低。
(二)推論統(tǒng)計分析
推論統(tǒng)計是在隨機抽樣的基礎上,根據(jù)部分資料(數(shù)據(jù))推斷總體的方法,也即利用樣本資料對抽出樣本的總體作出推論的方法。
1單個樣本的參數(shù)估計
參數(shù)是指總體的某一特征值,如均值、方差等,往往是未知數(shù);而根據(jù)樣本數(shù)據(jù)計算出來的均值、樣本標準差、樣本比例一般稱為樣本“統(tǒng)計量”。參數(shù)估計是根據(jù)樣本統(tǒng)計量對總體未知參數(shù)進行某種估計推斷。
(1)點估計。當總體分布的形式已知,但其中的一個或多個參數(shù)未知時,如果從總體中抽取一個樣本,用該樣本對未知參數(shù)作一個數(shù)值點的估計,稱為參數(shù)的點估計。
點估計的方法:矩法、最大似然法、最小二乘法等。
根據(jù)矩法,為滿足估計無偏性的要求,就是用樣本矩去估計總體矩,即
(2)區(qū)間估計。區(qū)間估計是用一個區(qū)間估計總體未知參數(shù)。
設X1…,Xn是來自總體的一個樣本,對于給定的α(為顯著性水平,0<α<1,),若有兩個統(tǒng)計量θ1(x1,…,xn)和θ2(x1,…,xn),使得:P(θ1<θ<θ2)=1—α,則稱1—α為信度(或置信度、置信概率),(θ1, θ2)是θ的信度為1—α的置信區(qū)間,α稱為顯著性水平。
①總體方差σ2已知時,總體均值μ的區(qū)間估計
置信度為l-α時,總體均值μ的置信區(qū)間為:
即:
、诳傮w方差σ2未知時,總體均值μ的區(qū)間估計
此時,總體均值μ在置信度為1-α下的置信區(qū)間為:
2.單個樣本的假設檢驗
假設檢驗則是先對總體參數(shù)的值提出一個假設,然后利用樣本信息,根據(jù)抽樣分布的原理去檢驗原先提出的假設是否成立。進行假設檢驗時,通常經(jīng)過以下步驟:
相關推薦:在線課程 |
2024年
學考雙贏定制班 63%學員選擇 |
2024年
學考雙贏黑卡班 31%學員選擇 |
2024年
學考雙贏取證班 6%學員選擇 |
2024年
專項提分班 |
||
學 | 基礎學習 拿分階段 |
私教精講班 | ||||
強化學習 提分階段 |
重要考點提煉班 | |||||
練 | 沖刺密訓 搶分階段 |
8套名師密押卷 | ||||
背 | 考前終極 搶分階段 |
通關必備200題 | ||||
考前3小時密訓班 | ||||||
專項班 | 經(jīng)濟基礎: 圖形/計算題專項 |
|||||
專業(yè)課: 案例專項專項 |
||||||
★★★ 三星題庫 ¥680/年 |
每日一練 |
|||||
每日錯題榜 |
||||||
章節(jié)刷題 |
||||||
★★★★ 四星題庫 ¥980/年 |
真題題庫 |
|||||
高頻? |
||||||
大數(shù)據(jù)易錯 |
||||||
★★★★★ 五星題庫 ¥1680/年 |
通關必備200題 |
|||||
名師密押8套卷 |
||||||
教學資料 | 課程講義 | |||||
全程學習計劃書 | ||||||
人工助學服務 | 微信一對一 班主任督學 7×13陪伴模式 |
|||||
老師微信 一對一答疑 |
||||||
定制服務 無憂從容包 |
無憂從容卡 ¥980 | |||||
專項突破班 ¥1360 | ||||||
黑卡特權(quán) | 不過退費 | |||||
額外贈送 | 贈送2023年 【教材精講班】 |
贈送2023年 【教材精講班】 |
贈送2023年 【教材精講班】 |
|||
課程有效期 | 2024年11月30日 | 2025年11月30日 | 2024年11月30日 | 2024年11月30日 | ||
套餐價格 | 全科:¥4680 單科:¥2880 |
全科:¥9880 單科:¥5980 |
全科:¥1580 單科:¥880 |
全科:¥1080 單科:¥680 |