版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)基礎(chǔ),數(shù)據(jù)分析的重要性,,,制定具有針對(duì)性的營(yíng)銷策略,幫助產(chǎn)品定位、生命周期管理與銷售分析,深層次研究競(jìng)爭(zhēng)分析,理解市場(chǎng)動(dòng)向與趨勢(shì),為管理、經(jīng)濟(jì)以及投資決策提供依據(jù),我司目前數(shù)據(jù)分析的現(xiàn)狀,如何提升我司數(shù)據(jù)分析能力,,,統(tǒng)計(jì)學(xué)基礎(chǔ)參數(shù)估計(jì)假設(shè)檢驗(yàn)方差分析回歸 - 線性回歸 - 方差回歸 - 邏輯回歸 - 定序回歸 - 生存回歸,,,,提升數(shù)據(jù)分析兩大方法,數(shù)據(jù)分析軟件E
2、xcel——初級(jí)SPSS——中級(jí)SAS——高級(jí),默認(rèn)所有人都學(xué)過(guò)《概率論與數(shù)理統(tǒng)計(jì)》,統(tǒng)計(jì)學(xué)的基本概念——話術(shù),統(tǒng)計(jì)學(xué)的基本概念——度量,,集中趨勢(shì)的度量,,,離散程度的度量,,,偏態(tài)與峰態(tài)的度量,統(tǒng)計(jì)學(xué)基礎(chǔ),1,2,3,參數(shù)估計(jì)與假設(shè)檢驗(yàn),方差分析,回歸分析,統(tǒng)計(jì)學(xué)基礎(chǔ),1,2,3,參數(shù)估計(jì)與假設(shè)檢驗(yàn),方差分析,回歸分析,參數(shù)估計(jì)的基本原理與置信區(qū)間,參數(shù)估計(jì):用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)參數(shù)估計(jì)的方法:點(diǎn)估計(jì)和區(qū)間估計(jì),置信區(qū)
3、間的理解置信度95%指有95%的區(qū)間包含總體參數(shù)的真值,5%則不包含;通過(guò)樣本求得的區(qū)間是固定的、已知的,而總體是未知的、隨機(jī)的;在實(shí)際問(wèn)題中,我們希望構(gòu)造的區(qū)間是包含總體真值其中的一個(gè)區(qū)間。,一個(gè)總體參數(shù)的區(qū)間估計(jì),*Z α/2 =1.96(置信度95%),兩個(gè)總體參數(shù)的區(qū)間估計(jì),*Z α/2 =1.96(置信度95%),通過(guò)Excel獲得參數(shù)估計(jì)所需的參數(shù),描述統(tǒng)計(jì)【數(shù)據(jù)】->【數(shù)據(jù)分析】->【描述統(tǒng)計(jì)】【輸入
4、區(qū)域】:源數(shù)據(jù)選擇“匯總統(tǒng)計(jì)”選擇“平均置信度”為95%,假設(shè)檢驗(yàn)的基本原理及思路,假設(shè)檢驗(yàn)的原理及判別依據(jù)先提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。通過(guò)統(tǒng)計(jì)量及P值判斷。假設(shè)表達(dá)式原假設(shè):H0備擇假設(shè):H1舉例:H0= μ,H1≠ μ,檢驗(yàn)兩個(gè)假設(shè)哪個(gè)成立假設(shè)檢驗(yàn)的原則把希望證明的命題放在備擇假設(shè)上把原有的,傳統(tǒng)的觀點(diǎn)或結(jié)論放在原假設(shè)上基本思路根據(jù)樣本計(jì)算統(tǒng)計(jì)量,通過(guò)統(tǒng)計(jì)量或P來(lái)判斷到底接受哪個(gè)
5、假設(shè)其中P為累計(jì)概率密度,假設(shè)檢驗(yàn)舉例,某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,今另?yè)Q一種新機(jī)床進(jìn)行加工,取200個(gè)零件進(jìn)行檢驗(yàn),得到橢圓度均值為0.076mm,樣本標(biāo)準(zhǔn)差為0.025mm,問(wèn)新機(jī)床加工零件的橢圓度總體均值與以前有無(wú)差別?H0: μ=0.081mm,沒(méi)有顯著差別H1: μ ≠0.081mm,有顯著差別選擇公式: ,且置信度
6、為95%得到Z=-2.83通過(guò)得到0.997672537,然后P=2x(1- 0.997672537 )= 0.004655 ,遠(yuǎn)遠(yuǎn)小于(1-95%)=0.05,因此拒絕H0,選擇H1,Z= 𝒙?μ𝟎 𝒔/ 𝒏,Excel:【插入】->【函數(shù)】->NORM.S.DIST,統(tǒng)計(jì)學(xué)基礎(chǔ),1,2,3,參數(shù)估計(jì)與假設(shè)檢驗(yàn),方差分析,回歸分析,方差分析基本原理及概
7、念,,通過(guò)誤差來(lái)判斷分類型自變量對(duì)數(shù)值型因變量的影響,,原理:,,SST(總誤差)=SSE(組內(nèi)誤差)+SSA(組間誤差),,誤差:,,通過(guò)假設(shè)檢驗(yàn),利用誤差分布或概率來(lái)檢驗(yàn)各總體的均值是否相等。如果各總體的均值相等無(wú)影響,不相等則有影響,,思路:,方差分析表的一般形式及含義,SSA:反映自變量對(duì)因變量的影響。SSE:反映除自變量對(duì)因變量的影響之外,其他因素對(duì)因變量的影響。SST:反映自變量和殘差變量的共同影響。MSE和MSA:
8、組內(nèi)和組間均方差,為了計(jì)算F值。F值:統(tǒng)計(jì)決策。F值>F臨界值,拒絕原假設(shè),表明所檢驗(yàn)因素對(duì)觀測(cè)值有顯著影響;F值<F臨界值,不拒絕原假設(shè),表明所檢驗(yàn)因素對(duì)觀測(cè)值沒(méi)有顯著影響。,方差分析的強(qiáng)度測(cè)量與多重比較,,測(cè)量自變量與因變量之間的關(guān)系強(qiáng)度,R2表示 基本公式:R2= 聯(lián)合效應(yīng) 總效應(yīng),,強(qiáng)度測(cè)量,,測(cè)量均值之間存在的差異 最小顯著差異法,簡(jiǎn)稱LSD LSD=tα/2* 𝑴𝑺
9、𝑬( 𝟏 𝒏𝒊 + 𝟏 𝒏𝒋 ),,多重比較,用Excel實(shí)現(xiàn)單雙因素方差分析,雙因素方差分析舉例,4個(gè)品牌的彩電在5個(gè)地區(qū)的銷售數(shù)量數(shù)據(jù),雙因素方差分析【數(shù)據(jù)】->【數(shù)據(jù)分析】->【方差分析:無(wú)重復(fù)雙因素方差分析】【輸入?yún)^(qū)域】:源數(shù)據(jù)選擇“α:0.05”,統(tǒng)計(jì)學(xué)基礎(chǔ),1,2,3,參數(shù)估計(jì)與假設(shè)檢驗(yàn),方差分析
10、,回歸分析,我司可能用到的回歸及應(yīng)用場(chǎng)合,,,線性回歸的基本概念,回歸的由來(lái),線性回歸模型,起源:回歸源于高爾頓的豌豆實(shí)驗(yàn)現(xiàn)象:一個(gè)總體中在某一時(shí)期具有某一極端特性的個(gè)體在未來(lái)的某一時(shí)期將減弱它的極端性,y=β0+ β1x1+ β2x2+ β3x3+……+ βixi+ε,β0、β1、β2、……βi:回歸系數(shù)。若β0 ≠0,β1=β2=…=β𝑖=0,則稱y沒(méi)有任何線性關(guān)系。ε:隨機(jī)誤差,符合正態(tài)分布。在計(jì)算回歸系數(shù)時(shí)
11、,假設(shè)E(ε)=0用Excel計(jì)算回歸系數(shù)的方法:【數(shù)據(jù)】->【數(shù)據(jù)統(tǒng)計(jì)】->【回歸】,Excel輸出回歸分析結(jié)果,,,常規(guī)統(tǒng)計(jì)量,回歸方程的擬合優(yōu)度,對(duì)回歸方程的線性關(guān)系進(jìn)行顯著性檢驗(yàn),回歸參數(shù)估計(jì)相關(guān)內(nèi)容,,回歸方程的擬合優(yōu)度,擬合優(yōu)度:回歸直線與各觀測(cè)點(diǎn)的接近程度,需計(jì)算判定系數(shù)R2或調(diào)整的R2。,R2=1- 𝑆𝑆𝐸 𝑆𝑆𝑇
12、; Adjusted R2=1-(1-R2)( 𝑛?1 𝑛?𝑘?1 ),,回歸方程的顯著性檢驗(yàn),顯著性檢驗(yàn):檢驗(yàn)線性回歸方程是否能真實(shí)反映變量x和y之間的關(guān)系。顯著性檢驗(yàn)分為兩部分:線性關(guān)系和回歸系數(shù)。,,線性關(guān)系顯著性檢驗(yàn) - F>F(4,20)分布,線性顯著 - Significance F>0.05,線性顯著,,回歸系數(shù)顯著性檢驗(yàn)因涉及多元線性回歸,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計(jì)學(xué)數(shù)據(jù)分析 統(tǒng)計(jì)學(xué)
- 統(tǒng)計(jì)學(xué)論文(數(shù)據(jù)分析)
- google+中文用戶手冊(cè)v0.2
- 福建省生態(tài)環(huán)境大數(shù)據(jù)平臺(tái)概要設(shè)計(jì)v0.2
- 統(tǒng)計(jì)學(xué)基礎(chǔ)
- 統(tǒng)計(jì)學(xué)基礎(chǔ) 統(tǒng)計(jì)概述
- 《統(tǒng)計(jì)學(xué)基礎(chǔ)》單元二統(tǒng)計(jì)數(shù)據(jù)的搜集
- 統(tǒng)計(jì)學(xué)基礎(chǔ)1
- [經(jīng)濟(jì)學(xué)]統(tǒng)計(jì)學(xué)基礎(chǔ)
- 浙江移動(dòng) smile平臺(tái) 新架構(gòu)壓力測(cè)試計(jì)劃v0.2
- 統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)
- 《統(tǒng)計(jì)學(xué)基礎(chǔ)》考試大綱
- [學(xué)習(xí)]統(tǒng)計(jì)學(xué)基礎(chǔ)廈門(mén)大學(xué)09統(tǒng)計(jì)指數(shù)與因素分析
- 《統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)》
- 趨勢(shì)科技web安全網(wǎng)關(guān)實(shí)施方案v0.2
- 數(shù)據(jù)分析與統(tǒng)計(jì)計(jì)算軟件dasc
- 統(tǒng)計(jì)學(xué)相關(guān)與回歸分析
- 數(shù)據(jù)挖掘中的統(tǒng)計(jì)學(xué)
- 統(tǒng)計(jì)學(xué)數(shù)據(jù)的圖表展示
- 統(tǒng)計(jì)學(xué)基礎(chǔ)復(fù)習(xí)題
評(píng)論
0/150
提交評(píng)論