葡萄酒的評(píng)價(jià)數(shù)學(xué)建模論文

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-24 格式：doc 頁數(shù)：28 大?。?.30MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩27頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、　　2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽　　承諾書　　我們仔細(xì)閱讀了中國大學(xué)生數(shù)學(xué)建模競賽的競賽規(guī)則.　　我們完全明白，在競賽開始后參賽隊(duì)員不能以任何方式（包括電話、電子郵件、網(wǎng)上咨詢等）與隊(duì)外的任何人（包括指導(dǎo)教師）研究、討論與賽題有關(guān)的問題。&

2、lt;/p>　　我們知道，抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料（包括網(wǎng)上查到的資料），必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。　　我們鄭重承諾，嚴(yán)格遵守競賽規(guī)則，以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為，我們將受到嚴(yán)肅處理。　　我們授權(quán)全國大學(xué)生數(shù)學(xué)建模競賽組委

3、會(huì)，可將我們的論文以任何形式進(jìn)行公開展示（包括進(jìn)行網(wǎng)上公示，在書籍、期刊和其他媒體進(jìn)行正式或非正式發(fā)表等）。　　我們參賽選擇的題號(hào)是（從A/B/C/D中選擇一項(xiàng)填寫）： A 　　我們的參賽報(bào)名號(hào)為（如果賽區(qū)設(shè)置報(bào)名號(hào)的話）： <p&

4、gt;　　所屬學(xué)校（請(qǐng)?zhí)顚懲暾娜?蘭州理工大學(xué) 　　參賽隊(duì)員 (打印并簽名) ：1. 楊自升 　　2. 韓向東

5、 　　3. 吳林峰 　　指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名)：汪訓(xùn)洋陳金淑 　　日期：2012年9月10日

6、;　　賽區(qū)評(píng)閱編號(hào)（由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)）：　　2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽　　編號(hào) 專用頁　　賽區(qū)評(píng)閱編號(hào)（由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)）：　　賽區(qū)評(píng)閱記錄（可供賽區(qū)評(píng)閱時(shí)使用）：</

7、p>　　全國統(tǒng)一編號(hào)（由賽區(qū)組委會(huì)送交全國前編號(hào)）：　　全國評(píng)閱編號(hào)（由全國組委會(huì)評(píng)閱前進(jìn)行編號(hào)）：　　葡萄酒的評(píng)價(jià)　　摘要　　評(píng)判葡萄酒質(zhì)量時(shí)一般是通過聘請(qǐng)一批有資

8、質(zhì)的評(píng)酒員進(jìn)行品評(píng)。每個(gè)評(píng)酒員對(duì)葡萄酒樣品進(jìn)行品嘗后對(duì)其分類指標(biāo)打分，然后求和得到其總分，從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系，葡萄酒和釀酒葡萄檢測的理化指標(biāo)會(huì)在一定程度上反映葡萄酒和葡萄的質(zhì)量。　　本文就葡萄酒質(zhì)量的評(píng)價(jià)問題進(jìn)行分析研究，針對(duì)如何對(duì)釀酒葡萄進(jìn)行分級(jí)，釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系，以及釀酒葡萄與葡萄酒的理化指標(biāo)對(duì)葡萄酒的質(zhì)量的影響等問題，建立

9、了相應(yīng)的數(shù)學(xué)模型，并運(yùn)用EXCEL、MATLAB等數(shù)學(xué)軟件，分別就題目所提出的問題進(jìn)行求解。　　對(duì)于問題一，我們采用的是假設(shè)檢驗(yàn)方法，得到了兩組評(píng)酒員的評(píng)價(jià)結(jié)果有顯著性差異，并且第二組結(jié)果更可信。　　對(duì)于問題二，我們應(yīng)用了圖表示可視化分類方法，并利用附件二中的數(shù)據(jù)得到了釀酒葡萄理化指標(biāo)中的兩種起決定性作用的主成分，即為氨基酸總量與褐變度，從而確定了葡萄酒

10、的質(zhì)量與釀酒葡萄理化指標(biāo)之間的關(guān)系，最后將釀酒葡萄分成了三個(gè)等級(jí)。　　對(duì)于問題三，通過聚類分析和典型相關(guān)分析來確定釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系。為了能夠在海量數(shù)據(jù)中找到兩個(gè)樣本之間的內(nèi)在聯(lián)系，我們先通過聚類分析對(duì)釀酒葡萄的理化指標(biāo)進(jìn)行分類如下表所示：(數(shù)字代表的含義見正文)　　再對(duì)簡化后的兩組樣本進(jìn)行典型相關(guān)分析，得到兩種樣本指標(biāo)被對(duì)方解釋的比例

11、分別達(dá)到了100%和92.4%，較好的反映了釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系。　　對(duì)于問題四，我們應(yīng)用多元線性回歸模型進(jìn)行了定性分析,論證了用葡萄和葡萄酒的理化指標(biāo)可以評(píng)價(jià)葡萄酒的質(zhì)量。　　關(guān)鍵詞:葡萄酒評(píng)價(jià) 假設(shè)檢驗(yàn) 可視化分類聚類分析典型相關(guān)分析多元線性回歸　　問題重述</

12、b>　　背景資料與條件　　確定葡萄酒質(zhì)量時(shí)一般是通過聘請(qǐng)一批有資質(zhì)的評(píng)酒員進(jìn)行品評(píng)。每個(gè)評(píng)酒員在對(duì)葡萄酒進(jìn)行品嘗后對(duì)其分類指標(biāo)打分，然后求和得到其總分，從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系，葡萄酒和釀酒葡萄檢測的理化指標(biāo)會(huì)在一定程度上反映葡萄酒和葡萄的質(zhì)量。

13、　　需要解決的問題　　1. 分析附件1中兩組評(píng)酒員的評(píng)價(jià)結(jié)果有無顯著性差異，哪一組結(jié)果更可信？　　2. 根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)。　　3. 分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。

14、　　4．分析釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響，并論證能否用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量？　　問題分析　　問題的重要性分析（社會(huì)背景）　　眾所周知，葡萄酒質(zhì)量的好壞，主要靠感官品嘗和理化指標(biāo)分析的方法來確定。目前我國規(guī)定，對(duì)葡萄酒的感官品嘗主要從色澤，香

15、氣，口味，風(fēng)格四個(gè)方面進(jìn)行品評(píng)，而品評(píng)往往受到評(píng)酒人員的嗜好，習(xí)慣，情緒，年齡，經(jīng)驗(yàn)等因素的影響，評(píng)定常有一定程度的主觀性和不確定性，這使評(píng)分的可靠性受到影響。如何解決以上一系列問題變得非常重要。 　　有關(guān)方面在這個(gè)問題上做過的研究　　現(xiàn)有文獻(xiàn)中大部分都從葡萄酒和釀酒葡萄的物理化學(xué)屬性方面進(jìn)行研究，一般只得到定性結(jié)果，很少見到定量具體分析

16、，不利于葡萄酒質(zhì)量的控制與提高。本文基于對(duì)所給三個(gè)附件數(shù)據(jù)的處理和分析，針對(duì)各具體問題提出了若干數(shù)學(xué)模型得到了較為滿意的解答。　　基本假設(shè)　　模型一假設(shè)　　假設(shè)一：假設(shè)各個(gè)評(píng)酒員的評(píng)判結(jié)果相互獨(dú)立；

17、;　　假設(shè)二：假設(shè)樣本數(shù)據(jù)不滿足正態(tài)分布；　　模型二假設(shè)　　假設(shè)一：假設(shè)同一樣本中各種成分相互獨(dú)立；　　假設(shè)二：假設(shè)附件二中的釀酒葡萄理化指標(biāo)的二級(jí)指標(biāo)影響較小；　　本文引用數(shù)據(jù)、資料均真實(shí)可靠。<p&g

18、t;　　符號(hào)說明　　模型一符號(hào)說明　?。罕硎倦S機(jī)變量；　?。罕硎緲颖揪?；　　：表示樣本方差；<

19、/b>　?。罕硎緲颖救萘?；　?。罕硎踞劸萍t葡萄的對(duì)應(yīng)的分級(jí)指標(biāo)；　?。罕硎踞劸瓢灼咸训膶?duì)應(yīng)的分級(jí)指標(biāo)；　?。横劸破咸训闹鞒煞种笜?biāo)　?。浩咸丫频睦砘笜?biāo)

20、;　?。横劸破咸训牡湫妥兞?lt;/p>　?。浩咸丫频牡湫妥兞?lt;/b>　　模型的建立與求解　　問題一的求解　　模型一概述

21、　　非正態(tài)總體區(qū)間估計(jì)：　　模型一的運(yùn)用與求解　　附件一所給的四個(gè)表格分別為：第一組為紅葡萄酒品嘗評(píng)分，第二組為紅葡萄酒品嘗評(píng)分。其中紅葡萄酒有27組樣品。另外的一組為白葡萄酒品嘗評(píng)分，另外的第二組為白葡萄酒品嘗評(píng)分。其中白葡萄酒有28組樣品。</p

22、>　　品酒員無論對(duì)紅葡萄酒樣品，還是白葡萄酒樣品的評(píng)分，都是以100分為基準(zhǔn)，其中，外觀分析占有15分（澄清度：5分，色調(diào)：10分），香氣分析占有30分（純正度：6分，濃度：8分，質(zhì)量：16分），口感分析占有44分（純正度：6分，濃度：8分，持久性：8分，質(zhì)量：22分），平衡/整體評(píng)價(jià)占有11分。評(píng)酒員通過對(duì)樣品不同指標(biāo)的評(píng)分，然后累加為此樣品的最終得分。　　通過對(duì)紅

23、葡萄酒，白葡萄酒，每組樣品最終得分的均值與方差的求解得到下表所示結(jié)果:　　表1: 紅、白葡萄酒品嘗評(píng)分的均值與方差　　通過觀察兩表數(shù)據(jù)我們發(fā)現(xiàn)兩組紅葡萄酒的得分均值近似相等，兩組白葡萄酒的得分均值也近似相等。而通過兩組紅葡萄酒得分方差的比較,我們發(fā)現(xiàn)，第一組紅葡萄酒得分的方差波動(dòng)明顯比第二組的大。同樣,通過對(duì)兩組白葡萄酒得分的方差的比較，我們進(jìn)一步發(fā)現(xiàn)，

24、第一組白葡萄酒得分的方差波動(dòng)明顯比第二組的大。　　應(yīng)用Excel軟件，以及數(shù)據(jù)擬合，我們得到以上四組樣本的均值與方差的柱形圖如下:　　圖1:兩組紅葡萄酒均值比較的柱形圖　　圖2:兩組紅葡萄酒方差比較的柱形圖　　圖3:兩組白葡萄酒均值比較的柱形圖&l

25、t;p>　　圖4:兩組白葡萄酒方差比較的柱形圖　　通過對(duì)圖形的直觀觀察我們發(fā)現(xiàn):均值與方差并不服從正態(tài)分布。于是，我們對(duì)所有紅葡萄酒與白葡萄酒品嘗評(píng)分做如下處理：在每一組中，將十位品酒員對(duì)每一酒樣品的評(píng)分累加，然后再求均值與方差。第一組紅葡萄酒的樣本得分均值為730.5556，第一組樣本方差為5391.41。第二組紅葡萄酒的樣本均值為705.1481，第二組紅葡萄酒的樣本方差為1582.4

26、39。當(dāng)均值與方差不服從正態(tài)分布時(shí)，由非正態(tài)總體的區(qū)間估計(jì)，設(shè)置信系數(shù)為=95%(其中取)，根據(jù):非正態(tài)整體分布的置信區(qū)間公式:　　(1)　　并查表： =1.96　　可得，第一組與第二組紅葡萄酒樣本總均值的置信區(qū)間分別為：[721.7972,7

27、39.3140]與[700.4031,709.8931]，第二組紅葡萄酒樣本總均值的置信區(qū)間寬度比第一組的置信區(qū)間寬度要窄，容易看出在對(duì)紅葡萄酒的評(píng)價(jià)中，兩組評(píng)酒員的評(píng)價(jià)結(jié)果有顯著性差異，并且第二組的結(jié)果更為可信。同理，再由式(1)及可得，第一組與第二組白葡萄酒樣本均值的置信區(qū)間分別為：[736.5148,748.6994]與[761.6072,769.0356], 由第二組白葡萄酒樣本均值的置信區(qū)間寬度比第一組的置信區(qū)間寬度窄，可知在

28、對(duì)白葡萄酒的評(píng)價(jià)中，兩組評(píng)酒員的評(píng)價(jià)結(jié)果有顯著性差異，并且第二組的結(jié)果更為可信。　　問題一結(jié)果　　綜上,我們得出第一問的結(jié)論為:兩組品酒員的評(píng)價(jià)結(jié)果有顯著性差異，并且第二組結(jié)果更可信。　　問題二的求解<p&g

29、t;　　對(duì)于葡萄酒，由于釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系，而葡萄酒和釀酒葡萄檢測的理化指標(biāo)會(huì)在一定程度上反映葡萄酒和葡萄的質(zhì)量，據(jù)此可根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)。　　模型二分析　　葡萄酒是一種成分復(fù)雜的酒精飲料，不同產(chǎn)地、年份和品種的葡萄酒成分不同。成分與葡萄酒的質(zhì)量關(guān)系密

30、切，是劃分葡萄酒等級(jí)的重要依據(jù)。對(duì)于問題二的求解，可通過葡萄酒的等級(jí)和釀酒葡萄的理化指標(biāo)來對(duì)釀酒葡萄進(jìn)行分級(jí)。　　釀酒葡萄理化指標(biāo)數(shù)據(jù)的可視化質(zhì)量評(píng)估　　5.2.2.1 葡萄酒數(shù)據(jù)　　葡萄酒數(shù)據(jù)包括27個(gè)紅葡萄酒樣本和28個(gè)白葡萄樣本，輸入的變量包括客觀的測試（如花色苷），輸出變量基于感覺數(shù)據(jù)（葡萄酒專家提出的至

31、少3個(gè)評(píng)價(jià)的均值）。每位專家的葡萄酒質(zhì)量分級(jí)介于 0 (極壞的) 和 10 (非常優(yōu)秀)。極好的和極差的葡萄酒的樣本都是少數(shù)，評(píng)價(jià)為中間的葡萄酒樣本最多，因此可以從葡萄酒專家的評(píng)分來確定葡萄酒的質(zhì)量。由問題一的求解已經(jīng)確定第二組品酒師的評(píng)分顯著性差異較小，所以對(duì)葡萄酒的質(zhì)量評(píng)價(jià)可借助于第二組評(píng)酒師的評(píng)分作為依據(jù)建立模型。　　5.2.2.2 釀酒葡萄理化指標(biāo)數(shù)據(jù)<p

32、>　　根據(jù)對(duì)釀酒葡萄理化測試得到的輸入變量為30個(gè)，包括氨基酸總量(mg/100gfw),蛋白質(zhì)(mg/100g),VC含量（mg/L),花色苷(mg/100g),鮮重(g),酒石酸（g/L）,蘋果酸（g/L）,檸檬酸（g/L）,多酚氧化酶活力(（A/min·g·ml）),褐變度(ΔA/g*g*min*ml),DPPH自由基1/IC50（g/L）,總酚(mmol/kg)，單寧(mmol/kg)，葡萄總黃酮（mm

33、ol/kg），白藜蘆醇(mg/kg)，黃酮醇(mg/kg)，總糖（g/L），還原糖（g/L），可溶性固形物（g/l），PH值，可滴定酸（g/l），可滴定酸，干物質(zhì)含量g/100g，果穗質(zhì)量/g，百粒質(zhì)量/g，果梗比(%)，出汁率(%)，果皮質(zhì)量（g），果皮顏色。借助各項(xiàng)理化指標(biāo)可對(duì)釀酒葡萄的質(zhì)量進(jìn)行評(píng)分。　　5.2.2.3 質(zhì)量評(píng)估方法　　隨著信息技術(shù)

34、的進(jìn)展使得搜集、存儲(chǔ)和處理數(shù)據(jù)成為可能。數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)、模式識(shí)別、機(jī)器學(xué)習(xí)等技術(shù)都能在葡萄酒分類中應(yīng)用。復(fù)雜的模型容易過擬合導(dǎo)致泛化能力減弱，模型太簡單導(dǎo)致學(xué)習(xí)能力有限。神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)兩種方法均有參數(shù)可以調(diào)整，能獲得令人滿意的效果。由于釀酒葡萄的理化指標(biāo)參數(shù)為多元數(shù)據(jù)，因此采用圖表示的可視化分類方法可取得比較好的效果。 　　采用圖表示的可視化分類方法，一般使用星點(diǎn)圖 (star

35、 plot) ，又稱雷達(dá)圖或蜘蛛圖，是目前應(yīng)用最廣泛的對(duì)多元數(shù)據(jù)進(jìn)行作圖的方法。由于星點(diǎn)圖是將正交坐標(biāo)軸重新安排為非正交的坐標(biāo)軸，即相交于圓心的徑向坐標(biāo)軸，因此可以在二維平面上同時(shí)顯示多維數(shù)據(jù)。從星點(diǎn)圖的圖表示可以看出，特征排序很重要外，相鄰維之間的角度的作用也重要。星點(diǎn)圖之所以能可視化，就是因?yàn)樾屈c(diǎn)圖要求所有相鄰維之間的角度的總和等于。 　　多維數(shù)據(jù)用圖來表示，可能會(huì)形成有利于視覺上分類或聚

36、類的很有特色的圖形特征。這與傳統(tǒng)的三大特征 (物理特征、結(jié)構(gòu)特征和數(shù)學(xué)特征) 相對(duì)應(yīng)。重心是星點(diǎn)圖多邊形提供的一種圖形特征。從幾何角度看，一個(gè)樣本的星點(diǎn)圖中的每一個(gè)三角形都產(chǎn)生一個(gè)重心。從幾何上講三角形三條中線相交于一點(diǎn)，這個(gè)交點(diǎn)叫做三角形的重心，而且三角形的重心與頂點(diǎn)的距離等于它與對(duì)邊中點(diǎn)的距離的2倍。當(dāng)然也可以利用三角形的重心坐標(biāo)是 3個(gè)頂點(diǎn)坐標(biāo)的平均值的性質(zhì)，計(jì)算的結(jié)果是一樣的。可以把三角形重心稱為重心圖形特征 (維數(shù)與原始特征維

37、數(shù)一樣)。星點(diǎn)圖的重心圖形特征提取方法如下：　　(2)　　其中，和表示詭異化特征樣本的第i維變量和第i+1維變量的值，一般由預(yù)處理計(jì)算得到：弧度為第i維變量和第i+1維變量間的夾角弧度。因此一個(gè)維特征的樣本就會(huì)產(chǎn)生一個(gè)對(duì)應(yīng)的維圖形特征的樣本。這樣特征排序影響重心圖形特征的問題就能夠解決，它轉(zhuǎn)化為一個(gè)特征選擇問題。&l

38、t;/p>　　因此，應(yīng)用貝葉斯理論，這個(gè)規(guī)則表述如下：如果，所有的，那么指定屬于類。這里是類概率密度函數(shù)，是類的先驗(yàn)概率。一般是未知的，需要從訓(xùn)練樣本中估計(jì)。那么第個(gè)樣本得到的結(jié)果就是一個(gè)回歸值，一般這個(gè)回歸值和那個(gè)類別標(biāo)簽距離近，第個(gè)樣本就屬于哪個(gè)類別。提出一種新的方法如下：對(duì)于第個(gè)樣本，利用分類方法得到一個(gè)類別標(biāo)簽，利用回歸方法得到一個(gè)排序的預(yù)測值，如果和的絕對(duì)值小于閾值 1，那么樣本屬于類；否則樣本

39、屬于距離預(yù)測值最近的類。例如，第個(gè)樣本的分類標(biāo)簽=5，排序的預(yù)測值=5.2，那么第個(gè)樣本屬于類別5；第個(gè)樣本的分類標(biāo)簽=5，排序的預(yù)測值=6.2，那么第個(gè)樣本屬于類別6。　　基于以上理論，可用圖表示的可視化分類方法對(duì)釀酒葡萄的理化指標(biāo)進(jìn)行分類，從而達(dá)到對(duì)葡萄的分級(jí)，進(jìn)而來確定釀酒葡萄的理化指標(biāo)與葡萄酒的理化指標(biāo)間的關(guān)系。　　5.2.3 模型的應(yīng)用與求解&

40、lt;/p>　　對(duì)釀酒葡萄的30種理化指標(biāo)分別編號(hào)，以該編號(hào)和釀酒葡萄理化指標(biāo)的含量建立二維直角坐標(biāo)系，并以理化指標(biāo)的編號(hào)為輸入變量，釀酒葡萄理化指標(biāo)的含量為變量值，借助matlab軟件（相應(yīng)的matlab程序見附錄），做出27個(gè)紅葡萄樣本和28個(gè)白葡萄樣本的數(shù)據(jù)可視化平行坐標(biāo)圖。如圖5 紅葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖和圖6 白葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖。　　圖5 紅葡

41、萄數(shù)據(jù)的可視化平行坐標(biāo)圖　　圖6 白葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖　　從圖5和圖6分析所得，對(duì)于同一種葡萄，這幾類數(shù)據(jù)在很多理化性質(zhì)上幾乎相同，只有第1個(gè)變量氨基酸總量和第9個(gè)變量褐變度不同，這說明這兩大理化性質(zhì)大大影響口味。因此要根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)這些釀酒葡萄進(jìn)行分級(jí)，還需結(jié)合第二組品酒師對(duì)葡萄酒樣本的打分和葡萄中氨基酸總量和褐變度來進(jìn)

42、一步對(duì)釀酒葡萄進(jìn)行分級(jí)。相應(yīng)的數(shù)據(jù)見附錄中葡萄中氨基酸與褐變度及相應(yīng)葡萄酒的評(píng)分?jǐn)?shù)據(jù)。　　依以上數(shù)據(jù)，分別作出以葡萄中氨基酸含量（褐變度）和葡萄酒相應(yīng)的評(píng)分建立直角坐標(biāo)系，作出分布圖，如圖7 紅葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖，圖8紅葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖，圖9白葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖，圖10白葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖

43、;　　圖7 紅葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖　　圖8 紅葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖　　通過對(duì)圖5.3和圖5.4的分析，當(dāng)紅葡萄中氨基酸和褐變度含量比較低時(shí)，對(duì)葡萄酒的影響比較低，當(dāng)含量較高時(shí)，可以依據(jù)褐變度（t）對(duì)紅葡萄質(zhì)量（）進(jìn)行分類如下：　　(3

44、)　　其中-1代表釀酒葡萄質(zhì)量較差，0代表釀酒葡萄質(zhì)量中等，1代表釀酒葡萄質(zhì)量較好。　　圖9白葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評(píng)分分布圖　　圖10白葡萄酒中褐變度和葡萄酒相應(yīng)的評(píng)分分布圖　　通過對(duì)圖5.5和圖5.6的分析，得到對(duì)于白葡萄，氨基酸的含量對(duì)

45、其所釀的葡萄的質(zhì)量影響較大，因此可用白葡萄中氨基酸的含量（）來衡量所釀的葡萄酒的質(zhì)量（），具體分類如下：　　其中-1代表釀酒葡萄質(zhì)量較差，0代表釀酒葡萄質(zhì)量中等，1代表釀酒葡萄質(zhì)量較好。　　模型二評(píng)價(jià)　　應(yīng)用以上圖表示可視化分類模型，雖能對(duì)葡萄等級(jí)進(jìn)行分級(jí)，但由于其并沒有考慮

46、釀酒葡萄中各成分理化指標(biāo)的相互關(guān)系及對(duì)所釀葡萄質(zhì)量的影響，所以其模型人具有許多不足之處，需對(duì)釀酒葡萄與葡萄酒的理化指標(biāo)之間聯(lián)系的進(jìn)一步研究來完善該模型。　　問題三的求解　　在分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系時(shí)，本文使用了層次聚類分析和典型相關(guān)分析。

47、　層次聚類分析　　根據(jù)聚類分析的原理可知，它的實(shí)質(zhì)是建立一種分類方法，將一批樣本數(shù)據(jù)按照它們在性質(zhì)上的親密程度在沒有先驗(yàn)知識(shí)的情況下進(jìn)行自動(dòng)分類。這種類就是一個(gè)具有相似性的個(gè)體的集合，不同類之間具有明顯的區(qū)別。　　層次聚類分析是根據(jù)觀察值或變量之間的親疏程度，將最相似的對(duì)象結(jié)合在一起，以逐次聚合的方式將觀察值分類，直到最后所有樣本都聚

48、成一類。由第三問可知，要想分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系，必然要用到附件2-指標(biāo)總表中的大量數(shù)據(jù)，如果不先對(duì)這些樣本進(jìn)行簡化，就很難找到它們之間的內(nèi)在關(guān)系。而R型聚類分析使具有共同特征的變量聚在一起，以便從不同類中分別選出具有代表性的變量作分析，從而減少分析變量的個(gè)數(shù)。　　對(duì)于附件二—指數(shù)總表，我們根據(jù)其中的一級(jí)指標(biāo)（即標(biāo)記為藍(lán)色的）先大致把釀酒葡萄的理化指標(biāo)分為30個(gè)，其中，1為氨基

49、酸總量，2為蛋白質(zhì)，3為VC含量，定義430依次為：花色苷、酒石酸、蘋果酸、檸檬酸、多酚氧化酶活力、褐變度、DPPH自由基、總酚、單寧、葡萄總黃酮、白藜蘆醇、黃酮醇、總糖、還原糖、可溶性固形物、PH值、可滴定酸、干物質(zhì)含量、果穗質(zhì)量、百粒質(zhì)量、果梗比、出汁率、果皮質(zhì)量、果皮顏色。　　定性考察釀酒葡萄的理化指標(biāo)，可以看出，某些指標(biāo)之間可能存在較強(qiáng)的相關(guān)性。比如紅（白）葡萄中的總糖、還原糖與可溶性

50、固行物之間可能存在較強(qiáng)的相關(guān)性，總酚、單寧與葡萄總黃酮之間也可能存在較強(qiáng)的相關(guān)性。為了驗(yàn)證這種想法，運(yùn)用MATLAB軟件計(jì)算紅葡萄30個(gè)一級(jí)指標(biāo)之間的相關(guān)系數(shù)，得到的相關(guān)系數(shù)矩陣如表所示：　　(因樣本的指標(biāo)太多，在此只列出了前十個(gè)指標(biāo)的相關(guān)系數(shù)矩陣，具體完整的相關(guān)系數(shù)矩陣參見附件一中的表格 (3))　　表3: 紅葡萄理化指標(biāo)的相關(guān)系數(shù)矩陣</p&

51、gt;　　可以看出某些指標(biāo)之間確實(shí)存在很強(qiáng)的相關(guān)性，因此可以考慮從這些指標(biāo)中選取幾個(gè)有代表性的指標(biāo)進(jìn)行聚類分析。為此，把三十個(gè)指標(biāo)根據(jù)其相關(guān)性進(jìn)行R型聚類，再從每個(gè)類中選取代表性的指標(biāo)。　　因?yàn)樵诰垲惙治鲋腥绻麉⑴c聚類的變量的量綱不同，就會(huì)導(dǎo)致錯(cuò)誤的聚類結(jié)果。因此在聚類過程進(jìn)行之前必須對(duì)每個(gè)理化指標(biāo)的數(shù)據(jù)分別進(jìn)行標(biāo)準(zhǔn)化處理，以消除量綱的影響。指標(biāo)間相近性度量采用相關(guān)系數(shù)，類

52、間相近性度量的計(jì)算選用類平均法。聚類樹形圖如下圖　　圖 11 紅葡萄指標(biāo)類聚樹形圖　　從紅葡萄指標(biāo)聚類圖中可以看出，可以將紅葡萄的30個(gè)理化指標(biāo)分為八類，分類結(jié)果如下( []中的代表聚為一類)　　[2、10、11、12、13、26]、[4、6、8、9、15、25]、[5、7]、[19、21]、[1、16、17、

53、18、20、22]、[3]、[14、28、29、30]、[23、24、27]　　同理可得，白葡萄的前十個(gè)指標(biāo)的相關(guān)系數(shù)矩陣如下表所示：　　表4: 紅葡萄理化指標(biāo)的相關(guān)系數(shù)矩陣　　圖12 白葡萄指標(biāo)類聚樹形圖　　依據(jù)白葡萄指標(biāo)聚類圖中，同樣可以將白葡萄30個(gè)理化指標(biāo)分為以

54、下八類　　[2、9、11、12、13、15]、[1、6、10、16、17、18、20、22、28、30]、[3、5、25][14]、[23、24、26、27]、[4、8、29]、[7]、[19、21]　　對(duì)比以上得到的兩種釀酒葡萄的指標(biāo)類聚樹形圖和由它們將各自的30種理化指標(biāo)的分類結(jié)果，我們不難發(fā)現(xiàn)，通過對(duì)兩組指標(biāo)分別用R型聚類分析歸類之后，兩種釀酒葡萄

55、的歸類區(qū)間有著明顯的相似度，再結(jié)合它們內(nèi)部的聯(lián)系和所歸的類與類之間的差異，可以得到如下的對(duì)應(yīng)關(guān)系：　　表5:主成分列表　　再通過兩組理化指標(biāo)的相關(guān)系數(shù)可以得出各類的主要指標(biāo)：依次為糖類中的總糖，酚類中的總酚，持久度的酚氧化酶活性，酸度中的蘋果酸，酒精度中的PH值，微量元素VC含量，色度中的白蘆藜醇，果皮質(zhì)地中的果硬比

56、。　　典型相關(guān)分析　　通常情況下，為了研究兩組變量　　， 　　的相關(guān)關(guān)系，可以用最原始的方法，分別計(jì)算兩組變量之間的全部相關(guān)系數(shù)，一共有個(gè)簡單相關(guān)系數(shù)，這樣又繁瑣又不能抓住問題的本質(zhì)。如果能夠采用

57、類似于主成分的思想，分別找出兩組變量的各自的某個(gè)線性組合，討論線性組合之間的相關(guān)關(guān)系，則更簡捷。　　為此，我們可以分別在每組變量中找出第一對(duì)線性組合，使其具有最大相關(guān)性，　　(5) 　　然后再在每組變量中找出第二對(duì)線性組合，使其分別與本組內(nèi)的

58、第一線性組合不相關(guān)，第二對(duì)本身具有次大的相關(guān)性。　　(6)　　與，與不相關(guān)，但和相關(guān)。如此繼續(xù)下去，直到進(jìn)行到步，兩組變量的相關(guān)性提取完為止，可以得到組變量，這里。　　研究兩組隨機(jī)變量之間的相關(guān)關(guān)系，可用復(fù)相關(guān)系數(shù)（也稱全相關(guān)系數(shù)）。

59、　　復(fù)相關(guān)系數(shù)描述兩組隨機(jī)變量與之間的相關(guān)程度。其思想是先將每一組隨機(jī)變量作線性組合，成為兩個(gè)隨機(jī)變量：　　， (7)　　再研究與的相關(guān)系數(shù)。由于，的投影與向量，有關(guān)，所以與，有關(guān)，。我們?nèi)≡诤偷臈l件下使達(dá)到最大的，作為投影向量，這樣得到的相關(guān)系數(shù)為復(fù)相關(guān)系數(shù)：。<p&

60、gt;　　將兩組變量的協(xié)方差矩陣分塊得：　　, (8)　　此時(shí)　　(9)　　因此問題轉(zhuǎn)化為在和的條件下求的極大值。

61、根據(jù)條件極值的求法引入Lagrange乘數(shù)，可將問題轉(zhuǎn)化為求　　(10)　　的極大值，其中，是Lagrange乘數(shù)。　　由極值的必要條件得方程組：　　(11)<p&

62、gt;　　將上二式分別左乘與，則得　　(12)　　注意,所以　　代入方程組得: (13)　　以左乘第二式得，所以<

63、;p>　　代入第一式得　　同理可得　　記　　, (14)　　則得

64、;　　，　　說明既是又是的特征根，就是其相應(yīng)于和的特征向量。和的特征跟非負(fù)，非零特征跟的個(gè)數(shù)等于，不妨設(shè)為。　　設(shè)的特征跟排序?yàn)椋溆鄠€(gè)特征根為0，我們稱為典型相關(guān)系數(shù)。相應(yīng)解出的特征向量為從解出的特征向量為從而可得對(duì)線性組合：　　(15)

65、;　　稱每一對(duì)變量為典型變量。求典型相關(guān)系數(shù)和典型變量歸結(jié)為求和的特征根和特征向量。　　又因?yàn)?，?dāng) 時(shí)， 　　表示一切典型變量都是不相關(guān)的，并且其方差為一，　　其中　　與的同一對(duì)典型變量和之

66、間的相關(guān)系數(shù)為，不同對(duì)的典型變量和（）之間不相關(guān)，即協(xié)方差為0：　　當(dāng)總體的均值向量和協(xié)差陣未知時(shí)，無法求總體的典型相關(guān)系數(shù)和典型變量，因而需要給出樣本的典型相關(guān)系數(shù)和典型變量。　　設(shè)和為來自總體容量為的樣本，這時(shí)，協(xié)差陣的無偏估計(jì)為　　(16)<

67、;p>　　其中，，用代替并按和求出和，，稱為樣本典型相關(guān)系數(shù)，稱，，為樣本的典型變量。　　計(jì)算時(shí)也可從樣本的相關(guān)系數(shù)矩陣出發(fā)求樣本的典型相關(guān)系數(shù)和典型變量，將相關(guān)系數(shù)矩陣取代協(xié)方差陣，計(jì)算過程是一樣的。　　如果復(fù)相關(guān)系數(shù)中一個(gè)變量是一維的，那么也可稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是描述一個(gè)隨機(jī)變量與多個(gè)隨機(jī)變量（一組隨機(jī)變量）之間的關(guān)系。其思想是先將

68、那一組隨機(jī)變量作線性組合，成為一個(gè)隨機(jī)變量：　　(17)　　再研究和的相關(guān)系數(shù)。由于和投影向量有關(guān)，所以與有關(guān)，。我們?nèi)≡诘臈l件下使達(dá)到最大的作為投影向量得到的相關(guān)系數(shù)為偏相關(guān)系數(shù)：　　(18)

69、　其余推導(dǎo)與計(jì)算過程與復(fù)相關(guān)系數(shù)類似。　　5.5 原始變量與典型變量之間的相關(guān)性　　(1)原始變量與典型變量之間的相關(guān)系數(shù)　　設(shè)原始變量相關(guān)系數(shù)矩陣　　典型變量系數(shù)矩陣　　典

70、型變量系數(shù)矩陣　　則有　　(19)　　和的相關(guān)系數(shù)　　(20)<p&g

71、t;　　同理可計(jì)算得　　(21)　　（2）各組原始變量被典型變量所解釋的方差　　組原始變量被解釋的方差比例　　(22)<p&

72、gt;　　組原始變量被解釋的方差比例　　(23)　　組原始變量被解釋的方差比例　　(24)　　組原始變量被解釋的方差比例　　(25)&l

73、t;/b>　　5.5.2 理化指標(biāo)典型相關(guān)分析　　結(jié)合以上的理論的推導(dǎo)結(jié)果，我們嘗試用典型相關(guān)分析來分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。有關(guān)變量見下表　　表6 兩組樣本中的主成分　　參照5.2.1中理論原理，用MATLAB編程即可實(shí)現(xiàn)兩個(gè)樣本之間關(guān)系的評(píng)估，

74、得到釀酒紅葡萄與紅葡萄酒之間的相關(guān)系數(shù)為　　表7:原始指標(biāo)與本組典型變量指標(biāo)之間的相關(guān)系數(shù)　　表8 原始指標(biāo)與本組典型變量指標(biāo)之間的相關(guān)系數(shù)　　表9:原始指標(biāo)與對(duì)應(yīng)組典型變量指標(biāo)之間的相關(guān)系數(shù)　　表10:原始指標(biāo)與對(duì)應(yīng)組典型變量指標(biāo)之間的相關(guān)系數(shù)&

75、lt;p>　　由以上六個(gè)表格可以看出，所有九個(gè)表示釀酒紅葡萄理化指標(biāo)的變量都與有大致相同的相關(guān)系數(shù)，因此可以視為形容葡萄理化特性的指標(biāo)。　　X組的原始變量被解釋的比例為1.000000(即100%)　　Y組的原始變量被解釋的比例為0.923773(即92.4%)　　由此可知，用典型相關(guān)分析來分析釀酒葡萄與

76、葡萄酒的理化指標(biāo)之間的關(guān)系具有較強(qiáng)的說服性和較好的準(zhǔn)確性。　　5.6問題四模型的建立與求解　　5.6.1多元線性回歸模型的建立　　要求解釀酒葡萄和葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響，分別將釀酒葡萄和葡萄酒的各理化指標(biāo)作為自變量，葡萄酒質(zhì)量作為因變量，建立多元線性回歸模型，求解各指標(biāo)的系數(shù)，即權(quán)重。從而研究各指標(biāo)對(duì)

77、葡萄酒質(zhì)量的影響。　　多元線性回歸模型：　　(31)　　5.6.2模型求解　　在第二問中已經(jīng)求解出了釀酒葡萄的主要理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響如下：</p

78、>　　紅葡萄線性回歸模型:　　白葡萄線性回歸模型：　　對(duì)葡萄酒的理化指標(biāo)進(jìn)行相同的分析，分別表示花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積、色澤（L*(D65)）、色澤（a*(D65)）、色澤（b*(D65)）求出葡萄酒的理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響：　　紅葡萄酒各理化指

79、標(biāo)回歸模型：　　白葡萄酒各理化指標(biāo)回歸模型：　　用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量是有一定道理的。葡萄酒質(zhì)量屬性主要指：復(fù)雜性、協(xié)調(diào)性以及能夠激發(fā)消費(fèi)者感情的能力。復(fù)雜性，意味著葡萄酒有濃郁的、令人愉快的香氣與滋味，及它的潛力與精巧性；協(xié)調(diào)性，指各種感官成分的結(jié)合是平衡的，每一種成分與其他成分相比，它的存在及其含量是非常適宜的。同時(shí)，它的復(fù)雜性、

80、顏色強(qiáng)度、香氣、滋味、后味是穩(wěn)定一致的。理化指標(biāo)各物質(zhì)比例合適，達(dá)到一種平衡，葡萄酒的質(zhì)量就高，而求出的各理化指標(biāo)的系數(shù)正是近似合理的搭配比例。物質(zhì)含量使得值越大葡萄酒的質(zhì)量就是越好的，通過所求出的線性相關(guān)關(guān)系，就可近似評(píng)價(jià)酒的質(zhì)量，所以是可以用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量。　　當(dāng)然，感官指標(biāo)是評(píng)價(jià)葡萄酒質(zhì)量的一個(gè)很重要指標(biāo)，但感官指標(biāo)是由附表三中給出的芳香類物質(zhì)造成的，而這些芳香類

81、物質(zhì)也是來源于理化指標(biāo)中的，這樣就可以利用理化指標(biāo)來評(píng)價(jià)葡萄酒的好壞，評(píng)酒師感官的效果是由芳香類物質(zhì)造成的，這樣就建立了理化指標(biāo)和感官指標(biāo)之間的聯(lián)系，就可以直接用理化指標(biāo)來判斷葡萄酒的質(zhì)量。　　5.6.3 模型的評(píng)價(jià)與分析：　　運(yùn)用多元線性回歸模型，求解出了主要量化指標(biāo)的系數(shù)，解決了主要指標(biāo)對(duì)葡萄酒的影響，模型簡單，易于求解，總體上能體現(xiàn)量化指標(biāo)對(duì)葡萄酒

82、質(zhì)量的影響，但有些指標(biāo)被忽略，不能全面的求出各個(gè)指標(biāo)對(duì)葡萄酒質(zhì)量的影響，造成求解出的函數(shù)關(guān)系并不夠準(zhǔn)確。　　在論證用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)葡萄酒的質(zhì)量中，能夠很好的指出量化指標(biāo)與感官指標(biāo)之間的聯(lián)系，但沒有用確切的函數(shù)關(guān)系來表示出來，沒有充分利用起芳香物質(zhì)的橋梁作用，求解出量化指標(biāo)與感官指標(biāo)的函數(shù)關(guān)系。　　6 模型的檢驗(yàn)</b

83、>　　問題一中主要運(yùn)用了統(tǒng)計(jì)學(xué)知識(shí)進(jìn)行數(shù)據(jù)處理，葡萄酒的評(píng)價(jià)結(jié)果由品酒員給出，由于不同的品酒員經(jīng)驗(yàn)不同等主觀與客觀因素的影響，所以不同的評(píng)酒員對(duì)同一樣品酒的評(píng)價(jià)也會(huì)有明顯不同，所以兩組品酒員的評(píng)判結(jié)果有顯著性差異。實(shí)際情況和本問題的求解結(jié)果相符合。問題二給出了釀酒葡萄的30個(gè)理化指標(biāo)，為了有效的對(duì)數(shù)據(jù)進(jìn)行處理，我們篩選出了9個(gè)主要理化指標(biāo)，通過查找資料，我們發(fā)現(xiàn)所求的主要理化指標(biāo)與實(shí)際中影

84、響葡萄品質(zhì)的主要理化指標(biāo)基本相符，這說明我們的模型建立與求解是正確的和符合實(shí)際的。對(duì)釀酒葡萄的分級(jí)，我們主要根據(jù)其能釀出的葡萄酒的好壞決定其分級(jí)，在實(shí)際情況中，一般按地區(qū)，種類等對(duì)葡萄分級(jí)，。問題三研究釀酒葡萄和葡萄酒的理化指標(biāo)之間的聯(lián)系，通過聚類分析和典型相關(guān)分析，以釀酒葡萄的理化指標(biāo)為自變量研究葡萄酒的理化指標(biāo)，發(fā)現(xiàn)葡萄酒的理化指標(biāo)主要受釀酒葡萄里相同的理化指標(biāo)影響，但也受其他個(gè)別理化指標(biāo)的影響。這是和假設(shè)即實(shí)際情況相符合的。問題四

85、的求解有一部分是和問題二相同的。當(dāng)然無論是釀酒葡萄的理化指標(biāo)還是葡萄酒的理化指標(biāo)與葡萄酒質(zhì)量的聯(lián)系既存在相關(guān)項(xiàng)，也有負(fù)相關(guān)項(xiàng)，這是與實(shí)際一致的。用葡萄和葡萄酒的理化指標(biāo)來評(píng)價(jià)　　7 模型的推廣　　為了更好地評(píng)價(jià)葡萄酒的質(zhì)量，可以從釀酒葡萄開始研究。在模型四中說明了釀酒葡萄主要理化指標(biāo)對(duì)葡萄酒質(zhì)量的影響，我們可以通過研

86、究釀酒葡萄的成分來判斷葡萄酒的質(zhì)量，但這是建立在外界條件一定的情況下。對(duì)于實(shí)際問題，我們不僅要考慮釀酒葡萄原料的理化指標(biāo)，葡萄酒的生產(chǎn)工藝也是決定葡萄酒好壞的必要條件。為了使模型更具說服性，可加上生產(chǎn)工藝這一必要因素，并確定其權(quán)重系數(shù)，即：　　葡萄酒的質(zhì)量=釀酒葡萄的質(zhì)量*生產(chǎn)工藝權(quán)重。　　由于人口味不同，對(duì)葡萄酒的評(píng)價(jià)也各有取向，這使得對(duì)葡萄酒質(zhì)量的客

87、觀評(píng)價(jià)不嚴(yán)謹(jǐn)，摻雜著個(gè)人主觀因素。隨著科學(xué)技術(shù)的進(jìn)步，影響葡萄酒質(zhì)量的釀酒葡萄理化成分的確定會(huì)更趨完善，運(yùn)用逐步回歸分析法選出對(duì)葡萄酒質(zhì)量影響較大的因素，確定其權(quán)值，這樣可以確定釀酒葡萄的質(zhì)量。同時(shí)，在培養(yǎng)葡萄時(shí)，可注重這些因素含量的控制，提高釀酒葡萄的質(zhì)量。　　而車間的流水作業(yè)的完善，可使得生產(chǎn)工藝穩(wěn)定，即生產(chǎn)工藝權(quán)重變化不大，這時(shí)，葡萄酒的質(zhì)量就取決于釀酒葡萄的理化指標(biāo)。

88、;　　8 參考文獻(xiàn)　　[1] 王松桂，張忠占，程維虎，高旅端，概率論與數(shù)理統(tǒng)計(jì)，科學(xué)出版社，2006.8。　　[2] 王金甲，尹濤，李靜，洪文學(xué)，馬崇霄，基于物理化學(xué)性質(zhì)的葡萄酒質(zhì)量的可視化評(píng)價(jià)研究，《燕山大學(xué)學(xué)報(bào)》，第34卷第2期：134-136，2010.3。<

89、p>　　[3] 李云，李記明，姜忠軍，統(tǒng)計(jì)分析在葡萄酒質(zhì)量評(píng)價(jià)中的應(yīng)用，釀酒科技，第四期：79-82，2009。　　[4] 李新蕊，主成分分析、因子分析、聚類分析的比較與應(yīng)用，《山東教育學(xué)院學(xué)報(bào)》，第六期：24-26,2007。　　[5] 章紹輝，數(shù)學(xué)建模，科學(xué)出版社，2010。　　附件

90、1　　1、問題二的繪圖程序：　　function nn　　r=load('d://red data.txt');%由red data文件中讀入紅葡萄的理化指標(biāo)　　w=load('d://white data.txt');

91、%由red data文件中讀入紅葡萄的理化指標(biāo)　　for i=1:27 %選取紅葡萄所給樣本中的任意一個(gè)樣本　　a=[]; b=[];　　for j=1:30; %選取紅葡萄所選樣本中的所有理化指標(biāo)　　b(j)=j;

92、;　　a(j)=r(i,j); 　　end　　plot(b,a) %繪制所選紅葡萄樣本的可視化平行坐標(biāo)圖　　hold on<b

93、>　　end　　title('紅葡萄酒數(shù)據(jù)的可視化平行坐標(biāo)圖');　　xlabel('輸入變量');　　ylabel('變量值');　　for q=1:28 %選取白葡萄所給樣本中的任意

94、一個(gè)樣本　　x=[]; v=[];　　for s=1:30; %選取白葡萄所選樣本中的所有理化指標(biāo)　　v(s)=s;　　x(s)=w(q,s); 　　end&l

95、t;/b>　　figure(2)　　plot(v,x) %繪制所選白葡萄樣本的可視化平行坐標(biāo)圖　　hold on　　end

96、　　title('白葡萄酒數(shù)據(jù)的可視化平行坐標(biāo)圖');　　xlabel('輸入變量');　　ylabel('變量值');　　y=load('d://red.txt');%由red文件讀取第二組品酒員對(duì)紅葡萄酒的打分

97、;　　x=load('d://white.txt');%由white文件讀取第二組品酒員對(duì)白葡萄酒的打分　　for f=1:27　　figure(3) 　　plot(f,y(f,2),'*r')

98、hold on　　end　　hold on　　for k=1:28　　plot(k,x(k,2),'^b')%繪制葡萄酒質(zhì)量品嘗得分圖&

99、lt;p>　　hold on　　end　　title('葡萄酒質(zhì)量品嘗得分圖');　　xlabel('樣本編號(hào)');　　ylabel('葡萄酒品嘗得分

100、');　　end　　2、問題三的聚類法求相關(guān)系數(shù)和繪制聚類樹狀圖的程序：　　M=load('G:\hptzb.txt'); %把原始數(shù)據(jù)保存到純文本hptzb.txt中　　r=corrcoef(M) %計(jì)

101、算相關(guān)系數(shù)矩陣　　d=1-r; %進(jìn)行數(shù)據(jù)變換，吧相關(guān)系數(shù)轉(zhuǎn)化為距離　　d=tril(d); %取出d的下三角元素　　d=nonzeros(d); %取出非零元素　　d=d'; %化為行向量　　z=linkage(

102、d,'average'); %按類平均法聚類　　dendrogram(z); %畫類聚圖　　T=cluster(z,'maxclust',8) %把變量劃分為9類　　for i=1:8　　tm=f

103、ind(T==i) %求第i類的對(duì)象　　tm=reshape(tm,1,length(tm)); %變成行向量　　fprintf('第%d類的有%s\n',i,int2str(tm)); %顯示分類結(jié)果　　end

104、　　3、問題三的典型相關(guān)分析求兩組樣本的相關(guān)系數(shù)及解釋率的程序：　　M=load ('G:\r.txt'); %把原始矩陣保存在純文本文件r.txt中　　M=zscore(M); %把原始矩陣進(jìn)行標(biāo)準(zhǔn)化　　fprintf('相關(guān)系數(shù)矩陣:\n')<p

105、>　　r=corrcoef(M) %計(jì)算相關(guān)系數(shù)矩陣　　n1=8;n2=9;num=min(n1,n2);　　s1=r(1:n1,1:n1); %提出X與X的相關(guān)系數(shù)　　s12=r(1:n1,n1+1:end); %提出X與Y的相關(guān)系數(shù)　　s21=s12'

106、;; %提出Y與X的相關(guān)系數(shù)　　s2=r(n1+1:end,n1+1:end); %提出Y與Y的相關(guān)系數(shù)　　m1=inv(s1)*s12*inv(s2)*s21; %計(jì)算矩陣M1　　m2=inv(s2)*s21*inv(s1)*s12; %計(jì)算矩陣M2　　[vec1,va

107、l1]=eig(m1); %求M1的特征向量和特征值　　for i=1:n1　　vec1(:,i)=vec1(:,i)/sqrt(vec1(:,i)'*s1*vec1(:,i)); %特征向量歸一化，滿足a's1a=1　　vec1(:,i)=vec1(:,i)/sign(sum(vec1(:,i)

108、)); %特征向量乘以1或－1，保證所有分量和為正　　end　　val1=sqrt(diag(val1)); %計(jì)算特征值的平方根　　[val1,ind1]=sort(val1,'descend'); %按照從大到小排列<p

109、>　　a=vec1(:,ind1(1:num)) %取出X組的系數(shù)陣　　dcoef1=val1(1:num) %提出典型相關(guān)系數(shù)　　flag=1; %把計(jì)算結(jié)果寫到Excel中的行計(jì)數(shù)變量　　xlswrite('bk.xls',a,'Sheet1','A1&#

110、39;) %把計(jì)算結(jié)果寫到Excel文件中去　　flag=n1+2; str=char(['A',int2str(flag)]); %str為Excel中寫數(shù)據(jù)的起始位置　　xlswrite('bk.xls',dcoef1','Sheet1',str)

111、[vec2,val2]=eig(m2);　　for i=1:n2　　vec2(:,i)=vec2(:,i)/sqrt(vec2(:,i)'*s2*vec2(:,i)); %特征向量歸一化，滿足b's2b=1　　vec2(:,i)=vec2(:,i)/sign(sum(vec2(:,i))); %特

112、征向量乘以1或－1，保證所有分量和為正　　end　　val2=sqrt(diag(val2)); %計(jì)算特征值的平方根　　[val2,ind2]=sort(val2,'descend'); %按照從大到小排列

113、b=vec2(:,ind2(1:num)) %取出Y組的系數(shù)陣　　dcoef2=val2(1:num) %提出典型相關(guān)系數(shù)　　flag=flag+2; str=char(['A',int2str(flag)]); %str為Excel中寫數(shù)據(jù)的起始位置　　xlswrite('bk.

114、xls',b,'Sheet1',str)　　flag=flag+n2+1; str=char(['A',int2str(flag)]); %str為Excel中寫數(shù)據(jù)的起始位置　　xlswrite('bk.xls',dcoef2','Sheet1',str)

115、;　　x_u_r=s1*a %x,u的相關(guān)系數(shù)　　y_v_r=s2*b %y,v的相關(guān)系數(shù)　　x_v_r=s12*b %x,v的相關(guān)系數(shù)　　y_u_r=s21*a %y,u的相關(guān)系數(shù)　　flag=flag+2; str=char(

116、['A',int2str(flag)]);　　xlswrite('bk.xls',x_u_r,'Sheet1',str)　　flag=flag+n1+1; str=char(['A',int2str(flag)]);　　xlswrite('b

117、k.xls',y_v_r,'Sheet1',str)　　flag=flag+n2+1; str=char(['A',int2str(flag)]);　　xlswrite('bk.xls',x_v_r,'Sheet1',str)　　flag=f

118、lag+n1+1; str=char(['A',int2str(flag)]);　　xlswrite('bk.xls',y_u_r,'Sheet1',str)　　mu=sum(x_u_r.^2)/n1 %x組原始變量被解釋的方差比例　　mv=sum(x_v_r.^

119、2)/n1 %x組原始變量被解釋的方差比例　　nu=sum(y_u_r.^2)/n2 %y組原始變量被解釋的方差比例　　nv=sum(y_v_r.^2)/n2 %y組原始變量被解釋的方差比例　　fprintf('X組的原始變量被u1~u%d解釋的比例為%f\n',num,sum(mu));&

120、lt;/p>　　fprintf('Y組的原始變量被v1~v%d解釋的比例為%f\n',num,sum(nv));　　4、問題四的線性回歸的MATLAB程序：　　load('G:\hptzb.txt'); %把原始數(shù)據(jù)保存到純文本hptzb.txt中

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

葡萄酒的評(píng)價(jià)數(shù)學(xué)建模論文

文檔簡介

溫馨提示

最新文檔

評(píng)論

葡萄酒的評(píng)價(jià)數(shù)學(xué)建模論文

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載