版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p> 2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽</p><p><b> 承 諾 書</b></p><p> 我們仔細(xì)閱讀了中國大學(xué)生數(shù)學(xué)建模競賽的競賽規(guī)則.</p><p> 我們完全明白,在競賽開始后參賽隊員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。&
2、lt;/p><p> 我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。</p><p> 我們鄭重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴(yán)肅處理。</p><p> 我們授權(quán)全國大學(xué)生數(shù)學(xué)建模競賽組委
3、會,可將我們的論文以任何形式進(jìn)行公開展示(包括進(jìn)行網(wǎng)上公示,在書籍、期刊和其他媒體進(jìn)行正式或非正式發(fā)表等)。</p><p> 我們參賽選擇的題號是(從A/B/C/D中選擇一項填寫): A </p><p> 我們的參賽報名號為(如果賽區(qū)設(shè)置報名號的話): </p><p&
4、gt; 所屬學(xué)校(請?zhí)顚懲暾娜?蘭州理工大學(xué) </p><p> 參賽隊員 (打印并簽名) :1. 楊自升 </p><p> 2. 韓向東
5、 </p><p> 3. 吳林峰 </p><p> 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): 汪訓(xùn)洋 陳金淑 </p><p> 日期:2012年9月10日</p>
6、;<p> 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進(jìn)行編號):</p><p> 2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽</p><p><b> 編 號 專 用 頁</b></p><p> 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進(jìn)行編號):</p><p> 賽區(qū)評閱記錄(可供賽區(qū)評閱時使用):</
7、p><p> 全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):</p><p> 全國評閱編號(由全國組委會評閱前進(jìn)行編號):</p><p><b> 葡萄酒的評價</b></p><p><b> 摘 要</b></p><p> 評判葡萄酒質(zhì)量時一般是通過聘請一批有資
8、質(zhì)的評酒員進(jìn)行品評。每個評酒員對葡萄酒樣品進(jìn)行品嘗后對其分類指標(biāo)打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標(biāo)會在一定程度上反映葡萄酒和葡萄的質(zhì)量。</p><p> 本文就葡萄酒質(zhì)量的評價問題進(jìn)行分析研究,針對如何對釀酒葡萄進(jìn)行分級,釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系,以及釀酒葡萄與葡萄酒的理化指標(biāo)對葡萄酒的質(zhì)量的影響等問題,建立
9、了相應(yīng)的數(shù)學(xué)模型,并運用EXCEL、MATLAB等數(shù)學(xué)軟件,分別就題目所提出的問題進(jìn)行求解。</p><p> 對于問題一,我們采用的是假設(shè)檢驗方法,得到了兩組評酒員的評價結(jié)果有顯著性差異,并且第二組結(jié)果更可信。</p><p> 對于問題二,我們應(yīng)用了圖表示可視化分類方法,并利用附件二中的數(shù)據(jù)得到了釀酒葡萄理化指標(biāo)中的兩種起決定性作用的主成分,即為氨基酸總量與褐變度,從而確定了葡萄酒
10、的質(zhì)量與釀酒葡萄理化指標(biāo)之間的關(guān)系,最后將釀酒葡萄分成了三個等級。</p><p> 對于問題三,通過聚類分析和典型相關(guān)分析來確定釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系。為了能夠在海量數(shù)據(jù)中找到兩個樣本之間的內(nèi)在聯(lián)系,我們先通過聚類分析對釀酒葡萄的理化指標(biāo)進(jìn)行分類如下表所示:(數(shù)字代表的含義見正文)</p><p> 再對簡化后的兩組樣本進(jìn)行典型相關(guān)分析,得到兩種樣本指標(biāo)被對方解釋的比例
11、分別達(dá)到了100%和92.4%,較好的反映了釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系。</p><p> 對于問題四,我們應(yīng)用多元線性回歸模型進(jìn)行了定性分析,論證了用葡萄和葡萄酒的理化指標(biāo)可以評價葡萄酒的質(zhì)量。</p><p> 關(guān)鍵詞:葡萄酒評價 假設(shè)檢驗 可視化分類 聚類分析 典型相關(guān)分析 多元線性回歸</p><p><b> 問題重述</
12、b></p><p><b> 背景資料與條件</b></p><p> 確定葡萄酒質(zhì)量時一般是通過聘請一批有資質(zhì)的評酒員進(jìn)行品評。每個評酒員在對葡萄酒進(jìn)行品嘗后對其分類指標(biāo)打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標(biāo)會在一定程度上反映葡萄酒和葡萄的質(zhì)量。</p>
13、<p><b> 需要解決的問題</b></p><p> 1. 分析附件1中兩組評酒員的評價結(jié)果有無顯著性差異,哪一組結(jié)果更可信?</p><p> 2. 根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級。</p><p> 3. 分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。</p><p>
14、 4.分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來評價葡萄酒的質(zhì)量?</p><p><b> 問題分析</b></p><p> 問題的重要性分析(社會背景)</p><p> 眾所周知,葡萄酒質(zhì)量的好壞,主要靠感官品嘗和理化指標(biāo)分析的方法來確定。目前我國規(guī)定,對葡萄酒的感官品嘗主要從色澤,香
15、氣,口味,風(fēng)格四個方面進(jìn)行品評,而品評往往受到評酒人員的嗜好,習(xí)慣, 情緒,年齡,經(jīng)驗等因素的影響,評定常有一定程度的主觀性和不確定性,這使評分的可靠性受到影響。如何解決以上一系列問題變得非常重要。 </p><p> 有關(guān)方面在這個問題上做過的研究</p><p> 現(xiàn)有文獻(xiàn)中大部分都從葡萄酒和釀酒葡萄的物理化學(xué)屬性方面進(jìn)行研究,一般只得到定性結(jié)果,很少見到定量具體分析
16、,不利于葡萄酒質(zhì)量的控制與提高。本文基于對所給三個附件數(shù)據(jù)的處理和分析,針對各具體問題提出了若干數(shù)學(xué)模型得到了較為滿意的解答。</p><p><b> 基本假設(shè)</b></p><p><b> 模型一假設(shè)</b></p><p> 假設(shè)一:假設(shè)各個評酒員的評判結(jié)果相互獨立;</p><p>
17、; 假設(shè)二:假設(shè)樣本數(shù)據(jù)不滿足正態(tài)分布;</p><p><b> 模型二假設(shè)</b></p><p> 假設(shè)一:假設(shè)同一樣本中各種成分相互獨立;</p><p> 假設(shè)二:假設(shè)附件二中的釀酒葡萄理化指標(biāo)的二級指標(biāo)影響較?。?lt;/p><p> 本文引用數(shù)據(jù)、資料均真實可靠。</p><p&g
18、t;<b> 符號說明</b></p><p><b> 模型一符號說明</b></p><p><b> ?。罕硎倦S機變量;</b></p><p><b> ?。罕硎緲颖揪担?lt;/b></p><p><b> ?。罕硎緲颖痉讲睿?lt;
19、/b></p><p><b> ?。罕硎緲颖救萘?;</b></p><p> ?。罕硎踞劸萍t葡萄的對應(yīng)的分級指標(biāo);</p><p> ?。罕硎踞劸瓢灼咸训膶?yīng)的分級指標(biāo);</p><p> :釀酒葡萄的主成分指標(biāo)</p><p><b> ?。浩咸丫频睦砘笜?biāo)</b>
20、;</p><p> ?。横劸破咸训牡湫妥兞?lt;/p><p><b> ?。浩咸丫频牡湫妥兞?lt;/b></p><p><b> 模型的建立與求解</b></p><p><b> 問題一的求解</b></p><p><b> 模型一概述
21、</b></p><p> 非正態(tài)總體區(qū)間估計:</p><p><b> 模型一的運用與求解</b></p><p> 附件一所給的四個表格分別為:第一組為紅葡萄酒品嘗評分,第二組為紅葡萄酒品嘗評分。其中紅葡萄酒有27組樣品。另外的一組為白葡萄酒品嘗評分,另外的第二組為白葡萄酒品嘗評分。其中白葡萄酒有28組樣品。</p
22、><p> 品酒員無論對紅葡萄酒樣品,還是白葡萄酒樣品的評分,都是以100分為基準(zhǔn),其中,外觀分析占有15分(澄清度:5分,色調(diào):10分),香氣分析占有30分(純正度:6分,濃度:8分,質(zhì)量:16分),口感分析占有44分(純正度:6分,濃度:8分,持久性:8分,質(zhì)量:22分),平衡/整體評價占有11分。評酒員通過對樣品不同指標(biāo)的評分,然后累加為此樣品的最終得分。</p><p> 通過對紅
23、葡萄酒,白葡萄酒,每組樣品最終得分的均值與方差的求解得到下表所示結(jié)果:</p><p> 表1: 紅、白葡萄酒品嘗評分的均值與方差</p><p> 通過觀察兩表數(shù)據(jù)我們發(fā)現(xiàn)兩組紅葡萄酒的得分均值近似相等,兩組白葡萄酒的得分均值也近似相等。而通過兩組紅葡萄酒得分方差的比較,我們發(fā)現(xiàn),第一組紅葡萄酒得分的方差波動明顯比第二組的大。同樣,通過對兩組白葡萄酒得分的方差的比較,我們進(jìn)一步發(fā)現(xiàn),
24、第一組白葡萄酒得分的方差波動明顯比第二組的大。</p><p> 應(yīng)用Excel軟件,以及數(shù)據(jù)擬合,我們得到以上四組樣本的均值與方差的柱形圖如下:</p><p> 圖1:兩組紅葡萄酒均值比較的柱形圖</p><p> 圖2:兩組紅葡萄酒方差比較的柱形圖</p><p> 圖3:兩組白葡萄酒均值比較的柱形圖</p>&l
25、t;p> 圖4:兩組白葡萄酒方差比較的柱形圖</p><p> 通過對圖形的直觀觀察我們發(fā)現(xiàn):均值與方差并不服從正態(tài)分布。于是,我們對所有紅葡萄酒與白葡萄酒品嘗評分做如下處理:在每一組中,將十位品酒員對每一酒樣品的評分累加,然后再求均值與方差。第一組紅葡萄酒的樣本得分均值為730.5556,第一組樣本方差為5391.41。第二組紅葡萄酒的樣本均值為705.1481,第二組紅葡萄酒的樣本方差為1582.4
26、39。當(dāng)均值與方差不服從正態(tài)分布時,由非正態(tài)總體的區(qū)間估計,設(shè)置信系數(shù)為=95%(其中取),根據(jù):非正態(tài)整體分布的置信區(qū)間公式:</p><p><b> (1)</b></p><p> 并查表: =1.96</p><p> 可得,第一組與第二組紅葡萄酒樣本總均值的置信區(qū)間分別為:[721.7972,7
27、39.3140]與[700.4031,709.8931],第二組紅葡萄酒樣本總均值的置信區(qū)間寬度比第一組的置信區(qū)間寬度要窄,容易看出在對紅葡萄酒的評價中,兩組評酒員的評價結(jié)果有顯著性差異,并且第二組的結(jié)果更為可信。同理,再由式(1)及可得,第一組與第二組白葡萄酒樣本均值的置信區(qū)間分別為:[736.5148,748.6994]與[761.6072,769.0356], 由第二組白葡萄酒樣本均值的置信區(qū)間寬度比第一組的置信區(qū)間寬度窄,可知在
28、對白葡萄酒的評價中,兩組評酒員的評價結(jié)果有顯著性差異,并且第二組的結(jié)果更為可信。</p><p><b> 問題一結(jié)果</b></p><p> 綜上,我們得出第一問的結(jié)論為:兩組品酒員的評價結(jié)果有顯著性差異,并且第二組結(jié)果更可信。</p><p><b> 問題二的求解</b></p><p&g
29、t; 對于葡萄酒,由于釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,而葡萄酒和釀酒葡萄檢測的理化指標(biāo)會在一定程度上反映葡萄酒和葡萄的質(zhì)量,據(jù)此可根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級。</p><p><b> 模型二分析</b></p><p> 葡萄酒是一種成分復(fù)雜的酒精飲料,不同產(chǎn)地、年份和品種的葡萄酒成分不同。成分與葡萄酒的質(zhì)量關(guān)系密
30、切,是劃分葡萄酒等級的重要依據(jù)。對于問題二的求解,可通過葡萄酒的等級和釀酒葡萄的理化指標(biāo)來對釀酒葡萄進(jìn)行分級。</p><p> 釀酒葡萄理化指標(biāo)數(shù)據(jù)的可視化質(zhì)量評估</p><p> 5.2.2.1 葡萄酒數(shù)據(jù)</p><p> 葡萄酒數(shù)據(jù)包括27個紅葡萄酒樣本和28個白葡萄樣本,輸入的變量包括客觀的測試(如花色苷),輸出變量基于感覺數(shù)據(jù)(葡萄酒專家提出的至
31、少3個評價的均值)。每位專家的葡萄酒質(zhì)量分級介于 0 (極壞的) 和 10 (非常優(yōu)秀)。極好的和極差的葡萄酒的樣本都是少數(shù), 評價為中間的葡萄酒樣本最多,因此可以從葡萄酒專家的評分來確定葡萄酒的質(zhì)量。由問題一的求解已經(jīng)確定第二組品酒師的評分顯著性差異較小,所以對葡萄酒的質(zhì)量評價可借助于第二組評酒師的評分作為依據(jù)建立模型。</p><p> 5.2.2.2 釀酒葡萄理化指標(biāo)數(shù)據(jù)</p><p
32、> 根據(jù)對釀酒葡萄理化測試得到的輸入變量為30個,包括氨基酸總量(mg/100gfw),蛋白質(zhì)(mg/100g),VC含量(mg/L),花色苷(mg/100g),鮮重(g),酒石酸(g/L),蘋果酸(g/L),檸檬酸(g/L),多酚氧化酶活力((A/min·g·ml)),褐變度(ΔA/g*g*min*ml),DPPH自由基1/IC50(g/L),總酚(mmol/kg),單寧(mmol/kg),葡萄總黃酮(mm
33、ol/kg),白藜蘆醇(mg/kg),黃酮醇(mg/kg),總糖(g/L),還原糖(g/L),可溶性固形物(g/l),PH值,可滴定酸(g/l),可滴定酸,干物質(zhì)含量g/100g,果穗質(zhì)量/g,百粒質(zhì)量/g,果梗比(%),出汁率(%),果皮質(zhì)量(g),果皮顏色。借助各項理化指標(biāo)可對釀酒葡萄的質(zhì)量進(jìn)行評分。</p><p> 5.2.2.3 質(zhì)量評估方法</p><p> 隨著信息技術(shù)
34、的進(jìn)展使得搜集、 存儲和處理數(shù)據(jù)成為可能。數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)、模式識別、機器學(xué)習(xí)等技術(shù)都能在葡萄酒分類中應(yīng)用。 復(fù)雜的模型容易過擬合導(dǎo)致泛化能力減弱, 模型太簡單導(dǎo)致學(xué)習(xí)能力有限。神經(jīng)網(wǎng)絡(luò)、支持向量機兩種方法均有參數(shù)可以調(diào)整,能獲得令人滿意的效果。由于釀酒葡萄的理化指標(biāo)參數(shù)為多元數(shù)據(jù),因此采用圖表示的可視化分類方法可取得比較好的效果。 </p><p> 采用圖表示的可視化分類方法,一般使用星點圖 (star
35、 plot) ,又稱雷達(dá)圖或蜘蛛圖,是目前應(yīng)用最廣泛的對多元數(shù)據(jù)進(jìn)行作圖的方法。由于星點圖是將正交坐標(biāo)軸重新安排為非正交的坐標(biāo)軸,即相交于圓心的徑向坐標(biāo)軸,因此可以在二維平面上同時顯示多維數(shù)據(jù)。 從星點圖的圖表示可以看出,特征排序很重要外,相鄰維之間的角度的作用也重要。星點圖之所以能可視化,就是因為星點圖要求所有相鄰維之間的角度的總和等于。 </p><p> 多維數(shù)據(jù)用圖來表示,可能會形成有利于視覺上分類或聚
36、類的很有特色的圖形特征。這與傳統(tǒng)的三大特征 (物理特征、結(jié)構(gòu)特征和數(shù)學(xué)特征) 相對應(yīng)。重心是星點圖多邊形提供的一種圖形特征。從幾何角度看,一個樣本的星點圖中的每一個三角形都產(chǎn)生一個重心。從幾何上講三角形三條中線相交于一點,這個交點叫做三角形的重心,而且三角形的重心與頂點的距離等于它與對邊中點的距離的2倍。當(dāng)然也可以利用三角形的重心坐標(biāo)是 3個頂點坐標(biāo)的平均值的性質(zhì),計算的結(jié)果是一樣的??梢园讶切沃匦姆Q為重心圖形特征 (維數(shù)與原始特征維
37、數(shù)一樣)。星點圖的重心圖形特征提取方法如下:</p><p><b> (2)</b></p><p> 其中,和表示詭異化特征樣本的第i維變量和第i+1維變量的值,一般由預(yù)處理計算得到:弧度為第i維變量和第i+1維變量間的夾角弧度。因此一個維特征的樣本就會產(chǎn)生一個對應(yīng)的維圖形特征的樣本。這樣特征排序影響重心圖形特征的問題就能夠解決,它轉(zhuǎn)化為一個特征選擇問題。&l
38、t;/p><p> 因此,應(yīng)用貝葉斯理論,這個規(guī)則表述如下:如果,所有的,那么指定屬于類。這里是類概率密度函數(shù),是類的先驗概率。一般是未知的,需要從訓(xùn)練樣本中估計。那么第個樣本得到的結(jié)果就是一個回歸值,一般這個回歸值和那個類別標(biāo)簽距離近,第個樣本就屬于哪個類別。提出一種新的方法如下:對于第個樣本,利用分類方法得到一個類別標(biāo)簽,利用回歸方法得到一個排序的預(yù)測值 ,如果和 的絕對值小于閾值 1,那么樣本屬于類;否則樣本
39、屬于距離預(yù)測值最近的類。例如,第個樣本的分類標(biāo)簽=5,排序的預(yù)測值=5.2,那么第個樣本屬于類別5;第個樣本的分類標(biāo)簽=5,排序的預(yù)測值=6.2,那么第個樣本屬于類別6。</p><p> 基于以上理論,可用圖表示的可視化分類方法對釀酒葡萄的理化指標(biāo)進(jìn)行分類,從而達(dá)到對葡萄的分級,進(jìn)而來確定釀酒葡萄的理化指標(biāo)與葡萄酒的理化指標(biāo)間的關(guān)系。</p><p> 5.2.3 模型的應(yīng)用與求解&
40、lt;/p><p> 對釀酒葡萄的30種理化指標(biāo)分別編號,以該編號和釀酒葡萄理化指標(biāo)的含量建立二維直角坐標(biāo)系,并以理化指標(biāo)的編號為輸入變量,釀酒葡萄理化指標(biāo)的含量為變量值,借助matlab軟件(相應(yīng)的matlab程序見附錄),做出27個紅葡萄樣本和28個白葡萄樣本的數(shù)據(jù)可視化平行坐標(biāo)圖。如圖5 紅葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖和圖6 白葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖。</p><p> 圖5 紅葡
41、萄數(shù)據(jù)的可視化平行坐標(biāo)圖</p><p> 圖6 白葡萄數(shù)據(jù)的可視化平行坐標(biāo)圖</p><p> 從圖5和圖6分析所得,對于同一種葡萄,這幾類數(shù)據(jù)在很多理化性質(zhì)上幾乎相同,只有第1個變量氨基酸總量和第9個變量褐變度不同,這說明這兩大理化性質(zhì)大大影響口味。因此要根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級,還需結(jié)合第二組品酒師對葡萄酒樣本的打分和葡萄中氨基酸總量和褐變度來進(jìn)
42、一步對釀酒葡萄進(jìn)行分級。相應(yīng)的數(shù)據(jù)見附錄中葡萄中氨基酸與褐變度及相應(yīng)葡萄酒的評分?jǐn)?shù)據(jù)。</p><p> 依以上數(shù)據(jù),分別作出以葡萄中氨基酸含量(褐變度)和葡萄酒相應(yīng)的評分建立直角坐標(biāo)系,作出分布圖,如圖7 紅葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評分分布圖,圖8紅葡萄酒中褐變度和葡萄酒相應(yīng)的評分分布圖,圖9白葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評分分布圖,圖10白葡萄酒中褐變度和葡萄酒相應(yīng)的評分分布圖</p>
43、;<p> 圖7 紅葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評分分布圖</p><p> 圖8 紅葡萄酒中褐變度和葡萄酒相應(yīng)的評分分布圖</p><p> 通過對圖5.3和圖5.4的分析,當(dāng)紅葡萄中氨基酸和褐變度含量比較低時,對葡萄酒的影響比較低,當(dāng)含量較高時,可以依據(jù)褐變度(t)對紅葡萄質(zhì)量()進(jìn)行分類如下:</p><p><b> (3
44、)</b></p><p> 其中-1代表釀酒葡萄質(zhì)量較差,0代表釀酒葡萄質(zhì)量中等,1代表釀酒葡萄質(zhì)量較好。</p><p> 圖9白葡萄酒中氨基酸含量和葡萄酒相應(yīng)的評分分布圖</p><p> 圖10白葡萄酒中褐變度和葡萄酒相應(yīng)的評分分布圖</p><p> 通過對圖5.5和圖5.6的分析,得到對于白葡萄,氨基酸的含量對
45、其所釀的葡萄的質(zhì)量影響較大,因此可用白葡萄中氨基酸的含量()來衡量所釀的葡萄酒的質(zhì)量(),具體分類如下:</p><p> 其中-1代表釀酒葡萄質(zhì)量較差,0代表釀酒葡萄質(zhì)量中等,1代表釀酒葡萄質(zhì)量較好。</p><p><b> 模型二評價</b></p><p> 應(yīng)用以上圖表示可視化分類模型,雖能對葡萄等級進(jìn)行分級,但由于其并沒有考慮
46、釀酒葡萄中各成分理化指標(biāo)的相互關(guān)系及對所釀葡萄質(zhì)量的影響,所以其模型人具有許多不足之處,需對釀酒葡萄與葡萄酒的理化指標(biāo)之間聯(lián)系的進(jìn)一步研究來完善該模型。</p><p><b> 問題三的求解</b></p><p> 在分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的關(guān)系時,本文使用了層次聚類分析和典型相關(guān)分析。</p><p><b>
47、 層次聚類分析</b></p><p> 根據(jù)聚類分析的原理可知,它的實質(zhì)是建立一種分類方法,將一批樣本數(shù)據(jù)按照它們在性質(zhì)上的親密程度在沒有先驗知識的情況下進(jìn)行自動分類。這種類就是一個具有相似性的個體的集合,不同類之間具有明顯的區(qū)別。</p><p> 層次聚類分析是根據(jù)觀察值或變量之間的親疏程度,將最相似的對象結(jié)合在一起,以逐次聚合的方式將觀察值分類,直到最后所有樣本都聚
48、成一類。由第三問可知,要想分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,必然要用到附件2-指標(biāo)總表中的大量數(shù)據(jù),如果不先對這些樣本進(jìn)行簡化,就很難找到它們之間的內(nèi)在關(guān)系。而R型聚類分析使具有共同特征的變量聚在一起,以便從不同類中分別選出具有代表性的變量作分析,從而減少分析變量的個數(shù)。</p><p> 對于附件二—指數(shù)總表,我們根據(jù)其中的一級指標(biāo)(即標(biāo)記為藍(lán)色的)先大致把釀酒葡萄的理化指標(biāo)分為30個,其中,1為氨基
49、酸總量,2為蛋白質(zhì),3為VC含量,定義430依次為:花色苷、酒石酸、蘋果酸、檸檬酸、多酚氧化酶活力、褐變度、DPPH自由基、總酚、單寧、葡萄總黃酮、白藜蘆醇、黃酮醇、總糖、還原糖、可溶性固形物、PH值、可滴定酸、干物質(zhì)含量、果穗質(zhì)量、百粒質(zhì)量、果梗比、出汁率、果皮質(zhì)量、果皮顏色。</p><p> 定性考察釀酒葡萄的理化指標(biāo),可以看出,某些指標(biāo)之間可能存在較強的相關(guān)性。比如紅(白)葡萄中的總糖、還原糖與可溶性
50、固行物之間可能存在較強的相關(guān)性,總酚、單寧與葡萄總黃酮之間也可能存在較強的相關(guān)性。為了驗證這種想法,運用MATLAB軟件計算紅葡萄30個一級指標(biāo)之間的相關(guān)系數(shù),得到的相關(guān)系數(shù)矩陣如表所示:</p><p> (因樣本的指標(biāo)太多,在此只列出了前十個指標(biāo)的相關(guān)系數(shù)矩陣,具體完整的相關(guān)系數(shù)矩陣參見附件一中的表格 (3))</p><p> 表3: 紅葡萄理化指標(biāo)的相關(guān)系數(shù)矩陣</p&
51、gt;<p> 可以看出某些指標(biāo)之間確實存在很強的相關(guān)性,因此可以考慮從這些指標(biāo)中選取幾個有代表性的指標(biāo)進(jìn)行聚類分析。為此,把三十個指標(biāo)根據(jù)其相關(guān)性進(jìn)行R型聚類,再從每個類中選取代表性的指標(biāo)。</p><p> 因為在聚類分析中如果參與聚類的變量的量綱不同,就會導(dǎo)致錯誤的聚類結(jié)果。因此在聚類過程進(jìn)行之前必須對每個理化指標(biāo)的數(shù)據(jù)分別進(jìn)行標(biāo)準(zhǔn)化處理,以消除量綱的影響。指標(biāo)間相近性度量采用相關(guān)系數(shù),類
52、間相近性度量的計算選用類平均法。聚類樹形圖如下圖</p><p> 圖 11 紅葡萄指標(biāo)類聚樹形圖</p><p> 從紅葡萄指標(biāo)聚類圖中可以看出,可以將紅葡萄的30個理化指標(biāo)分為八類,分類結(jié)果如下( []中的代表聚為一類)</p><p> [2、10、11、12、13、26]、[4、6、8、9、15、25]、[5、7]、[19、21]、[1、16、17、
53、18、20、22]、[3]、[14、28、29、30]、[23、24、27]</p><p> 同理可得,白葡萄的前十個指標(biāo)的相關(guān)系數(shù)矩陣如下表所示:</p><p> 表4: 紅葡萄理化指標(biāo)的相關(guān)系數(shù)矩陣</p><p> 圖12 白葡萄指標(biāo)類聚樹形圖</p><p> 依據(jù)白葡萄指標(biāo)聚類圖中,同樣可以將白葡萄30個理化指標(biāo)分為以
54、下八類</p><p> [2、9、11、12、13、15]、[1、6、10、16、17、18、20、22、28、30]、[3、5、25][14]、[23、24、26、27]、[4、8、29]、[7]、[19、21]</p><p> 對比以上得到的兩種釀酒葡萄的指標(biāo)類聚樹形圖和由它們將各自的30種理化指標(biāo)的分類結(jié)果,我們不難發(fā)現(xiàn),通過對兩組指標(biāo)分別用R型聚類分析歸類之后,兩種釀酒葡萄
55、的歸類區(qū)間有著明顯的相似度,再結(jié)合它們內(nèi)部的聯(lián)系和所歸的類與類之間的差異,可以得到如下的對應(yīng)關(guān)系:</p><p><b> 表5:主成分列表</b></p><p> 再通過兩組理化指標(biāo)的相關(guān)系數(shù)可以得出各類的主要指標(biāo):依次為糖類中的總糖,酚類中的總酚,持久度的酚氧化酶活性,酸度中的蘋果酸,酒精度中的PH值,微量元素VC含量,色度中的白蘆藜醇,果皮質(zhì)地中的果硬比
56、。</p><p><b> 典型相關(guān)分析</b></p><p> 通常情況下,為了研究兩組變量</p><p><b> , </b></p><p> 的相關(guān)關(guān)系,可以用最原始的方法,分別計算兩組變量之間的全部相關(guān)系數(shù),一共有個簡單相關(guān)系數(shù),這樣又繁瑣又不能抓住問題的本質(zhì)。如果能夠采用
57、類似于主成分的思想,分別找出兩組變量的各自的某個線性組合,討論線性組合之間的相關(guān)關(guān)系,則更簡捷。</p><p> 為此,我們可以分別在每組變量中找出第一對線性組合,使其具有最大相關(guān)性,</p><p> (5) </p><p> 然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的
58、第一線性組合不相關(guān),第二對本身具有次大的相關(guān)性。</p><p><b> (6)</b></p><p> 與,與不相關(guān),但和相關(guān)。如此繼續(xù)下去,直到進(jìn)行到步,兩組變量的相關(guān)性提取完為止,可以得到組變量,這里。</p><p> 研究兩組隨機變量之間的相關(guān)關(guān)系,可用復(fù)相關(guān)系數(shù)(也稱全相關(guān)系數(shù))。</p><p>
59、 復(fù)相關(guān)系數(shù)描述兩組隨機變量與之間的相關(guān)程度。其思想是先將每一組隨機變量作線性組合,成為兩個隨機變量:</p><p> , (7)</p><p> 再研究與的相關(guān)系數(shù)。由于,的投影與向量,有關(guān),所以與,有關(guān),。我們?nèi)≡诤偷臈l件下使達(dá)到最大的,作為投影向量,這樣得到的相關(guān)系數(shù)為復(fù)相關(guān)系數(shù):。</p><p&
60、gt; 將兩組變量的協(xié)方差矩陣分塊得:</p><p> , (8)</p><p><b> 此時</b></p><p><b> (9)</b></p><p> 因此問題轉(zhuǎn)化為在和的條件下求的極大值。</p><p>
61、根據(jù)條件極值的求法引入Lagrange乘數(shù),可將問題轉(zhuǎn)化為求</p><p><b> (10)</b></p><p> 的極大值,其中, 是Lagrange乘數(shù)。</p><p> 由極值的必要條件得方程組:</p><p><b> (11)</b></p><p&
62、gt; 將上二式分別左乘與,則得</p><p><b> (12)</b></p><p><b> 注意,所以</b></p><p> 代入方程組得: (13)</p><p> 以左乘第二式得,所以</p><
63、;p><b> 代入第一式得</b></p><p><b> 同理可得</b></p><p><b> 記</b></p><p> , (14)</p><p><b> 則得</b></p><p>
64、;<b> ,</b></p><p> 說明既是又是的特征根,就是其相應(yīng)于和的特征向量。和的特征跟非負(fù),非零特征跟的個數(shù)等于,不妨設(shè)為。</p><p> 設(shè)的特征跟排序為,其余個特征根為0,我們稱為典型相關(guān)系數(shù)。相應(yīng)解出的特征向量為從解出的特征向量為從而可得對線性組合:</p><p><b> (15)</b>
65、;</p><p> 稱每一對變量為典型變量。求典型相關(guān)系數(shù)和典型變量歸結(jié)為求和的特征根和特征向量。</p><p> 又因為,當(dāng) 時, </p><p> 表示一切典型變量都是不相關(guān)的,并且其方差為一,</p><p><b> 其中</b></p><p> 與的同一對典型變量和之
66、間的相關(guān)系數(shù)為,不同對的典型變量和()之間不相關(guān),即協(xié)方差為0:</p><p> 當(dāng)總體的均值向量和協(xié)差陣未知時,無法求總體的典型相關(guān)系數(shù)和典型變量,因而需要給出樣本的典型相關(guān)系數(shù)和典型變量。</p><p> 設(shè)和為來自總體容量為的樣本,這時,協(xié)差陣的無偏估計為</p><p><b> (16)</b></p><
67、;p> 其中,,用代替并按 和 求出和,,稱為樣本典型相關(guān)系數(shù),稱,,為樣本的典型變量。</p><p> 計算時也可從樣本的相關(guān)系數(shù)矩陣出發(fā)求樣本的典型相關(guān)系數(shù)和典型變量,將相關(guān)系數(shù)矩陣取代協(xié)方差陣,計算過程是一樣的。</p><p> 如果復(fù)相關(guān)系數(shù)中一個變量是一維的,那么也可稱為偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是描述一個隨機變量與多個隨機變量(一組隨機變量)之間的關(guān)系。其思想是先將
68、那一組隨機變量作線性組合,成為一個隨機變量:</p><p><b> (17)</b></p><p> 再研究和的相關(guān)系數(shù)。由于和投影向量有關(guān),所以與有關(guān),。我們?nèi)≡诘臈l件下使達(dá)到最大的作為投影向量得到的相關(guān)系數(shù)為偏相關(guān)系數(shù):</p><p><b> (18)</b></p><p>
69、 其余推導(dǎo)與計算過程與復(fù)相關(guān)系數(shù)類似。</p><p> 5.5 原始變量與典型變量之間的相關(guān)性</p><p> (1)原始變量與典型變量之間的相關(guān)系數(shù)</p><p> 設(shè)原始變量相關(guān)系數(shù)矩陣</p><p><b> 典型變量系數(shù)矩陣</b></p><p><b> 典
70、型變量系數(shù)矩陣</b></p><p><b> 則有</b></p><p><b> (19)</b></p><p><b> 和的相關(guān)系數(shù)</b></p><p><b> (20)</b></p><p&g
71、t;<b> 同理可計算得</b></p><p><b> (21)</b></p><p> ?。?) 各組原始變量被 典型變量所解釋的方差</p><p> 組原始變量被解釋的方差比例</p><p><b> (22)</b></p><p&
72、gt; 組原始變量被解釋的方差比例</p><p><b> (23)</b></p><p> 組原始變量被解釋的方差比例</p><p><b> (24)</b></p><p> 組原始變量被解釋的方差比例</p><p><b> (25)&l
73、t;/b></p><p> 5.5.2 理化指標(biāo)典型相關(guān)分析</p><p> 結(jié)合以上的理論的推導(dǎo)結(jié)果,我們嘗試用典型相關(guān)分析來分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。有關(guān)變量見下表</p><p> 表6 兩組樣本中的主成分</p><p> 參照5.2.1中理論原理,用MATLAB編程即可實現(xiàn)兩個樣本之間關(guān)系的評估,
74、得到釀酒紅葡萄與紅葡萄酒之間的相關(guān)系數(shù)為</p><p> 表7:原始指標(biāo)與本組典型變量指標(biāo)之間的相關(guān)系數(shù)</p><p> 表8 原始指標(biāo)與本組典型變量指標(biāo)之間的相關(guān)系數(shù)</p><p> 表9:原始指標(biāo)與對應(yīng)組典型變量指標(biāo)之間的相關(guān)系數(shù)</p><p> 表10:原始指標(biāo)與對應(yīng)組典型變量指標(biāo)之間的相關(guān)系數(shù)</p>&
75、lt;p> 由以上六個表格可以看出,所有九個表示釀酒紅葡萄理化指標(biāo)的變量都與有大致相同的相關(guān)系數(shù),因此 可以視為形容葡萄理化特性的指標(biāo)。</p><p> X組的原始變量被解釋的比例為1.000000(即100%)</p><p> Y組的原始變量被解釋的比例為0.923773(即92.4%)</p><p> 由此可知,用典型相關(guān)分析來分析釀酒葡萄與
76、葡萄酒的理化指標(biāo)之間的關(guān)系具有較強的說服性和較好的準(zhǔn)確性。</p><p> 5.6問題四模型的建立與求解</p><p> 5.6.1多元線性回歸模型的建立</p><p> 要求解釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,分別將釀酒葡萄和葡萄酒的各理化指標(biāo)作為自變量,葡萄酒質(zhì)量作為因變量,建立多元線性回歸模型,求解各指標(biāo)的系數(shù),即權(quán)重。從而研究各指標(biāo)對
77、葡萄酒質(zhì)量的影響。</p><p><b> 多元線性回歸模型:</b></p><p><b> (31)</b></p><p><b> 5.6.2模型求解</b></p><p> 在第二問中已經(jīng)求解出了釀酒葡萄的主要理化指標(biāo)對葡萄酒質(zhì)量的影響如下:</p
78、><p> 紅葡萄線性回歸模型:</p><p> 白葡萄線性回歸模型:</p><p> 對葡萄酒的理化指標(biāo)進(jìn)行相同的分析,分別表示花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積、色澤(L*(D65))、色澤(a*(D65))、色澤(b*(D65))求出葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響:</p><p> 紅葡萄酒各理化指
79、標(biāo)回歸模型:</p><p> 白葡萄酒各理化指標(biāo)回歸模型:</p><p> 用葡萄和葡萄酒的理化指標(biāo)來評價葡萄酒的質(zhì)量是有一定道理的。葡萄酒質(zhì)量屬性主要指:復(fù)雜性、協(xié)調(diào)性以及能夠激發(fā)消費者感情的能力。復(fù)雜性,意味著葡萄酒有濃郁的、令人愉快的香氣與滋味,及它的潛力與精巧性;協(xié)調(diào)性,指各種感官成分的結(jié)合是平衡的,每一種成分與其他成分相比,它的存在及其含量是非常適宜的。同時,它的復(fù)雜性、
80、顏色強度、香氣、滋味、后味是穩(wěn)定一致的。理化指標(biāo)各物質(zhì)比例合適,達(dá)到一種平衡,葡萄酒的質(zhì)量就高,而求出的各理化指標(biāo)的系數(shù)正是近似合理的搭配比例。物質(zhì)含量使得值越大葡萄酒的質(zhì)量就是越好的,通過所求出的線性相關(guān)關(guān)系,就可近似評價酒的質(zhì)量,所以是可以用葡萄和葡萄酒的理化指標(biāo)來評價葡萄酒的質(zhì)量。</p><p> 當(dāng)然,感官指標(biāo)是評價葡萄酒質(zhì)量的一個很重要指標(biāo),但感官指標(biāo)是由附表三中給出的芳香類物質(zhì)造成的,而這些芳香類
81、物質(zhì)也是來源于理化指標(biāo)中的,這樣就可以利用理化指標(biāo)來評價葡萄酒的好壞,評酒師感官的效果是由芳香類物質(zhì)造成的,這樣就建立了理化指標(biāo)和感官指標(biāo)之間的聯(lián)系,就可以直接用理化指標(biāo)來判斷葡萄酒的質(zhì)量。</p><p> 5.6.3 模型的評價與分析:</p><p> 運用多元線性回歸模型,求解出了主要量化指標(biāo)的系數(shù),解決了主要指標(biāo)對葡萄酒的影響,模型簡單,易于求解,總體上能體現(xiàn)量化指標(biāo)對葡萄酒
82、質(zhì)量的影響,但有些指標(biāo)被忽略,不能全面的求出各個指標(biāo)對葡萄酒質(zhì)量的影響,造成求解出的函數(shù)關(guān)系并不夠準(zhǔn)確。</p><p> 在論證用葡萄和葡萄酒的理化指標(biāo)來評價葡萄酒的質(zhì)量中,能夠很好的指出量化指標(biāo)與感官指標(biāo)之間的聯(lián)系,但沒有用確切的函數(shù)關(guān)系來表示出來,沒有充分利用起芳香物質(zhì)的橋梁作用,求解出量化指標(biāo)與感官指標(biāo)的函數(shù)關(guān)系。</p><p><b> 6 模型的檢驗</b
83、></p><p> 問題一中主要運用了統(tǒng)計學(xué)知識進(jìn)行數(shù)據(jù)處理,葡萄酒的評價結(jié)果由品酒員給出,由于不同的品酒員經(jīng)驗不同等主觀與客觀因素的影響,所以不同的評酒員對同一樣品酒的評價也會有明顯不同,所以兩組品酒員的評判結(jié)果有顯著性差異。實際情況和本問題的求解結(jié)果相符合。問題二給出了釀酒葡萄的30個理化指標(biāo),為了有效的對數(shù)據(jù)進(jìn)行處理,我們篩選出了9個主要理化指標(biāo),通過查找資料,我們發(fā)現(xiàn)所求的主要理化指標(biāo)與實際中影
84、響葡萄品質(zhì)的主要理化指標(biāo)基本相符,這說明我們的模型建立與求解是正確的和符合實際的。對釀酒葡萄的分級,我們主要根據(jù)其能釀出的葡萄酒的好壞決定其分級,在實際情況中,一般按地區(qū),種類等對葡萄分級,。問題三研究釀酒葡萄和葡萄酒的理化指標(biāo)之間的聯(lián)系,通過聚類分析和典型相關(guān)分析,以釀酒葡萄的理化指標(biāo)為自變量研究葡萄酒的理化指標(biāo),發(fā)現(xiàn)葡萄酒的理化指標(biāo)主要受釀酒葡萄里相同的理化指標(biāo)影響,但也受其他個別理化指標(biāo)的影響。這是和假設(shè)即實際情況相符合的。問題四
85、的求解有一部分是和問題二相同的。當(dāng)然無論是釀酒葡萄的理化指標(biāo)還是葡萄酒的理化指標(biāo)與葡萄酒質(zhì)量的聯(lián)系既存在相關(guān)項,也有負(fù)相關(guān)項,這是與實際一致的。用葡萄和葡萄酒的理化指標(biāo)來評價</p><p><b> 7 模型的推廣</b></p><p> 為了更好地評價葡萄酒的質(zhì)量,可以從釀酒葡萄開始研究。在模型四中說明了釀酒葡萄主要理化指標(biāo)對葡萄酒質(zhì)量的影響,我們可以通過研
86、究釀酒葡萄的成分來判斷葡萄酒的質(zhì)量,但這是建立在外界條件一定的情況下。對于實際問題,我們不僅要考慮釀酒葡萄原料的理化指標(biāo),葡萄酒的生產(chǎn)工藝也是決定葡萄酒好壞的必要條件。為了使模型更具說服性,可加上生產(chǎn)工藝這一必要因素,并確定其權(quán)重系數(shù),即:</p><p> 葡萄酒的質(zhì)量=釀酒葡萄的質(zhì)量*生產(chǎn)工藝權(quán)重。</p><p> 由于人口味不同,對葡萄酒的評價也各有取向,這使得對葡萄酒質(zhì)量的客
87、 觀評價不嚴(yán)謹(jǐn),摻雜著個人主觀因素。隨著科學(xué)技術(shù)的進(jìn)步,影響葡萄酒質(zhì)量的釀酒葡萄理化成分的確定會更趨完善,運用逐步回歸分析法選出對葡萄酒質(zhì)量影響較大的因素,確定其權(quán)值,這樣可以確定釀酒葡萄的質(zhì)量。同時,在培養(yǎng)葡萄時,可注重這些因素含量的控制,提高釀酒葡萄的質(zhì)量。</p><p> 而車間的流水作業(yè)的完善,可使得生產(chǎn)工藝穩(wěn)定,即生產(chǎn)工藝權(quán)重變化不大,這時,葡萄酒的質(zhì)量就取決于釀酒葡萄的理化指標(biāo)。</p>
88、;<p><b> 8 參考文獻(xiàn)</b></p><p> [1] 王松桂,張忠占,程維虎,高旅端,概率論與數(shù)理統(tǒng)計,科學(xué)出版社,2006.8。</p><p> [2] 王金甲,尹濤,李靜,洪文學(xué),馬崇霄,基于物理化學(xué)性質(zhì)的葡萄酒質(zhì)量的可視化評價研究,《燕山大學(xué)學(xué)報》,第34卷第2期:134-136,2010.3。</p><
89、p> [3] 李云,李記明,姜忠軍,統(tǒng)計分析在葡萄酒質(zhì)量評價中的應(yīng)用,釀酒科技,第四期:79-82,2009。</p><p> [4] 李新蕊, 主成分分析、因子分析、聚類分析的比較與應(yīng)用,《山東教育學(xué)院學(xué)報》,第六期:24-26,2007。</p><p> [5] 章紹輝,數(shù)學(xué)建模,科學(xué)出版社,2010。</p><p><b> 附件
90、1</b></p><p> 1、問題二的繪圖程序:</p><p> function nn</p><p> r=load('d://red data.txt');%由red data文件中讀入紅葡萄的理化指標(biāo)</p><p> w=load('d://white data.txt');
91、%由red data文件中讀入紅葡萄的理化指標(biāo)</p><p> for i=1:27 %選取紅葡萄所給樣本中的任意一個樣本</p><p> a=[]; b=[];</p><p> for j=1:30; %選取紅葡萄所選樣本中的所有理化指標(biāo)</p><p><b> b(j)=j;</b>
92、;</p><p> a(j)=r(i,j); </p><p><b> end</b></p><p> plot(b,a) %繪制所選紅葡萄樣本的可視化平行坐標(biāo)圖</p><p><b> hold on</b></p><p><b
93、> end</b></p><p> title('紅葡萄酒數(shù)據(jù)的可視化平行坐標(biāo)圖');</p><p> xlabel('輸入變量');</p><p> ylabel('變量值');</p><p> for q=1:28 %選取白葡萄所給樣本中的任意
94、一個樣本</p><p> x=[]; v=[];</p><p> for s=1:30; %選取白葡萄所選樣本中的所有理化指標(biāo)</p><p><b> v(s)=s;</b></p><p> x(s)=w(q,s); </p><p><b> end&l
95、t;/b></p><p><b> figure(2)</b></p><p> plot(v,x) %繪制所選白葡萄樣本的可視化平行坐標(biāo)圖</p><p><b> hold on</b></p><p><b> end</b></p>
96、<p> title('白葡萄酒數(shù)據(jù)的可視化平行坐標(biāo)圖');</p><p> xlabel('輸入變量');</p><p> ylabel('變量值');</p><p> y=load('d://red.txt');%由red文件讀取第二組品酒員對紅葡萄酒的打分</p>
97、;<p> x=load('d://white.txt');%由white文件讀取第二組品酒員對白葡萄酒的打分</p><p> for f=1:27</p><p> figure(3) </p><p> plot(f,y(f,2),'*r')</p><p><b>
98、hold on</b></p><p><b> end</b></p><p><b> hold on</b></p><p> for k=1:28</p><p> plot(k,x(k,2),'^b')%繪制葡萄酒質(zhì)量品嘗得分圖</p>&
99、lt;p><b> hold on</b></p><p><b> end</b></p><p> title('葡萄酒質(zhì)量品嘗得分圖');</p><p> xlabel('樣本編號');</p><p> ylabel('葡萄酒品嘗得分
100、');</p><p><b> end</b></p><p> 2、問題三的聚類法求相關(guān)系數(shù)和繪制聚類樹狀圖的程序:</p><p> M=load('G:\hptzb.txt'); %把原始數(shù)據(jù)保存到純文本hptzb.txt中</p><p> r=corrcoef(M) %計
101、算相關(guān)系數(shù)矩陣</p><p> d=1-r; %進(jìn)行數(shù)據(jù)變換,吧相關(guān)系數(shù)轉(zhuǎn)化為距離</p><p> d=tril(d); %取出d的下三角元素</p><p> d=nonzeros(d); %取出非零元素</p><p> d=d'; %化為行向量</p><p> z=linkage(
102、d,'average'); %按類平均法聚類</p><p> dendrogram(z); %畫類聚圖</p><p> T=cluster(z,'maxclust',8) %把變量劃分為9類</p><p><b> for i=1:8</b></p><p> tm=f
103、ind(T==i) %求第i類的對象</p><p> tm=reshape(tm,1,length(tm)); %變成行向量</p><p> fprintf('第%d類的有%s\n',i,int2str(tm)); %顯示分類結(jié)果</p><p><b> end</b></p><p>
104、 3、問題三的典型相關(guān)分析求兩組樣本的相關(guān)系數(shù)及解釋率的程序:</p><p> M=load ('G:\r.txt'); %把原始矩陣保存在純文本文件r.txt中</p><p> M=zscore(M); %把原始矩陣進(jìn)行標(biāo)準(zhǔn)化</p><p> fprintf('相關(guān)系數(shù)矩陣:\n')</p><p
105、> r=corrcoef(M) %計算相關(guān)系數(shù)矩陣</p><p> n1=8;n2=9;num=min(n1,n2);</p><p> s1=r(1:n1,1:n1); %提出X與X的相關(guān)系數(shù)</p><p> s12=r(1:n1,n1+1:end); %提出X與Y的相關(guān)系數(shù)</p><p> s21=s12'
106、;; %提出Y與X的相關(guān)系數(shù)</p><p> s2=r(n1+1:end,n1+1:end); %提出Y與Y的相關(guān)系數(shù)</p><p> m1=inv(s1)*s12*inv(s2)*s21; %計算矩陣M1</p><p> m2=inv(s2)*s21*inv(s1)*s12; %計算矩陣M2</p><p> [vec1,va
107、l1]=eig(m1); %求M1的特征向量和特征值</p><p> for i=1:n1</p><p> vec1(:,i)=vec1(:,i)/sqrt(vec1(:,i)'*s1*vec1(:,i)); %特征向量歸一化,滿足a's1a=1</p><p> vec1(:,i)=vec1(:,i)/sign(sum(vec1(:,i)
108、)); %特征向量乘以1或-1,保證所有分量和為正</p><p><b> end</b></p><p> val1=sqrt(diag(val1)); %計算特征值的平方根</p><p> [val1,ind1]=sort(val1,'descend'); %按照從大到小排列</p><p
109、> a=vec1(:,ind1(1:num)) %取出X組的系數(shù)陣</p><p> dcoef1=val1(1:num) %提出典型相關(guān)系數(shù)</p><p> flag=1; %把計算結(jié)果寫到Excel中的行計數(shù)變量</p><p> xlswrite('bk.xls',a,'Sheet1','A1
110、39;) %把計算結(jié)果寫到Excel文件中去</p><p> flag=n1+2; str=char(['A',int2str(flag)]); %str為Excel中寫數(shù)據(jù)的起始位置</p><p> xlswrite('bk.xls',dcoef1','Sheet1',str)</p><p>
111、[vec2,val2]=eig(m2);</p><p> for i=1:n2</p><p> vec2(:,i)=vec2(:,i)/sqrt(vec2(:,i)'*s2*vec2(:,i)); %特征向量歸一化,滿足b's2b=1</p><p> vec2(:,i)=vec2(:,i)/sign(sum(vec2(:,i))); %特
112、征向量乘以1或-1,保證所有分量和為正</p><p><b> end</b></p><p> val2=sqrt(diag(val2)); %計算特征值的平方根</p><p> [val2,ind2]=sort(val2,'descend'); %按照從大到小排列</p><p>
113、b=vec2(:,ind2(1:num)) %取出Y組的系數(shù)陣</p><p> dcoef2=val2(1:num) %提出典型相關(guān)系數(shù)</p><p> flag=flag+2; str=char(['A',int2str(flag)]); %str為Excel中寫數(shù)據(jù)的起始位置</p><p> xlswrite('bk.
114、xls',b,'Sheet1',str)</p><p> flag=flag+n2+1; str=char(['A',int2str(flag)]); %str為Excel中寫數(shù)據(jù)的起始位置</p><p> xlswrite('bk.xls',dcoef2','Sheet1',str)</p>
115、;<p> x_u_r=s1*a %x,u的相關(guān)系數(shù)</p><p> y_v_r=s2*b %y,v的相關(guān)系數(shù)</p><p> x_v_r=s12*b %x,v的相關(guān)系數(shù)</p><p> y_u_r=s21*a %y,u的相關(guān)系數(shù)</p><p> flag=flag+2; str=char(
116、['A',int2str(flag)]);</p><p> xlswrite('bk.xls',x_u_r,'Sheet1',str)</p><p> flag=flag+n1+1; str=char(['A',int2str(flag)]);</p><p> xlswrite('b
117、k.xls',y_v_r,'Sheet1',str)</p><p> flag=flag+n2+1; str=char(['A',int2str(flag)]);</p><p> xlswrite('bk.xls',x_v_r,'Sheet1',str)</p><p> flag=f
118、lag+n1+1; str=char(['A',int2str(flag)]);</p><p> xlswrite('bk.xls',y_u_r,'Sheet1',str)</p><p> mu=sum(x_u_r.^2)/n1 %x組原始變量被解釋的方差比例</p><p> mv=sum(x_v_r.^
119、2)/n1 %x組原始變量被解釋的方差比例</p><p> nu=sum(y_u_r.^2)/n2 %y組原始變量被解釋的方差比例</p><p> nv=sum(y_v_r.^2)/n2 %y組原始變量被解釋的方差比例</p><p> fprintf('X組的原始變量被u1~u%d解釋的比例為%f\n',num,sum(mu));&
120、lt;/p><p> fprintf('Y組的原始變量被v1~v%d解釋的比例為%f\n',num,sum(nv));</p><p> 4、問題四的線性回歸的MATLAB程序:</p><p> load('G:\hptzb.txt'); %把原始數(shù)據(jù)保存到純文本hptzb.txt中</p><p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 葡萄酒的評價-數(shù)學(xué)建模論文
- 葡萄酒的評價數(shù)學(xué)建模論文
- 數(shù)學(xué)建模-葡萄酒評價
- 關(guān)于葡萄酒評價的數(shù)學(xué)建模論文
- 葡萄酒的評價建模論文
- 數(shù)學(xué)建模葡萄酒的評價
- 2012數(shù)學(xué)建模a題論文-葡萄酒評價
- 數(shù)學(xué)建模-葡萄酒評價優(yōu)秀論文
- 葡萄酒的評價 數(shù)學(xué)建模優(yōu)秀論文
- 葡萄酒的評價—數(shù)學(xué)畢業(yè)論文
- 2012國賽數(shù)學(xué)建模a題葡萄酒論文
- 數(shù)學(xué)建模論文-基于統(tǒng)計分析的葡萄酒評價模型
- 葡萄酒的評價優(yōu)秀論文
- 數(shù)學(xué)與應(yīng)用數(shù)學(xué)畢業(yè)論文--葡萄酒的評價
- 葡萄酒論文
- 葡萄酒論文-葡萄酒的分析及等級劃分
- 2012高全國大學(xué)生數(shù)學(xué)建模競賽a題葡萄酒的評價論文
- 論文—自制葡萄酒
- 葡萄酒與葡萄酒文化論文-淺談葡萄酒的歷史,文化及現(xiàn)狀
- 葡萄酒畢業(yè)論文
評論
0/150
提交評論