题目 葡萄酒的评价
建模 组号: 组员及分工:张娜(
--第三次模拟训练
30 组
11数学系)建模 雒蒙(12物理系)编程 刘芯(11物理系)论文
摘要
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。对于本题,我们主要采用SPSS软件对模型进行求解。
问题一 运用EXCLE单因素方差分析两组评酒员的评分结果,分别求出均值和方差,通过F检验,得出两组评酒员对红葡萄酒的评价有明显差异,对白葡萄酒的评价无明显差异;引入克伦巴赫alpha系数,通过SPSS软件得到克伦巴赫系数,从而确定出第二组评分结果的可信度更高。
问题二 用系统聚类分析法对数据进行处理,通过SPSS软件,找出酿酒葡萄的一级指标相似程度的统计量,再以这些统计量作为划分依据,将所有品种初步分为四个等级,再进一步根据二级指标将每一级别分为甲,乙,丙,丁。
等一 二级 级 级 甲 乙 三级 丙 丁 甲 18 8、14 乙 丙 四丁 级 11 红1、17 4、5、7、9、10、12、13、6 15、16、19、20、21、22、葡2、23、24、25、26、27 萄 3 白27 葡萄 6、1、13 15 18 7、 2、5、8、9、10、11、 14 12、17、19、21、22、 23、25、26、28 3、4、24 20 16 问题三 采用统计学分析方法中的主成分分析法,用SPSS软件分别筛选出酿酒葡萄与葡萄酒的理化指标中重要的几个理化指标,再对选出的两组重要理化指标建立线性回归方程,在SPSS中求出两者相关系数矩阵,得出酿酒葡萄与葡萄酒的理化指标之间的联系。
问题四 利用因子分析法,分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,芳香物质求和作为芳香指标进行因子分析,比较前后两者结果来确定芳香指数也是评价葡萄酒的质量的重要指标,最后还需要结合感官指标来评价葡萄酒质量。
关键词:单因素方差分析 F检验 alpha系数 SPSS软件 系统聚类分析法 主成分分析法
(一) 问题重述
在给出某一年份一些葡萄酒品尝评分表、葡萄和葡萄酒的理化指标的两个表格以及葡萄和葡萄酒的芳香物质的四个表格后,为了简化问题,我们对表中数据的各项指标进行计算,得出其对应的均值与标准差,适当的进行数据筛选,提取出相应的指标进行分析,建立数学模型。
现在我们需要解决以下四个问题:
1、分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可 信?
2、根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3、分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
(二)问题分析
本题为判断葡萄酒的评价标准是否合理可行及酿酒葡萄与葡萄酒两者之间的联系并对酿酒葡萄进行等级划分,同时分析论证葡萄和葡萄酒的理化指标可不 可以作为评价葡萄酒质量的依据。
针对问题一 要求分析附件1中两组评酒员的评价结果有无显著性差异,判定哪一组的结果更加可信。首先要考虑每组所有评酒员对同一种酒样品的综合评价,再运用excel进行单因素方差分析[1],通过F检验[2],判定当FF crit时,,具有显著性差异,否则无显著行差异。判断数据的可信度,仅在处理附件1中数据的前提下,引入alpha系数[3],通过对alpha系数大小的对比来判定两组数据的可信度。
针对问题二 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。用系统聚类分析法[4]对数据进行处理,通过SPSS软件,先找出度量酿酒的葡萄的参数和葡萄酒参数之间相似程度的统计量,然后以这些统计量作为
划分的依据,将相似程度大的先聚为一类,相似程度较小的聚为另一类,直到所有变量都聚合完毕,从而对酿酒的葡萄的等级进行分类。
针对问题三 分析酿酒葡萄与葡萄酒的理化指标之间的联系。采用统计学分析方法中的主成分分析方法,首先筛选出酿酒葡萄与葡萄酒的理化指标中对葡萄酒质量影响比较明显的几个理化指标,再对选出的两组重要理化指标建立线性回归方程,在SPSS中求出两者相关系数矩阵,得出酿酒葡萄与葡萄酒的理化指标之间的联系。
针对问题四 利用因子分析法,分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求和,作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较前后两者结果中由样品中的芳香指标导致的影响差异,来确定不能只用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,其次,还需要结合感官指标,感官指标是评价葡萄酒质量的最终及最有效的指标,对葡萄酒的质量进行综合评判。
(三)模型的假设
1.对于红酒的27组数据,当其中大于25%组的数据间存在显著性差异时,我们 就认为整体也存在显著性差异,白酒亦然。
2.因为对样品评价数据中,大部分的数据都接近各自的平均数,不会太高也不会是太低,所以四种样品的各自数据都可以看作是来自正态或近似正态总体。 3.假设各个评酒员的评判结果相互独立;同一样本中各种成分相互独立。 4.假设附件二中的酿酒葡萄理化指标的二级指标影响较小。 5.本文引用数据、资料均真实可靠。 (四)符号说明 Si xij 第i组品酒师给出分数的标准偏差 第i组品酒师给第j号酒样的评分 xi n ai Vij Vi Xi Yi 第i组品酒师打出的平均分 样本总数 第i组品酒师的评分克伦巴赫alpha系数 第i组品酒师给第j号酒样的评分方差 第i组品酒师的评分总方差 酿酒葡萄的i个指标形成的向量 葡萄酒的j个指标形成的向量 第i个变量xi在第j个公共因子Fj上的载荷 aij
(五)模型建立与求解
5.1 问题一的模型建立与求解 5.1.1 显著差异性的模型建立与求解
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据方差S2,以确定它们的精确度是否存在显著性差异。
Si2(xijxi)j2 样本方差,即:
n1 (i=1,2...)
其中:Si — 第i组品酒师给出分数的标准偏差; xij — 第i组品酒师给第j号酒样的评分; xi — 第i组品酒师打出的平均分; n — 样本总数;
maxSi 则 : F 2minSi2得到的结果当F 通过EXCLE中的数据分析的到如下表5.1.1和 5.1.2 : 表5.1.1 红葡萄酒 方差 组别 一 二 组别 一 二 组别 一 二 1 92.9 81.87 10 30.4 36.17 19 47.37 55.15 2 39.78 16.22 11 70.76 38.04 20 26.04 39.06 3 45.82 30.71 12 79.65 25.12 21 116.1 35.51 4 41.28 13 44.93 15.28 22 50.62 24.26 5 13.65 14 36 23.15 23 32.48 24.76 6 59.73 21.12 15 85.56 41.34 24 74.88 10.72 7 62.67 16 18.1 20.1 25 64.62 43.73 8 65.11 17 88.01 9.16 26 31.28 41.55 9 32.94 25.73 18 47.21 50.26 27 49.77 20.5 108.04 62.01 103.61 44 表 5.1.2 白葡萄酒 方差 组别 一 二 组别 一 二 19 46.4 26.04 1 92.22 25.87 10 212.6 70.4 20 64.4 50.04 2 3 4 5 6 7 8 183.6 31.12 17 144.1 38.45 27 144.4 35.55 9 92.76 106.26 18 156.5 30.23 28 80.45 25.37 201.06 365.12 44.71 49.06 11 177.1 87.82 21 172.7 64.4 142.48 42.1 12 115.7 140 22 138.6 53.6 13 170.7 46.76 23 43.65 11.6 126.44 162.71 39.16 26.27 14 114.2 15.87 24 111.1 38.54 22.72 15 131.6 54.04 25 33.87 106.5 42.17 16 178 82.23 26 72.9 102.9 1)针对红葡萄酒,利用EXCLE的单因素方差分析,得到两组品酒师对每一种 型号红葡萄酒的评分差异: 表5.1.3 红葡萄酒分析结果:F crit=4.41 种类 1 2 3 4 5 6 7 8 9 10 11 12 19.79 26 13 5.58 27 0.32 F 14 0.02 1.66 7.08 15 16 4.39 0.45 17 18 0.19 4.3 2.31 3.63 1.85 4.37 6.63 19 20 21 22 23 24 25 3.86 6.54 2.37 3.1 3.51 1.2 1.58 4.18 12.6 4.93 0.09 0.44 当F 表5.1.4 白葡萄酒分析结果:F crit=4.41 种类 1 F 2 3 4 5 7.2 19 2.4 6 7 8 9 10 11 12 13 14 1.42 0.1 16 1.85 0.7 17 18 2.71 1.3 0.03 20 21 22 2.82 1.06 0.03 3.23 2.9 1.99 23 0.4 24 25 26 27 28 种类 15 F 1.93 1.72 0.12 0.6 0.12 0.3 3.66 0.52 0.41 2.78 8.2 0.27 其中F 5.1.2 可信度的模型建立与求解 对于可信度的判定引入克伦巴赫alpha系数,建立模型: n[1j] (i =1,2) ain1ViVij 其中:ai — 第i组品酒师的评分克伦巴赫alpha系数; Vij — 第i组品酒师给第j号酒样的评分方差; Vi — 第i组品酒师的评分总方差; n — 样本总数; 运用SPSS软件得到克伦巴赫系数的计算结果: 表5.1.5克伦巴赫系数计算结果 组别 1组红葡萄酒a1 2组红葡萄酒a2 1组白葡萄酒a3 2组白葡萄酒a4 alpha系数 0.866 1)对于红葡萄酒a2= 0.935>a1=0.866,即第二组品酒师对红葡萄酒的评分结果的可信度高于第一组; 2)对于白葡萄酒a3=0.970>a4=0.959,即第一组品酒师对白葡萄酒的评分结果的可信度略高于第二组; 综上所述,就整体而言,第二组品酒师对葡萄酒的评分结果的可信度更高。 0.935 0.970 0.959 5.2 酿酒葡萄分级的模型建立与求解 1)聚类分析的概念与系统聚类分析的思想 A.类聚分析[5] 聚类分析根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它讨论的对象是大量的样品,要求能合理的按各自的特性进行合理的分配没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的数据分析。 B. 系统聚类分析的思想[6] 系统聚类分析是聚类分析中应用最广泛的一种,其步骤一般是先根据一批数据或指标找出度量这些数据或指标之间相似程度的统计量,然后以统计量作为划分的依据,将相似程度大的先聚为一类,相似程度较小的聚为另一类,直到所有变量都聚合完毕,起相似程度由距离或相似系数定义。 设有m个聚类对象,每个对象有n个要素构成,它们所对应的要素数据由表给出: 聚类对象与要素数据 聚类对象 要素 12i m a11a21a11a22a1ja1n a2ja2naj1aj2ajja3nam1am2amjamn2222 计算类之间距离的统一公式:dkrpdpkqdqk|dpkdqk| 1)红葡萄酒等级划分: 首先,用SPSS软件对红葡萄的30个一级指标进行系统聚类分析,输出结果得到指标的聚类树状图(图5.2.1)以及集群成员分布表(表5.2.1),根据分析将30项指标聚成4类,进一步根据二级指标将已经分组的每一级进一步为甲乙丙丁四个等级,从而得出等级划分结果如(表5.2.3)。 2 图5.2.1 红葡萄酒酒一级指标类聚树状图 表5.2.2 红葡萄酒一级 集群成员分布 群集成员 案例 1:Case 2 2:Case 3 3:Case 4 8 群集 1 2 3 7 群集 1 1 2 6 群集 1 1 1 5 群集 1 1 1 4 群集 1 1 1 3 群集 1 1 1 2 群集 1 1 1 4:Case 5 5:Case 6 6:Case 7 7:Case 8 8:Case 9 9:Case 10 10:Case 11 11:Case 12 12:Case 13 13:Case 14 14:Case 15 15:Case 16 16:Case 17 17:Case 18 18:Case 19 19:Case 20 20:Case 21 21:Case 22 22:Case 23 23:Case 24 24:Case 25 25:Case 26 26:Case 27 27:Case 28 4 4 4 4 5 2 6 7 4 4 5 4 4 4 4 4 8 4 4 2 4 4 8 4 3 3 3 3 4 1 5 6 3 3 4 3 3 3 3 3 7 3 3 1 3 3 7 3 2 2 2 2 3 1 4 5 2 2 3 2 2 2 2 2 6 2 2 1 2 2 6 2 2 2 2 2 3 1 2 4 2 2 3 2 2 2 2 2 5 2 2 1 2 2 5 2 2 2 2 2 3 1 2 4 2 2 3 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 3 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 表5.2.4 红葡萄酒分级结果 等级 一级 二级 甲 乙 丙 丁 三级 四级 红葡萄种类 1、2、3 17 4、5、7、9、10、12、13、15、16、19、20、21、22、23、24、25、26、27 6 18 8、14 11 2)白葡萄酒等级划分: 同红葡萄酒的划分方法,用SPSS软件对白葡萄的30个一级指标进行系统聚类分析,输出结果得到指标的聚类树状图(图5.2.4)以及集群成员分布表(表5.2.5),根据分析将30项指标聚成4类,进一步根据二级指标将已经分 组的每一级进一步为甲乙丙丁四个等级,从而得出等级分类结果如(表5.2.6)。 白葡萄的等级划分 图5.2.5白葡萄酒一级指标聚类树状图 表5.2.6 白葡萄酒一级 集群成员分布 群集成员 案例 1:Case 1 2:Case 2 3:Case 3 4:Case 4 5:Case 5 6:Case 6 7:Case 7 8:Case 8 9:Case 9 8 群集 1 2 2 3 3 4 4 2 3 7 群集 1 2 2 3 3 4 4 2 3 6 群集 1 2 2 3 3 1 1 2 3 5 群集 1 2 2 2 2 1 1 2 2 4 群集 1 2 2 2 2 1 1 2 2 3 群集 1 1 1 1 1 1 1 1 1 2 群集 1 1 1 1 1 1 1 1 1 10:Case 10 11:Case 11 12:Case 12 13:Case 13 14:Case 14 15:Case 15 16:Case 16 17:Case 17 18:Case 18 19:Case 19 20:Case 20 21:Case 21 22:Case 22 23:Case 23 24:Case 24 25:Case 25 26:Case 26 27:Case 27 28:Case 28 5 2 2 4 3 4 6 7 4 2 3 3 7 3 5 2 3 8 3 3 2 2 4 3 4 5 6 4 2 3 3 6 3 3 2 3 7 3 3 2 2 1 3 1 4 5 1 2 3 3 5 3 3 2 3 6 3 2 2 2 1 2 1 3 4 1 2 2 2 4 2 2 2 2 5 2 2 2 2 1 2 1 3 2 1 2 2 2 2 2 2 2 2 4 2 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 1 表5.2.7 白葡萄酒分级结果 等级 一级 二级 三级 甲 乙 丙 甲 乙 丙 丁 四级 白葡萄种类 27 6、15 1、13 7、18 2、5、8、9、10、11、12、17、19、21、22、23、25、26、28 14 3、4、20 24 16 5.3 酿酒葡萄和葡萄酒理化指标联系的模型建立与求解 1)重要指标的选取 本文将分析酿酒葡萄和葡萄酒的理化指标理想化为分析酿酒葡萄和葡萄酒的主要成分指标间的联系。 基于主成分分析法,运用SPSS对附件2中的数据进行主成分分析,取累 计%大于83%的部分得到酿酒葡萄和葡萄酒的主要成分: 研究对象 酿酒红葡萄 酿酒白葡萄 红葡萄酒 白葡萄酒 2)多元线性回归方程模型的建立与求解 酿酒葡萄Xi(x1,x2,...,xi) 表示酿酒葡萄的i个主要指标形成的向量。 葡萄酒Yj(y1,y2,...,yj) 表示葡萄酒的j个主要指标形成的向量。 建立二者主要理化指标之间的多元线性回归方程: 主要成分 花色苷、单宁、总酚、葡萄总黄酮、DPPH自由基、总糖、多酚氧化酶活力、白藜芦醇 色泽、单宁、总酚、DPPH自由基、葡萄总黄酮、白藜芦醇、总糖、褐变度、干物质含量 DPPH半抑制体积、总酚、单宁 色泽b、总酚、白藜芦醇 a11a12a1iaaa21222i 其中Aji ,为多元线性回归方程的系数矩阵。 aaaj2jij1 运用SPSS软件对红(白)葡萄酒的3中指标与酿酒红(白)葡萄的8(9)种指标进行线性拟合,得到多元回归方程: A . 红葡萄:(自变量依次为花色苷、多酚氧化酶活力、DPPH自由基、总酚、单宁、葡萄总黄酮、白藜芦醇、总糖) a.因变量:单宁 y10.007x10.059x20.043x30.036x40.151x50.27x60.043x70.055x810.351 其中R2=0.856,Sig=0.000,说明线性拟合效果较好,回归极显著。 b.因变量:总酚 y20.009x10.012x26.366x30.035x40.055x50.099x60.021x70.019x82.711 其中R2=0.856,Sig=0.000,说明线性拟合效果较好,回归极显著。 c.因变量:DPPH半抑制体积 y30.001x20.276x30.007x40.003x50.003x60.001x70.001x80.284 其中R2=0.817,Sig=0.000,说明线性拟合效果较好,回归极显著。 B. 白葡萄:(自变量依次为酶活力、DPPH自由基、总酚、单宁、葡萄总黄酮、白藜芦醇、总糖、干物质含量、色泽) a.因变量:总酚 y10.006x11.112x20.05x30.012x40.193x50.025x60.01x70.014x80.029x91.031 其中R2=0.65,Sig=0.009,说明线性拟合效果一般,回归极显著。 b.因变量:白藜芦醇 y20.002x10.851x20.003x30.057x40.087x50.058x60.011x70.055x80.017x91.345 其中R2=0.0433,Sig=0.213,说明线性拟合效果较差,回归不显著。 c.因变量:色泽b y30.02x10.276x20.025x30.013x40.004x50.312x60.011x70.355x80.012x97.832 其中R2=0.57,Sig=0.038,说明线性拟合效果一般,回归较显著。 c.因变量:色泽b y30.02x10.276x20.025x30.013x40.004x50.312x60.011x70.355x80.012x97.832 综上述回归方程则可以反映出酿酒葡萄与葡萄酒的理化指标之间的联系。 5.4 问题四模型的建立和求解 5.4.1 模型准备和建立 设Xx1,x2,,xp为观察到的随机向量,F(F1,F2,,Fm)是不可观测的向量。则有 x1a11F1x2a21F1a1mFm1 a2mFm2 xpap1F1apmFmp 用矩阵表示为:XAF,其中1,2,,p称作误差或特殊因子,称Fi为第i个公共因子,式中A称为因子载荷矩阵,其元素(系数)aij表示第i个变量 xi在第j个公共因子Fj上的载荷,简称因子载荷,如果把xi看成P维因子空间的一个向量,则aij表示xi在坐标轴Fj上的投影。 5.4.2 模型求解 由附件表2 中的数据,利用统计分析软件SPSS,将表2中的数据标准化,然后计算变量间的相关系数,可见变量之间存在共同因子的可能性很大,可以建立因子分析模型进行相关分析。对酿酒红葡萄、白葡萄以及红葡萄酒、白葡萄酒理化指标建立因子分析模型,求得样本相关矩阵R的特征根和贡献率。 5.4.3葡萄酒理化指标对葡萄酒质量的影响 表5.4.1 红葡萄解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 8 9 10 11 合计 5.332 1.708 1.032 .965 .755 .691 .296 .128 .038 .029 .025 方差的 % 48.472 15.532 9.377 8.775 6.866 6.278 2.695 1.162 .350 .267 .226 累积 % 48.472 64.004 73.381 82.156 89.022 95.300 97.996 99.157 99.507 99.774 100.000 合计 5.332 1.708 1.032 提取平方和载入 方差的 % 48.472 15.532 9.377 累积 % 48.472 64.004 73.381 提取方法:主成份分析。 表5.4.2 白葡萄酒解释的总方差 成份 初始特征值 提取平方和载入 1 2 3 4 5 6 7 8 9 10 合计 3.317 2.492 1.301 1.075 0.672 0.519 0.279 0.228 0.097 0.02 方差的 % 33.173 24.924 13.014 10.75 6.716 5.188 2.788 2.275 0.971 0.201 累积 % 33.173 58.096 71.111 81.861 88.577 93.764 96.553 98.828 99.799 100 合计 3.317 2.492 1.301 1.075 方差的 % 33.173 24.924 13.014 10.75 累积 % 33.173 58.096 71.111 81.861 提取方法:主成份分析。 上表叫做总的解释方差表。左边第一栏为各成份的序号。第二大栏为初始特征值,共由三栏构成:特征值、解释方差和累积解释方差。合计栏为各成份的特征值。方差的 %栏为各成分所解释的方差占总方差的百分比,即各因子特征值占总特征值总和的百分比。累积%栏为各因子方差占总方差的百分比的累计百分比。第三大栏与第二大栏的前两行完全相同,即把特征值大于1的两个成份或因子单独列出来了。这两特征值由大到小排列,所以第一个共同因子的解释方差最大。 表5.4.3 成分矩阵 红葡萄酒成份矩阵 a白葡萄酒成份矩阵 a 花色苷 单宁 总酚 酒总黄酮 白藜芦醇 DPPH L* a* b* 芳香物1 芳香物4 1 0.828 0.937 0.981 0.919 0.461 0.962 -0.857 -0.284 -0.014 -0.042 -0.075 成份 2 -0.336 -0.021 0.024 -0.002 0.585 0.101 -0.175 0.749 0.739 0.321 0.046 3 1 0.866 0.907 0.743 -0.257 0.76 -0.098 0.351 0.012 0.643 0.046 2 -0.088 单宁 0.125 总酚 -0.028 酒总黄酮 0.006 白藜芦醇 0.034 DPPH 0.045 L* 0.044 a* -0.03 b* 0.085 芳香物3 -0.391 芳香物2 成份 3 0.032 0.071 0.176 0.806 0.09 0.078 -0.389 0.154 0.135 -0.639 4 -0.332 -0.2 0.49 -0.063 -0.474 -0.215 0.076 0.135 0.619 0.04 -0.156 -0.161 0.198 0.053 -0.071 0.891 0.688 -0.963 0.122 -0.431 0.917 提取方法 :主成份。 已提取了 4 个成份。 提取方法 :主成份。 上表为旋转后的成份矩阵表,表中各变量根据负荷量的大小进行了排列。旋转后的因子矩阵与旋转前的因子矩阵有明显的差异,旋转后的负荷量明显地向0和1两极分化了。从旋转后的矩阵表中,可以很容易地判断哪个变量归入哪个因 子。从上表看出,最后一个因子只有一个变量,包含的变量不多,因此删除这个因子可能更为合适。但是删除了一个因子后,因素结构会有所改变,需要重新进行因子分析。 5.4.4酿酒葡萄对葡萄酒质量的影响 (1)附表一,是因子分析后因子提取和因子旋转的结果。第一列到第四列描述了因子分析初始解对原有变量总体描述情况。第一列是因子分析27个初始解序号。第二列是因子变量的方差贡献(特征值),它是衡量因子重要程度的指标。第三列是各因子变量的方差贡献率(% of Variance),表示该因子描述的方差占原有变量总方差的比例。第四列是因子变量的累计方差贡献率,表示前m个因子描述的总方差占原有变量的总方差的比例。第五列和第七列则是从初始解中按照一定标准(在前面的分析中是设定了提取因子的标准是特征值大于1)提取了3个公共因子后对原变量总体的描述情况。各列数据的含义和前面第二列到第四列相同,可见提取了9个因子后,它们反映了原变量的大部分信息。 (2)附表二,是按照前面设定的方差极大法对因子载荷矩阵旋转后的结果。未经过旋转的载荷矩阵中,因子变量在许多变量上都有较高的载荷。经过旋转之后,第一个因子含义略加清楚,基本上反映了“可溶性固形物”、“总糖”、“还原糖”“干物质含量”、“出汁率”“果穗质量”;第二个因子基本上反映了“葡萄总黄酮”、“总酚”“单宁”“黄酮醇”“DPPH自由基”;第三个因子反映了“固酸比”“可滴定酸”“PH值” 5.4.5.论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量 (1)模型准备 设Xx1,x2,,xp为观察到的随机向量,F(F1,F2,,Fm)是不可观测的向量。则有 x1a11F1x2a21F1xpap1F1a1mFmF01 a2mFmF02 apmFmF0p 用矩阵表示为:XAF,其中1,2,,p (2)模型求解 首先对附件三中的每种样品所含芳香物质进行求和,以此值作为芳香物质 指标。 将之与葡萄酒中主要理化指标进行因子分析得到表9.1,单独以葡萄酒中主要理化指标进行因子分析得到表9.2,对比两表中的数据可以发现,累计方差贡献率由81.483增至90.650,所以芳香物质指标对葡萄酒质量的评价的重要性不容忽视。 表5.4.4:加入芳香物质后红葡萄酒解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 8 合计 5.301 1.218 .845 .366 .153 .051 .036 .031 方差的 % 66.261 15.222 10.558 4.573 1.909 .643 .449 .385 累积 % 66.261 81.483 92.041 96.614 98.523 99.166 99.615 100.000 合计 5.301 1.218 提取平方和载入 方差的 % 66.261 15.222 累积 % 66.261 81.483 表5.4.5:加入芳香物质后白葡萄酒解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 合计 2.923 1.134 1.031 .900 .619 .292 .103 方差的 % 41.754 16.194 14.727 12.851 8.837 4.166 1.471 累积 % 41.754 57.948 72.675 85.526 94.363 98.529 100.000 合计 2.923 1.134 1.031 提取平方和载入 方差的 % 41.754 16.194 14.727 累积 % 41.754 57.948 72.675 葡萄酒质量的评价是人们为了反映葡萄酒的客观性而人为采取的一些方法,主要包括以下指标: (1) 感官指标:包括葡萄酒的香气(类型、浓度、和谐程度);滋味(协调性、结构感、平衡性、后味等);典型性(外观、香气与滋味之间的平衡性);感官指标是评价葡萄酒质量的最终及最有效的指标。 (2) 理化指标:指由葡萄酒的成分(糖、酒精、矿物质元素、干浸出物、有机酸等)所构成的指标。 (3) 卫生指标:指葡萄酒中的微生物(酵母菌、细菌、大肠杆菌)和一些对人体健康有影响的限量成分。 葡萄酒的感官分析(品尝)就是利用感官去了解,确定某一产品的感官特征及其优缺点,并最后估价其质量,即利用视觉、嗅觉和味觉对葡萄酒进行观察、分析、描述、定义、分级。葡萄酒的质量检定,单单依靠化学分析或仪器分析,即使完全符合国家标准或部颁标准,是远远不够的,因为化学分析和仪器分析只能表示葡萄酒的化学成分或卫生指标。无法表示酒的风味质量。只有通过目测、鼻嗅与口尝,依靠视觉、嗅觉、味觉对酒的色泽、芳香、滋味做出精密的检定。 以上分析表明可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 (六)模型的分析与评价 模型优点: (1)模型具有坚实可靠的数学基础; (2)建模过程中,充分利用SPSS软件对数据进行筛选、排序和求均值,使计算相对简单。在不影响对结果的定性分析的情况下,对数据进行了大胆的简化,使问题变得更加简单明了。同时,模型对各种情况都做了较全面的分析,并且有些参数可以根据实际需要取一定的值,使模型具有很强的普遍性和实用性; (3)回归分析可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果。 (4)多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。 模型缺点: (1)回归分析算法对大规模样本难以实现; (2)在回归分析中,有时选用何种因子和该因子采用何种表达只是一种推测,这影响了该因子的多样性和某些因子的不可测性,使得回归分析方法的适用范围变窄; (七)模型的推广 本文利用聚类分析、判别分析对给定的数据进行处理,在SPSS中实现等级的划分。该模型用于生活实践中,也可以解决很多实际问题,例如:医学实践中根据各种化验结果、疾病症状、体征判断患者患的是什么病;体育选材中根据运动员的体形、运动成绩、生理指标心理素质指标、遗传因素判断是否选入运动队继续培养等。它在生活中有广泛的适用性。 (八) 参考文献 [1]贾俊平,何晓群,金勇进,统计学(第四版),中国人民大学出版社,2009年。 [2]贾俊平编著,描述统计,北京:中国人民大学出版社,2003年。 [3]王力宾主编,多元统计分析:模型、案例及SPSS应用,北京:经济科学出版社 ,2010年。 [4] 韩中庚,数学建模方法及其应用,高等教育出版社,2005年。 [5](http://wenku.baidu.com/view/5c28f24ef7ec4afe04a1dfea.html)。 [6](http://wenku.baidu.com/view/02fd520f79563c1ec5da7149.html)。 附录: 附表1:红葡萄解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 8 9 合计 7.083 4.751 2.905 2.893 1.780 1.541 1.202 .867 .727 方差的 % 26.232 17.597 10.759 10.717 6.593 5.709 4.452 3.210 2.694 累积 % 26.232 43.830 54.588 65.305 71.898 77.606 82.058 85.269 87.963 合计 7.083 4.751 2.905 2.893 1.780 1.541 1.202 提取平方和载入 方差的 % 26.232 17.597 10.759 10.717 6.593 5.709 4.452 累积 % 26.232 43.830 54.588 65.305 71.898 77.606 82.058 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 .654 .511 .498 .360 .313 .234 .217 .185 .103 .064 .043 .026 .021 .016 .003 .001 .001 2.423 1.894 1.845 1.335 1.160 .867 .802 .686 .381 .238 .160 .095 .077 .058 .011 .003 .002 90.386 92.279 94.125 95.459 96.620 97.486 98.288 98.975 99.356 99.594 99.754 99.849 99.926 99.984 99.995 99.998 100.000 -1.901E-16 -7.041E-16 100.000 附表2:白葡萄解释的总方差 初始特征值 成份 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 合计 5.409 4.852 2.734 2.088 1.805 1.547 1.459 1.265 1.075 .922 .830 .649 .522 .431 .365 .277 .240 .187 .110 .090 .065 .040 方差的 % 20.033 17.972 10.128 7.734 6.687 5.730 5.402 4.684 3.981 3.414 3.072 2.402 1.934 1.597 1.352 1.027 .890 .692 .408 .335 .242 .148 累积 % 20.033 38.005 48.133 55.866 62.553 68.283 73.685 78.369 82.350 85.764 88.836 91.239 93.173 94.770 96.121 97.148 98.038 98.730 99.138 99.473 99.714 99.863 合计 5.409 4.852 2.734 2.088 1.805 1.547 1.459 1.265 1.075 提取平方和载入 方差的 % 20.033 17.972 10.128 7.734 6.687 5.730 5.402 4.684 3.981 累积 % 20.033 38.005 48.133 55.866 62.553 68.283 73.685 78.369 82.350 23 24 25 26 27 .028 .006 .003 .001 .103 .022 .010 .002 99.966 99.988 99.998 100.000 100.000 a 2.302E-5 8.527E-5 附表3:红葡萄旋转成份矩阵 总酚 葡萄总黄酮 DPPH自由基1/IC50 单宁 出汁率 花色苷鲜重 VC含量 蛋白质 总糖 干物质含量 可溶性固形物 还原糖 氨基酸总量 褐变度 苹果酸 多酚氧化酶活力 果皮质量 果穗质量 百粒质量 白藜芦醇 可滴定酸 固酸比 PH值 黄酮醇 果梗比 柠檬酸 酒石酸 附表4:白葡萄旋转成份矩阵 可溶性固形物 成份 1 .899 2 .028 3 .198 4 -.059 5 .063 6 .151 7 .039 a成份 1 .907 .907 .841 .817 .738 .689 .585 .585 .042 .089 .068 -.187 .123 .256 .097 -.016 -.007 -.062 -.107 -.072 -.070 .091 .335 .199 .273 -.061 .210 2 .147 .008 -.176 .041 .082 .071 -.280 -.246 .925 .922 .905 .785 .668 -.085 .151 .148 -.068 -.300 -.255 -.238 .348 .107 .074 .173 -.148 .019 .154 3 .090 -.031 -.016 .254 .075 .595 -.137 -.127 .008 .156 .097 .032 -.304 .842 .838 .669 .004 -.135 -.235 -.092 -.130 .282 -.480 .129 .247 .413 -.258 4 -.120 -.012 -.052 -.013 .060 -.079 .001 .013 -.081 -.086 .056 -.050 -.306 -.126 -.267 .275 .890 .775 .738 -.568 .207 -.085 -.085 -.027 -.369 -.111 -.166 5 .141 .065 .208 -.226 .078 .159 .484 .493 .049 -.131 -.074 -.021 -.058 .086 -.024 .088 -.210 .227 -.119 .220 -.836 .813 .675 .050 .047 .057 .250 6 .151 .057 .331 .193 -.182 .120 .357 .353 -.037 .020 -.019 -.006 .375 .272 -.179 .371 .129 -.169 -.178 .135 -.108 -.052 .024 .879 .699 .058 .066 7 -.038 .007 .031 .139 -.021 .036 .270 .290 -.039 .188 -.058 .027 .143 .045 .054 -.024 -.046 .107 -.273 .152 -.128 .170 -.116 .112 -.026 .843 .800 总糖 还原糖 干物质含量 出汁率 果穗质量 葡萄总黄酮 总酚 单宁 黄酮醇 DPPH自由基1/IC50 固酸比 可滴定酸 PH值 果皮质量 百粒质量 褐变度 花色苷鲜重 蛋白质 果梗比 酒石酸 VC含量 苹果酸 氨基酸总量 白藜芦醇 多酚氧化酶活力 柠檬酸 .854 .795 .780 -.593 -.587 -.231 -.213 .374 -.019 .405 .095 .057 .216 -.077 -.293 .007 -.296 -.012 -.113 .301 -.287 -.040 .499 -.034 -.304 .189 -.061 -.075 .089 -.261 .103 .857 .856 .762 .553 .538 -.083 .099 .018 .144 .145 -.014 -.122 .410 -.354 -.113 .086 .173 .192 -.022 -.316 .002 .070 -.156 .094 -.245 -.135 -.075 -.043 -.046 .184 -.254 .890 -.881 .803 -.070 -.091 -.025 .124 -.106 -.166 .407 -.253 -.250 .123 .023 .034 .121 -.020 -.104 -.357 .113 .509 .258 .196 -.111 -.056 .158 -.122 .149 .089 .893 .790 -.163 -.125 .043 -.231 -.065 -.257 -.032 .113 -.012 -.210 .134 .138 .082 -.017 .113 -.060 .045 .219 -.090 .437 .050 -.089 .102 .062 -.044 .002 .833 -.712 .579 -.105 -.081 .080 -.024 -.128 -.043 -.280 .028 .004 -.243 -.181 .005 -.234 -.202 -.136 -.123 .061 .121 -.092 .108 .139 -.056 -.265 .047 .122 -.500 .713 .634 .621 -.073 -.001 -.054 -.131 .031 .027 .008 .187 .424 .066 .156 .201 .002 -.004 -.198 -.066 .176 .028 .097 -.115 -.165 -.077 .099 -.078 .386 -.236 .877 .576 .076 -.164 .191 附录五:在SPSS中运行聚类分析的程序,对酿酒红葡萄进行一级分类 PROXIMITIES V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24 V25 V26 V27 V28 V29 V30 V31 V32 V33 V34 V35 V36 V37 V38 V39 V40 V41 V42 V43 V44 V45 V46 V47 V48 V49 V50 V51 V52 V53 V54 V55 V56 V57 V58 V59 V60 V61 V62 V63 V64 V65 V66 V67 V68 V69 V70 V71 V72 V73 V74 V75 V76 /MATRIX OUT('C:\\Users\\ADMINI~1\\AppData\\Local\\Temp\\spss4916\\spssclus.tmp') /VIEW=CASE /MEASURE=SEUCLID /PRINT NONE /STANDARDIZE=VARIABLE RESCALE. 分类柱状图 附录六:在SPSS中运行聚类分析的程序,对酿酒白葡萄进行一级分类 GET DATA /TYPE=XLS /FILE='C:\\Users\\Administrator\\Desktop\\白葡萄酒一级指标.xls' /SHEET=name 'Sheet1' /CELLRANGE=full /READNAMES=on /ASSUMEDSTRWIDTH=32767. EXECUTE. DATASET NAME 数据集6 WINDOW=FRONT. DATASET ACTIVATE 数据集6. DATASET CLOSE 数据集3. PROXIMITIES 蛋白质mg100g V4 VC含量(mgL V6 花色苷mgl00g V8 V9 酒石酸 分数 苹果酸 柠檬酸 多酚氧化酶活力 V15 V16 褐变度 V18 V19 DPPH自由基1IC50(gL) V21 V22 总酚mmolkg V24 V25 单宁mmolkg V27 V28 葡萄总黄酮(mmolkg) V30 V31 白藜芦醇mgkg 黄酮醇mgkg 总糖gL V35 V36 还原糖gL 可溶性固形物gl V39 V40 PH值 V42 V43 可滴定酸(gl) V45 V46 固酸比 V48 V49 干物质含量g100g V51 V52 果穗质量g V54 V55 百粒质量g V57 V58 果梗比 V60 V61 出汁率 V63 V64 果皮质量(g) V66 V67 V68 果皮颜色 V70 V71 V72 V73 V74 V75 V76 /MATRIX OUT('C:\\Users\\ADMINI~1\\AppData\\Local\\Temp\\spss4916\\spssclus.tmp') /VIEW=CASE /MEASURE=SEUCLID /PRINT NONE /STANDARDIZE=VARIABLE RESCALE. 因篇幅问题不能全部显示,请点此查看更多更全内容