评分数据的多层插值修正法及葡萄酒感官评级

陈 欣,牛志蕾(北京林业大学理学院,北京 100083)

Liquor-Making Science and Technology - - News -

摘要: 讨论了插值法在多层评级数据修正中的应用,通过运用4种不同的插值修正方法(分段线性插值法、拉格朗日插值法、牛顿插值法、埃尔米特插值法)对葡萄酒的感官评级数据进行了两层数据修正,确定了最终的评级分数。数据结果表明,多层分段线性插值修正法最好,具有计算复杂度低、所需条件少、应用范围广、易于操作等优点。关键词: 插值法; 数据修正; 多层评级; 感官评级1001- 08-0139-中图分类号: TS262.6;TS261.7;TS971;O24 文献标识码: A 文章编号: 9286(2017) 04

Multi-Level Interpolation Methods for Data Updating in Sensory Rating of Grape Wine CHEN Xin and NIU Zhilei ( School of Science, Beijing Forestry University, Beijing 100083, China)

Abstract: In this paper, the use of interpolation methods for updating multi- level data was discussed. Four different interpolation correction methods (Piecewise linear interpolation, Lagrange interpolation, Newton interpolation and Hermite interpolation) were used for two- level updating of the sensory rating data of grape wine. And the final rating data were determined. The results suggested that multi- level piecewise linear interpolation method was the best method and it had the advantages including low computational complexity, less necessary conditions, extensive application range and simple operation. Key words: interpolation method; data updating; multi-level rating; sensory rating

在现实生活中,人们经常需要对现有的数据结果,按照等级要求做出整体的评价。例如,根据学生分数或教师工作量划分优秀、良好、合格、不合格4个等级;根据品酒师的感官评分判断葡萄酒的A、B、C3个等级,并且各个等级样品数量满足给定比例要求,但是原始数据无法同时满足这些需求。例如要评出5个优秀教师,要求分数在90分以上,而原始分数在90分以上的人数小于5,所以需要对原始数据进行修正后再评级。本文受到涂俐兰、黄丹的

[1]《插值法在数据修正中的应用》和陈灵娟、张智丰、

[2]傅琳的《各种插值法在数据修正应用中的比较》文 献的启发,结合他们提到的分段线性插值法、拉格

[5]朗日插值法和牛顿插值法,以及文献《数值分析》中的埃尔米特插值法,提出多层插值修正六步骤算

[3]法。进一步以红葡萄酒 的感官评级为例来给出了多层次插值修正法的数值结果。

1 评级方法

红葡萄酒的感官评级一般是通过聘请一组有资质的评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对其分等级指标打分,然后求和得到其总分,最后求得其平均分,从而确定葡萄酒的质量评

[4] [3]分。为了方便计算,本文从文献中选取第一组评酒员对1号到20号红葡萄酒的一组评分数据(降序排列见表2)。本文中红葡萄酒的感官评级标准为:一是根据一组评酒员的评分进行评级。评级分为3个等级: A、B、C,等级A的比率控制在20 %,等级B的比率控制在75 %,等级C的比率控制在5 %;二是针对B等级进行二层评级,将等级B划分为B1、B2、B3 3个等级,等级B1比率控制在20 %,等级 B2比率控制在60 %,等级 B3比率控制在20 %。此外,相关等级对应的分数满足表1(表1为评级标准表)。

2 数据修正的算法

本文提到的数据修正是指在不改变上述评级标准的前提下,通过运用插值法调整评酒师的评级分数,使其满足分级要求的方法。2.1 Step 1:分级

表2按照评分排序后显示: A等级3个, B等级14个, C等级3个,而按照等级划分比例: A等级( 25 %)为4个, B等级( 75 %)15个, C等级( 5 %)1个,可见,一组评分的AC、 等级的酒样品数目与分级要求的每个等级的酒样品数目有差异,我们将对此进行数据修正。葡萄酒一组评分分级表见表2。2.2 Step 2:找节点,确定目标值

先找出各等级数据的最高分及最低分,即为各段的上限分值和下限分值( 其中约定A的最高分为100分, C的最低分为0 分) ,分别用符号 x0、x1、x2、x3、x4、x5表示,其中 x0=0,x5=100。再根据评级标准表1确定目标分值,记为y0、y1、y2、y3、y4、y5。一组评分节点原始分值和评分节点目标分值见表3。2.3 Step 3:数据修正

记原始数据为x,修正后数据为y,根据表3构造插值计算公式。

( 1)分段线性插值计算公式: x- x- x- y(x)=f(x0)+ f[ x0, x1]( x0)+ f[x0,x1,x2]( x0)( x1)+… x- x- x- + f[x0,x1,…,x5]( x0 )( x1)…( x4),其中, f(x0)= 0.0, f(x1)= 59.9, f(x2)= 60.0, f(x3)= 74.9,

f(x4)= 80.0, f(x5)= 100.0,f [ x0,x1, …, xk]=(f [ x0,x1, …, xk- 2, 1)]- xk- f[x0,x1,…,xk- 2])/( xk-xk- 1), k= 1,2,…,5。( 4)埃尔米特插值法计算公式: x- x- y(x)=f(x0)+ f[x0,x0]( x0)+ f[x0,x0,x0]( x0) 2+…+ f[x0, x- x0,…,x0] ( x0) 5,它满足条件: y( k)( x0)=f k) ( x0), k=1,2,…,5。(将表2中的一组评分值,代入上述公式,得到相应修正数据,结果见表4。2.4 Step 4:评级对修正数据进行重新评级,结果见表4。

由表4可看出,4种不同的数据修正方法得到的数据都满足评级标准的要求。其中,拉格朗日插值

[ 2]法和牛顿插值法的修正数据完全相等,这与文献1-的结果一致。事实上,这两者的插值余项完全相同[ 5],只是在插值节点增减时,牛顿插值法不需要重新计算,通过逐次生成插值多项式,节省了计算量。下面我们只讨论牛顿插值法。 2.5 Step 5:二层评级如果需要进行二层评级,则进入Step 1,否则进入Step 6。 分析表4的修正数据,按照二层评级等级划分比例要求等级B1(20 %)有3个,等级B2(60 %)有9个,等级B3(20 %)有3个。但是这里分段线性插值法修正数据的B1等级有5个, B2等级只有7个,埃尔米特插值法修正数据等级B1有4个,等级B2只有6个,都不满足上述要求。所以我们对分段线性插值法修正数据和埃尔米特插值法修正数据的B等级葡萄酒进行二层评级。此次评级的节点和目标值见表5,分段线性插值修正数据进行的二层评级的修正结果见表6的第2列,埃尔米特见表6的第3列。所有二层评级数据修正结果见图1。 图1 葡萄酒等级B二层评级数据修正图

2.6 Step 6:检查输出检查数据是否满足要求,满足则输出结果。由表6和图1可看出,上述4种算法均能得到满意的分级结果。3 数据修正的方法比较3.1 单层评级与二层评级的比较为了做深入研究,我们根据感官评级的标准对一组评分进行单层评级,标准表见表7,数据节点见表8。通过观察数据修正结果,比较单层评级和多层评级的效果。

按照Step 3的数据修正方法得到的结果见表9。由表9发现,分段线性插值法和埃尔米特插值法都得到满意的分级结果,而牛顿插值法两端的数据都发生了高次插值的Runge现象 5],葡萄酒单层

[评级数据修正图见图2。

牛顿插值法的数据修正结果的大小顺序并不完全符合一组评分的数据单调性,其中的R18的修正数据结果大于R1的数据结果, R9、R3、R2的修正数据结果小于R17的数据结果,从而使得修正数据不满足等级A、B1、B2、B3的评级比率,这是高态插值的病态性质的体现,即在上给出的节点做插值多项式近似,对任意的插值节点,当时,并不一定收 图2 葡萄酒单层评级数据修正图

[5]敛,高次函数两边会出现振荡现象 。

由图2可知,分段线性插值法和分段埃尔米特插值法,明显优于高次牛顿插值法,避免了 Runge现象,而二层评级也修正了一层评级的 Runge现象。3.2 误差分析

葡萄酒数据修正方差分析见表10。根据表10,通过比较方差大小发现:二层评级的牛顿插值法最好,因为它的方差最小即它修正数据的幅度最小;二层评级优于单层评级,针对同一种插值法,二层评级的方差小于单层评级的方差,说明二层评级

(下转第143页)

(上接第142页) 修正数据的幅度小于单层评级;单层评级的牛顿插值法最差,因为它的方差远高于分段线性插值法和埃尔米特插值法的方差,说明它对数据的修正幅度最大。 4 小结

总之,多层分段线性插值修正数据的效果最好。多层分段线性插值修正法计算复杂度低,计算便捷,修正数据幅度小,应用范围广,适合数据节点较多的情况。在处理精确数据时,推荐用埃尔米特插值法,该方法误差小,计算效果好,但复杂程度略 高。节点个数较少时,可以用拉格朗日法和牛顿插值法,其中牛顿插值法较好,因为它计算复杂程度比拉格朗日插值法低,计算快速。

参考文献:

[1] 涂俐兰,黄丹.插值法在数据修正中的应用[J].数学理论

110-与应用,2013(3): 116. [2] 陈灵娟,张智丰,傅琳.各种插值法在数据修正应用中的

259-比较[J].科学导报,2014(8): 261. [3] 赵熙,漆志鹏.葡萄酒评酒员的评酒结果的可信度研究——2013年全国大学生数学建模比赛A题第一问[J].科技信息,2013(6):144. [4] 李治奇,毛小燕.葡萄酒评价的数学建模[J].黑龙江科

32-学,2013,4(5): 35. [5] 李庆阳,王能超,易大义.数值分析[M].4版.北京:清华

21-大学出版社,2001: 58.

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.