【感官知识】三点检验之差别&相似（寻找差异安卓版）

三点检验小课堂

三点检验（Triangle test）是感官实验中使用非常频繁的一类差别检验，也常称为三角检验，是用来确定2个产品（A和B）是否存在可感觉到的感官差别或相似的一种方法。国家标准GB/T 12311—2012《感官分析方法三点检验》给出了三点检验具体操作指导。

三点检验测试时设置3个样品（2个A产品1个B产品，或者1个A产品2个B产品），要求评价员必须选择1个与其他两个不一样的产品。因此，三点检验属于一种强迫选择的方法，即使评价员无法确定哪个产品不同，也必须给出1个答案（需注明是猜测答案）。需要注意一点，三点检验主要用于差别特性不确定的情况，即不需要知道是什么感官特性导致的样品不同（啥不同？），也无须指出差异强度大小（哪个更强？）。这也是三点检验与成对比较、定向3-AFC的关键差异。

差别or相似，相同与不同

三点检验中，根据检验目的不同给出了差别检验和相似检验2种方法，差别检验用于确定产生可感知的差别，相似检验用于确定未产生可感知的差别。差别和相似，看上去似乎相同也不同，那到底有何异同呢？

差别和相似检验，使用相同的评价员资质和测试程序。

相同的评价员资质 差别检验和相似检验都要求使用资质一致的评价员，同时评价员都应熟悉三点检验的技术方法。

相同的测试程序 差别检验和相似检验都使用相同的测试程序，包括测试环境、样品准备和呈送、回答表、品评顺序和具体要求等。测试时都是问相同的问题：哪一个样品是不一样的？

差别和相似检验，使用不同的评价员数量、敏感性参数和结果判别方法。

不同的评价员数量 评价员数量通常取决于达到检验所需要的敏感度。评价员数量越多，检出产品间微小差异的可能性越高。通常，差别检验所需评价员数量为24-30人，而相似检验达到同样敏感度，则需要约2倍数量（约60人）。

不同的敏感性参数设置 差别检验的敏感性参数为α-风险（Ⅰ类错误），而相似检验敏感性参数为β-风险（Ⅱ类错误）和Pd（能检验出样品感官差别的评价员比例）值。

不同的结果分析与表述 差别检验根据正确回答数和设置的敏感性参数α-风险进行结果分析，当正确答案数大于或等于要求数量时，结论表述为：存在感官差别。相似检验结果分析是根据正确回答数和设置的敏感性参数β-风险和Pd值进行结果分析，当正确答案数小于或等于要求数量时，结论表述为：不存在显著差别。

相似检验是找“差异”？

这里很多感官君就困惑了，相似检验不应该是找相同吗？为啥测试时还是要找不同？而且结论也不是相似，而是“不存在显著差别”？

要说清这个，首先我们要再看看相似检验的定义。GB/T 12311—2012中指出，相似是指“样品间的感官差别小至产品可互换的状态”。什么意思呢？就是说，相似不等于相同或一样。就像我们常说，世界上没有2片一模一样的叶子，只要检测手段足够，我们就可以找到2个样品的差异，就像即使是同卵双胞胎，他们的DNA也不会完全相同。

同样，感官检验中，当我们替换原料、调整工艺或是货架期品质变化测定时，产品一定发生了变化，即一定会存在差异。关键只在于这个差异是否足够达到被人类感官器官所感知，或者说，是否有足够多的人（感知到差异的人群比例）

能够感受到产品差异？结合统计手段，设置一个置信水平，如果感受到产品差异的人群比例没有达到这个水平，ok，我们就可以认为，在统计水平上，2个产品之间不存在明显感官差别，即产品“相似”，大多数评价员或者消费者不会感受到产品之间存在差异。

因此，相似检验的核心同样是“找差别”，只是当感受到差别的人群比例未达到假设条件时，则认为不具有实际意义，产品“相似”。

差别 PK 相似检验，谁更胜一筹？

既然相似检验还是找差别，那检验时应该如何选呢？通常，如果检验目的是确定产生了可感知的差别，则选择用差别检验；如果检验目的是确定未产生可感知的差别（即相似）。则选择相似检验。因此，根据检验目的不同进行选择是最常见的选择方式。

但日常应用时，选择差别检验会更多。差别检验需要18人以上评价员，通常24~30名，而且可以使用重复检验数据，例如可以使用10个评价员、3次重复检验的结果。相似检验需要评价员数量不少于30人，而且不允许使用评价员的重复评价结果，例如需要选择30个评价员、单次检验的结果。因此，由于差别检验需要评价员数量更少从而更容易开展，时效性强，应用也更广泛。

差别&相似检验，真的不一样吗？

这时又有人问了，如果检验目的也想确定未存在可感知的差异，但因为评价员数量不够，选择了差别检验，那结果会不会与相似检验有差异导致错判呢？接下来，我们就来看下2种检验结果是否会有差异。按照GB/T 12311—2012中的表A.3，确定不同敏感性参数设置下需要的评价员数量。再根据标准中的表A.1和表A.2，确定差别检验中不能拒绝“无差别”所需的最大正确答案数和相似检验中接受“无差别”所需的最大正确答案数，结果如下表所示。

表统计结果

由上表可知，大多数情况下，差别检验中不能拒绝“无差别”所需的最大正确答案数和相似检验中接受“无差别”所需的最大正确答案数相同，表明在选定了α、β和Pd水平时，大多数情况下采用差别检验和相似检验能够获得一致的“无差别”结果。但需要注意的是，也有部分情况下，相似检验中接受“无差别”的最大正确数比差别检验中不能拒绝“无差别”的最大正确数小1（或大1），表明在这种情况下，当检验结果中的正确答案数正好处在差别检验中不能拒绝“无差别”的最大正确数（或相似检验中接受“无差别”所需的最大正确答案数）时，采用相似检验则是拒绝“无差别”的结果（或采用差别检验则是拒绝“无差别”的结果），2种检验方式结果刚好相反。因此，当检验结果正确答案数处于临界值附近时，这时候结果判别时则需要更加严格。企业应用时可以根据情况进行调整，满足实际的检验需求。

因此，从统计角度上，差别检验中的不能拒绝原假设“无差别”并不等于接受原假设“无差别”，因为假设检验存在2类错误，我们也不知道检验的power。但从仅从结果反推来看，大多数情况下，采用差别检验中不能拒绝“无差别”所需的最大正确数与相似检验中接受“无差别”所需的最大正确数是基本相同的。因此，实际应用时，当选定了α、β和Pd水平后，可以考虑直接使用差别检验进行2个产品的比较，执行起来操作也更加简便，也不用担心与相似检验结果不一致。

结语：相似检验的三问

存在即合理。既然有了“相似检验”，尽管任务可以交给差别检验，但也留给了我们一些思考：相似检验从何而来？发挥了什么作用？未来咋应用呢？带着这个问题，让我们一起在感官的花园中挖一挖吧。感官之路漫漫兮，带着问题继续求索兮。