DOE(of )是一种实验设计方法,用于探索和验证因素对结果的影响。 在 DOE 中,实验通常分为多个组合,每个组合控制一个因素并测量其对结果的影响。 通过这种方式,可以更全面地了解因素对结果的影响,并确定因素的最佳组合。
以下是DOE的基本步骤:
①确定实验的目标和因素:确定实验的目标和要探索的因素。 这些因素可以是自变量或因变量。
②设计实验设计:根据实验目标和因素设计实验方案回归成本分析法根据的原理是,包括对照组、实验处理、因素水平等。
③选择实验处理:选择合适的实验处理方法,包括平行组、重复组等。
④ 进行试验:按照设计的实验方案进行试验,并记录数据。
⑤分析数据:分析测试数据,包括统计方法、图表制作等。
⑥ 得出结论:根据分析结果,得出影响结果的因素的结论。
⑦ 优化实验设计:根据结论和实验数据,优化实验设计,提高实验的准确性和可靠性。
⑧ 重复实验:得出结论后,重复实验,验证结论的准确性和可靠性。
美国能源部著名专家乔治·博克斯表示:“如果我们能够让我们的工程师开始学习运行一个简单的实验,这将极大地激发他们的胃口。即使这是他们掌握的唯一的数据驱动方法,也会大大提高实验的效率、创新的速度以及整个国家的竞争力。”
2. 如何学习本课程
DOE是一门复杂的高级统计技术,了解基本的统计知识是必要的;
课程提供了详细且清晰的实施DOE的路线图和说明,您必须了解其中的要求和指南;
通过探究和互动促进学习,提倡多提问,但不要质疑统计数据和应用原理,可以问“为什么”?
带问题学习时,最好准备好工厂数据,带到课堂上讨论;
带上电脑并安装,帮助学生进行DOE计算并建立分析模型,深化统计原理,解决实际问题。
三、课程设置
第一单元实验设计原理
第 2 单元正交实验设计和
第三单元全析因实验设计
单元 4 部分因子实验设计
单元 5 响应面实验设计
单元 6 筛选实验设计
第 7 单元 DOE 总结和改进
第一单元 实验设计原理 1. 简介
过程中复杂的自变量X和输出响应Y如何相互作用? 哪个X对Y影响大? 哪些对Y影响不大?
应如何设置工艺参数才能获得理想工艺输出Y的最优值?
质量问题长期得不到解决,类似质量问题反复出现。 是什么原因? 有没有可行的办法来解决企业质量问题的“顽疾”?
答案是肯定的,那就是DOE。
2. 什么是能源部?
DOE:实验设计在整个质量控制过程中起着非常重要的作用。 它是提高产品质量、产品设计开发、工艺改进的重要工具。
由于其强大有效的功能,实现设计已广泛应用于冶金、制造、化工、电子、医药、食品等行业以及航空航天工业。
3.实验设计的定义
它是安排实验和分析实验数据的数理统计方法。
计划安排一批实验,并按照计划在设定的条件下进行这些实验。 通过改变过程的输入变量,获得新的数据,然后进行分析以获得我们得出科学结论所需的信息。 并据此做出合理、有效的决策。
4. DOE发展的三个里程碑
1920年,实验设计技术由英国统计学家费舍尔(RA)首先创造,他首先将其应用于农业实验,目的是提高农业产量。
1947年,来自印度的Rao博士(D,R)发明并建议使用正交表来规划具有多个参数的实验计划。
英国统计学家乔治·博克斯(Box)发展了响应面法(RSM),开创了DOE应用的黄金时代。
二战后,日本质量管理大师田口元一研究开发了“田口质量工程方法”,简称田口方法。 这极大地提高了日本产品的质量和日本工业的研发设计能力,成为日本质量管理最重要的工具。
5. 检测复杂的因果关系
实验设计是一种用于检测、筛选和确认原因的先进统计工具。 它使用整个统计领域的知识来理解流程中普遍存在的复杂关系。
它不仅可以识别单个因素的影响,还可以识别多个因素的交互影响。
DOE通过安排最经济数量的实验来进行实验,以确认各种因素X对输出Y的影响,并找到能够达到质量的最佳因素组合。
DOE是产品和工艺改进最有效、最有力的武器!
6.传统实验的致命弱点
原来,一位大学教授教授了一种至今仍被传统工程师使用的测试方法。 在这一老式实验中,一次仅改变一个变量,而其他变量保持不变。
①测试周期太长,需要大量的时间和金钱;
②致命弱点是主效应离不开交互效应;
③结果就是不断受挫,恶性循环,成本增加。
7.DOE的优势
① 可以同时改变和测试多个变量的影响;
②实验次数少L8(2^7)=128次(全部组合);
③效果最佳、最可靠; 最短的实验周期; 且成本最低。
8.实验设计的三个基本原则
1)重复设计
概念:一个流程应用于多个单元。 简单来说,就是相同的测试条件需要重复两次或多次。
作用:估计随机误差
常见的策略是使用中心点。
----------------------------------
2) 随机化
概念:以完全随机的方式对试验进行排序。
目的:防止系统差异的影响。
----------------------------------
3)分组
概念:一组同质的实验单元(操作)称为分块,将所有实验单元划分为若干块的方法称为分块。
作用:分块也是可变因素,使实验分析更加有效。
例:上午和下午有差异,时间段跨度较长……
9. 实验设计的基本目标
1) 过滤器
目的:检测因素(自变量)对响应Y的影响程度——剔除不显着因素,保留显着因素。
方法:筛选设计、分段设计
----------------------------------
2)分析
目的:表征处理,检测因素的主效应和交互作用,建立Y和X之间的关系——回归方程。
方法:2^k 因子设计
----------------------------------
3)优化
目的:寻找“最优区域”,确定响应Y值最优时X的设定条件(因子水平的最佳组合)
方法:响应面设计RSM
10.DOE适用范围
①新产品研发;
②产品设计参数优化;
③选择最合理的产品配方;
④工艺设计和优化,寻找最佳生产条件;
⑤提高老产品的质量或生产能力;
⑥ 用于质量改进和解决长期质量问题。
11. DOE基本术语
1)实验计划
这是一种在实验中产生结果的经济有效的方法。
实验设计是一种有利于实验进行的安排。 实验是一种随机改变多个自变量以确定其影响的研究方法。 一个好的实验可以对实验结果进行简洁的解释,确定各种因素的主效应,并确定各种因素之间的相互作用。
通常,实验计划是通过正交表来实施的。

3因素2水平实验计划(例如, 表示是、正确等,-表示否、错误等)
----------------------------------
2)响应
响应:又称指标、质量特性,是实验设计中可以测量的系统输出,一般用Y表示。
输出响应Y可以用定量指标和计数指标两种方式表示。
----------------------------------
3)因素和水平
因素:指系统或过程的输入变量。 它是工程师需要研究或设置的一个对象,用于解释响应的大小。
因素分类有两种方法:
定性因素的级别仅限于一些,并且没有固定的顺序,例如操作人员或材料;
定量因素可以是具有连续值的因素(如温度、压力)。
层次:每次实验时,每个因素至少要从两个层次进行研究,这两个层次称为该因素的层次。 例如,可以应用210℃至230℃范围内的温度。 这两个值可以作为因子温度的高低。
重要提示:因子的水平数应至少为 2
表达方式:
如果有2级:高级 1; 低电平-1;
如果有三个级别:从低到高,依次表示为1、2、3。
----------------------------------
4)主要影响和相互作用
主效应:某个因素对输出响应的影响。

相互作用:两个或多个因素对输出响应值的影响。

因素的相互作用:一篇文章中易于理解的相互作用。
12.如何选择和确定因素和水平
如何正确选择因素和水平完全取决于工程师的经验和对流程的理解。
在头脑风暴/鱼骨图分析的基础上,选择所有主要因素并丢弃那些明显不重要的因素。
因子水平值应尽可能分散,但不要分散到对分析产生不利影响。
水平取值建议:以当前运行值为中心点,然后确定控制范围内的最大值和最小值。
13.实验设计的基本程序

14. 实验设计的类型

15.DOE基础统计知识教程
DOE提供了一套组织和表达数据的方法——结构化矩阵表,它以这种方式提供数据:测试条件不需要包含在模型中。
1)两种类型的错误和置信度
I型错误:记为α,也称显着性水平。 拒绝正确假设或结论的概率。
II型错误:记为β。 接受错误假设或结论的概率。
置信度:记为1-α。
α的一般取值有:0.01、0.05、0.10,系统默认值为0.05。
----------------------------------
2)正态分布原理
正态分布又称高斯分布,是质量工程中应用最广泛的连续分布,是质量管理的核心统计基础。
正态分布图/概率密度函数:


标准正态分布图
正态分布详细介绍:/p/。
小明每天上学的通勤时间是一个随机变量X,服从正态分布。 统计他过去20天的通勤时间(单位:分钟):26,33,65,28,34,55,25,44,50,36,26,37,43,62,35,38,45,32 , 28, 34。现在我们想知道他去学校需要 30 到 45 分钟的概率。
首先,我们将问题转化为数学表达式,计算上学时间为30到45分钟的概率,即求P(30 < X < 45)。 如果变量服从正态分布,请立即考虑其平均值和标准差是多少。 这里我们简化一下,用他过去20天的样本数据来代替。 因此,我们首先计算这20天内通勤时间的样本均值和标准差。 通过 Excel 计算得出:样本均值 = 38.8(分钟),标准差 = 11.4(分钟)。

然后,我们进行归一化,这一步非常重要,也称为Z变换。 通过标准化,所有服从一般正态分布的随机变量都变成服从均值为0、标准差为1的标准正态分布。对于服从标准正态分布的随机变量,具体用Z表示。因此,找到P(30 < X < 45) 转换为求 P(-0.77 < Z < 0.54)。 归一化的具体计算如下。
30 → (30-38.8) / 11.4 = - 0.7745 → (45-38.8) / 11.4 = 0.54X → ZP(30 ≤ X ≤ 45) = P(-0.77 ≤ Z ≤ 0.54)
归一化后,原来曲线的形状不会改变,也不会改变胖瘦,只是位置会发生偏移。
----------------------------------
3)正态分布的三个关键指标
以图形方式表示的一组数据称为分布。 使用正态分布来描述过程。

分布的 3 个特征是帮助我们理解该过程的关键!
----------------------------------
4) 休哈特 3σ 原理
虽然理论上一个正态随机变量可以取无数个值,并且它的定义域是整个实数轴,但实际上区间 [-1, 1] 包含了它可以取值的 68%,[-2, 2] ] 区间包含了 95% 的值,[-3, 3] 包含了它可以取的 99.73% 的可能值。


----------------------------------
5)实验误差
包括系统误差和随机误差
总测试误差=条件误差 测试误差
条件误差:指实验条件(因素和水平)变化而引起的误差。
测试误差:由于测试条件以外的不可控的偶然因素而引起的误差。
----------------------------------
6)方差分析的基本模式和目标
(1)方差分析(ANOVA)
它是假设检验的延伸,主要用于分析实验结果。 它将所有组间误差与实验误差分开,然后分析和检验其统计显着性:因子显着性; 拟合回归的显着性。
----------------
(2)方差分析的基本模型

显着性检验指标——P值
DOE 分析的主要目的之一是区分哪些因素是关键因素,哪些因素是次要因素。 这需要复杂的统计计算和检测,但却给了我们一个简单的方法——P值确定。
通过P值,我们还可以判断:
该项目是否为关键因素(P
模型是否弯曲(P
模型拟合是否有效(P

----------------------------------
7)回归分析的基本模型和目标
回归分析:通过计算变量之间的相关系数来估计X和Y之间的关系式的统计方法。
线性回归方程的一般形式为Y=a bx
Y不仅与多个自变量X1有关,
析因实验设计采用线性回归方程,其基本表达式为:
其中,二阶项AA或交互项AB被视为新的自变量X...
响应面设计采用二次曲面回归方程,其基本表达式为:
第 2 单元正交实验设计和 DOE 应用:正交实验设计
它是战后日本质量管理的重要工具。 20世纪70年代引入我国,现已广泛应用于冶金、化工、电子、机械、纺织、医药等行业。
主要方法是使用正交表。
目的:设计和优化工艺参数,提高质量
优点:适用范围广; 因素和级别数不受限制; 该方法简单易行,可手动或计算机操作。
2.正交表
1)什么是正交表?
它是一个标准化的形式和一个实验计划。 一般来说,只要掌握正交表的应用方法,DOE的目的就可以达到。 表达式如下。

正交性的详细描述移至:信号与系统 3-傅立叶变换和频域分析。

表2.2.1 L9(3^4)正交表
正交表情况:.
----------------------------------
2)正交表的性质
均匀分布:在任意列中,任意因子的水平(状态)出现的次数相同。
完全可比:在任意两列中,任意水平组合出现的次数相同。
如果不满足上述任何一个条件,则它不再是正交表。 获取正交表有专门的算法,用户无需深究。
3.应用实例(增加磁鼓电机的输出扭矩)
磁鼓电机是彩色录像机的关键部件之一。 国外同类产品的扭矩指标规定大于210g·cm。 某工厂工程师以此水平为依据考察电机质量,发现故障率为23%。 决定采用实验设计来提高电机的输出扭矩。
一切都从简单开始:正交设计是 DOE 系统中一种简单实用的方法。 通过这个案例,了解DOE的基本概念、机制和操作步骤。
步骤1:明确质量改进和测试目的。 本次试验的目的是提高电动滚筒的输出扭矩,属于单响应正交试验设计。
步骤2:选择响应变量(即质量特征)。
区分指标要注意三种情况——看小、看大、看眼睛。 这是一个正交实验,也是田口方法的一个特点。
本例中以输出扭矩作为检验指标。 这是一个大的特性,要求越大越好。
第 3 步:确定因素和水平
工程师分析,影响输出扭矩的因素有三个:磁化量、定位角度和线圈匝数。 根据以往的经验,分别确定了三个级别。 这三个因素有3*3*3=27种排列组合。 通过Excel创建的因子水平表如下。

因素水平表
第四步:制定实验计划(选择正交表)
打开创建正交表。

进入正交表生成界面

正交表设置

通过生成的田口正交表
步骤5:进行测试并确定测试结果
(1)按表2.2.2进行试验

表2.2.2 完成实验结果的正交表
通过直观的方法可以确定实验5号的效果最好,但看不到影响的程序,即哪个显着,哪个不太重要,也无法明确效果大小。 将实验结果填入C4栏,如下图所示。

将实验结果填入正交表
正交表移动:///。
----------------
(二)测试要点
①试验顺序应随机化;
②每次试验的环境条件基本相同;
③确定样本量:测量数据为3个,离散数据为50个;
④ 不仅记录响应数据,还记录环境数据;
⑤保证测量系统(MSA)的可信度;
⑥填写数据时要小心,不要填错。
第 6 步:构建模型并分析数据
为了分析数据,必须预先建立数学模型——这是DOE方法的基本策略;
此步骤需要完成两项重要任务:
A、通过计算、排序,编制《均值分析表》;
B. 手动绘制“主效应图”。
均值分析:计算各因素各水平对Y的贡献(均值)

通过 Excel 计算平均值:

在此下载此结构化矩阵表:DOE 实验设计结构化矩阵表。 从27种排列中取出了9种组合,有一定的局限性。
R/效应的计算:因子的主效应=因子处于高水平时的输出平均值-因子处于低水平时的输出平均值。
通过生成平均响应表和主效应图:





一旦确定,就可以生成平均响应表和主效应图:

平均响应表和主效应图

主效应图分析
影响:某个因素由于其水平的变化而对Y产生的影响,用其平均值的范围来表示。
第七步:分析数据并得出实验结论
(一)评选标准
如果要最大化特征:取最大响应对应的级别;
如果寻找小特征:取最小响应对应的水平;
如果是凝视特征:采取与中等反应相对应的水平。
(2)工程推论
显着性因素排列:B-A-C,参见均值分析表;
最佳因子水平组合:A2 B2 C3,参见效果分析图。
最佳工艺设置:磁化量1100; 定位角度11; 线圈匝数 90。
4. 方差分析
磁化量、角度、匝数这三个测试因素对输出扭矩的影响是否有统计显着性,那么接下来需要进行方差分析。
1)调用方差分析

2) 双击选择响应和因子

3)方差分析结果


最简单、最直接的解释方法是直接看最后一列,即概率p值。 结果发现,只有角度的p值小于0.05,这意味着统计上认为角度对实验指标的转化率有显着影响,具有统计显着性。 其他两个因素影响相对较小。
如今,角度被认为是统计上相对重要的因素。 它分为三个级别。 这三个级别之间的差异表现如何? 谁应该被选为最佳级别? 因此,需要进行多重比较。
5. 与美国能源部
1) 简要说明
它是一家美国公司发明的世界上最强大的统计软件。
统计软件为质量改进和概率应用提供了准确且易于使用的工具。 许多世界领先的公司都在使用它,包括通用电气、福特汽车、通用汽车、3M、LG、东芝和六西格码咨询公司。
作为技术领先的统计入门教育软件包,它也被超过4000所院校采用。
----------------------------------
2)让统计变得如此简单
实现六西格码改进的工具; 解开统计秘密的钥匙; 使用软件使我们成为专家。

图2.4.1 语言切换
----------------------------------
3)使用介绍

图2.4.2 操作界面

图2.4.3 数据文件的特征和结构

图2.4.4 恢复正交试验计算结果

图2.4.5 第三单元采用全析因实验设计进行预测 1. 全析因设计的基本原理
全因子设计:意味着所有因子和水平的所有组合必须至少测试一次。
具有 k 个因子的两水平检验表示为 2^k 检验。
当k=4时,试验次数为m=2^4=16次
当k=5时,试验次数m=2^5=32次
当k=7时,试验次数m=2^7=128次
……
2 全析因设计的应用
1)申请
全因子设计是DOE方法体系的典型代表。
使用两个主要的统计功能 - 方差分析和回归分析
方差分析 - 检测并区分组间误差和实验误差,以确定因素的显着性 - 自变量 X 对 Y 的影响。
回归分析——建立回归方程Y=f(x)来选择最优解。
----------------------------------
2) 功能
最重要的目的是综合分析系统(产品或过程)中各因素的主效应和相互作用; 它也是一种有效的优化工具。
3.全因子设计约束
1)约束条件
因素总数≤5;
因子水平数只能为2个,即(-)和( );
设置中心点:2到4(不是必须的,测试次数也会相应增加)。
4.关于实验中的中心点
1)什么是中心点? 例如“反应温度”
代码
低-1
高 1
中心 0
实际价值
200℃
300℃
250℃
设置中心点的意义:
对于“重复测试”的要求,添加中心点是更好的测试安排。
增强的统计分析能力(评估实验误差和弯曲趋势的能力)
----------------------------------
2)什么情况下使用中心点? 因子设计,RSM
中心点设置数量:2~4
应综合考虑实验目的和实验成本。
5. 代码值与实际值的转换
系统自动生成水平码值(-1,0,1)
优点:具有连续变量、无量纲的特点,有利于统计分析和回归方程的建立。
低电平L
中心值
高水平H
实际价值
100
150
200
代码值
-1
1

6. 实际测试分析五步流程

7. 因子设计
1)二次建模
第一次建模:(初级模型草案)
检查所有因素,但不考虑三阶项(例如 ABC)及以上项,该规则适用于所有模型。
第二次建模:(简化模型)
利用初级模型分析的结果,删除不显着的因素,仅使用显着的因素来建立更小、更好的模型;
它是建立Y对X的回归方程和优化器分析的基础。
----------------------------------
2)模型数据分析
回归分析和方差分析会生成供我们分析的信息 - 工程师学会解释这些数据并做出正确的决策。
包含6个分析指标:
①总效应[H1:模型有效P
②弯曲[H0:无弯曲P>0.05]
③失配合[H0:无失配合P>0.05]
④拟合相关系数R-Sq和R-Sq(adj)(预测)越接近1越好; 两者之间的差异越小越好。
⑤标准差S分析越小越好
⑥ 因素效应显着性
P值判断[H1:模型有效P
图解判断(正态效应图/帕累托效应图)
8、应用实例(压力成型塑料板工艺条件)
目的是探讨工艺条件对产品强度的影响,尝试提高产品强度。 实验拟安排4个中心点,因子水平表如下:

第 1 步:决定制定试用计划

第2步:安排实验——实验计划和数据表

第 3 步:一次性建模 - 拟合模型

如何构建模型(首次/完整模型)
t设置:包括需要检查的项目中的项目 - 包括所有主要效果和二阶术语,例如ABC AB AC BC,但不检查三阶及以上术语,例如ABC。

在正常情况下,未检查三阶及以上条款! 此规则适用于任何设计模型。



残留诊断
什么是残留?
残差是观察到的响应值与模型预测的值之间的差。
为什么要进行剩余分析?
仅执行ANOVA和回归分析并不能保证该模型符合实际情况。 只有在剩余分析是正常的情况下,才能将模型判断为有效。
如何执行剩余分析?
剩余分析是通过4种图形工具进行的。










10.案例1.爆米花制作过程
为了生活中的榜样,我相信每个人都吃了爆米花,但是每个人都知道制作爆米花的过程吗? 品尝爆米花时,我想知道您是否注意到很多爆米花没有被弹出,而且燃烧了很多。 两种情况都是生产过程中的质量缺陷。
主要因素:
1)爆米花的处理时间(3至5分钟之间);
2)微波炉中使用的热量(5至10个水平之间);
3)用过的玉米品牌(A或B)。
响应:玉米的“流行音乐数”或“流行率”。
当弹出玉米时,我们希望所有(或几乎全部)内核弹出,而没有(或很少的)内核才能弹出,这最终是焦点。
实验设计的主要线是根据因子的值范围进行多个参数组合。 下图显示了两级测试组合,以形成一个多重测试计划。 在序列进行测试后,通过分析测试结果来确定哪种参数组合是最好的。 最佳的。
使用拟合方法(干货)DOE的基本步骤及学习方法,例如最小二乘方法,建立了响应和多个因素之间的数学模型,也称为响应表面模型。


最终是通过实验设计确定的:使用品牌A,过程5分钟,然后将火力调整为6.96。 该测试预测,在此设置下进行处理时,所有的445个玉米核会爆炸。
本文中的测试可以是物理测试或模拟。 在可靠性设计分析中,经常使用测试设计来解决问题,例如无法建立明确的可靠性模型,并具有一半的努力获得两倍的结果。
,















