概述
UA MATH571B 试验设计 总结 试验的类型与选择
- 试验的意义,试验设计的意义
- 单个treatment factor的试验
- 多个treatment factor的试验
- 多个treatment factor、且包含随机效应的试验
最近做qualify往年题目的时候,发现试验设计的题目第一小问往往是判断试验类型,这个问题才是试验设计这整个学科的精华。这类题目已知条件多种多样,有文字描述试验设计背景的,有展示试验数据的,还有展示分析试验数据的SAS输出的,要准确判断试验类型,就需要对所有的试验设计基本概念有深刻了解。我给自己总结一篇一文总结常见试验设计类型,希望考试的时候试验设计不要倒在第一个小问!先给出总结表:
试验设计名称 | Treatment Factor数目 | Nuisance Factor数目 |
---|---|---|
RCBD | 一个 | 一个 |
Latin Square Design | 一个 | 两个 |
Graeco-Latin Square Design | 一个 | 三个 |
Factorial Design | k k k个 | 0个 |
Blocking Factorial Design | k k k个 | 至少一个 |
2 k 2^k 2k Design | k k k个 | 0个 |
Blocking 2 k 2^k 2k Design | k k k个 | 1个 |
A Half 2 k 2^k 2k Design | k k k个 | 0个 |
A Quarter 2 k 2^k 2k Design | k k k个 | 0个 |
Nested Design | k k k个 | 0个 |
Split-plot Design | k k k个 | 0个 |
叫得出名字的(要考的)设计就这些,前五种根据Treatment Factor数目、Nuisance Factor数目还是比较容易区分的,但后四种区分难度就要大一点了,下面简单介绍这些试验设计类型的概念。
试验的意义,试验设计的意义
统计学有两大类研究方法,Observational Study与Experimental Study,这两类研究的目标都是找因果关系,估计Causal effects。Causal effects are the ceteris paribus response to a change in variable or parameter (Marshall [1961] and Heckman [2000])。ceteris paribus是一个拉丁语短语,ceteris是除了我们感兴趣的因素以外的其他因素,paribus的意思是相等,因此这个短语连起来就是除了我们感兴趣的因素外的其他因素保持不变。Causal effects也就是在其他因素保持不变的条件下,我们感兴趣的因素对被解释变量的效应。
Observational Study的Data generating process发生在observing之前,因此研究者无法通过控制data generating获得理想的数据,只能通过后续的统计、计量技术来补救,所以Observational Study的统计理论研究的问题是对于既定的数据,怎么更准确地做推断;Experimental Study的Data generating process发生在observing之后,因此研究者可以通过控制data generating获得理想的数据,所以Experimental Study除了怎么做推断外,更多的研究在回答怎么通过试验设计来控制Data generating。
试验设计的要点就在于ceteris paribus。在UA MATH571B 试验设计II 简单试验的分析方法配对t检验部分,我介绍了一个例子:某桑拿房宣称自家定制桑拿配合自创按摩服务可以治疗高血脂。某公众号团队为了验证这家桑拿房的说法,随机选择了 2 n 2n 2n个人。测量并记录其初始的血清总胆固醇(TC),并将TC相近的分为一对,记其TC均值为 { β i } i = 1 n {beta_i}_{i=1}^n {βi}i=1n。在每一对中随机抽一人去体验这家桑拿房定制桑拿配合自创按摩服务,另一个人去普通的桑拿房。体验完毕后测血清总胆固醇记为 { ( y 1 i , y 2 i ) } i = 1 n {(y_{1i},y_{2i})}_{i=1}^n {(y1i,y2i)}i=1n,其中 1 1 1是去体验定制桑拿配合自创按摩服务那一组。收集到这些数据就可以用配对t检验比较两组的TC均值了。事实上这并不是一个完美的ceteris paribus,最完美的ceteris paribus一定是选 n n n个人,然后再把这 n n n个人从身体到灵魂都复制一下,获得另外 n n n个人,然后赶紧让他们去蒸桑拿。
这个例子其实是说,除了我们感兴趣的因素(是不是蒸的定制桑拿)还有一些我们不感兴趣的因素(性别、年龄、身高、体质比、腰臀比、血糖、血压、肝功等等)可能会影响TC,称我们感兴趣的这个叫treatment factor,不感兴趣但可能影响结果的叫nuisance factor,试验设计的一个目标就是处理nuisance factor,让它们不会影响treatment effect。
单个treatment factor的试验
这类试验的设计可以用四个字母表示,RCBD,全称叫randomized complete blocking design。在UA MATH571B 试验设计I 试验设计简介消除偏差部分我举了一个例子:六味地黄丸有滋阴补肾的功效,肾虚的人会气虚,气虚的话湿气就会重,湿气重了就有可能得脚气,所以我们可以设想一下,六味地黄丸应该是可以治疗脚气的。假设我们要研究六味地黄丸到底能不能治疗脚气,用二值随机变量 T T T表示服用了六味地黄丸( T = 1 T=1 T=1)或接受安慰剂处理( T = 0 T=0 T=0),随机变量 Y Y Y表示患者左右脚三四趾趾腹真菌数之和(简称真菌数)。但我们又认为经常用脚的人一定很多脚汗,就会更容易感染真菌。所以我们随机找了 6 n 6n 6n个有脚气的个体,将他们随机分为 2 2 2组,然后随机挑一组让他们服用六味地黄丸,另外一组让他们服用和六味地黄丸样子差不多的丸子;在每组中,将被试对象再随机分为3组,随机挑一组让他们保持每天微信步数在5000以下,再随机挑一组让他们保持每天微信步数在5000-15000之间,最后一组每天微信步数保持在15000以上,假设每个人都不会cheat,实施试验时做double-blinding处理。
这个例子中一共有 6 n 6n 6n个试验单元。试验设计中提到的各种随机分配就叫randomized,因为我们感兴趣的是是否服用六味地黄丸,因此 T T T是treatment factor,微信步数是可能对结果有影响,但我们不感兴趣,所以是nuisance factor。我们把nuisance factor分为三个level(<5000,5000-15000,>15000),它与treatment factor是totally crossed(乘法原则,二三得六,一共六种treatment),所以nuisance factor的三个level各自对应的试验单元就叫三个block,这种设计方法就叫blocking。因为六种treatment每一种都有试验单元与之对应,所以叫complete。注意到这个试验每种treatment都包含 n n n个试验单元(数目一致),所以这个试验也是Balanced,如果每种treatment包含的试验单元数目不一致,就叫Imbalance。
如果有两个nuisance factor就需要Latin square design;如果有三个nuisance factor就需要Graeco-Latin square design,再多老师就没教过了。但Graeco-Latin square其实就是两个Latin square的Hamada乘积,我估计再四个nuisance factor就用三个Latin square的Hamada乘积就好,以此类推。这部分的知识点请参考UA MATH571B 试验设计III 单因素试验设计1、UA MATH571B 试验设计III 单因素试验设计2、UA MATH571B 试验设计III 单因素试验设计3、UA MATH571B 试验设计IV RCBD与Latin Square上。
多个treatment factor的试验
多个treatment factor的试验知识点可以参考UA MATH571B 试验设计V 析因设计简介。Factorial Design,翻译为析因设计,我觉得这个翻译还是比较到位的。多个treatment factor的试验需要考虑不同factor之间的交互项,超过两个factor还有考虑所有的高阶交互项。
2 k 2^k 2k析因试验是析因试验的预实验,因为我们感兴趣的factor越多,treatment effect(单个因子和所有的交互项)就越多,并且是指数增长了,为了节省试验资源,我们需要做预实验,判断哪些因子比较重要,然后再对重要的因子做析因试验。 2 k 2^k 2k析因就是对 k k k个因子,每个因子都只取low level和high level来做试验。
2 k 2^k 2k析因试验有一个很大的问题,如果只做一次试验,残差自由度为0,没有办法用ANOVA;如果做多次试验,那么多做一次试验资源消耗就要翻倍。因此分析只有一次的 2 k 2^k 2k析因试验可以用Confounding技术,具体参考UA MATH571B 试验设计 2k析因设计理论下。
如果实验室经费真的很紧张,一次完整的 2 k 2^k 2k析因试验都做不了,那就只能做A half或者A quarter了。会考到的一般是A half 2 k 2^k 2k析因设计,定性分析时为了确定到底是哪种A half 2 k 2^k 2k析因设计,需要先找到Defining relation,然后根据defining relation判断resolution类型,这样才能完全确定,具体方法参考UA MATH571B 试验设计 2k析因设计理论下。
多个treatment factor、且包含随机效应的试验
要区分这类试验首先要掌握一对很重要的概念:固定效应 vs 随机效应。从模型假设上来讲,在对试验的线性模型做估计的时候,OLS和MLE都会缺少一个方程,如果假设每一个treatment不同level的treatment effect之和为0,那么这种模型就是固定效应模型;如果假设每一个treatment的effect都是随机变量,这种模型就是随机效应模型。从实际意义上讲,如果treatment factor的level只有肉眼可见的数种可能性(比如一家制造业工厂的几条不同的八宝粥的灌装生产线、凉糕的制作工艺等)那就应该用固定效应;如果treatment factor的level有一个很大的population,做试验的时候是选择几个代表性的取值,那就应该用随机效应。有的题目给的是SAS output,是标明了factor type的。
前面介绍的都是处理固定效应的,处理随机效应的随机效应模型与处理两种效应都有的混合效应模型可以参考UA MATH571B 试验设计VI 随机效应与混合效应1、UA MATH571B 试验设计VI 随机效应与混合效应2。
处理混合效应的设计方法有两种,Nested Design和Split-plot design。Nested Design比较好理解,它在level combination的形式上可以是totally crossed,也可以是partially crossed,区分nested和crossed有一个很重要的特征,如果同一个factor B的level只与一个factor A的level构成一个treatment,就称factor B nested in factor A(可能是totally crossed,也可能是factor B是random factor)。Split-plot design有两点特征可以辅助判断:1)给定sub-plot factor的值,whole-plot factor与block的结果构成以whole-plot factor为treatment factor、block为nuisance factor的RCBD;2)整个实验可以看成以sub-plot factor为treatment factor、block*whole-plot factor为nuisance factor的RCBD。
最后
以上就是善良汽车为你收集整理的UA MATH571B 试验设计 总结 试验的类型与选择试验的意义,试验设计的意义单个treatment factor的试验多个treatment factor的试验多个treatment factor、且包含随机效应的试验的全部内容,希望文章能够帮你解决UA MATH571B 试验设计 总结 试验的类型与选择试验的意义,试验设计的意义单个treatment factor的试验多个treatment factor的试验多个treatment factor、且包含随机效应的试验所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复