DiVoMiner® 使用手册

  1. 主页
  2. 文档
  3. DiVoMiner® 使用手册
  4. 高级统计
  5. 单因素方差分析

单因素方差分析

定义与作用:

单因素方差分析用于1个定类字段(X)与 1 个或 1 个以上的定量字段(Y)之间的差异性研究。单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。例如,培训是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。

基本假设:

在单因素实验中,记因素为A,设其中有k个水平,记为A1,A2,…,Ak,在每個水平下考察的指标可以看成一个总体,则现有k个总体,在方差分析时需要满足以下假定:

  1. 每个总体都服从正态分布;
  2. 各总体满足方差齐性;
  3. 每个总体抽取的样本都是相互独立的,不存在多重线性相关。

分析步骤:

1.提出假设

原假设H0 : a1 = a2 = …… = ak 、备择假设H1 : a1、a2、……、ak不全相等。若原假设H0成立,则因素A的不同水平对指标的影响是无显著差异的,若原假设H0不成立,则因素A的不同水平对指标的影响是有显著差异。

2. 构造检验统计量

首先对因素 A 不同水平下的均值进行计算:

i = 1,2,…k ,其中,ni 是第 i 个总体实验数据的个数;然后通过所有水平的均值确定计算全部观测值的总均值:

其中,n = n1 + n2 + …+ nk;
再者就是计算 3 个误差平方和构造检验统计量———总误差平方和、因素误差平方(组间平方和)以及随机误差平方和(组内平方和),分别是 SST、SSA、SSE,其计算公式如下:
这三个公式之间的关系是 SST = SSA + SSE。

为了保证误差平方和计算的准确性可以利用各平方和计算的结果除以各自对应的自由度转变为均方进行度量,依次对应的自由度为 n-1、k-1、n-k。

SSA 的均方也被称为组间均方或组间方差,记为 MSA 。计算公式可以表示为MSA = 组间平方和/自由度 = SSA / (k – 1);

SSE 的均方也被称为组内均方或组内方差,记为 MSE 。其计算公式为: MSE = 组内平方和/自由度 = SSE/( n – k) 。

通过MSA、MSE的比值即可以得到所需的 F 检验统计量,如下图所示:

3. 确定临界值

根据给定的显著性水平α、分子(组间均方)自由度 df1 = k – 1 、分母(组内均方)自由度 df2 = n – k ,查找Fα(k – 1,n – k),确定相应的临界值。

4. 作出决策

将步骤2得到的F值与步骤3中的 α 水平临界值Fα(k – 1,n – k)进行比较,做出决策。若 F > Fα ,则拒绝原假设,即 H0 : a1 = a2 =…= ak 的假设不成立,表明因素A的不同水平对指标的影响是有显著差异的;F < Fα,则不能拒绝原假设H0,因素A的不同水平对指标的影响是无显著差异的。在进行统计决策时,还可以直接利用方差分析表中输出 P 值与显著性水平 α 进行比较,得出结论。

参考文献:

  • 牛凯.数据分析之单因素方差分析[J].产业与科技论坛,2019(2):57-58.
  • 田霞,徐瑞民编. 概率论与数理统计 人工智能专用. 北京:中国纺织出版社, 2021.05.
  • Kim T K. Understanding one-way ANOVA using conceptual figures[J]. Korean journal of anesthesiology, 2017, 70(1): 22-26.
这篇文章对您有用吗?

我们要如何帮助您?