====== 卡方检验的基本原理 ====== ====== 卡方检验的性质 ====== 在前面的章节中,我们学习的大部分为参数检验方法,这对于数据有一定的要求:必须是**等距/等比型**数据,而且需要满足正态分布和方差同质的要求。而卡方检验不用对参数进行假设,对分布较少有要求, 可以用于**类目/顺序型**数据。但是相对地,卡方检验 没有参数检验敏感,效力低。 因此在二种检验都可用时,总是用参数检验。 卡方匹配度检验是用样本数据来检验总体分布的形状和比例,以确定与假设的总体性质的匹配度,它是对分布的检验。 ====== 卡方检验的计算 ====== 样本中得到的不同类别的频数称为观察频数f_𝑜𝑏𝑠𝑒𝑟𝑣𝑒𝑑,按期望分布计算得到的频数称为期望频数或理论频数f_𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑。 {{ :14-1.png?400 |}} 𝜒^2反映了实际的观察频数与期望频数的偏离程度。 𝜒^2取决于实际值与观测值之间的**差异大小**、**自由度**以及**样本大小**。 𝜒^2是在给定样本大小和分类变量的频数的情况下,比较预期结果和实际结果之间差异的大小。常用于分析分类变量的差异,尤其是那些名义变量。