在前面的章节中,我们学习的大部分为参数检验方法,这对于数据有一定的要求:必须是等距/等比型数据,而且需要满足正态分布和方差同质的要求。而卡方检验不用对参数进行假设,对分布较少有要求, 可以用于类目/顺序型数据。但是相对地,卡方检验 没有参数检验敏感,效力低。 因此在二种检验都可用时,总是用参数检验。 卡方匹配度检验是用样本数据来检验总体分布的形状和比例,以确定与假设的总体性质的匹配度,它是对分布的检验。
样本中得到的不同类别的频数称为观察频数f_𝑜𝑏𝑠𝑒𝑟𝑣𝑒𝑑,按期望分布计算得到的频数称为期望频数或理论频数f_𝑒𝑥𝑝𝑒𝑐𝑡𝑒𝑑。 𝜒^2反映了实际的观察频数与期望频数的偏离程度。 𝜒^2取决于实际值与观测值之间的差异大小、自由度以及样本大小。 𝜒^2是在给定样本大小和分类变量的频数的情况下,比较预期结果和实际结果之间差异的大小。常用于分析分类变量的差异,尤其是那些名义变量。