高一数学独立性检验的基本思想及其初步应用知识点
独立性检验的基本思想及其初步应用是高中数学的一个难点,有些知识点需要同学们了解,下面是小编给大家带来的高一数学独立性检验的基本思想及其初步应用知识点,希
高一数学独立性检验的基本思想及其初步应用知识点(一)
独立性检验的基本思想及其初步应
分类变量与列联表:
变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量;
列出的两个分类变量的频数表,称为列联表。
独立性检验:
为了使不同样本容量的数据有统一的评判标准,构造一个随机变量
,其中n=a+b+c+d为样本容量。利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。
利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是:
(1)根据实际问题需要的可信程度确定临界值k0;
(2)利用公式(1),由观测数据计算得到随机变量K2的观测值;
(3)如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据。
独立性检验的性质:
独立性检验没有直观性,必须依靠K2的观测值k作判断。
独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式
,计算K2的值;
(3)查表比较K2与临界值的大小关系,作统计判断。
高一数学独立性检验的基本思想及其初步应用知识点(二)
统计学的一种检验方式。与适合性检验同属于X2检验(即卡方检验,英文名:chi square test)
它是根据次数资料判断两类因子彼此相关或相互独立的假设检验。
假设有两个分类变量X和Y,它们的值域分另为{x1, x2}和{y1, y2},其样本频数列联表为:
y1y2总计
x1aba+b
x2cdc+d
总计a+cb+da+b+c+d
若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量
K^2的值越大,说明“X与Y有关系”成立的可能性越大。
当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度:
P(K^2≥k)0.500.400.250.150.10
k0.4550.7081.3232.0722.706
P(K^2≥k)0.050.0250.0100.0050.001
k3.8415.0246.6357.87910.828
例如,当“X与Y有关系”的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以“X与Y有关系”成立的概率为1-0.025=0.975,即97.5%。
与列表相关联的概念
分类变量
其不同“值”表示相应对象所属的不同类别的变量,分类变量的取值一定是离散的,而且不同的取值仅表示相应对象所属的类别,如性别变量只取男、女两个“值”,某商品的等级变量只取一级、二级、三级三个“值”,等等。分类变量的取“值”有时可用数字来表示,但这时的数字除了类别以外,没有其他的含义.如用“0”表示“男”,用“1”表示“女”?
列联表
分类变量的统计汇总表(频数表).在独立性检验中,一般只研究两个分类变量,且每个分类变量只有两个可取的值;这时得到的列联表称为2×2列联表,如后面的案例中的关于患肺癌与否与吸烟与否的列联表.?
独立性检验的基本思想
独立性检验的必要性
独立性检验的学习目标:了解独立性检验的基本思想
独立性检验的学习重点:会对两个分类变量进行独立性检验
即为什么不能只凭列联表中的数据和由其绘出的图形下结论, 由列联表可以粗略地估计出两个变量(两类对象)是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用独立性检验的方法确认所得结论在多大程度上适用于总体.关于这一点,在后面的案例中还要进一步说明.
独立性检验的原理及步骤
独立性检验是一种假设检验(先假设,再推翻假设),它的原理及步骤与反证法类似.
反证法假设检验
要证明结论A想说明假设H1(两个分类变量,即两类对象有关)成立
在A不成立的前提下进行推理
在H1不成立,即H0(两类对象无关,即相互独立)成立的条件下进行推理,
推出矛盾,意味着结论A成立,
推出小概率事件(概率不超过α,α一般为0.001,0.01,0.05或0.1)发生,意味着H1成立的可能性很大(可能性为1-α),
没有找到矛盾,意味着不能确定A成立,
没有推出小概率事件发生,意味着不能确定H1成立。
望对你有帮助。