1. 什么是假设检验:
“假设”就是对从总体参数(均值、比例等)的具体数值所作的陈述,比如,我认为配方一比配方二好。
“假设检验”就是先对总体的参数提出某种假设,然后利用样本的信息判断假设是否成立的的过程。如上面的假设是该接受还是该拒绝。
2. 什么是显著性水平 α
显著性水平式是一个概率值,原假设为真时,拒绝原假设的概率。例如,公司招聘100人,只希望有5%的人是浑水摸鱼招进来的。则这5%即为显著水平。
3. 原假设与备择假设
原假设(H0):原假设一般表示两者没有显著性差异。
备择假设(H1):备择假设一般表示两者有显著性差异。
4. 检验统计量(Z值):即计算检验的统计量。根据给定的显著性水平,查表得出相应的临界值。再将检验统计量的值与该显著性水平的临界值进行比较,得出是否拒绝原假设的结论。
5. P值:是一个概率值,如果原假设为真,P值是抽样分布中大于或小于样本统计量的概率。左检验时,P值为曲线上方小于等于检验统计量部分的面积。右检验时,P值为曲线上方大于等于检验统计量部分的面积。
6. 假设检验的两类错误:
1)原假设为真,但拒绝了它。犯1类错误的概率为 α(置信水平)
2)原假设为假,但接受了它。犯2类错误的概率为 β(统计功效)?
7. 单双侧检验:
单侧检验:当假设关键词有不得少于/低于的时候用左侧检验,比如灯泡的使用不得少于/低于700小时;当假设关键词有不得多于/高于的时候用右侧检验,比如次品率不得多于/高于5%时。
双侧检验:指按分布两端计算显著水平概率的检验,应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验。一般假设检验写作H0:μ1=μ2。
8. 假设检验方法(Z检验、T检验、卡方检验)
假设检验中,比例类指标用Z检验,均值类指标使用T检验。原因:均值检验中,方差是独立于均值的额外参数;比例(服从二项分布)检验中,方差是均值的函数P(1-P),因此不需要T分布修正。(Z检验适合大样本且总体标准差已知<样本量大时可用样本标准差替代总体标准差>,T检验适合小样本且总体标准差未知)
1. 比例类指标来自二项分布,在大样本下,样本比例近似正态分布,而且零假设下方差可由(1-P)*P唯一确定(无需额外估计方差参数),因此可直接使用正态近似(Z检验)。实际上,当n大时,比例检验统计量服从标准正态分布,无需T分布修正。
2. 均值类指标来自总体分布,通常总体方差未知,需要用样本方差估计,此时T统计量服从T分布(小样本)或近似正态(大样本)。T分布考虑了估计方差带来的额外不确定性,尤其在小样本时至关重要。
9. 单、双变量假设检验
单样本均值检验:检验样本均值与总体均值是否存在显著差异
双样本均值检验:检验两个样本均值之间是否存在显著差异
参考源:https://blog.csdn.net/luoluo96321/article/details/106561913?ops_request_misc=elastic_search_misc&request_id=644377891f1193950ad29a8122ab2340&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~baidu_landing_v2~default-6-106561913-null-null.142