请问卡方检验中理论频数怎么算?
答案:5 悬赏:0 手机版
解决时间 2021-01-15 10:38
- 提问者网友:不爱我么
- 2021-01-15 05:59
请问卡方检验中理论频数怎么算?
最佳答案
- 五星知识达人网友:洎扰庸人
- 2021-01-15 07:27
我给你的数据起个名字好了,第一列列名叫患病,第二列叫健康,第一行行名叫吸烟,第二行行名叫不吸烟。
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
扩展资料:
理论频数又称验频数,统计学概念,是指用阳性理论率推算各实际频数的估计值 。
双向无序列联表的理论频数Eij等于所在行、列的合计数Oi.、O.j之积除以总频数N
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)
自由度v=(行数-1)(列数-1)=1
2. 应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
2. 应用条件:
要求每个格子中的理论频数T均大于5或1 参考资料:百度百科-理论频数
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
扩展资料:
理论频数又称验频数,统计学概念,是指用阳性理论率推算各实际频数的估计值 。
双向无序列联表的理论频数Eij等于所在行、列的合计数Oi.、O.j之积除以总频数N
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)
自由度v=(行数-1)(列数-1)=1
2. 应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
2. 应用条件:
要求每个格子中的理论频数T均大于5或1
全部回答
- 1楼网友:从此江山别
- 2021-01-15 10:01
a<-c(28,54,72,56)
b<-c(1,2,1,2)
c<-c(1,1,2,2)
d<-xtabs(a~b+c)
e<-margin.table(d,1)
f<-margin.table(d,2)
g<-margin.table(d)
t(matrix(c(e[1]*f[1]/g,e[1]*f[2]/g,e[2]*f[1]/g,e[2]*f[2]/g),2))
前面是R代码,后面是理论频数表
[,1] [,2]
[1,] 39.04762 60.95238
[2,] 42.95238 67.04762
b<-c(1,2,1,2)
c<-c(1,1,2,2)
d<-xtabs(a~b+c)
e<-margin.table(d,1)
f<-margin.table(d,2)
g<-margin.table(d)
t(matrix(c(e[1]*f[1]/g,e[1]*f[2]/g,e[2]*f[1]/g,e[2]*f[2]/g),2))
前面是R代码,后面是理论频数表
[,1] [,2]
[1,] 39.04762 60.95238
[2,] 42.95238 67.04762
- 2楼网友:痴妹与他
- 2021-01-15 09:40
54+56=100?
- 3楼网友:摆渡翁
- 2021-01-15 09:22
拿你的数据为例,理论频数T11=82*100/200=41; T12=128*100/200=64 以此类推
下面是适用于四格表应用条件:
1)随机样本数据。两个独立样本比较可以分以下3种情况:
(1)所有的理论频数T≥5并且总样本量n≥40,用卡方进行检验。
(2)如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验。
(3)如果有理论数T<1或n<40,则用Fisher’s检验。
手打请采纳
下面是适用于四格表应用条件:
1)随机样本数据。两个独立样本比较可以分以下3种情况:
(1)所有的理论频数T≥5并且总样本量n≥40,用卡方进行检验。
(2)如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验。
(3)如果有理论数T<1或n<40,则用Fisher’s检验。
手打请采纳
- 4楼网友:鱼芗
- 2021-01-15 07:56
我给你的数据起个名字好了,第一列列名叫患病,第二列叫健康,第一行行名叫吸烟,第二行行名叫不吸烟。
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯