当前在线人数14154
首页 - 分类讨论区 - 学术学科 - 统计版 - 同主题阅读文章

此篇文章共收到打赏
0

  • 10
  • 20
  • 50
  • 100
您目前伪币余额:0
未名交友
[更多]
[更多]
问个Chi-Square和T-test的问题
[版面:统计][首篇作者:Rutland] , 2019年03月21日21:56:23 ,1555次阅读,10次回复
来APP回复,赚取更多伪币 关注本站公众号:
[分页:1 ]
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 1 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Thu Mar 21 21:56:23 2019, 美东)

有两组参加fitness的人:中年与青年。

1)对比两组人的职业状况:全职,半职,失业者,学生。(单一选项)
预计青年中全职者参加健身的比率要高于中年中全职者的比率;中年健身者中半职者的
比率高于青年中半职者的比率。(各种职业状况的比率在两组人种都要比较一下)


2)怎样找到健身中心的:社交媒体,朋友介绍,健身老师,张贴广告,。。共8-10项。
假设青年中使用社交媒体找到健身中心的比率高于中年者的比率。其余各种方式也都需
要比较。

这样的情况是Chi-Square, Independent T-test 还是用one-way ANOVA比较好,然后用
post hoc 比较frequency,看是否达到了statistic significance. 选项很多,但只有
两组人。

谢谢!
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
HarvardThief
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 2 ]

发信人: HarvardThief (博后肄业), 信区: Statistics
标  题: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Mar 22 14:19:51 2019, 美东)

binomial/multinomial count数据,比较两组的频率应该用chisq test或者fisher
exact。t test和anova适用于连续型数据,跟这不搭嘎

--
※ 来源:· 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 69.]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 3 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Mar 22 20:30:46 2019, 美东)

谢谢回答。

我先用了 crosstab chi-square, 但chisq只给一个总和的significance, 不区分每组
里category的frequency 是否大到统计上的区别(statistic significane, p<.05,
etc.)

比如chisq只说明青年和中年总体上职业比率的不同,但不能说明是全职方面的比率不
同,还是半职比例的不同,并且是否大到统计意义上的不同。

两组人在同一个变量下:employment status, 然后两组人选择不同的回答:全职,半职
,失业者。。。。不知道是否需要先select cases 用spss, 然后用chiqs.

谢谢!


【 在 HarvardThief (博后肄业) 的大作中提到: 】
: binomial/multinomial count数据,比较两组的频率应该用chisq test或者fisher
: exact。t test和anova适用于连续型数据,跟这不搭嘎



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
HarvardThief
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 4 ]

发信人: HarvardThief (博后肄业), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Mar 22 22:33:20 2019, 美东)

可以针对每一个职业类型做检验,比如全职,那就把除了全职的其他类型当做一类,数
据pool到一起,做全职vs非全职检验得到p值。然后对其他职业都同样做一遍。最后多
个p值做多重检验校正
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 76.]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 5 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Mar 22 23:57:35 2019, 美东)

谢谢回答!

并非是要做全职vs非全职的检验。

主要想了解同类职业状况在不同人群中比例的差异。比如在同一个健身房里青年人中40
%有全职工作,而中年健身者中全职工作的只有18%,想得出这两者的比例差异达到了
statistically significant different的结论. 在同一健身房里观察了3年,每年这两
组人的职业比例差异都大到significantly different,所以想得出结论说年轻人中有
全职工作的健身者比中年人的比率高。

用同样的方法也可以作年轻人比中年人更多通过social media找到健身房。这样的情况
可以用select cases, 然后把同是全职的两组年龄的人进行比较,看proportation大的
程度,这样可以吗?

谢谢!


【 在 HarvardThief (博后肄业) 的大作中提到: 】
: 可以针对每一个职业类型做检验,比如全职,那就把除了全职的其他类型当做一类,数
: 据pool到一起,做全职vs非全职检验得到p值。然后对其他职业都同样做一遍。最后多
: 个p值做多重检验校正




--
※ 修改:·Rutland 於 Mar 23 20:38:39 2019 修改本文·[FROM: 2001:558:6033:19]
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 6 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Sat Mar 30 09:45:20 2019, 美东)

自己顶一下吧,希望有人能帮我回答以下。

谢谢。


【 在 Rutland (樱桃) 的大作中提到: 】
: 谢谢回答!
: 并非是要做全职vs非全职的检验。
: 主要想了解同类职业状况在不同人群中比例的差异。比如在同一个健身房里青年人中
40
: %有全职工作,而中年健身者中全职工作的只有18%,想得出这两者的比例差异达到了
: statistically significant different的结论. 在同一健身房里观察了3年,每年这两
: 组人的职业比例差异都大到significantly different,所以想得出结论说年轻人中有
: 全职工作的健身者比中年人的比率高。
: 用同样的方法也可以作年轻人比中年人更多通过social media找到健身房。这样的情况
: 可以用select cases, 然后把同是全职的两组年龄的人进行比较,看proportation大的
: 程度,这样可以吗?
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
minquan
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 7 ]

发信人: minquan (三民主义), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Thu Apr 25 04:18:16 2019, 美东)

比较各组平均值是否有显著性差异
就是ANOVA

一个经典问题是班上男生的身高是不是平均比女生高
和你的应用场景接近吧?

【 在 Rutland (樱桃) 的大作中提到: 】
: 自己顶一下吧,希望有人能帮我回答以下。
: 谢谢。
: 40



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 72.]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 8 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Apr 26 01:36:51 2019, 美东)

谢谢回答:)

和我说的场景不太接近。身高是连续数值(continuous data),和职业身份(
employment status)是categorical data,所以我觉得用chi-square 应该比较好。



【 在 minquan (三民主义) 的大作中提到: 】
: 比较各组平均值是否有显著性差异
: 就是ANOVA
: 一个经典问题是班上男生的身高是不是平均比女生高
: 和你的应用场景接近吧?



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
Bighappy
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 9 ]

发信人: Bighappy (快乐大大大), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Apr 26 15:41:52 2019, 美东)


【 在 Rutland (樱桃) 的大作中提到: 】
: 谢谢回答!
: 并非是要做全职vs非全职的检验。
: 主要想了解同类职业状况在不同人群中比例的差异。比如在同一个健身房里青年人中
40
: %有全职工作,而中年健身者中全职工作的只有18%,想得出这两者的比例差异达到了
: statistically significant different的结论. 在同一健身房里观察了3年,每年这两
: 组人的职业比例差异都大到significantly different,所以想得出结论说年轻人中有
: 全职工作的健身者比中年人的比率高。
: 用同样的方法也可以作年轻人比中年人更多通过social media找到健身房。这样的情况
: 可以用select cases, 然后把同是全职的两组年龄的人进行比较,看proportation大的
: 程度,这样可以吗?
: ...................


你其实应该首先说明你的零假设是什么,就省得别人一开始在ANOVA或是卡方检验纠缠
了。
根据你的描述,你希望的是比较比例的差异,所以卡方检验应该是首选。因为你划分的
类别太细,有可能得用Fisher Exact Test来取代卡方检验。
不过,这些讨论只限于教科书上的范围;也就是虽说理论上你可以这么做,但在实践中
却未必可取。一个明显的例子是LS建议是全职vs非全职的检验,非常合理,而你却还想
细化。通常上2X2 Contingency Table用卡方或Fisher Exact Test,可以延伸到CXR(C
,R>2),但最好不要分类太多,一般3或4就可以了。像你前面那个例子:社交媒体,
朋友介绍,健身老师,张贴广告,。。共8-10项,也就8-10个类别,卡方检验也就非常
不敏感了。如果总体卡方不显著,你也没有必要往下做两两比较;如果总体卡方显著,
你再做两两比较,找到的差异组未必是你期望的。另外一点,划分太多的类别其结果很
难解释,最后往往都到了难以自圆其说的地步。
卡方检验受样本大小的影响也很大。青年人中40%有全职工作,而中年健身者中全职工
作的只有18%,只观察了1个月的数据卡方显示差距不显著。继续观察3年,两个比例不
变,但卡方检验却显示差距显著了。换句话说,只有你肯耐心的等下去,差异都可以让
你等出个显著来。。。
总体来说,感觉你的这个抽样调查设计并不合理,有了结果,列表出来就可以了。试图
用P值,显著性什么的来解释太过牵强了,未必让人信服。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 50.]

 
Rutland
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 10 ]

发信人: Rutland (樱桃), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Sat Apr 27 00:51:20 2019, 美东)

非常感谢!回答的真是太全面了,明白是怎么回事,下一步该怎么作了。

你介意有空时帮我看一下另外一个关于scatter plot的提问吗?在这里:http://www.mitbbs.com/article_t0/Statistics/31402375.html

像你说的,我虽然跟踪了4个学年,但是 r squaired value 每年都在0.20左右,我觉
得没必要按每学期来作一个scatter plot, 干脆把4年的数据放在一起做个总体的
scatter plot,表现两个变量间没什么correlation. 你觉得怎样?

非常感谢热心回答,祝周末快乐!





【 在 Bighappy (快乐大大大) 的大作中提到: 】
: 40
: 你其实应该首先说明你的零假设是什么,就省得别人一开始在ANOVA或是卡方检验纠缠
: 了。
: 根据你的描述,你希望的是比较比例的差异,所以卡方检验应该是首选。因为你划分的
: 类别太细,有可能得用Fisher Exact Test来取代卡方检验。
: 不过,这些讨论只限于教科书上的范围;也就是虽说理论上你可以这么做,但在实践中
: 却未必可取。一个明显的例子是LS建议是全职vs非全职的检验,非常合理,而你却还想
: 细化。通常上2X2 Contingency Table用卡方或Fisher Exact Test,可以延伸到CXR
(C
: ,R>2),但最好不要分类太多,一般3或4就可以了。像你前面那个例子:社交媒体,
: 朋友介绍,健身老师,张贴广告,。。共8-10项,也就8-10个类别,卡方检验也就非常
: ...................



--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 2001:558:6033:1]

 
okay
进入未名形象秀
我的博客
[回复] [回信给作者] [本篇全文] [本讨论区] [修改] [删除] [转寄] [转贴] [收藏] [举报] [ 11 ]

发信人: okay (傻人有傻福), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Tue May  7 10:45:55 2019, 美东)

response有2个,variables 是categorical, 用loglinear model analysis?

可以用frequence table先看下数据
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 98.]

[分页:1 ]
[快速返回] [ 进入统计讨论区] [返回顶部]
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996