当前在线人数14844
首页 - 分类讨论区 - 学术学科 - 统计版 -阅读文章
未名交友
[更多]
[更多]
文章阅读:Re: 问个Chi-Square和T-test的问题
[同主题阅读] [版面: 统计] [作者:Bighappy] , 2019年04月26日15:41:52
Bighappy
进入未名形象秀
我的博客
[上篇] [下篇] [同主题上篇] [同主题下篇]

发信人: Bighappy (快乐大大大), 信区: Statistics
标  题: Re: 问个Chi-Square和T-test的问题
发信站: BBS 未名空间站 (Fri Apr 26 15:41:52 2019, 美东)


【 在 Rutland (樱桃) 的大作中提到: 】
: 谢谢回答!
: 并非是要做全职vs非全职的检验。
: 主要想了解同类职业状况在不同人群中比例的差异。比如在同一个健身房里青年人中
40
: %有全职工作,而中年健身者中全职工作的只有18%,想得出这两者的比例差异达到了
: statistically significant different的结论. 在同一健身房里观察了3年,每年这两
: 组人的职业比例差异都大到significantly different,所以想得出结论说年轻人中有
: 全职工作的健身者比中年人的比率高。
: 用同样的方法也可以作年轻人比中年人更多通过social media找到健身房。这样的情况
: 可以用select cases, 然后把同是全职的两组年龄的人进行比较,看proportation大的
: 程度,这样可以吗?
: ...................


你其实应该首先说明你的零假设是什么,就省得别人一开始在ANOVA或是卡方检验纠缠
了。
根据你的描述,你希望的是比较比例的差异,所以卡方检验应该是首选。因为你划分的
类别太细,有可能得用Fisher Exact Test来取代卡方检验。
不过,这些讨论只限于教科书上的范围;也就是虽说理论上你可以这么做,但在实践中
却未必可取。一个明显的例子是LS建议是全职vs非全职的检验,非常合理,而你却还想
细化。通常上2X2 Contingency Table用卡方或Fisher Exact Test,可以延伸到CXR(C
,R>2),但最好不要分类太多,一般3或4就可以了。像你前面那个例子:社交媒体,
朋友介绍,健身老师,张贴广告,。。共8-10项,也就8-10个类别,卡方检验也就非常
不敏感了。如果总体卡方不显著,你也没有必要往下做两两比较;如果总体卡方显著,
你再做两两比较,找到的差异组未必是你期望的。另外一点,划分太多的类别其结果很
难解释,最后往往都到了难以自圆其说的地步。
卡方检验受样本大小的影响也很大。青年人中40%有全职工作,而中年健身者中全职工
作的只有18%,只观察了1个月的数据卡方显示差距不显著。继续观察3年,两个比例不
变,但卡方检验却显示差距显著了。换句话说,只有你肯耐心的等下去,差异都可以让
你等出个显著来。。。
总体来说,感觉你的这个抽样调查设计并不合理,有了结果,列表出来就可以了。试图
用P值,显著性什么的来解释太过牵强了,未必让人信服。
--
※ 来源:·WWW 未名空间站 网址:mitbbs.com 移动:在应用商店搜索未名空间·[FROM: 50.]

[上篇] [下篇] [同主题上篇] [同主题下篇]
[转寄] [转贴] [回信给作者] [修改文章] [删除文章] [同主题阅读] [从此处展开] [返回版面] [快速返回] [收藏] [举报]
 
回复文章
标题:
内 容:

未名交友
将您的链接放在这儿

友情链接


 

Site Map - Contact Us - Terms and Conditions - Privacy Policy

版权所有,未名空间(mitbbs.com),since 1996