发帖回复
查看:4425|回复:27
  • 1
When you buy via links in posts, huaren.us may earn a commission
Advertisement

[灌水]有学统计的同志吗,进来一下

头像
0操作1 #
头像
1 #
0
04-05-17 17:02操作
查看全部AA分享不感兴趣
恩,你用什么作为gap between subgroup地衡量呢?是difference between the means of subgroups么?
如果是,这个不就是一个很简单的2 sample t test么。
用不到anova德说
头像
0操作2 #
头像
2 #
0
04-05-17 18:05操作
查看全部AA分享
2 sample t test assumptions:

1. independent 2 samples
2. normally distributed. 这个,你画个histogram,看看data是不是类似于normal形状的,一般你的data如果不是被truncated得,或者不是有两个modes得,都可以假设满足把。反正世界上没有perfectly normal得data.泥的数据多么?如果多,还可以run一下normality test之类的
3。 variance assumption. 这个无所谓了。你either可以assume equal variances or unequal variances. 反正软件都给你两个结果的。主要就是他们算p-value的时候,用不同的degrees of freedom而已。如果想play with the results,你就拿个对你最有利的p value就是了。

反正统计就这么回事,结果significant了,client就开心了。不significant,就挖空心思,用别的各种方法,直到弄出significant来。

以下是引用robinsnow在2004-5-17 17:43:43的发言:
是的是的
我也觉得是这样子的
不过t-test有什么assumption之类的吗
(看到有人说他们的这个这个不能用t-test的)
我可能不argue什么t value significant拉
这是不是比较简单
不用假设一个null distribution

以下是引用bbcat在2004-5-17 17:02:37的发言:
恩,你用什么作为gap between subgroup地衡量呢?是difference between the means of subgroups么?
如果是,这个不就是一个很简单的2 sample t test么。
用不到anova德说

Advertisement
头像
0操作3 #
头像
3 #
0
04-05-17 18:09操作
查看全部AA分享
恩,你说得太对了。
robinsnow,如果你的数据不多,而且,那个histogram什么的,看起来很恶心,不normal,你最好用这个wilcoxon rank sum test,这个只需要两个sample independent得assumption,别的什么都不用。
在这种情况下,这个test是比较powerful得

8过,如果你有比较多的数据,而且数据是normally distributed得,
用2 sample t test是更加powerful得。


以下是引用ondietmm在2004-5-17 17:54:57的发言:

是不是可以试一下nonparametric analysis 里的 Wilcoxon test 啊?这个不需要什么assumptions
头像
0操作4 #
头像
4 #
0
04-05-17 18:58操作
查看全部AA分享
是呀,就是那些number,你的数据是什么形式储存的?
叫软件给你画个图不就好了,看一下是不是bell shape得。
不麻烦的

以下是引用robinsnow在2004-5-17 18:41:58的发言:
完了
normal distribution?
是谁啊?是说那些raw data吗?
就是那些我用来算average和sd的numbers吗?
什么叫数据多阿
每个mean, 从两个,到一百多个,number里面算得
让我google一下这个rank sum

头像
0操作5 #
头像
5 #
0
04-05-17 23:32操作
查看全部AA分享
恩,不是。应该是这样子,
你一个group有两个subgroup是把,你的兴趣是subgroup得difference,假设这个叫做D1. 所以,你应该是画这个D1,看看是不是bell shape.
对于另外一个group得subgroup difference,假设为D2,再画一下。
如果这次看起来不错,那就万事大吉了。用t test德了

然后,你的null hypothesis is: D1=D2

如果你用wilcoxon test,就是rank所有的D1和D2们,然后按照那个方法算出一个test statistic. 不过,不推荐你手算,太可怕了,这么多observation.excel没有给对应的table得。而且,很有可能,你的那些d1和d2得rank有ties。如果有ties,就不能用那个你说得table,我记得是要用normal approximation得。
嗯,说了这么多,可能都把你搞糊涂了。
你有sas么?这个如果在sas,很容易做的,他什么都给你了。你就打几个语句进取就可以了。excel spredsheet也很容易import进sas.


以下是引用robinsnow在2004-5-17 22:49:41的发言:
正如我所料
他们不是normal distribution的
(btw, 我拿了一组137个data point的,花了histogram,
跟normal根本不沾边儿)
这个wilcoxon, 我学习了一下
好像sum完了之后要查表
根据两个sample sequence 中的sample数量来查
google来的文件里面只有12个samples以下的表
问题:
哪里有很大的表可以查?
我在excel里面search了一下,好像也没有这个功能




[此贴子已经被作者于2004-5-17 23:33:54编辑过]

Advertisement
头像
0操作6 #
头像
6 #
0
04-05-18 17:53操作
查看全部AA分享
厚厚,这个问题的结论是,你们公司应该hire一个statistician,或者直接去consult一把亚
头像
0操作7 #
头像
7 #
0
04-05-18 18:30操作
查看全部AA分享
酱紫阿。如果你不介意,把整个data,问题给我看看吧。
保证给你搞定得说

以下是引用robinsnow在2004-5-18 18:23:19的发言:
我自己的thesis, hire谁呢;-(
发帖回复
查看:4425|回复:27
  • 1
Advertisement
打开收藏板块打开个人中心
边缘侧滑返回