发帖回复
查看:4420|回复:27
When you buy via links in posts, huaren.us may earn a commission
Advertisement

[灌水]有学统计的同志吗,进来一下

头像
0操作1 #
头像
1 #
0
04-05-17 15:50操作
只看楼主AA分享不感兴趣
[灌水]有学统计的同志吗,进来一下
如果我有两个group of numbers,
每个group又有两个subgroup of numbers
算出来各自的average and standard deviation
我想知道那个group的gap between subgroups大
这个统计上面有什么现成的概念算法吗?

例子
group 1
alg 1: ave 0.41, sd 0.05
alg 2: ave 0.39, sd 0.04

group 2
alg 1: ave 0.56, sd 0.11
alg 2: ave 0.42, sd 0.10

which of the groups have larger gap between the two algorithms 呢?
觉得光比average比较容易引起argument

超级感谢~~~any pointers are appreciated!
头像
0操作2 #
头像
2 #
0
04-05-17 16:01操作
只看TAAA分享
偶不是学统计的,先来胡说两句:比average 不够,要看sd, 用t-stat就行了。
这里有一页原理/公式解释的很清楚:
http://trochim.human.cornell.edu/kb/stat_t.htm
Advertisement
头像
0操作3 #
头像
3 #
0
04-05-17 16:12操作
只看楼主AA分享
[em31][em05]
seems i can calculate t-test for the two groups...
thanks a bunch!
can start looking into statistics textbook now!

以下是引用EverAfter在2004-5-17 16:01:53的发言:
偶不是学统计的,先来胡说两句:比average 不够,要看sd, 用t-stat就行了。
这里有一页原理/公式解释的很清楚:
http://trochim.human.cornell.edu/kb/stat_t.htm
头像
0操作4 #
头像
4 #
0
04-05-17 16:21操作
只看TAAA分享
ANOVA
头像
0操作5 #
头像
5 #
0
04-05-17 16:39操作
只看楼主AA分享
[em05], 这个是什么啊?

以下是引用maye在2004-5-17 16:21:06的发言:
ANOVA
Advertisement
头像
0操作7 #
头像
7 #
0
04-05-17 16:47操作
只看楼主AA分享
google了一下
看得我晕头转向
(everafter那个t-test page写得真是清楚啊,btw)
没看明白那些sum是整个dataset的还是各个group的
不过是个candidate, 我去看看书吧!
谢谢各位美女!


以下是引用Poohbear在2004-5-17 16:41:13的发言:
以下是引用robinsnow在2004-5-17 16:39:17的发言:
[em05], 这个是什么啊?

以下是引用maye在2004-5-17 16:21:06的发言:
ANOVA



Analysis of Variance
头像
0操作8 #
头像
8 #
0
04-05-17 17:02操作
只看TAAA分享
恩,你用什么作为gap between subgroup地衡量呢?是difference between the means of subgroups么?
如果是,这个不就是一个很简单的2 sample t test么。
用不到anova德说
头像
0操作9 #
头像
9 #
0
04-05-17 17:43操作
只看楼主AA分享
是的是的
我也觉得是这样子的
不过t-test有什么assumption之类的吗
(看到有人说他们的这个这个不能用t-test的)
我可能不argue什么t value significant拉
这是不是比较简单
不用假设一个null distribution

以下是引用bbcat在2004-5-17 17:02:37的发言:
恩,你用什么作为gap between subgroup地衡量呢?是difference between the means of subgroups么?
如果是,这个不就是一个很简单的2 sample t test么。
用不到anova德说
头像
0操作10 #
头像
10 #
0
04-05-17 17:54操作
只看TAAA分享
以下是引用robinsnow在2004-5-17 17:43:43的发言:
是的是的
我也觉得是这样子的
不过t-test有什么assumption之类的吗
(看到有人说他们的这个这个不能用t-test的)
我可能不argue什么t value significant拉
这是不是比较简单
不用假设一个null distribution

以下是引用bbcat在2004-5-17 17:02:37的发言:
恩,你用什么作为gap between subgroup地衡量呢?是difference between the means of subgroups么?
如果是,这个不就是一个很简单的2 sample t test么。
用不到anova德说



是不是可以试一下nonparametric analysis 里的 Wilcoxon test 啊?这个不需要什么assumptions
头像
0操作11 #
头像
11 #
0
04-05-17 18:05操作
只看TAAA分享
2 sample t test assumptions:

1. independent 2 samples
2. normally distributed. 这个,你画个histogram,看看data是不是类似于normal形状的,一般你的data如果不是被truncated得,或者不是有两个modes得,都可以假设满足把。反正世界上没有perfectly normal得data.泥的数据多么?如果多,还可以run一下normality test之类的
3。 variance assumption. 这个无所谓了。你either可以assume equal variances or unequal variances. 反正软件都给你两个结果的。主要就是他们算p-value的时候,用不同的degrees of freedom而已。如果想play with the results,你就拿个对你最有利的p value就是了。

反正统计就这么回事,结果significant了,client就开心了。不significant,就挖空心思,用别的各种方法,直到弄出significant来。

以下是引用robinsnow在2004-5-17 17:43:43的发言:
是的是的
我也觉得是这样子的
不过t-test有什么assumption之类的吗
(看到有人说他们的这个这个不能用t-test的)
我可能不argue什么t value significant拉
这是不是比较简单
不用假设一个null distribution

以下是引用bbcat在2004-5-17 17:02:37的发言:
恩,你用什么作为gap between subgroup地衡量呢?是difference between the means of subgroups么?
如果是,这个不就是一个很简单的2 sample t test么。
用不到anova德说

Advertisement
头像
0操作12 #
头像
12 #
0
04-05-17 18:09操作
只看TAAA分享
恩,你说得太对了。
robinsnow,如果你的数据不多,而且,那个histogram什么的,看起来很恶心,不normal,你最好用这个wilcoxon rank sum test,这个只需要两个sample independent得assumption,别的什么都不用。
在这种情况下,这个test是比较powerful得

8过,如果你有比较多的数据,而且数据是normally distributed得,
用2 sample t test是更加powerful得。


以下是引用ondietmm在2004-5-17 17:54:57的发言:

是不是可以试一下nonparametric analysis 里的 Wilcoxon test 啊?这个不需要什么assumptions
头像
0操作13 #
头像
13 #
0
04-05-17 18:41操作
只看楼主AA分享
完了
normal distribution?
是谁啊?是说那些raw data吗?
就是那些我用来算average和sd的numbers吗?
什么叫数据多阿
每个mean, 从两个,到一百多个,number里面算得
让我google一下这个rank sum


以下是引用bbcat在2004-5-17 18:09:06的发言:
恩,你说得太对了。
robinsnow,如果你的数据不多,而且,那个histogram什么的,看起来很恶心,不normal,你最好用这个wilcoxon rank sum test,这个只需要两个sample independent得assumption,别的什么都不用。
在这种情况下,这个test是比较powerful得

8过,如果你有比较多的数据,而且数据是normally distributed得,
用2 sample t test是更加powerful得。


以下是引用ondietmm在2004-5-17 17:54:57的发言:

是不是可以试一下nonparametric analysis 里的 Wilcoxon test 啊?这个不需要什么assumptions

头像
0操作14 #
头像
14 #
0
04-05-17 18:58操作
只看TAAA分享
是呀,就是那些number,你的数据是什么形式储存的?
叫软件给你画个图不就好了,看一下是不是bell shape得。
不麻烦的

以下是引用robinsnow在2004-5-17 18:41:58的发言:
完了
normal distribution?
是谁啊?是说那些raw data吗?
就是那些我用来算average和sd的numbers吗?
什么叫数据多阿
每个mean, 从两个,到一百多个,number里面算得
让我google一下这个rank sum

头像
0操作15 #
头像
15 #
0
04-05-17 20:41操作
只看TAAA分享
我刚刚进入统计系,才开始补微积分的课。想问问统计难学吗?
头像
0操作16 #
头像
16 #
0
04-05-17 20:48操作
只看TAAA分享
有人觉得难, 有人觉得简单, 看你的数学基础了, 基础好,不用担心, 基础不好, 就看你的学东西快不快, 聪明不聪明了.

以下是引用fionabeiyi在2004-5-17 20:41:24的发言:
我刚刚进入统计系,才开始补微积分的课。想问问统计难学吗?
Advertisement
头像
0操作17 #
头像
17 #
0
04-05-17 20:53操作
只看TAAA分享
学了一点儿统计,觉得ROBINSNOW要介绍一下这个STUDY的DESIGN先。 在我看来, you have an outcome variable which is continuous and two covariates (group factor & subgroup factor) which are categorical. What is the group factor, treatment or block? What is the subgroup factor? Is subgroup factor independent of group factor or nested within it? If it is the former, then it seems you have a 2x2 factorial design. If it is the latter, then it is a block design. For either case, you should use ANOVA to evaluate the differences between groups or subgroups. However, ANOVA is just a general term, there are different methodologies for different designs. Personally, I don't think two-sample t test or Wilcoxon rank sum test will do the work in this case. Just my two cents.
头像
0操作18 #
头像
18 #
0
04-05-17 20:58操作
只看TAAA分享
In addition, you don't need to calculate the test result yourself. Besides, sometimes the computation is complicated and to do it by hand would be very hard, especially when you have to estimate variances or compare multiple pairs using Tukey or Bonferroni. I suggest you use a statistical software such as SAS.
头像
0操作19 #
头像
19 #
0
04-05-17 22:49操作
只看楼主AA分享
正如我所料
他们不是normal distribution的
(btw, 我拿了一组137个data point的,花了histogram,
跟normal根本不沾边儿)
这个wilcoxon, 我学习了一下
好像sum完了之后要查表
根据两个sample sequence 中的sample数量来查
google来的文件里面只有12个samples以下的表
问题:
哪里有很大的表可以查?
我在excel里面search了一下,好像也没有这个功能
头像
0操作20 #
头像
20 #
0
04-05-17 22:52操作
只看楼主AA分享
i probably use the wrong word...
the group is not a factor at all
by two groups of data...i mean two sets of data...


以下是引用roseprimrose在2004-5-17 20:53:15的发言:
学了一点儿统计,觉得ROBINSNOW要介绍一下这个STUDY的DESIGN先。 在我看来, you have an outcome variable which is continuous and two covariates (group factor & subgroup factor) which are categorical. What is the group factor, treatment or block? What is the subgroup factor? Is subgroup factor independent of group factor or nested within it? If it is the former, then it seems you have a 2x2 factorial design. If it is the latter, then it is a block design. For either case, you should use ANOVA to evaluate the differences between groups or subgroups. However, ANOVA is just a general term, there are different methodologies for different designs. Personally, I don't think two-sample t test or Wilcoxon rank sum test will do the work in this case. Just my two cents.
发帖回复
查看:4420|回复:27
Advertisement
打开收藏板块打开个人中心
边缘侧滑返回