Statistics  @ eMaestro

Friday, September 24, 2004

Concept - P-value

p-value is in hypothesis testing context.
First you need a null hypothesis and alternative hypothesis.
Then you define a test statistics. Usually this test statistics has the
property that if its value is large then we reject the null hypothesis.
(ie. the larger value of test statistics, the more deviation from the null
hypothesis)
Then the p-value is probability that the test statistics (random variable) is
larger than its realization (value) under the null hypothesis.
(ie. the probability of more deviation events under the null hypothesis)

我们老师有句很精炼的概括:
P-value is the degree of how much the sample is near the hypothesis.

原话记不得了
我琢磨了很久,才觉得很有道理

以前的TA给过一句P-VALUE的正确定义,很好理解,回头我查查。
不过,
我们实践中可以把它看成“H0这个假设为真”的概率”,很方便的。(虽然这个解释在技
术上是错误的,因为在实际的population中,这个h0假设正确或者错误是确定的,只是尚
不知道。不涉及正确的概率是多少的问题。)

另外,
以前的理论会把p-value和所采用的a(显著性水平,significant
level)做比较,如果p-value比它大,就认为H0正确。如果p-value 比它小,就认为H0错
误。
现在基本上已经不再用这种方法了。
而是只看p-value,如果在0-0.01之间
,则(convicing)拒绝h0,0.01-0.05之间则(moderate)拒绝h0,如果在0.05-0.10之间则
(suggestive,but inconclusive)拒绝H0,在0.10以上,则接受h0.
so this is purely Fisherian's argument, w/o considering the consequence(or the
loss) of action and entirely lacks optimality consideration

比如在SPLUS中的各种TEST(如t.test(),binom.test())给出的结果就三个部分(对于参
数推论而言),estimated value of the parameter, CI of the parameter,p-value。

看来你们都未能真正理解p值,或者是没有说到点子上.
对纯被噎死学派来说,把p值解释成零假设成立的概率是可以的,因为H0被看成是随机事件,
是可以讨论概率的.
对频率学派来说,我的解释是:假设检验看成是类似于数学的反证法.假设H0成立,然后去找
矛盾,如果找到矛盾了,否定零假设,OK.没找到矛盾,并不能说明假设是成立的,可能是因为
你水平低运气差.
好了统计的假设检验类似于数学的反证法的地方在于它通过构造统计量(statistic)去找
反例(矛盾)--即小概率事件,因为统计只谈概率,没有绝对的真理或矛盾(你要较真的话可
以把概率为1或0看成真理或谬误),这是与数学不同之处.因为统计量是随机变量,所以可以
谈论概率. 因为统计量是人为构造的,所以不同的统计量power有高低.

some interesting relationships:
(1) If p is small, then reject H0
(2) If accept H0, then p must be large
(3) If failed to reject H0, we can not conclude to accept H0


0 Comments:

Post a Comment

<< Home