一些收获

关于今日对统计学的部分知识的理解

Posted by 柠萌 on October 23, 2017

从p值开始

对于空间自相关,之前一直没看明白,只是大概知其所以,但也就这样不知其所以然。

其中原因,也许是统计没学好。但这不能怪我,毕竟我们概率统计都没讲到假设检验。

今天上课讲地理统计,提到空间自相关,老师解释了一通p值,但似乎没戳到p值本质,于是我在网上找了一下,很糙地理解了何为p值。

假设-检验

你真的懂p值吗? - 说人话的统计学里面把p值讲得十分通俗易懂,是一篇难得的好文章。

原文对p值定义是:“在假定原假设为真时,得到与样本相同或者更极端的结果的概率。” 这和Wikipedia中引的定义差不多。 the probability for a given statistical model that, when the null hypothesis is true, the statistical summary (such as the sample mean difference between two compared groups) would be the same as or of greater magnitude than the actual observed results. refer - Wasserstein, Ronald L.; Lazar, Nicole A. (7 March 2016). “The ASA’s Statement on p-Values: Context, Process, and Purpose”. The American Statistician. 70 (2): 129–133. doi:10.1080/00031305.2016.1154108. Retrieved 30 October 2016.

文中,还举了一个很好的例子:

statistical model:AB两人掷硬币,硬币由A提供。

null hypothesis:B首先假设硬币是均质的。

observed results:B检查硬币,掷五次,出现五次正面。

在这个例子中p值:p=Pr(A)+Pr(B), 其中: A=the same asthe actual observed results(出现五次正面), B=greater magnitude than the actual observed results(更小概率的情况).

显然p值很小的时候我们的零假设就可以被拒绝了。

空间自相关

空间自相关的零假设是“空间分布是均匀的”,然后在这个条件下算出当前分布出现的概率和跟不均匀的概率的和,这个结果就是p值。

至于p值小于多少(显著性水平α),就是人为指定的了。

因此空间自相关的p值说明的是“在显著性水平α下没有发现足够的证据反对原假设”。

知乎上还提到,p值其实是拒绝真的概率,也就是说,如果我们拒绝假设,有p的概率是该假设为真。从而又引申出第一类错误、第二类错误的概念。

关于统计学

统计是一个很有趣而且实用的东西,在地理学的研究中其实十分重要,或者说,有时候我们对一些概念的不理解其实是因为统计没学好。

2017.10.23 晚 于广州