讀書:小島寬之《你一定愛讀的極簡統(tǒng)計學》短評

隨便在某寶上搜搜“極簡統(tǒng)計學”這類的書,出來的不少都是日本作者寫的讀物,比如永野裕之《寫給所有人的極簡統(tǒng)計學》,小宮山博仁《預測未來的極簡統(tǒng)計學》、涌井良幸《統(tǒng)計學入門很簡單:看得懂的極簡統(tǒng)計學》以及這本《你一定愛讀的極簡統(tǒng)計學》,所有的這類書都有一個特點:買了以后去讀發(fā)現(xiàn)名為極簡,實際上挖坑都極深,然后后悔為什么不去買另一本,買回來下一本之后繼續(xù)后悔。
你要問我為什么一下子就相中了小島寬之這本書,第一,它看起來挺薄,而且價格相對便宜;第二,本書幾乎不使用概率;第三,本書不使用組合符號、求和符號和隨機變量的期望值,完全排除微積分。你可以接受“統(tǒng)計學的本質和數(shù)學符號是兩回事”的觀點,然后還可以做出如下感想:不,這書你不愛讀,一點也不愛讀。我寧可去讀遠山啟的《數(shù)學與生活》,再重溫一下從小學到大學被數(shù)學支配的那種恐懼,也不愿掉進極簡的坑中。
我個人覺得本書有些太過于執(zhí)著“極簡”兩個字了,所謂“再精簡下去,就不是統(tǒng)計學了”,固然只用初中數(shù)學知識(比如一元一次不等式、開方計算)等完成了書內的絕大部分計算,砍掉了很多數(shù)學內容,從知識學習上說,在某個子系統(tǒng)層面的認知上減少一些東西,必然要在其他子系統(tǒng)層面的認知上增加一些東西。
這種思路,在某些方面相當精妙:比如講標準正態(tài)分布,對待無限個數(shù)據(jù)時,將其定義為與面積相同的量(真正平滑的曲線圖與細柱圖近似),這個處理很方面缺乏相應知識背景的讀者理解;或者,“海水水位”是平均值,浪涌的激烈程度是“標準差”,這就很直觀;還有把住宅參觀者人數(shù)轉換為拋硬幣的問題,條件限制和轉換比較巧妙;
當然,在某些方面處理就有些差強人意:比如講隨機抽樣法和總體均值,為了不涉及概率表達,專門從無限母群體構造講起,說隨機抽樣法的假設,是“進行足夠多次的觀測做成直方圖,再現(xiàn)母群體分布”,原理固然是這么個原理,但是有些繞圈圈;再或,這本書里關于推論統(tǒng)計學有一個很重要的概念叫“95%預測命中區(qū)間”,這對不少讀者來講就有些劍走偏鋒。
這本書的緊緊圍繞的核心概念是“標準差”,這在第一部分就講明白了,而這部分,包括正態(tài)分布,假設檢驗等內容是最適合初學者入門的部分;第二部分的思路其實也比較清晰,它要逐漸解決4個問題:1.已知正態(tài)母群體和總體方差時,總體均值的估計;2.已知正態(tài)母群體和總體均值時,總體方差的估計;3.已知正態(tài)母群體,未知總體均值時,總體方差的估計;4.已知正態(tài)母群體,未知總體方差時,總體均值的估計。這一部分的內容基本是跟著例題的思路捋下來的,但要在“其他子系統(tǒng)層面的認知上增加一些東西”了,倒不如一開始去看看《統(tǒng)計學概論》打打基礎。
PS:前幾天和老楊喝酒,說起看書看得太雜,保持好奇心,和對未知世界的探索欲望,固然是好的,然“吾生也有涯,而知也無涯。以有涯隨無涯,殆已”——即便老楊認為人精力有限,讀書要有方向,還一定要讀最好的。人類,終歸讀書轉化的效率太低,而為求得某一方面的深入成本太高,一生就是在不斷地和時間賽跑,關鍵自己還得知道“已而為知者,殆而已矣”。