把某統計資料集合,比如
以點圖(Dot plot)表示如下:
我們可以找出這集的標準差(standard deviation),電腦代勞,見下:
http://www.wolframalpha.com/input/?i=standard+deviation+of+1,1,1,2,2,2,2,2,3,3,4,4,4,5
好了,現有兩組資料,分別以紅藍兩種顏色表示如下:
問:兩組資料集的標準差相等嗎?
不用直接計算,紅組不過是把藍組對應點,右移 7 個單位,情況就如把同班學生的數學測驗分,每人都加 7 分,無損彼此間分數之參差,即標準差沒改變。
找電腦確認一下:
http://www.wolframalpha.com/input/?i=standard+deviation+of+8,8,8,9,9,9,9,9,10,10,11,11,11,12
好了,如果點圖如下:
問:藍綠兩組資料集的標準差相等嗎?
在班中問過此例,學生也感猶疑。你認為怎樣?
先找電腦輸入資料
確定一下:
http://www.wolframalpha.com/input/?i=standard+deviation+of+8,9,9,9,10,10,11,11,11,11,11,12,12,12
可知藍綠兩組資料集的標準差是相等的。
如何解釋這現象?會不會只是因為資料與資料的間距相同(相差一個單位)才會這樣?
讓我加多一對「對稱」點(和旁邊的資料間距為 0.5 者)如下:
請問,以上藍綠兩組資料集的標準差相等嗎?
藍組的標準差是
http://www.wolframalpha.com/input/?i=standard+deviation+of+1,1,1,2,2,2,2,2,3,3,4,4,4,5,5.5
綠組的標準差是
http://www.wolframalpha.com/input/?i=standard+deviation+of+7.5,8,9,9,9,10,10,11,11,11,11,11,12,12,12
也是相等的。初步猜想,因兩組資料點的「分佈形狀」一樣,「離散程度」理應相同。
但如何證明或否證上述猜想?
(即如何使用數學說服同學?那天,我見部份沒有在堂上睡覺的學生滿臉狐疑,很想多談,但都是走過場算,少在堂上談這些無聊東西,在 blog 談算。)
先要知道,把整個資料點集左右平移,完全不會影響該集的標準差,標準差仍保持不變。
於是我可以把藍綠兩組資料點集平移到一個位置,使對稱軸落在 的位置,見下:
假設綠組的資料是
對稱地,藍組的資料便是
又假設綠組的平均數是 ,
易知藍組的平均數是 (同學,證明一下)
於是,綠組的方差(variance)是
(其中 )
而藍組的方差是
可見藍綠組的方差相等,故它們的標準差也相同。
注:因這是 core mathematics 的東西,我逃避使用 summation sign 和更直接的方差公式:
Also read
https://johnmayhk.wordpress.com/2012/01/12/just-a-core-math-question/
https://johnmayhk.wordpress.com/2012/01/14/just-a-question-of-core-math-2/
