變異係數與相關係數

名詞解析

名詞: 變異係數(coefficient of variation)
解釋:

變異係數定義為樣本標準差除以樣本平均數。有時也用百分比表示:

名詞: 相關係數(correlation coefficient)
解釋:

設有兩組樣本,其樣本平均數分別為, , 樣本標準差分別為,且兩組樣本之樣本共變異數(covariance) 定義為

則相關係數 r 定義為

表兩組樣本之間的相關程度,其值介於-1與1之間。

名詞: 最小平方法(least squares method)
解釋:

若有 n 筆資料, 假設 y 對 x 的線性迴歸線為

則最小平方法主要是求出迴歸係數,使得

最小。我們可解出迴歸係數分別為

其中

 

生活中的實例

設甲、乙兩班某次數學考試成績,甲班樣本平均數為60分,樣本標準差為18分,乙班樣本平均數為65分,樣本標準差為13分。則甲班成績之變異係數為

乙班成績之變異係數為

所以乙班變異係數較小。 

某機構曾研究溫度對翻車魚(sunfish)的存活之影響。在一定溫度下, 經 x 單位時間, 翻車魚存活 y 比例的數據如下:

(0.10, 1.00), (0.15, 0.95), (0.20, 0.95), (0.25, 0.90), (0.30, 0.85),

(0.35, 0.70), (0.40, 0.65), (0.45, 0.60), (0.50, 0.55), (0.55, 0.40),

則我們可以計算出=0.325, =0.755, , , , 所以相關係數

r 小於0, 表 x 與 y 呈現負相關,即溫度提升, 翻車魚存活比例將明顯降低。其次設 y 對 x 之迴歸線為可算出

所以 y 對 x 之迴歸線為

散佈圖與迴歸線如下: