3 注解
標準差是表征被統計數據組中,每一數據偏離平均值程度大小的數量指標。亦稱“均方差”或“均方根”。即由離差(距平)平方和的平均數,再開平方后所得的算術根的值。若一數列中各“變量彼此相差很小則平均數比較穩定,代表性強;若平均數穩定性小,則代表性也差。因此,平均數并不能完全說明隨機變量的特征,為了補充平均數的不足,還要研究它的離散度。數列中最大值Dmax與最小值Dmin之差稱為全距,用符號“D”表示。D=Dmax-Dmin,全距表示了數列變化的范圍。數列中各項數值與算術平均值的距離叫做離差,亦稱距平,用符號“d”表示。如數列x1,x2,…xn,算術平均值為
離差,
(1)當di>0,稱為正離差(正距平);
(2)當di<0,稱為負離差(負距平);
(3)當di=O,稱為零離差(零距平)。離差僅是對一個隨機變量的分布在其均值(數學期望)附近的展布而言的,它反映了隨機變量與均值(數學期望)的偏離程度。標準差可由離差平方和的平均數再開平方求得。在不分組的情況下,標準差的計算公式是:
標準差是樣本內各變數變異程度的度量。由樣本計算標準差的公式為:
為求和符號。從上可知標準差是反映樣本內各個變數與平均數差異大小的一個統計參數。從S可了解樣本內各變數的變異程度及樣本平均數代差,反之亦然。此外,在生物統計中,還用樣本標準差來估計總體標準差。在實踐中通常用下式計算樣本標準差S。
舉例:調查某小組18名學生的身高(cm),其數據為:173,165,154,180,175,170,166,162,158,169,160,174,179,177,168,157,160,163。經計算得∑x=3010,∑x2=504408,
數的次數分布作出估計,如觀察數據屬常態分布(正態分布),于是有:
的范圍內;變數的個數約有95.46%落在x±2S的范圍內;變數的個數
167.2222±7.9303(159.2919~175.1525)厘米的范圍內;約有95%的學生身高在167.2222±2×7.9303(151.3616~183.0828)厘
和標準差是分析數量性狀最常用的兩個參數。