〈解説〉平均値と偏差、平方和、分散
平均値
データを数直線上にプロットしたときの、重心の位置にあたる値が平均値です。数直線を重さのないてんびん棒、データを重さ1のおもりと考えたとき、てんびんがつり合う位置が平均値です。
偏差
データからある定数を引いた値を偏差といいます。通常は平均値を引いた値を指します。平均より小さいデータの偏差(負の偏差)の絶対値の総和と、平均より大きいデータの偏差(正の偏差)の絶対値の総和は等しくなり、足し合わせると0になります。
分散
偏差を二乗して総和をとった値を偏差平方和(偏差二乗和)といいます。偏差を計算するときのある定数をデータの平均値にすると、偏差二乗和は最小の値をとります。平均値からの偏差二乗和をデータ数(自由度)で割った値が分散で、分散が小さいほど、データが平均値のまわりに密集しており、分散が大きいほど、データが平均値から離れて散らばっていることを意味する指標です。
直感と計算とのずれを体感する
このシミュレーションでは、プロットの配置だけをたよりに、平均値の位置を探します。データが左右対称でない場合、平均の位置は直感と大きく異なる場合があります。直感に頼らず、偏差の和や偏差二乗の値に注目して、正しい平均値の位置を探してください。