連載「X線CTで高精度寸法測定!?」

◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇ 標準偏差をエクセルで計算すると・・・ 発行:エスオーエル株式会社 http://www.sol-j.co.jp/ 連載「X線CTで高精度寸法測定!?」 2012年6月10日号 VOL.015 平素は格別のお引き立てを賜り、厚く御礼申し上げます。 X線CTスキャンによる精密測定やアプリケーション開発情報などをテーマに、 無料にてメールマガジンを配信いたしております。 ◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇ 測定機を使って測定データを集めた後は、 データを統計的手法によって解析するのが常です。 分布の広がり具合を表す指標として、標準偏差というものがあります。 統計学の教科書を開くと、最初の方に定義が載っていて、データ数がnのとき、   (標準偏差)^2 = Σ( 各データ値 - 平均値 )^2 /n であるとなっています。 そこで、現代にはエクセルという便利なツールがありますから、 この計算をさせてみます。 例として、(123, 124, 126, 128) という4つのデータから、 定義に従って、標準偏差を計算してみます。 結果は、1.920 となります。 しかし、毎回、データの平均値を求めて、各データから引いて、二乗して、 全てを足し上げた後、nで割って、平方根を取るというのは面倒です。 そこで、もっと便利な出し方はないものかと、調べてみると、 エクセルに一発で標準偏差を計算してくれる STDEV という関数があることに 気が付きます。 しめしめと思い、さっきの例で計算してみます。 すると、あれっ?答えが違います。2.217 になってしまいます。 どちらが正しいのでしょうか? 実は、教科書の定義式もエクセルも間違ってはいません。 標準偏差を計算しましたと言っても、冒頭の定義式とエクセルの STDEV は、 少し違うものを計算しています。 コンピュータは言われたとおりの計算をするだけなので、 どちらで計算すべきかは、人間がちゃんと考える必要があります。 エクセルの STDEV は、   (標準偏差)^2 = Σ( 各データ値 - 平均値 )^2 /(n-1) です。n ではなく、n-1 で割っているのがミソです。 与えられたデータが全てで、その標準偏差を計算しなさいと言われた場合、 n で割るのが正しい計算方法です。 一方で、手元のデータが全てではなく、 もっと多くのデータがあるところ(母集団)から無作為に拾ってきた標本 とみなせるとき、 n-1 で割るのが正しい計算方法です。 どうしてこうなるかというと、母集団の分散(標準偏差の二乗)が σ^2 のとき、 標本の分散 s^2 の期待値 E[s^2] を計算すると、   E[s^2] = σ^2 - σ^2 /n と少し小さくなってしまうからです。 この2つが一致すること、つまり無作為標本の標準偏差を計算することで、 母集団の標準偏差を正しく推定できるようにすることのために、 n ではなく n-1 で割って、E[s^2] = σ^2 となるようにしているのです。 ちなみに、エクセルでも n で割る標準偏差を計算する関数があって、 STDEVP です。 ただ、実用的に使う頻度が多いのは、STDEV の方ではないでしょうか。 推定の話は、統計学の教科書のちょっと後ろの方に出てくるので、 標準偏差の定義を n で割るで覚えて、推定の詳細はよく理解していないけど、 エクセルで STDEV を使って、正しい答えを得ている というケースも多いのかもしれません。 普段便利に使っているツールの背後にある原理や理論を少し立ち止まって 見直してみるのも楽しいものです。 -- 高野智暢 ☆TomoScope専門サイトはこちら☆ ●┳┳┳●━━━━ 連 絡 先 ━━━━━━━━━━━━━ ┣╋╋○ エスオーエル株式会社 ( SOL ) ┣╋○ 〒335-0012 埼玉県戸田市中町1-34-1 ┣○ Tel: 048-441-1133 Fax: 048-445-1678 ● Email: sales@sol-j.co.jp Web: http://www.sol-j.co.jp    --デモ測定を承ります-- 詳細は上記Webサイトまで

測定機に関する理論や解析技術の情報発信として、定期的にメールマガジンを無料配信しています。メルマガにご登録頂くと、最新情報やWEB未公開の情報をいち早くお手元にお届けすることができます。

メルマガご登録はこちらから