《無料相談受付中》
  • TEL
    03-3803-5724
  • FAX
    03-6869-1564

データの代表値

データの代表値

今回はデータの代表値を書いてみましょう。

(1)平均値
 最もよく使われる指標と言ってもいいでしょう。データ母集団の大まかな量を把握するには向いているといえます。
 ただし、平均値はそのデータ母集団の構成と必ずしも一致するわけではありません。例えば4人の預金残高がそれぞれ100万円、200万円、800万円、900万円であったとき、平均預金残高は500万円ですが、500万円という平均貯蓄残高の人は誰もいないのです。
 
 そのため、話を代えて、ある店舗の1回の平均売上高が500円だとして、600円購入頂いたお客様には買上金額の10%を特別値引きしますというキャンペーンをうったとしてもまったく効果はないことがおわかり頂けると思います。

 そのため、もし、データ分析を行って、施策決定をしたいというならば、平均値のような「要約値」ではなく、ヒストグラムや散布図をつかって、データの全体的な分布を覧ることをお薦めします。
 
 上記の貯蓄の話であれば、データの全体的な分布を覧れば平均貯蓄が100~200万円の層と、同じく800~900万円の2グループに分類できることがわかるはずです。そうして2グループに分類して「それぞれの平均貯蓄残高」に合わせた施策決定を行っていくことがも求められるわけです。

 最後ですが、損益計算書の売上高総利益率もそれは企業のすべての製品等の平均売上高総利益率であり、すべての顧客の平均売上高総利益率です。そのため、単純に企業の売上高総利益率を向上させようという目標は、事実上何らの行動目標にならないことがおわかり頂けると思います。

(2)標準偏差
 標準偏差とはデータのぶれの大きさを示します。少しだけわかりやすく言えば「データ全体の平均値と個々のデータの差額の平均値」を意味します。
 例えばA店舗の5日間の売上高は1000,1200,1080,980,1100で、B店舗の同じく売上高は1000,1500,600,1200、800となっていれば目で数字を追っただけでB店舗の売上高の方がぶれが大きいとわかります。実際に標準偏差をExcel関数で計算してみますとA店舗は88、B店舗は349となり、B店舗の売上高の標準偏差が大きいことが数字で立証できます。

 それで、データのばらつきが大きいと何が問題となるかですが、予測が難しくなるということです。例えば売上高が今日は1000であった場合、明日は500になるかもしれない、または1500になるかもしれないというのでは商品の仕入量やバイトの人数を最適に決めることが難しくなるわけです。
 もし、高めに予測が外れれば機会損失が発生し、低めにはずれれば在庫ロス・無駄な人件費が発生してしまうわけです。すなわち、リスクが顕在化するということです。

 一般的にぶれが大きい(不確実性が高い)ビジネスほどにハイリスク・ハイリターンになり、逆にぶれが小さいビジネスほどローリスク・ローリターンになります。

 上記のように考えてきますと、利益額が大きくリスクが少ない事業が理想なのですが、現実的には難しいかもしれません。ただ、少なくても言えることは我々は利益だけを考えるのでなく、リスクも考える必要もあることでしょう。

 ちなみに変動係数という指標もあります。変動係数は「標準偏差÷平均値」です。標準偏差だけで例えば商品のリスクを比較しようとすると高額な商品ほど標準偏差が高くなり、比較が有効にできません。そのため、金額ではなく率で不確実性(リスク)を現したのが遠藤係数です。
 リスクの違いがあるような事業や商品を扱うのであれば利益と共に変動係数の管理が必要と個人的には考えています。