本日、拙著を購入していただいた採用担当の方とアポイントがありました。はじめてお会いする方だったので緊張しましたが、私の本を用意してくださり、そこにはたくさんの付箋が貼付けられていました。
「嬉しい」
心の底からそう思いました。過去にも同様のアポイントを経験していますが、何度あっても嬉しいものです。嬉しくて無理を言って写真を撮らせていただきました。本当にありがとうございました。
さて、この投稿では、本日の商談でいくつかご質問をいただいた中から、「標準偏差」について解説したいと思います。
その前に、タイトルに付けた「今月の応募数が減った理由」について簡単に触れておきます。特にはじめてお会いする採用担当の方から、「先月に比べ、今月の応募数が少ないのですが理由は分かりますか?」と聞かれることが多いです。
その回答で用いているのが「標準偏差」の考えです。応募数は増えたり減ったりするので、特に大きなイベントがなければ、前月と今月の応募数を比較をしてもあまり意味がありません。この辺りをこの記事で掴んでいただけたら幸いです。
応募数の増減を予測したいのであれば、時系列分析や状態空間モデルで大きな流れ(トレンド)を予測することもできます。それは、また別の機会に投稿します。
標準偏差とは
標準偏差は(ひょうじゅんへんさ)と読みます。統計学でよく利用される指標なので、下記の問いでイメージを摑んでください。
問:過去の応募数が以下の状態だった場合、10月の応募数を予測してください。
1月 25件
2月 18件
3月 26件
4月 24件
5月 19件
6月 30件
7月 29件
8月 20件
9月 28件
10月 ??件
こんな感じで応募があったとすると、10月の応募数はどのくらいになりそうでしょうか? ちなみに、1~9月までの平均の応募数は「24」件です。
20応募ですかね? それとも30応募でしょうか?
恐らく、多くの方が平均の24件近くの数値をイメージされたと思います。 中には0件や100件という方もいるかも知れませんが、この、「多くの人が平均の24件の近くをイメージしたこと」(私の推測)が、標準偏差を理解するポイントです。
多くの方がイメージしたということは、「平均24の近くの値が確率的に高い」と判断したと言うことができます。平均の24件と1月~9月までの応募数(実測)から予測すると、10月の応募数はプラスマイナス5くらい(19~29)になりそうですよね=確率的に高そうですよね。
平均値の近くは確率が高く、平均値から離れると確率が低くなることがイメージできれば、標準偏差はほぼ理解できたといっても過言ではありません。時系列や確率分布といった数学的な理解は必要ですが、ここでは一切無視したいと思います。
「いつもだいたいこのくらい」とイメージできるのが「標準偏差」と覚えてください。で、実際の「幅」(いつもこのくらいの数値)はいくつなんだよ!という問いがあった場合に、Rを使って計算すればよいと思います(私たちはちゃんと計算しますが)。
1 2 3 4 5 6 |
oubo <- c(25,18,26,24,19,30,29,20,28) sd(oubo) > oubo <- c(25,18,26,24,19,30,29,20,28) > sd(oubo) [1] 4.444097 |
Rで標準偏差sd()を算出すると「4.444097」と出ました。この値を平均値の24からプラスマイナスすると、10月の応募数は約68%の確率で20~28件の応募であることが予測できます。
問題は、いつもこれくらいと思っていた数値から大きく値が外れた時です。平均24件なのに、0件や100件など、確率的に低い数値が観測できた場合は、原因の特定を急ぎます。こうしたアラートとしても標準偏差は活用できます。
標準偏差について詳しく知りたい方は、「人材採用に統計学 WEBリクルーティング入門」のP.62~をご覧ください。立ち読みでも十分ご理解いただけると思います。