統計学と確率論のお勉強です
目次
宅建の合格率は、15%~18%で推移します。これは狙いの数値が15%であるが、15%がどこかの点数と一致するとは限らず、15%にプラスアルファをして合格点を決めるからです
さて、統計学をあまり知らない一部の人達(もしかしたら予備校や講師も?)の間で、予備校が行っているネットの無料採点サイトに登録された平均点を元に、今年の合格点を求めようとする試みがされています
しかし、統計学の知識がある人から見れば、それが全くの意味のないことだと理解できます
ただし、確率論から考えると、少しだけ意味があることかもしれないので、これについては、この投稿の最後で説明しましょう
具体的な例で考えてみましょう
テリー小学校の全校生徒は600人、1学年ちょうど100人ずつ生徒がいます。男女比も50対50です
ある日、このテリー小学校で全生徒対象に、身体測定が行われました
では、全校生徒の身長で、ちょうど、上位15%:90番目の生徒の身長は何cmであるかを調べるにはどうしたらいいですか?
そんなの超簡単です
全校生徒600人の身長を背が高い順に並べて15%=90番目に背が高い生徒の身長を調べる
それだけです
宅建の問題とちょっと似ていますね。機構が発表する合格点はこれです
ただ、これではクイズにならないので、この方法は使わずに上位15%の身長を求める方法を考えてみましょう
宅建の合格ラインを予測するのと似ていますね
6年生の生徒数は100人。ということは、上位15%=90番目って、6年生の中にいるんじゃないですか?それなら6年1組の身長の分布を調べれば、全校生徒の上位15%の身長が何cmかもわかるんですかね?
どう思います?
6年1組の生徒の身長の分布を見ても、全校生徒の中で90番目に背が高い生徒の身長が何cmかを知ることはできませんよね
じゃあ、6年1組の身長の平均を求めればいいんじゃないですか?たしか、去年は、6年1組の平均身長から1cm引いた身長が全校生徒の90番目の身長になっていたって聞いたことがあるよ
すると、隣の6年2組の生徒がやってきていいいました
ウチの担任の先生が、去年の6年2組の身長の平均に1cmプラスした身長が全校生徒の90番目の身長と一致したっていっていたよ
えー!どうしたらいいんだろう?そうか、とりあえず平均値を出してみよう
- 6年1組の平均身長148cm:マイナス1で147cm
- 6年2組の平均身長149cm:プラス1で150cm
あれれ?147cmと150cm、なんでこんなに違ううだろう???
◇
当然です。去年の6年1組と6年2組の生徒の身長はたしかに今年と似ていますが、全く同じではないからです
宅建に当てはめて考えてみましょう。6年1組を大手予備校A社、6年2組を大手予備校B校として考えれば、A社、B社の今年の平均点と今年の合格点の関係が、去年と一緒の関係になる保証はどこにもありません
そして、上位15%だからといって、6年生だけに着目してしまったのが間違いの始まりです
なぜなら、6年生の身長の平均値は、5年生の身長の平均値より高いと思いますが、6年生の中にも背の高い子、背の低い子がいて分布があります。同じく、5年生の中に、とても背の高い子がいて、全校生徒の中でちょうど15%、つまり90番目に背の高い子は5年生の中にいるかもしれません。もしかしたら4年生かもしれません
別の方法を考えてみましょう
テリー小学校のテリー校長が、身長が上位90番はいるとその生徒たちに1000円の商品券をプレゼントするというコンテストを開催しました
応募はもちろん無料です。ただ、自分の身長を小学校のホームページに自分で登録をしないといけません
投票の開始は、10/17 15:00からです。正解の発表は12/1です
しかし、大変なことが起こりました。10/17の16:30ごろ、社会科のM先生が、うっかり、今年の90番目の身長は、145±1cmになりそうだと、予想をTwitterでつぶやいてしまったのです
さて、身長当てクイズの投票結果は?
投票は、144cm以上に集中しました。当然、143cm以下の生徒は、教師歴20年大ベテランのM先生が145±1cmと予想するんだから、自分が当選することはないとあきらめてほとんど投票しませんでした
1週間後、投票の中間結果が発表になりました。平均値は144cmでした
そして、12/1になり、全校生徒の90番目の身長が発表されました。なんと、143cmでした
もうわかりますよね
大手予備校A社もB社も同じことをしているのです。
先に合格予想点を発表し、その後に投票した人のデータを集計して、平均値を見ても何もわかりません
統計学で説明すれば、いろいろな意図が込めれられて抽出されたデータをいくら分析しても、本当の母集団の姿を類推することはできないということです
じゃあ、テリーさん、結局、小学校の全員の身長の測定結果を調べないと上位90番目の身長はわからないと言うことですか?
そうとも言っていません
テリー小学校の学区には小さい団地があります。そこには、たまたま、テリー小に通う生徒が60人が住んでいました。さらに、1年生から6年生まで、1学年10人ずつ、男女もちょうど5人と5人です
この、団地の小学生の身長の測定結果を集めてみましょう。背の高い順に並べると高い方から15%:9番目の生徒はXくんでした。
Xくんの身長は144.5cm
おそらく、テリー小学校の全校生徒の上位15%:90番目の生徒の身長も144.5cmでしょう。1cm以下ぐらいの誤差はあるかもしれません
ただ、言えることは、投票方式に比べると遥かに精度が高いです。このようなデータの抽出の仕方を無作為抽出:ランダムサンプリングといいます
宅建でも、出口調査とかを用いてランダムサンプリングできればいいんですけどね
もう、頭がウニのようになっているかもしれませんね・笑
無理はしないでくださいね。でも、理工系の大学に行けば、このぐらいことは基礎中の基礎で学びます
さて、最後に確率についてお話をしておきましょう
この投稿の最初に、A社やB社がやっていることは、統計学としては何の意味もないと切り捨てましたが、確率論で考えると意味があるかもしれません
確率論とは、あることが起こる確からしさ:確率です。仮に中身がブラックボックスでも、常に同じ条件でデータを取り続けると、なにか一定の傾向が見つかることがあり、それを評価する学問です
予備校のA社やB社の平均値を10年に渡って取り続け、その平均値と合格点に一定の相関があれば、確率論的には〇〇%の確率で正しいと計算で導き出すことができます。多分、宅建村に何十年も住んでいる方は、確率論に基づいていろいろな分析をされているのだと思います
ただし、コロナのような通常とは違う特殊なことが起こると、この方法は一気に崩壊します。ブラックボックスに対しては、常に同じ条件でデータとらないといけないからです。さて、今年は通常通りの年でしたでしょうか?
私は、3ヶ月前に宅建村にやってきた旅人なので、村の掟や神様の予言のことはよくわかりませんので、統計学の知識を用いてデータを分析しましたが、初心者ゆえ、手持ちのデータが少ないので、統計学で出したデータがどのぐらいの確率で起こるのかを予測することはできません
では、私がやったテリーメゾッド1、2、3は、統計学と確率論のどちらを用いたのでしょうか?もちろん、最初の計算は、統計学です。そして、それが確かかどうか、確率論で一応の評価をしましたが、確率論的にはデータ数が不十分なため、確率◯◯%で当たりますとは言えないんです。わかりやすく言えば、たった一つの分析だけですべてを見通せることはないということです。科学は、そこまで甘くはないです
と言うふうに私の合格点予測は見ていただきたいと思います。訳あって拡散希望です