最初に申し上げますが、私は、会員数約20万人の楽待新聞の不動産投資コラムニストであり、連載記事も執筆しており、専門分野は不動産投資シミュレーションです。
今回、残念ながら、宅建の結果は34点でしたが、自分の都合のいいように合格点を34点に誘導しようという意図はありません。それをやれば、立場上、不動産投資初心者を指導している本業の方が危うくなってしまいます。その辺りはご理解ください
◇
①に続き、もう一つ興味深いデータ分析ができましたのでご紹介します
ただし、最初に、統計学の常識について簡単に勉強してもらいましょう
目次
平均値でデータを予測してはいけない
さて、まず、この図を見てください。
青いラインとオレンジのライン、平均値は全く同じ、全体の面積も同じですが、分布が違いますよね
では、上位15%の位置はどうでしょうか?当然、オレンジの方が左より、青は中心よりになりますね。
では、これを宅建試験の得点と人数分布と考えてみた場合、
宅建試験の平均値は同じでも、分布が違えば、上位15%の合格ライン:合格点も違ってくる
と言えます
◇
ちょっと待って!、宅建の人数分布ってあんな左右対称の分布にならないですよね。これって本当ですか?
これは、2017年のTACのの全国模試の結果です。平均値は29点。だいたいですが、正規分布になっていますね
ただ、問題は、
グラフのトンガリ具合
なんです
WEB調査の平均値
大手資格予備校のA社は、10年以上に渡り、宅建受験者の得点を集計し、その平均点と人数分布を公表してきました
新参者の私は全く知りませんでしたが、このA社が公表しているWB登録した受験者の平均値を用いて、合格ラインを求めることが、毎年行われているようです。
もちろん、WEB登録は任意ですし、その平均値が合格ラインとどのような関係にあるのかは数学的に求めることは不可能ですが、試験の難易度によって、上下することは予想できます。実際、過去10年ぐらいの数値を追ってみると、約2点の幅で、A社のWEB調査と実際の合格点には相関があるようです
しかし、この分析には大きな欠陥があります。要するに、平均値だけ見ていて、分布、つまりトンガリ度を見ていないということです
復習になりますが、
宅建試験の平均値は同じでも、分布が違えば、上位15%の合格ライン:合格点も違ってくる
と言えます
わかりやすく、具体的な例で示しましょう
平均値が同じで、分布が違う場合、合格点はどうなるか?
A社の今年のWEB調査の結果から、平均値は35.5点ということがわかりました
さて、過去のデータを用いた従来のやり方だと、A社の場合、合格点は35.5点のプラスマイナス1点の範囲、つまり、34.5点から36.5点の中に存在すると考えるようです。いきなり私の33点または、34点とは違ってしまいましたね
でも、分布のトンガリ度は? 気になりますよね。
そこで、数値が近い3年のA社がWEBで公開したデータで比較しました。まずは平均値と合格点です
年:A社WEB調査平均値:合格点
2018:35.8:37
2019:35.3:35
2021:35.5:??
です
3つの年の平均値はそれにしても近いですね。2021年の平均値は、35.5点なので、ちょうど2018年と2019年の中間です。やっぱり、合格点も中間の36点なんですかね?
平均値を見た限り、講師の方も
今年は難易度が高かったけど、結局、平均値が高いということは、意外とみんな解けたんだな。じゃあ、難易度の肌感は34点だったけど、受験生の実際の出来を考えると、平均値からみて、35点か36点ぐらいが合格ラインだな
と考えたのではないでしょうか?
では、A社から公表された3年のデータ(得点と人数の分布)をグラフにしてみましょう
ちょっと複雑ですが、2018年緑、2019年オレンジ、2021年青のラインを良く見てください。形が随分違いますよね。単に、WEBのデータを入力しただけなんですが、こんなに違いがありました
中身は、いわゆる、点数ごとの度数分布(人数の分布)ですね。実線が公表された数値のグラフ、点線はその近似曲線です
どうでしょう。平均値が
2018年:35.8点
2019年:35.3点
2021年:35.5点
とほぼ同じなのに、分布のトンガリ度はずいぶんと違いますね。これは、結果的に合格点の差に繋がります
2018年:合格点 37点
2019年:合格点 35点
と合格点に2点もの差がついた理由は何でしょうか?それは、
分布のトンガリ度
特に重要なのが、グラフの赤い円の部分
40点以上の高得点者の人数の違い
です。グラフの赤い丸の部分の人数をよく見てください
◇
びっくりしませんか?平均値が同じなのに人数分布はこんなに違うんですよ。当然、上位15%の得点も違ってきます
つまり、得点と人数分布の山がなだらかになるほど、上位15%の得点は高くなります(2018年の場合)、逆に、得点と人数分布の山がとんがれば、上位15%の得点は低くなります(2019年の場合)
では、今年(2021年)の場合はどうでしょうか?
3つの年の中で一番尖っています。赤い丸の中、つまり、40点以上の人の割合が一番少ないことがわかります。
そうすると、自ずと、上位15%の人数の得点=合格点は、3年の中で一番低いものになるはずです。つまり、2019年の35点より低くなるということです。
これが、私が、今年の宅建の合格ラインが
33点または、34点
と考える根拠です
要するに3つの年のWEB調査の平均値がほぼ同じでも、人数分布のトンガリ度を見ないと上位15%の合格点はわからないということです
◇
参考までに、得点が高かった2020年10月合格点38点のグラフも追加しました。黄色のラインです。
山がつぶれて、高得点側に人数分布がよっているのがわかります。これなら合格点38点になっても不思議はありませんが、でも、予備校や講師の皆さん、結構、予想を外しましたよね。この分布の差を見ていたのでしょうか?
ちょっと、実データの折れ線グラフは見にくいので、Excelの6次関数近似で近似した曲線のみのグラフにしてみました
こちらの方がはっきりしますね
得点ごとの人数分布の変化のトガリ具合に注目して、上位15%が、分布の形状によって違ってくるのがわかります
特に、赤線の楕円で囲んだ、40点以上の人数に大きな違いがあります。順番に左から
2020年:合格点38点:オレンジ
2018年:合格点37点:グレー
2019年:合格点35点:赤
合格点とグラフがきれいに左から並んでいます
では、このグラフから2021年:青の合格点は、35点以上でしょうか?35未満でしょうか?
グラフの並び方を見れば、2021年は一番右にありますよね
このことから、私は、この人数分布から2021年の合格点は35点未満=33点または、34点と予想します。人数分布を見れば明らかですよね。グラフを見る限り、2019年の35点より、合格点が高いとは考えられません
A社WEB調査は、平均値だけではなく、得点ごとの人数分布も公開しています。これを使わずに、単に平均値だけで合格点を予想するのは片手落ちだと思います
予備校講師も間違える平均値のトリック
今回、予想合格点に関する予備校や講師たちのコメントやYouTube動画を念入りに見て、分布の見落としがあるのではないかと思い、この分析を試みました
なぜかというと、講師の皆さんは、試験当日、あまりデータの集計ないときに、口を揃えて、今年は難易度が高かったと言っていましたが、データが集まるに従い、今年は難易度は高かったが、意外と点数は取れているようで、予想合格点は予想の上側かもしれないというふうに発言を変化させ始めました。中には、上方修正する予備校も現れたぐらいです
おそらく、人数分布を分析せずに、統計学でいう、平均値のトリックにハマってしまったのではないかと考えています。平均点が高ければ、合格点も高いと単純に考えてしまったのでしょう
この予測がハズれる要因
これについては①と同じです
注:この予測はあくまでも私が個人的に求めたもので、これがハズレても何らかの保証をすることはできませんのでその点はご了承ください。競馬の予想や人生相談の占いぐらいの情報として捉えてもらいたです