目的
この分析では、不登校児童の増加の原因は何なのかを統計的に調べる。
近年不登校児童の増加が社会的に問題になっており、個人的にも小学3年生の子供を持つ親として、とても関心のある問題である。増加の原因を知ることで不登校児童の減少、防止、対応策を考える材料になればとの思いでこの題材を分析することにした。
1991年からの不登校児童数推移のグラフを見ていると、あることに気が付く。増加傾向ではあるが、途中で横ばいの時期がある。
2002年から本格的に実施されたいわゆるゆとり教育により、中学3年間での総授業時間が3150時間から2940時間に短縮されいる。その後学力の低下が騒がれて、2012年には3045時間に増加されている。不登校児童数推移のグラフを見ると、2002年から横ばいになり、2013年から増加に転じているのが見て取れる。ちょうどゆとり教育による総授業時間の増減の時期と重なっている。
そこで、以下の仮説が正しいか調べてみることにする。
仮説 : ゆとり教育による総授業時間の増減が不登校児童増加に影響している
方法
データは、政府機関が公開している下記のものを分析に用いる。このデータは、1991年から2021年までの中学生の総数や不登校児童数、教員などに関するデータである。特に中学生の不登校率の増加幅が大きかったので、中学生のデータを対象とした。
重回帰分析を使う場合、複数の説明変数のうち特定のものだけの条件を変えて目的変数への影響の有無を評価することがよく行われる。ここでは複数年にわたって同じ特徴量として報告されている値をそのまま使って、不登校を説明する大きな傾向が捉えられるかを検討している。分析手法は、VIFの算出は統計分析をする時に標準的に使われているR、それ以外はPythonのscikit-learnを使用した。
はじめに、目的変数を「不登校児童の割合」、説明変数として「教員1人あたりの生徒数」、「教員の職務上の負傷・疾病での休職率」、「休職中教員の割合」、「総授業時間」、「教員試験倍率」の5つで、重回帰分析を実施した。決定係数は0.94となったものの、「教員1人あたりの生徒数」と「休職中教員の割合」の相関係数が-0.94、「教員の職務上の負傷・疾病での休職率」と「休職中教員の割合」が0.92とかなり高い値が出た。決定係数と相関係数の解釈については以下に記載したが、決定係数は1に近づくほどいい数値で、相関係数は1に近づくほどより両者の関係が大きいと解釈ができる。そのため、説明変数間での相関係数が高すぎるのは、多重共線性の可能性がある。そこで、さらにVIFを計算して、多重共線性の有無を確認した。結果は次のように、stu_per_tch(教員1人あたりの生徒数)とrate_Lve(休職中教員の割合)では10を超えており、やはり多重共線性がありそうである。多重共線性を判定する基準は決まっていないが、10以上とすることが多いようなので、この分析ではそれに従って10を基準とした。
<VIFの結果>
stu_per_tch | classes | pass_rate | rate_OII | rate_Lve |
---|---|---|---|---|
52.591917 | 1.931079 | 7.333334 | 8.274620 | 77.440528 |
この後 "rate_Lve" を抜いて再度VIFを計算したところ、結果は次のようになった。'rate_Lve'を抜いたことで、10を超えるものは無くなった。
stu_per_tch | classes | pass_rate | rate_OII |
---|---|---|---|
6.945564 | 1.914028 | 1.942463 | 6.740278 |
また、"stu_per_tch" は単純に生徒数合計を教員数合計で割って算出した、「教員1人あたりの生徒数」であり、これが少なくなれば教員の負担が軽くなり、生徒一人一人に向き合うことができ不登校児童減少につながる、つまり正の相関が見られると考えていた。しかし実際には「不登校児童の割合」との相関係数が-0.89で負の相関になっている。「教員1人あたりの生徒数」という数字だけで見ると、1991年から減少している。この減少の原因は何なのか、調べてみると少人数学級の推進と、少子化による児童減少が関係がありそうなことがわかった。
少人数学級は、教員が児童との関わりが大きくなることにより学力の向上につながる、との認識から推進されてきた。文部科学省が定める公立小中学校の学級編成を見ると、1980年から40人だった学級編制が、2011年より小学1年生で35人学級へと引下げられ、2025年までに小学校全体で35人に引き下げられる。また、1989年からの児童の減少率幅が教員の減少率幅より大きい。これらの理由により、教員1人あたりの生徒の数が減少していると見られる。
このことについて文部科学省の資料では、教員1人あたりの生徒の数は減少していても、特別支援学級や激増する教育課題への対応に充てられている、との見解のようである。教員の実稼働時間や、教員が生徒と向き合っている時間、などのデータの資料が見つけられなかったため、「教員1人あたりの生徒数」という説明変数としては、今回の分析にはそぐわないと判断したためははずすことにした。
参考:文部科学省資料
「公立小中学校等の学級編制及び教職員定数の仕組み」
「少人数教育の実現」
「財政制度等審議会財政制度分科会 (平成28年11月4日開催)資料(義務教育費国庫負担金関係)についての文部科学省の見解」
その後、多項式/交互作用特徴量の計算を実施し、出てきた特徴量と不登校児童率との相関係数から、説明変数を「総授業時間^2」と「教員の職務上の負傷・疾病での休職率」の2つに絞り重回帰分析を行うことにした。これにより、不登校児童率増加に最も影響を与えているものは何かを知ることができるはずである。
【決定係数、相関係数の解釈】
決定係数、相関係数ともVIF同様明確な基準はないが、決定係数では、0.5以上や0.8以上など、分析対象によっても変わるようであるが、1に近づくほど精度の高いモデルと言える。相関係数に関しては一般的な基準で、次のように言われていることが多く見受けられた。
相関係数 | 相関の度合い |
---|---|
0~0.2 | 相関なし |
0.2~0.4 | 弱い相関 |
0.4~0.7 | 相関あり(中等度の相関) |
0.7~1 | 強い相関 |
検証した特徴量
- ⚫️futoko_rate
- 特徴量の説明:不登校児童の割合
- 抽出方法:毎年4月1日~翌年3月31日までの期間が対象。国公私立中学校、都道府県教育委員会、市区町村教育委員会を対象に、全数調査
- 定義: 不登校とは,何らかの心理的,情緒的,身体的,あるいは社会的要因・背景により,児童生徒が登校しないあるいはしたくともできない状況にある者 (ただし,病気や経済的理由,新型コロナウイルスの感染回避に よるものを除く。)をいう。なお,長期欠席者は,令和元年度調査までは年度間に連続又は断続して30日以上欠席した児童生徒,令和2年度調査以降は,「児童・生徒指導要録」の「欠席日数」欄及び「出席停止・忌引き等の日数」欄の合計の日数により,年度間に30日以上登校しなかった児童生徒について調査。
- *定義が令和2年に変更されたが、分析結果に影響はないと判断
- 出典:e-Stat「児童生徒の問題行動・不登校等生徒指導上の諸課題に関する調査」
- ⚫️stu_per_tch
- 特徴量の説明:教員一人あたりの生徒数 (生徒数合計/教員数合計)
- 抽出方法:全数調査で、5月1日現在の国公私立の合計
- 出典:e-Stat「学校基本調査」
- ⚫️classes
- 特徴量の説明:中学3年間の総授業時間
- 出典:文部科学省「学習指導要領の変遷」
- ⚫️pass_rate
- 特徴量の説明:教員試験倍率
- 定義:採用倍率とは受験者数/採用者数である。 採用者数とは4/1-6/1に採用された数である。
- 出典:文部科学省 公立学校教員採用選考試験の実施状況
- ⚫️rate_OII
- 特徴量の説明:職務上の負傷・疾病での休職率 (職務上の負傷・疾病での休職教員数/教員数合計)
- 抽出方法:全数調査で、5月1日現在の国公私立の合計
- 定義:「休職」している者とは,公立の場合は,休職の発令があった者をいい,国立及び私立の場合もこれに準じる。
- 出典:e-Stat「学校基本調査」
- ⚫️rate_Lve
- 特徴量の説明:休職中教員の割合 (休職教員数/教員数合計)
- 抽出方法:全数調査で、5月1日現在の国公私立の合計
- 定義:「休職」している者とは,公立の場合は,休職の発令があった者をいい,国立及び私立の場合もこれに準じる。
- 出典:e-Stat「学校基本調査」
【学習指導要領の変遷】
改訂年度 | 定義 |
---|---|
平成元年改訂/(実施)小学校:平成4年度、中学校:平成5年度 | 授業時数の1単位時間は、50分とする。中学校の教育課程は、国語、社会、数学、理科、音楽、美術、保健体育及び技術・家庭の各教料とし、選択教科、道徳及び特別活動によって編成するものとする。中学校の各学年における必修教科、道徳及び特別活動のそれぞれの授業時数、各学年における選択教料等に充てる授業時数並びに各学年におけるこれらの総授業時数 |
平成10~11年改訂/(実施)小学校:平成14年度、中学校:平成14年度 | 授業時数の1単位時間は、50分とする。中学校の教育課程は,国語,社会,数学,理科,音楽,美術,保健体育,技術・家庭及び外国語,選択教科,道徳,特別活動及び総合的な学習の時間によって編成するものとする。中学校の各学年における必修教科,道徳,特別活動及び総合的な学習の時間のそれぞれの授業時数,各学年における選択教科等に充てる授業時数並びに各学年におけるこれらの総授業時数 |
平成20~21年改訂/(実施) 小学校:平成23年度、中学校:平成24年度 | 授業時数の1単位時間は、50分とする。中学校の教育課程は、国語、社会、数学、理科、音楽、美術、保健体育、技術・家庭及び外国語の各教科、道徳、総合的な学習の時間並びに特別活動によつて編成するものとする。中学校の各学年における各教科、道徳、総合的な学習の時間及び特別活動のそれぞれの授業時数並びに各学年におけるこれらの総授業時数 |
平成29~30年改訂/(実施) 小学校:令和2年度、中学校:令和3年度 | 授業時数の1単位時間は、50分とする。中学校の教育課程は,国語,社会,数学,理科,音楽,美術,保健体育,技術・家庭及び外国語の各教科,特別の教科である道徳,総合的な学習の時間並びに特別活動によつて編成するものとする。中学校の各学年における各教科,特別の教科である道徳,総合的な学習の時間及び特別活動のそれぞれの授業時数並びに各学年におけるこれらの総授業時数 |
結果
目的変数を「不登校児童の割合」、説明変数を「総授業時間^2」と「教員の職務上の負傷・疾病での休職率」の2つで重回帰分析を実施した結果、作成したモデルの決定係数は0.63となり、不登校児童率との相関係数は次のようになった。
【不登校児童率との相関係数】
説明変数 | 相関係数 |
---|---|
rate_OII | 0.813922 |
classes^2 | 0.547418 |
また、総授業時間(classes)の偏回帰係数がゼロになる事象が発生する確率「P値」は0.11であり、P<0.05を満たしていない。
つまり、ゆとり教育による総授業時間の増減が不登校児童増加に影響していない、とする帰無仮説を棄却することができなかった、というのが今回の分析結果である。
ゆとり教育による総授業時間の増減が不登校児童増加に影響していない、とする帰無仮説を棄却することができなかった
考察
仮設は支持されなかったが、前提としてデータの数が少なく、分析用のデータとして基準が揃っていない可能性がある。それを承知の上で、何か発見できものがあればとの思いで分析してみた結果である。
不登校というものについて、少しまとめてみる。
令和 2 年に、調査当時小学6年生及び中学2年生の不登校児童に対して文部科学省が実施した調査の結果をまとめた、「不登校児童生徒の実態把握に関する調査報告書」では、"不登校になったきっかけは自分でもわからない" が両者とも20%を超えており、成長期の児童の心の複雑さを表しているのではないだろうか。不登校というと、いじめが真っ先にうかぶ人も多いと思うし、私自身もそうであった。しかし原因は一つではなく、貧困,親や子どもの障害,虐待,非行,ひとり親,不安定な家族関係,親の不安定な就労,健康問題,などが複合的に絡み合っていることが多いという。数字でデータ化をするには難しい、少し無理があるテーマであったかもしれない。
更に、2020年には新型コロナウィルスによる休校もあり、児童の心にも大きな影響を与えただろう。これが不登校に影響を与えているかはデータが少なく分析できなかったため、今後も分析を続けたいと思う。
しかし、データを眺めていると見えてきたものもあった。都道府県別の不登校児童率では特定の県が毎年低いことが気になった。
その県は、幸福度ランキングで上位常連であった記憶がある。福井県である。福井県には何かあるのかもしれない、そう思い、次は都道府県別のデータで分析をしてみることにした。
その分析レポートはまた別の記事で記載しようと思う。
おわりに
PythonやR、統計を勉強しながら初めて作ったレポートとなります。データ集めとデータの信頼性を調べることに一番時間がかかりました。
結果についてご指摘をいただき書き直しました、ありがとうございます。
初心者のですので、お気付きの点があったらコメント頂けますと大変ありがたいです。
使用したコード
今回分析した結果は下記Githubに置いてあります。
school_problem