@article{oai:mue.repo.nii.ac.jp:00001458, author = {田端, 健人 and 丸山, 千佳子 and 本図, 愛実 and 原田, 信之 and 野坂, 実央}, journal = {宮城教育大学紀要, BULLETIN OF MIYAGI UNIVERSITY OF EDUCATION}, month = {Jan}, note = {全国学力テストを有効活用するために、私たちは「平均ゾーン」という新概念を創作し、各学校・教育委員会の平均正答数と分布曲線が、全国からどの程度ズレているかを可視化する「平均ゾーンシステム」を新規開発した。本稿では、この新システムを、実用的ならびに理論的に解説する。1章で、この開発を導いた問題意識を述べる。一般に全国平均と各学校平均との数値のひらきが広く話題になるが、数値のひらきが「大きい」か「小さい」かの基準は不明のままであった。これが本稿の問題意識である。2章では、本システムの仕組みと出力画面を示し、グラフの見方を解説した。3章では、本システムの理解を促すために、活用例として学校間の比較を示した。4章では異なる活用例として、ある自治体の平成30年度と令和3 年度の同一集団の経年変化を可視化した。5章では、この平均ゾーンシステムが前提とする2つの仮説を示した。第1仮説は「47都道府県の平均値に、実質的な差はない」であり、これを本稿では、全都道府県の平均正答数の分布曲線と箱ひげ図により可視化した。第2仮説は「約30名以上の集団の学力分布の、正規分布からの逸脱は、統計的に無視できる」であり、これをF 小学校の児童集団29名のデータをK-S検定することで実証した。6章では、本システムの理論背景を述べた。本システムは、Z検定と効果量を直感的に可視化するものである。Z検定は、統計的有意差の有無を基準とし、全国と標本との平均差の「大きさ」を評価する。しかし、z値やp値はサンプルサイズに影響され、サンプルサイズが大きければ効果が小さくても有意差ありになる、という問題を指摘した。そこでサンプルサイズに影響されない効果量を合わせて提示する必要がある。ところが、効果量にしても、基準値の難問が浮上し、基準値設定には、主観的判断が避けられない。この難問を解消するために考案したのが、本システムである。7章では、ある小学校の全国学力テスト結果を、7年間追跡した活用例を紹介する。最後の8章で、今後の課題と展望を述べた。私たち「子ども教育データサイエンスDS-EFA」チームの目標は、数量的エビデンスと実践感覚とを架橋し、学校教育の質向上を図り、すべての子どもと社会のウェルビーイングを高めることにある。, In order to make effective use of the national academic achievement test, we created a new concept called "average zone" and invented the "average zone system". This system visualizes how much the average number of correct answers and the distribution curve of each school deviate from the whole country. In this paper, we will explain this new system practically and theoretically. Chapter 1 describes the awareness of the issues that led to this development. Generally, the average gap between the whole country and each school is widely talked about, but the criteria for whether the gap is "large" remained unclear. This is the problem awareness of this paper. Chapter 2 showed the mechanism of this system and the output screen, and explained how to read the graph. In Chapter 3, in order to promote understanding of this system, a comparison between schools is shown as an example of utilization. Chapter 4 shows another usage example. We visualized the secular change of the same group in a certain municipality. In Chapter 5, we have presented two hypotheses that this average zone system presupposes. Hypothesis 1 is "there is no substantial difference in the average values of 47 prefectures". In this paper, this is visualized by the distribution curve of all prefectures and the boxplot of the average number of correct answers. Hypothesis 2 is that "the academic ability distribution of a group of about 30 or more deviates from the normal distribution, but the deviation is statistically negligible." This was demonstrated by K-S testing data from a group of 29 F elementary school children. Chapter 6 described the theoretical background of this system. This system intuitively visualizes the Z-test and effect size. The Z-test can evaluate the "magnitude" of the mean difference between the whole country and the sample based on the presence or absence of statistically significant difference. However, the z-value and p-value are affected by the sample size, and if the sample size is large, there will be a significant difference even if the effect is small. Therefore, it is necessary to present the effect size that is not affected by the sample size. However, even with effect sizes, the difficult problem of reference values has emerged, and subjective judgment is inevitable when setting reference values. This system was devised to solve this difficult problem. Chapter 7 introduces an example of using the results of a national academic achievement test at an elementary school for 7 years. In Chapter 8, we described future issues and prospects. The goal of our "Data Science of Education for All (DS-EFA)" team is to bridge quantitative evidence and a sense of practice, improve the quality of school education, and enhance the well-being of all children and society.}, pages = {319--333}, title = {全国学力テストを有効活用する「平均ゾーンシステム」の新規開発―Z 検定と効果量の可視化―}, volume = {56}, year = {2022} }