@article{oai:mue.repo.nii.ac.jp:02000051, author = {田端. 健人}, journal = {宮城教育大学紀要}, month = {Mar}, note = {本稿の目的は、全国学力・学習状況調査「教科に関する調査」(以下「教科調査」)の品質を検証することにある。第1章では、文部科学省による全国学力・学習状況調査の目的に照らし、調査問題の精度検証が不可欠であることを述べた。第2章では、テスト理論を参照し、テストの品質はその妥当性と信頼性にあることを解説した。第3章では、教科調査の信頼性の検証として、クロンバックのα係数を算出した。同調査の品質検証に関する先行研究を批判的に補完するため、本稿での検証対象年度を、問題数が多かった平成28、30年度と問題数が減少した令和3、4年度に定めた。利用データは、文部科学省から貸与を受けた匿名データ、各年度各学年約10万件である。基準値は先行研究に倣い、国語α=0.75、算数・数学α=0.80とした。計算の結果、平成の教科調査では小6中3の国語と算数・数学すべてで基準値をクリアしたが、令和の教科調査ではすべてで基準値を下回った。第4章では、テスト情報量と測定誤差につき4か年度を比較した。分析にはIRT分析ソフトEasyEstimationを利用し、出力された数値を統計ソフトRにて独自に可視化した。その結果、問題数減少の令和調査では、テスト情報量が低下し、測定誤差も大きくなっていることが分かった。第5章では、EasyEstimationが出力する「項目番号」「難易度」「無回答」の相関係数を独自に計算・可視化し、良いテストの基本原則が守られているかを検証した。その結果、令和3年度小6国語、令和4年度小6算数、令和3、4年度中3国語で、「易しい問題から難しい問題へと配列する」という基本原則が守られていないことが判明した。対して中3数学では4か年度すべてでこの原則が守られていた。また項目難易度と無回答の相関を分析することで、令和3年度小6国語、令和4年度小6算数、平成28、30、令和4年度中3国語で、「難しい問題ほど無回答が多くなる」という自然な現象に反する不自然な結果となった。第6章では、教科調査の妥当性の検証として、本体調査と経年変化分析調査との同一教科間個人スコアの相関の強さを計算した。経年変化分析調査が実施された平成25、28、令和3年度を検証対象とした。相関係数は最大0.86、最小0.70であった。令和3年度で、小6中3の国語、算数・数学のすべてで相関係数が低下している結果となった。ただこの相関係数の評価については、その「基準値」の議論の不足から慎重を要する。そこで本稿では、異教科間の相関係数を算出し、同一教科の異調査間の相関係数を見積もってみた。その結果、同一教科の異調査間の相関係数0.70はどちらかと言えば改善が望ましい値であるとの暫定的評価にいたった。第7章で以上の結論をまとめ、改善を提言した。, The purpose of this paper is to examine the quality of National Assessment of Academic Ability (NAAA) by MEXT. Chapter 1 pointed out that in light of the purpose of NAAA, it is essential to verify the accuracy of the "test" that is the measurement tool. Chapter 2 referred to test theory and explained that the quality of a test lies in its validity and reliability. In Chapter 3, Cronbach's α coefficient was calculated to verify the reliability of NAAA. In order to critically develop the previous research on the quality verification of the same survey, the years targeted for verification in this paper are 2016 and 2018, when the number of questions was high, and 2021 and 2022, when the number of questions decreased. The data is anonymous data lent by MEXT and consists of approximately 100,000 students in each grade each year. The standard values were set as Japanese language (Jpn) α=0.75 and mathematics (Math) α=0.80, following the previous research. As a result of the calculations, in the 2016 and 2018 tests, all Grades 6 and 9, all subjects Jpn and Math passed the standard, but in the 2021 and 2022 tests, they all fell below the standard. Chapter 4 compares the four years in terms of test information amount and measurement error. The IRT analysis software EasyEstimation was used for the analysis, and the output values were visualized using the statistical software R. The results showed that in the 2021 and 2022 tests, where the number of questions was reduced, the amount of test information decreased, and the measurement error increased. Chapter 5 calculated and visualized the correlation coefficients of “item number”, "difficulty", and "non-response", and verified whether the basic principles of a good test were being followed. As a result, the basic principle of “ordering questions from easy to difficult” was not observed in Grade 6 Jpn in 2021, Grade 6 Math in 2024, and Grade 9 Jpn in 2021. On the other hand, in Grade 9 Math, this principle was followed in all four years. In addition, by analyzing the correlation between item difficulty and non-response, we found a result that goes against the natural phenomenon that “the more difficult the problem, the more non-answers there are”, in Grade 6 Jpn in 2021, in Grade 6 Math in 2022, and in Grade 9 Jpn in 2016, 2018, 2022. In Chapter 6, to verify the validity of the test, we calculated the correlation between individual scores in the same subject between the main survey and the secular change analysis survey. The verification target was 2013, 2016, and 2021, when the secular change analysis survey was conducted. The maximum correlation coefficient was 0.86 and the minimum was 0.70. In 2021, the correlation coefficients for all Jpn and Math in the Grade 6 and 9 decreased. However, the evaluation of this correlation coefficient requires caution due to the lack of discussion regarding its “standard value”. Therefore, in this paper, we calculated the correlation coefficient between different subjects and estimated the correlation coefficient between different surveys on the same subject. As a result, we tentatively concluded that the correlation coefficient of 0.70 between different surveys on the same subject is a value that should be improved. Chapter 7 summarizes the above conclusions and recommends improvements.}, pages = {103--116}, title = {全国学力・学習状況調査「教科に関する調査」の品質検証 ―平成28、30年度、令和3、4年度の比較―}, volume = {58}, year = {2024} }