I. 序論
1.1. 現行大学入試制度の課題と改革の喫緊性
現在の日本の大学入試制度は、独立行政法人大学入試センターが実施する「大学入学共通テスト」(以下、共通テスト)と各大学が個別に実施する「個別試験」を二本柱とし、一般選抜、学校推薦型選抜、総合型選抜という多様な選抜方法が併存する複雑な構造となっている 1。特に、従来の大学入試センター試験に代わって導入された共通テストは、単なる「知識・技能」の評価に留まらず、「思考力・判断力・表現力」を重視する方向性を示している 3。文部科学省が推進する「高大接続改革」においても、これら能力に加え、「主体性を持って多様な人々と協働して学ぶ態度」を含む「学力の3要素」を多面的・総合的に評価することの重要性が繰り返し強調されている 4。
しかしながら、これらの改革努力にもかかわらず、依然として多くの受験生にとっては、数少ない試験機会が将来を大きく左右するという、いわゆる「一発勝負」の性格が色濃く残っており、これが過度な受験競争や精神的負担、さらには高等学校における教育活動の歪みを生んでいるとの指摘は後を絶たない 5。現行制度は、その複雑さゆえに、受験生や保護者、さらには高等学校の進路指導においても多大な情報収集と対策を強いる状況を生み出している。
このような状況を鑑みるに、現行制度の根底に横たわる「一発勝負」という構造的課題への抜本的な対策が急務である。現在の入試システムは、一般選抜、学校推薦型選抜、総合型選抜といった複数の経路を提供するものの、最終的には共通テストや個別試験といった特定の時点でのパフォーマンスに大きく依存する傾向がある 1。この構造は、受験生に極度の精神的プレッシャーを与え 9、高等学校教育においては、試験対策に偏重した指導を助長し、生徒の知的好奇心や探究心を十分に育む教育活動を制約する可能性が指摘されている 5。一日の体調や偶然の要素が、長年にわたる学習の成果を正当に反映しない結果を招きかねないという問題も依然として存在する。本提言が目指す「ベンチマーク試験」は、複数回かつ任意選択の受験機会を提供することにより、このような「一発勝負」の弊害を緩和し、より持続的で健全な学習と評価のサイクルを構築することを企図するものである。これにより、高等学校における教育も、目前の試験対策に終始することなく、「学力の3要素」をバランス良く育成する方向へと転換を促すことが期待される。
1.2. 本政策提言の目的と「ベンチマーク試験」構想の概要
本政策提言は、上記のような現行大学入試制度の課題認識に基づき、受験生の継続的な学習努力と多面的な能力をより適切に評価し、かつ大学側の入試業務負担を軽減することを目的とした新たな大学入試制度の中核として、「ベンチマーク試験」の導入を提案するものである。
「ベンチマーク試験」構想の骨子は以下の通りである。
- 実施主体と位置づけ: 高校生を対象とし、大学進学希望者が任意で受験できる全国統一の評価指標とする。
- 受験機会: 高校在学中、各教科において複数回(例えば年3回程度、3年間で最大9回程度)の受験機会を提供する。
- 評価内容: 各教科における基礎的な知識・技能の定着度に加え、文部科学省が提唱する「学力の3要素」のうち、特に「思考力・判断力・表現力」及び「主体性を持って多様な人々と協働して学ぶ態度」を多面的に評価することに重点を置く 4。
- 大学による活用: 大学は、原則としてこの「ベンチマーク試験」の結果に基づき学力を評価するものとし、これにより各大学における個別試験作成の負担を軽減する。ただし、各大学・学部が専門分野の特性に応じて特に評価したい能力がある場合には、別途専門的な試験を実施することを可能とする。
この「ベンチマーク試験」は、受験生にとっては一回限りの試験結果に左右されることなく、平常時の努力と実力、そしてその成長の軌跡を評価される機会を得られるというメリットがある。また、大学にとっては、質の高い標準化された評価情報を得られると同時に、独自の入試問題作成にかかる労力とコストを削減し、より教育研究活動に資源を集中できるという利点がある。
本提言は、日本の大学入試における「公正性」の概念についても再考を促すものである。伝統的に、日本の入学者選抜における公正性は、全受験生に対する同一条件下での一斉実施、高利害型の試験によって担保されるという認識が強かった 12。提案するベンチマーク試験は、複数回かつ任意の受験機会を設けるため、一見するとこの画一的な公正観とは異なる様相を呈する。しかし、真の公正性とは、むしろ多様な背景を持つ受験生一人ひとりが、それぞれの状況に応じて最大限の能力を発揮できる機会を複数提供し、一過性の不調や環境要因に左右されにくい評価を実現することにあるのではないだろうか。米国におけるSATやACTのような試験では、複数回受験とその最高点の活用が一般的であり、これは能力発揮の機会均等という観点からの公正性担保の一形態と捉えられる 13。ただし、このような制度が受験機会の格差を助長する可能性も指摘されており、本提言においては、制度設計段階から経済的・地理的格差への配慮を十分に組み込む必要がある。このベンチマーク試験制度は、単なる均一性ではなく、機会の公平性と持続的な努力の評価を重視する、より多角的な公正性の実現を目指すものである。
II. 「ベンチマーク試験」の理念と設計
2.1. 試験の基本理念:学力の3要素の育成と多面的評価
「ベンチマーク試験」の最も根幹をなす理念は、文部科学省が高等教育改革の柱として掲げる「学力の3要素」、すなわち①確かな知識・技能、②知識・技能を基盤とした思考力・判断力・表現力、そして③主体性を持って多様な人々と協働して学ぶ態度、を総合的かつ多面的に評価し、その育成を促すことにある 4。これは、従来の知識偏重型と批判されてきた入試からの脱却を目指し、生徒が将来社会で自立して活動していくために不可欠な資質・能力を、入試を通じて積極的に評価しようとする国家的な教育改革の方向性と完全に軌を一にするものである 5。現行の共通テストもこれらの要素の評価を目指してはいるが、特に③の「主体性」に関しては、その評価方法が依然として各大学の個別選抜における試行錯誤に委ねられている側面が大きい 15。
これらの3要素は、それぞれ独立して存在するものではなく、相互に深く関連し合っていると理解することが重要である。確かな知識・技能(要素①)は、思考力・判断力・表現力(要素②)を発揮するための不可欠な基盤となる 4。例えば、歴史的事実に関する知識がなければ、その歴史的意義を多角的に思考し、自らの見解を論理的に表現することは困難である。同様に、主体性を持って多様な人々と協働して学ぶ態度(要素③)は、多くの場合、知識・技能を活用し、思考・判断・表現を伴う具体的な活動(例えば、探究学習におけるグループワークやディベート、地域課題解決プロジェクトなど)を通じて発揮され、また育成される。
したがって、「ベンチマーク試験」の設計においては、これら3要素を機械的に分離して評価するのではなく、それらの有機的な連関を捉えるような評価課題を開発する必要がある。例えば、特定の社会課題に関する複数の資料(記事、統計データ、インタビュー記録など)を提示し、それらを読解・分析した上で(知識・技能と思考力・判断力)、自らの意見を論述させ(表現力)、さらにその課題解決に向けてどのような主体的な行動を取りうるか、あるいは他者とどのように協働して取り組むかを考察させる(主体性・協働性)といった、統合的な課題設定が求められる。これは、現実社会や大学での学術活動において求められる能力のあり方をより忠実に反映するものである。
2.2. 評価対象とする能力:思考力・判断力・表現力及び主体性等の定義と具体像
「ベンチマーク試験」が評価対象とする主要な能力は、「思考力・判断力・表現力」及び「主体性等」である。これらの能力の定義と具体的な評価像を明確にすることは、試験の妥当性と信頼性を担保する上で極めて重要となる。
「思考力・判断力・表現力」は、共通テスト改革においても中心的な評価対象とされており、問題文の長文化や複数の情報源の分析を求める形式などでその測定が試みられている 3。具体的には、
- 思考力:課題の本質を見抜き、情報を分析・整理し、論理的な道筋を立てて解決策を模索する力。これには、批判的思考、創造的思考、問題解決能力などが含まれる。
- 判断力:多様な情報や選択肢の中から、状況や目的に応じて最適なものを選び取り、意思決定を行う力。情報の信頼性評価やリスク評価もこれに含まれる。
- 表現力:自らの思考や判断のプロセス及び結果を、他者に理解できるように論理的かつ効果的に伝達する力。文章記述、口頭発表、図表やICTを用いた表現など、多様な形態が考えられる。
一方、「主体性等」の評価は、より挑戦的な課題である。大学の多様な入試(特に総合型選抜や学校推薦型選抜)においては、志望理由書、活動報告書、面接などを通じて評価が試みられている 15。OECDの「Education 2030プロジェクト」における「ラーニング・コンパス」でも、生徒エージェンシー(主体性)や知識・スキル・態度・価値観といったコンピテンシーが重視されている 19。主体性とは、自ら課題を発見し、目標を設定し、他者と協働しながら粘り強く取り組む意欲や姿勢と捉えることができる 15。
標準化された試験という枠組みの中で「主体性」を直接的に測定することは本質的に困難である。主体性は、特定の状況下での行動や長期的な取り組みを通じて発現するものであり、一時点のペーパーテストでその全てを捉えることは不可能に近い。現行の入試における主体性評価も、多くは自己申告や活動記録、面接といった間接的な手法に依存している 16。したがって、「ベンチマーク試験」における主体性評価は、思考力・判断力・表現力を測る問題の中に、主体的な取り組みや協働的な学びに関する経験を振り返り、分析し、記述させる要素を組み込む形や、試験登録時や特定のモジュールにおいてポートフォリオ的な情報を構造化された形で提出させ、それに対する省察を求める形などが考えられる。これにより、単なる活動の羅列ではなく、経験からの学びや自己成長を捉えることを目指す。ただし、この評価方法が新たな「対策」を生み出し、表面的な活動歴の追及に繋がらないよう、評価の観点や方法論には細心の注意を払う必要がある。
2.3. 試験の実施形態:高校3年間を通じた複数回・任意受験の意義と柔軟性
「ベンチマーク試験」の最も特徴的な実施形態は、高校3年間を通じて、各教科において年複数回(例えば年3回、計9回程度)、受験生が任意で受験できるという点である(ユーザー提案)。これは、現行の共通テストが年1回の実施であること 3 とは対照的であり、米国のSATやACTのように複数回の受験機会が提供されるシステムに近い 13。
複数回・任意受験の導入には、以下のような意義と柔軟性が期待される。
- 受験生の精神的負担の軽減: 年1回の一発勝負というプレッシャーから解放され、体調不良や不運による影響を最小限に抑えることができる 14。
- 学習成果の経時的評価: 生徒は自らの学習の進捗に合わせて受験時期を選択でき、複数回の結果を通じて能力の伸長や安定性を評価することが可能となる。
- 失敗からの学びと再挑戦の機会: 一度の失敗が致命的とならず、結果を分析し、学習方法を改善して再挑戦する機会が得られる。これは学習意欲の維持・向上にも繋がる。
- 多様な学習進度への対応: 生徒一人ひとりの学習ペースや得意・不得意科目に合わせた柔軟な受験計画が可能となる。
- 大学への多角的情報提供: 大学は、一時点の点数だけでなく、複数回の受験結果から生徒の持続的な努力や学力の定着度、得意分野の早期発見など、より多角的な情報を得ることができる。
このような頻回かつ任意の試験制度が教育現場に与える影響、いわゆる「ウォッシュバック効果」については慎重な検討が必要である 26。ベンチマーク試験が思考力や主体性といった望ましい能力を効果的に評価するものであれば、高等学校の教育活動もこれらの能力育成を重視する方向へと好ましい影響を受ける可能性がある 28。生徒たちは、単なる暗記や試験対策に留まらず、より深い学びや探究活動に主体的に取り組むようになることが期待される。しかしながら、試験の回数が過度に多くなると、その都度の試験対策に追われ、かえって生徒や教員の負担増を招いたり 10、教育内容が試験に過度に最適化されたりするリスクも存在する。また、任意受験であるため、受験しない生徒と複数回受験する生徒との間で、学校内での学習支援や進路指導に差異が生じる可能性も考慮しなければならない。
したがって、ベンチマーク試験の設計と、その重要性に関するメッセージの発信は慎重に行われるべきである。試験は、表層的な試験対策ではなく、真の能力育成を促すものでなければならない。高等学校に対しては、ベンチマーク試験対策を日常のカリキュラムに過度な負担なく統合し、生徒の学びを深めるための指針を提供することが不可欠となる。試験の実施頻度や内容については、パイロット運用等を通じて、生徒の学習意欲や精神的負担、カリキュラムへの影響を十分に検証し、最適化を図る必要がある。
表1:「ベンチマーク試験」と現行の大学入学共通テスト・個別大学試験の比較概要
評価軸 | 現行の共通テスト | 現行の個別大学試験 | 提案する「ベンチマーク試験」 |
目的 | 高等学校段階における基礎的な学習の達成の程度を判定 3 | 各大学・学部のアドミッションポリシーに基づき、専門分野への適性やより深い学力を評価 1 | 高等学校段階における継続的な学習成果と「学力の3要素」(特に思考力・判断力・表現力、主体性等)を多面的に評価する指標 |
主な評価内容 | 知識・技能、思考力・判断力・表現力 3 | 知識・技能、思考力・判断力・表現力(教科により比重は異なる)、専門分野の適性、小論文、面接等 1 | 思考力・判断力・表現力、主体性等。知識・技能はその基盤として評価。 |
実施頻度・時期 | 年1回(1月) 1 | 大学・学部により異なる(主に2月~3月) 1 | 高校在学中、年3回程度(3年間で最大9回程度) |
受験の任意性 | 国公立大学一般選抜では原則必須、私立大学でも多くが利用 3 | 大学・学部により必須 | 受験生による任意選択 |
結果の活用主体 | 大学(主に国公立大学の一次試験、私立大学の共通テスト利用入試) 3 | 各大学 | 各大学(原則として学力評価の基礎資料)、受験生(自己の学力把握、進路選択) |
問題作成主体 | 大学入試センター 33 | 各大学 | 新設される中立的な専門機関(または大学入試センターの機能拡充) |
この表は、提案する「ベンチマーク試験」が、現行制度と比較して、評価内容、実施方法、活用のあり方において、いかに受験生中心で柔軟、かつ多面的な評価を目指すものであるかを示している。
III. 「ベンチマーク試験」の評価内容と方法論
3.1. 思考力・判断力・表現力を測る問題設計:PISA型課題、パフォーマンス評価、ポートフォリオ的要素の導入検討
「ベンチマーク試験」において中核となる「思考力・判断力・表現力」を測定するためには、従来の知識再生型の問題形式から脱却し、より高度で複雑な認知能力を要する問題設計が不可欠である。現行の共通テストにおいても、問題文の長文化、複数の資料やデータからの情報統合、日常生活や社会的事象と関連付けた問いかけなど、これらの能力を測る試みがなされている 3。本試験では、これらの方向性をさらに推し進め、国際的な学力調査であるPISA(Programme for International Student Assessment)で用いられるような実社会の文脈に基づいた課題(PISA型課題)や、実際の遂行能力を評価するパフォーマンス評価、さらには継続的な学習成果を蓄積・活用するポートフォリオ的要素の導入を積極的に検討すべきである 16。
- PISA型課題の導入: PISA調査では、単に知識を記憶しているかではなく、実生活の様々な場面で知識や技能を活用して課題を解決する能力(リテラシー)を測定する 37。例えば、複数の情報源(テキスト、図表、グラフ等)を批判的に読み解き、それらを統合して自らの見解を論証したり、社会的な課題に対する解決策を提案したりするような課題が考えられる。これにより、情報編集力、論理的思考力、問題解決能力といった、より実践的な能力を評価することが可能となる。
- パフォーマンス評価の活用: パフォーマンス評価とは、知識やスキルを実際の文脈で活用する能力を、具体的な成果物や行動を通じて評価する手法である 35。CBT(Computer-Based Testing)環境を活用すれば、例えば、シミュレーション課題(仮想実験の計画・実行・考察)、デザイン課題(特定の条件下でのシステム設計)、複雑なデータセットの分析と報告書の作成といった、より実践的で思考のプロセス自体も評価対象としうる課題の導入が可能となる。これらは、受験者が実際に「何ができるか」を直接的に示すものであり、学習の成果をより具体的に捉えることができる 41。
- ポートフォリオ的要素の組込み: ポートフォリオは、生徒が一定期間に作成した学習成果物(レポート、作品、研究記録など)を体系的に収集したものであり、学習の過程や成長の軌跡を示すことができる 15。ベンチマーク試験の枠組みの中で、例えば特定の教科の探究活動の成果物や、主体的な学習の記録などを電子的に提出させ、それに基づいて試験の一部(例えば、自己の探究プロセスを説明・考察する論述問題など)を構成することが考えられる。これにより、一過性の試験では捉えきれない、継続的な努力や深い学びの成果を評価に組み込むことが期待される。
これらの新しい評価方法を大規模な入試システムに導入する際には、標準化と真正性のバランスが重要な課題となる。PISA型課題やパフォーマンス評価は、伝統的な試験よりも真正な能力評価を可能にする一方で、特に複数回実施を前提とする場合、評価の公平性、客観性、信頼性を担保するための標準化が極めて重要となる 48。特に、自由記述や成果物に対する採点には、明確な評価規準(ルーブリック)の策定と採点者間の高度な一致が求められ、これは大きな挑戦である 53。ポートフォリオ評価も、その真正な評価能力は高いものの、全国規模での標準化された採点システムの構築や採点者の負担は甚大であり、慎重な検討が必要となる 47。
したがって、ベンチマーク試験においては、CBTのインタラクティブ機能を活用した新しい問題形式の開発や、一部の複雑な解答に対するAI等を活用した自動採点技術の研究開発を進めることが望ましい。パフォーマンス課題やポートフォリオ的要素については、明確なルーブリック 35 に基づく評価を徹底するとともに、採点の質を担保するために、サンプリングによる中央採点や、複数の評価者による協調的評価(モデレーション)などの仕組みを導入する必要がある。初期段階では比較的構造化された課題から導入し、採点技術や評価ノウハウの蓄積に合わせて、より自由度の高い課題へと段階的に移行することも現実的な方策であろう。
3.2. 主体性等の評価方法:活動記録、自己報告、探究学習の成果等を活用した評価指標
「主体性を持って多様な人々と協働して学ぶ態度」(以下、主体性等)の評価は、学力の3要素の中でも特に測定が難しいとされる領域である 15。多くの大学では、総合型選抜や学校推薦型選抜において、志望理由書、活動報告書、面接、調査書の所見欄などを通じて、この主体性等の評価を試みている 15。また、高等学校における「総合的な探究の時間」に代表される探究学習は、生徒の主体性や協働性が発揮される重要な場面として注目されている 15。
ベンチマーク試験において主体性等を評価するためには、これらの既存の取り組みを参考にしつつ、標準化された枠組みの中でより客観的かつ多角的に情報を収集・評価する仕組みを構築する必要がある。大阪大学が開発を進めているeポートフォリオシステムや「高等学校ポートレート」(各高校の教育方針や特色、進路実績などをデータベース化したもの)は、生徒の活動記録や学習成果を文脈の中で理解し、公正な評価を行うための先進的な試みとして参考になる 15。
ベンチマーク試験における主体性等の評価指標としては、以下のような要素を組み合わせることが考えられる。
- 構造化された自己報告・活動記録: 受験生自身が、高校時代の探究活動、課外活動、ボランティア活動、リーダーシップ経験などについて、具体的な取り組み内容、役割、そこから得た学びや課題などを、定められた形式(例えば、STARメソッド:Situation, Task, Action, Resultを意識した記述)で報告する。これらは、高等学校の教員による確認や証明を付加することで信頼性を高める。
- 探究学習の成果に関する省察: 探究学習のプロセスや成果物(一部)を提出させ、それに基づいて、課題設定の理由、情報収集・分析の方法、協働作業における工夫や困難、自己の成長などを記述させる。
- シナリオベースの状況判断問題: 協働的な課題解決や倫理的なジレンマを含む具体的な場面を設定し、そのような状況で自身ならどのように考え、行動するかを問う問題。これにより、主体的な判断力や協調性、倫理観などを間接的に評価する。
主体性の評価において重要なのは、単に「何をしたか」という活動のリストアップではなく、その活動を通じて「何を考え、どのように行動し、何を学んだか」というプロセスと、そこからの内省(リフレクション)である。OECDのラーニング・コンパス2030が示す「予測・行動・省察」のサイクル 20 にも通じるように、経験から学び、それを次の行動に繋げる力こそが主体性の本質と言える。したがって、ベンチマーク試験の主体性評価部分は、活動の記録だけでなく、それらの経験に対する深い内省を促し、それを言語化する能力を重視すべきである。これにより、生徒の知的好奇心、探究心、自己調整学習能力、そして他者と関わりながら学ぶ姿勢といった、より深層的な資質を捉えることが期待できる。
3.3. CBT (Computer-Based Testing) 導入の可能性と課題
「ベンチマーク試験」を複数回実施し、かつ思考力・判断力・表現力や主体性といった多面的な能力を評価するためには、CBT(Computer-Based Testing)の導入が極めて有効な手段となり得る。CBTは、動画や音声を用いた多様な出題形式、インタラクティブな課題設定、解答プロセスの記録、効率的なデータ収集・採点、さらには個々の受験者の能力に応じた出題難易度調整(アダプティブ・テスティング)など、従来のPBT(Paper-Based Testing)にはない多くの利点を提供する 59。文部科学省も共通テストのデジタル化を推進しており、CBTの研究開発を進めている 4。
しかし、全国規模で約50万人が対象となりうる大学入試システム 3 にCBTを全面的に導入するには、克服すべき多くの課題が存在する。主な課題としては、以下の点が挙げられる 60。
- インフラ整備: 全ての受験生に公平な受験環境を提供するための、十分なスペックを持つ端末(PCやタブレット)及び安定したネットワーク環境の全国的な整備。これには莫大な初期投資と維持管理コストが伴う。
- セキュリティ: 試験問題の漏洩防止、不正行為の防止(特に遠隔監視型の場合)、個人情報保護など、高度なセキュリティ対策。
- 技術的支援体制: 試験中のトラブルシューティングや技術サポートを行う専門スタッフの育成と配置。
- 受験者のデジタル格差: 家庭環境や学校のICT環境の違いによる、生徒間の情報リテラシーやCBT形式への習熟度の差が、試験結果に影響を与える可能性。
- 問題作成・管理: CBT、特にアダプティブ・テスティングを実施する場合、膨大な量の質の高い問題アイテムバンクの構築と管理、項目反応理論(IRT)等を用いた統計的処理が必要となる 50。
- 費用: 上記インフラ整備、ソフトウェア開発、セキュリティ対策、問題作成・管理等にかかる費用は、PBTに比べて高額になる傾向がある。
これらの課題に対応するためには、国レベルでの戦略的なICT環境整備計画、標準化されたCBTプラットフォームの開発、受験生向けの十分な練習機会の提供、そして教員や試験監督者向けの研修プログラムが不可欠である。
複数回の受験機会を提供するベンチマーク試験の特性を考えると、CBTの導入は、単なる効率化に留まらず、評価の質そのものを変革する可能性を秘めている。特に、IRTを活用した採点システムは、異なる時期に異なる問題セットで受験した生徒の能力を共通の尺度で比較可能にするため、複数回実施の公平性を担保する上で鍵となる 62。さらに、アダプティブ・テスティングを導入できれば、各生徒の能力レベルに応じた最適な難易度の問題を出題することで、より精密な能力測定が可能となり、同時に生徒の学習意欲を引き出す効果も期待できる。このように、ベンチマーク試験は、CBTとIRT、アダプティブ・テスティングといった技術を組み合わせることで、単なる選抜のための試験から、生徒の成長を可視化し、個別のフィードバックを通じて学習を支援する「成長志向の評価(Growth-Oriented Assessment)」へと進化しうる。ただし、このような高度なシステムの開発と運用には、莫大な費用と高度な専門知識が必要であり、長期的な視点での投資と人材育成が不可欠であることは言うまでもない 60。
3.4. 教科横断的な評価の視点
現代社会が直面する複雑な課題の多くは、単一の学問分野の知識だけでは解決できず、複数の分野にまたがる知識やスキルを統合し、活用する能力が求められている。OECDのラーニング・コンパス2030においても、学際的知識(Interdisciplinary knowledge)の重要性が指摘されている 20。大学教育においても、リベラルアーツ教育の重視や学際的な学部・学科の設置が進んでおり、入学段階でそのような素養を持つ学生を求める声も高まっている。一部の大学入試では、既に教科の枠を超えた「総合問題」が出題される例も見られる 32。
「ベンチマーク試験」においては、このような社会や高等教育の要請に応えるため、教科横断的な視点を取り入れた評価を導入することを検討すべきである。具体的には、以下のような形式が考えられる。
- 教科複合型問題: 特定のテーマ(例:環境問題、情報社会の倫理、地域活性化など)について、複数の教科(例:理科と社会、数学と情報、国語と英語など)の知識や思考法を組み合わせて解答を導き出す問題。
- 探究型課題: 与えられた課題に対して、自ら情報を収集・分析し(教科の知識を活用)、複数の視点から考察し、解決策や意見を論理的に構成して表現する課題。これは、高等学校の「総合的な探究の時間」の成果を評価する上でも有効である。
- PBL(Project-Based Learning)的要素: CBTを活用し、あるプロジェクトを遂行する過程をシミュレーションさせ、その中での意思決定や問題解決のプロセスを評価する。
教科横断的な評価を導入することは、生徒が各教科で学んだ知識やスキルを断片的なものとしてではなく、相互に関連付け、実社会の文脈の中で活用する能力を育成する上で大きな意義を持つ。しかし、その実現にはいくつかの留意点がある。第一に、現在の高等学校のカリキュラムや授業は、依然として教科ごとの縦割り構造が強い場合が多い。教科横断的な評価を導入するのであれば、それに対応できるようなカリキュラム改革や、教員が教科の枠を超えて連携し指導する体制づくりが高等学校側に求められる。第二に、教員自身が教科横断的な指導法や評価法に関する専門性を高めるための研修機会の充実が不可欠である。これらの準備が不十分なまま教科横断的な評価を導入すれば、生徒が十分に育成されていない能力を測ることになり、不公平感や混乱を招く可能性がある。
したがって、ベンチマーク試験における教科横断的評価の導入は、高等学校のカリキュラム改革や教員研修と連動させた長期的な戦略のもとで段階的に進めるべきである。初期には、既存の教科の枠組みの中で、他教科との関連を意識させるような問いかけや資料の活用を促す程度から始め、徐々に教科の垣根を低くしていくアプローチが現実的であろう。
IV. 大学による「ベンチマーク試験」結果の活用と専門試験との連携
4.1. 大学における「ベンチマーク試験」結果の原則的活用方針
提案する「ベンチマーク試験」は、大学が学力評価を行う際の基本的な指標として活用されることを原則とする(ユーザー提案)。これは、多くの国公立大学が共通テストの結果を第一次選考等に利用している現状と類似の役割を担うことを意味する 1。大学は、この試験結果を通じて、受験生の広範な基礎学力、思考力・判断力・表現力、そして主体性等に関する標準化された情報を得ることができる。
各大学は、自学のアドミッション・ポリシー(入学者受入れの方針)に基づき、ベンチマーク試験の結果をどのように入学者選抜に利用するかを具体的に定める必要がある 39。これには、試験結果の最低基準点の設定、特定の教科への重み付け、あるいは総合的な得点や段階別評価の活用などが考えられる。重要なのは、大学がベンチマーク試験の結果を、自らが求める学生像と照らし合わせ、他の選抜資料(調査書、面接、小論文、大学独自の専門試験の結果など)と組み合わせて総合的に評価することである。
この「原則的活用」という方針は、大学の自主性を尊重しつつ、全国的な学力評価の基盤を形成することを目指すものである。しかし、この「原則的」という言葉の解釈が大学によって大きく異なると、受験生にとってはどの程度の重要度を持つ試験なのかが不明確になり、混乱を招く可能性がある。例えば、一部の大学がベンチマーク試験の結果を形式的にしか利用しない、あるいは極端に低い比重でしか評価しない場合、試験の権威性や受験生の受験インセンティブが損なわれる恐れがある。
この点を考慮すると、大学の自主性を最大限尊重しつつも、ベンチマーク試験の結果を実質的に活用するための一定のガイドラインや、スコア解釈のための共通理解の枠組み(例えば、全国的な到達度レベルの設定など)を、試験運営主体が大学関係者との協議の上で策定・提供することが望ましい。これにより、受験生は自身の成績が各大学でどのように評価されるかの見通しを持ちやすくなり、試験の「ベンチマーク」としての機能がより確かなものとなる。この透明性と一貫性の確保は、本試験制度の信頼性を高める上で不可欠である。
4.2. 複数回成績の取り扱い:最高点利用、平均点、成長の軌跡の評価など多様な選択肢
「ベンチマーク試験」は高校3年間で最大9回程度の受験機会を提供するため、大学が複数回の成績をどのように取り扱うかが極めて重要な論点となる。主な選択肢としては、以下のようなものが考えられる。
- 最高点の利用(Superscoringを含む): 受験した複数回の試験のうち、最も高い総合点、あるいは教科ごとの最高点を組み合わせて評価する(スーパースコアリング)。これは米国のSATやACTで広く採用されており、受験生が自己ベストを達成する機会を最大化し、再受験へのインセンティブを高める効果がある 23。
- 特定回(最新回など)の得点利用: 最新の受験結果や、受験生が指定した特定の回の結果のみを評価対象とする。
- 平均点の利用: 受験した複数回の平均点を評価に用いる。これにより、安定した学力を評価できる可能性があるが、初期の低い得点が影響するデメリットもある。
- 全受験結果の提出と総合的判断: 全ての受験結果を提出させ、大学がそれらを総合的に見て判断する。一部の米国大学ではこの方式が採用されている 24。
- 成長の軌跡の評価: 単一の点数だけでなく、複数回の受験結果から見える学力の伸長度や学習への取り組み姿勢を評価する。
これらの選択肢は、それぞれにメリット・デメリットがあり、大学のアドミッション・ポリシーや評価したい能力によって最適な方法は異なる。例えば、スーパースコアリングは受験生に有利に働くことが多いが、大学側にとっては、受験生の「真の能力」よりも「ピーク時の能力」を捉えることになる可能性がある。
ここで特に注目すべきは、「成長の軌跡の評価」という新たな視点である。現行の入試システムやSAT/ACTのような海外の試験でも、主に最高得点や特定回の得点が重視されることが多い 24。しかし、ベンチマーク試験が高校3年間にわたる複数回のデータを提供するという特性を活かせば、単なる点数だけでなく、生徒がどのように学力を伸ばしてきたか、困難を乗り越えてきたかといった「学習のプロセス」や「粘り強さ」を評価に組み込むことが可能になる。これは、初期の学力は必ずしも高くないものの、学習を通じて大きく成長する潜在能力を持つ生徒や、不利な環境から努力を重ねてきた生徒をより公平に評価する上で有効な手段となり得る。このような評価方法は、結果だけでなく努力の過程をも重視するという教育的メッセージを発することにも繋がる。
ただし、「成長の軌跡」を客観的かつ公平に評価するための具体的な方法論(例えば、どのような統計モデルを用いるか、初期のスコアと最終スコアの差をどう解釈するか、受験回数や間隔をどう考慮するか等)は、慎重な研究開発が必要となる。大学がこの評価方法を導入する際には、その基準を明確に公開し、受験生に予測可能性を与えることが不可欠である。ベンチマーク試験システムは、このような新しい評価指標の開発と、大学への活用支援を検討すべきである。これは、既存の入試モデルとは一線を画す、本試験独自の価値を生み出す可能性を秘めている。
4.3. 大学独自の専門試験の役割と「ベンチマーク試験」との補完関係
「ベンチマーク試験」が大学の学力評価の原則的な基礎資料となる一方で、各大学・学部がその専門分野の特性に応じて、より専門的な知識や技能、あるいは特定の適性を評価するために独自の試験(以下、専門試験)を実施することは引き続き可能である(ユーザー提案)。これは、現行制度における個別試験(二次試験)が担っている役割に相当し、大学の自主性と教育の多様性を担保する上で重要である 1。
ベンチマーク試験と専門試験の役割分担は、以下のように整理できる。
- ベンチマーク試験:
- 広範な教科における基礎的・汎用的学力(知識・技能と思考力・判断力・表現力)。
- 主体性、協働性といった非認知能力の指標。
- 全国共通の尺度による客観的で標準化された評価。
- 大学独自の専門試験:
- 特定の専門分野における深い知識や高度な技能。
- 実験・実技能力、特定の思考様式(例:デザイン思考、論証能力)。
- 学部・学科の教育理念や研究分野への適性、学習意欲。
- ポートフォリオ評価、実技試験、高度な記述式問題、専門分野に関する面接・口頭試問など、ベンチマーク試験では実施困難な、より個別化・専門化された評価方法。
重要なのは、ベンチマーク試験の導入によって大学の入試問題作成負担が軽減されるというメリット(ユーザー提案)を最大限に活かすため、専門試験の位置づけを明確にすることである。ベンチマーク試験が広範な能力を網羅的に評価するのであれば、大学が追加で専門試験を課す場合には、その試験がベンチマーク試験では測定できない、どのような「付加価値」のある能力を評価しようとしているのかを具体的に示す必要がある。文部科学省も、共通テストと個別試験の役割分担の明確化を求めている 4。
これにより、専門試験がベンチマーク試験の内容と重複することを避け、受験生にとっての過度な負担増を防ぐことができる。大学は、アドミッション・ポリシーにおいて、ベンチマーク試験で評価する能力と、専門試験で評価する能力を明確に区分し、それぞれの試験結果をどのように総合して合否判定に用いるかを具体的に示すべきである。このような透明性の確保は、受験生が適切な準備を行う上で不可欠であり、ベンチマーク試験導入による効率化の恩恵を確実なものにするためにも求められる。
4.4. アドミッション・ポリシーに基づく多様な入学者選抜の実現
大学入試改革の大きな目標の一つは、各大学が自らのアドミッション・ポリシー(AP)に基づき、多様な背景や能力を持つ学生を多面的・総合的に選抜できるようにすることである 4。提案する「ベンチマーク試験」は、その多面的な評価項目(思考力・判断力・表現力、主体性等)と複数回の受験結果(最高点、成長の軌跡等)を提供することにより、この目標達成に大きく貢献し得る。
大学は、ベンチマーク試験の結果を、必要に応じて実施する専門試験の結果や、調査書、志望理由書、活動報告書、面接といった他の選抜資料と組み合わせることで、より精緻な学生評価を行うことが可能となる。これにより、単一の学力尺度では捉えきれなかった学生の個性や潜在能力、特定の分野への強い関心や適性などを発見し、APに合致した学生を的確に選抜することが期待される。
特に、米国の一部の大学で採用されている「ホリスティック・レビュー(総合的評価)」のようなアプローチを日本の大学が導入・拡充する上で、ベンチマーク試験は重要な役割を果たす。ホリスティック・レビューは、学業成績やテストスコアだけでなく、エッセイ、推薦状、課外活動、家庭環境、困難を乗り越えた経験など、受験生の様々な側面を総合的に考慮して合否を判断する評価方法である。ベンチマーク試験が提供する多角的かつ標準化された学力情報は、このようなホリスティック・レビューにおいて、主観的になりがちな他の評価要素とのバランスを取り、評価全体の信頼性を高めるための「アンカー」として機能し得る。
例えば、ある大学のAPが「未知の課題に主体的に挑戦し、多様な人々と協働して解決策を創造できる人材」を求めている場合、ベンチマーク試験の「主体性等」の評価指標や「思考力・判断力・表現力」のスコア、複数回の受験から見える粘り強さなどを重視しつつ、面接やグループディスカッション、過去の活動実績(ポートフォリオ)などを組み合わせて評価を行うことができる。このように、ベンチマーク試験は、大学がそれぞれの教育理念や特色を反映した、より個別化された入学者選抜を実現するための強力なツールとなり得る。ただし、そのためには、各大学がAPをより具体的に、かつ測定可能な形で記述し、それに基づいて選抜方法を設計・検証していく努力と、ホリスティック・レビューを適切に実施するための評価者の育成が不可欠である。
V. 「ベンチマーク試験」導入による期待効果と教育システムへの貢献
5.1. 受験生へのメリット:一発勝負からの解放、継続的な学習意欲の向上、自己の強みの発見
「ベンチマーク試験」の導入は、受験生に対して多岐にわたる肯定的な効果をもたらすと期待される。その最大のメリットは、現行入試制度が持つ「一発勝負」という重圧からの解放である(ユーザー提案)。年複数回の任意受験機会が提供されることにより、特定の試験日における体調不良や精神的な緊張が結果に及ぼす影響を大幅に軽減できる 7。これは、特にプレッシャーに弱い生徒や、時間をかけて能力を伸長させるタイプの生徒にとって、より公平な評価機会を提供することに繋がる。米国のSAT/ACTにおける複数回受験の事例は、生徒が自己の最高能力を発揮する機会を増やすという点で参考になる 14。
さらに、複数回の受験機会と、それぞれの結果に基づくフィードバックは、受験生の継続的な学習意欲を刺激し、維持する効果が期待できる。一度の失敗で諦めるのではなく、自身の弱点を把握し、次回の試験に向けて具体的な学習計画を立て、改善に取り組むというサイクルが生まれる。これは、単に試験の点数を上げるためだけでなく、生涯にわたる自律的な学習習慣の形成にも寄与する。
また、様々な教科・分野で複数回試験を受ける中で、生徒は自身の得意な分野や潜在的な能力、あるいは興味関心の方向性をより明確に認識する機会を得られる。例えば、初期には意識していなかった教科で回を重ねるごとに好成績を収める、あるいは特定の思考力を問う問題形式で高いパフォーマンスを示すといった経験は、自己理解を深め、将来の学部選択やキャリア設計において重要な示唆を与えるだろう。高等学校におけるキャリア教育の充実が求められる中で 29、ベンチマーク試験の結果とそれに対する内省は、生徒が自身の強みや適性に基づいた主体的な進路選択を行うための貴重な情報源となり得る。試験システム自体が、定期的なフィードバックを通じて生徒の自己分析を促し、科目選択や学習戦略の最適化を支援する機能を備えることができれば、その教育的価値は一層高まる。これは、単なる選抜手段としての試験を超え、生徒の成長を支援する形成的評価の側面を強化することに繋がる。
5.2. 大学へのメリット:入試問題作成負担の軽減、学生の多面的な能力把握、教育改善への接続
大学にとって、「ベンチマーク試験」の導入は、入試運営の効率化と教育の質的向上の両面で大きなメリットをもたらす。ユーザー提案にもある通り、最も直接的な効果は、各大学が個別に行っている入試問題作成の負担軽減である。質の高い入試問題を毎年作成・実施するには、多大な人的・時間的・財政的リソースが必要となる。ベンチマーク試験が全国共通の信頼性の高い学力指標を提供することで、大学はこれらのリソースを、より専門性の高い能力を測る試験の開発や、教育研究活動そのものに振り向けることが可能となる。
さらに、ベンチマーク試験は、従来の学力試験の点数だけでは捉えきれなかった学生の多面的な能力に関する情報を提供する。思考力・判断力・表現力、主体性といった「学力の3要素」に関する評価 4 や、複数回の受験結果から見える学習の軌跡は、学生の潜在能力や学習スタイル、粘り強さなど、より深層的な特性を理解する上で貴重な手がかりとなる。これにより、大学は自学のアドミッション・ポリシーに合致した、多様な個性と能力を持つ学生をより的確に見出し、受け入れることが可能になる。
加えて、ベンチマーク試験の成績データと入学後の学修成果データを接続・分析することで、大学教育の改善に繋がる重要な知見を得ることができる。大阪大学が試みているような、入試情報と入学後の学業成績や学生生活に関する追跡調査 15 は、どのような能力や特性を持つ学生が特定の教育プログラムで成功しやすいか、あるいはどのような点に課題を抱えやすいかを明らかにする。このようなエビデンスに基づいた分析は、アドミッション・ポリシーの妥当性検証、カリキュラム改善、学生支援プログラムの最適化など、大学全体の教育改革を推進するためのデータ駆動型の意思決定を可能にする。ベンチマーク試験が提供する全国規模の標準化されたデータは、個々の大学だけでなく、日本の高等教育全体の質保証と改善に貢献する基盤情報となり得る。ただし、このようなデータの収集・分析・活用には、厳格な個人情報保護とデータガバナンス体制の確立が前提となることは言うまでもない。
5.3. 高校教育へのポジティブな波及効果:探究学習の深化、主体的な学びの促進
大学入試の内容や形式は、高等学校の教育課程や指導方法に大きな影響を与える(ウォッシュバック効果)。「ベンチマーク試験」が、知識の暗記再生だけでなく、思考力・判断力・表現力、そして主体性といった能力を重視して評価するようになれば、高等学校の教育もこれらの能力育成をより重視する方向へとシフトすることが期待される 4。
特に、新学習指導要領で重視されている「総合的な探究の時間」をはじめとする探究学習の深化に繋がる可能性がある 57。ベンチマーク試験が、生徒自身が課題を設定し、情報を収集・分析し、他者と協働しながら解決策を模索し、その成果やプロセスを表現するといった探究的な能力を評価対象に含めることで、高等学校は探究学習を単なる活動としてではなく、生徒の重要な資質・能力を育成する中核的な教育活動として位置づけ、その質的充実に一層力を入れるようになるだろう。
また、主体的な学びの促進も期待される。ベンチマーク試験が複数回・任意の受験機会を提供し、生徒の継続的な努力や成長の軌跡を評価するようになれば、生徒は受け身の学習から脱却し、自らの学習目標を設定し、計画的に学習を進め、結果を振り返って改善を図るという、より主体的な学習スタイルを身につける動機付けとなる。これは、生涯学習社会において不可欠な自律的学習者の育成に貢献する。
このように、ベンチマーク試験は、高等学校に対して、21世紀型スキルや「学力の3要素」を育むための教育実践を奨励し、その成果を可視化する役割を果たすことができる。しかし、そのためには、高等学校の教員が、これらの能力を育成するための指導法や評価法に関する専門性を高めることが不可欠である。ベンチマーク試験の導入と並行して、教員研修プログラムの充実や、先進的な教育実践事例の共有・普及といった支援策を講じることが、ポジティブな波及効果を最大化する上で重要となる。これにより、高等学校の教員が、試験対策に追われるのではなく、生徒の真の能力を育むことに専念できる環境を整備し、教育の質的転換を後押しすることが可能となる。
5.4. 高大接続の円滑化と教育全体の質向上
「ベンチマーク試験」の導入は、高等学校教育と大学教育の間の連携、すなわち「高大接続」をより円滑にし、教育システム全体の質的向上に貢献することが期待される。「高大接続改革」の核心的な目標は、生徒が高校までに培った力を大学でさらに発展・向上させ、社会で活躍できる人材を育成するための一貫した教育体系を構築することにある 4。
ベンチマーク試験が「学力の3要素」といった、大学での学修やその後の社会生活で必要とされる汎用的な能力を評価の軸に据えることで、高等学校と大学の間で、育成すべき能力像に関する共通理解が深まる。高等学校は、ベンチマーク試験が示す評価規準を参考に、生徒がこれらの能力をバランス良く習得できるような教育課程を編成・実施することができる。一方、大学は、ベンチマーク試験の結果を通じて、入学してくる学生がどのような強みや課題を持っているかをより具体的に把握し、それに基づいて初年次教育のプログラムを設計したり、個別の学習支援を提供したりすることが可能になる。
このように、ベンチマーク試験は、高等学校と大学が、生徒の能力育成という共通の目標に向けて連携・協働するための「共通言語」や「共通の物差し」として機能し得る。例えば、特定の思考スキルや主体的な学習態度に関して、高等学校での育成目標と大学での期待水準がベンチマーク試験を通じて可視化されれば、両者の間でより具体的な教育内容や指導方法に関する対話が促進されるだろう。これは、現在一部で試みられている高大連携プログラム(大学教員による高校での出張授業、高校生向けの大学レベルの講座提供など)を、より体系的かつ広範に展開するための基盤ともなり得る。
結果として、生徒は高等学校で身につけた能力を大学での学びにスムーズに繋げることができ、大学は入学者の多様な能力を前提とした上で、より高度で専門的な教育を展開できるようになる。これは、学習者の視点からは、教育段階間の移行に伴う断絶感や困難を軽減し、継続的な学びの意欲を維持することに繋がる。教育システム全体としては、各教育段階がそれぞれの役割をより効果的に果たし、社会の要請に応える人材育成システムの効率性と実効性を高めることに貢献するだろう。
VI. 「ベンチマーク試験」の実現に向けた課題と具体的な対応策
「ベンチマーク試験」構想は、日本の大学入試制度に大きな変革をもたらす可能性を秘めているが、その実現には数多くの課題を克服する必要がある。本章では、主要な課題を特定し、それらに対する具体的な対応策を、国内外の事例や研究成果を踏まえつつ検討する。
6.1. 試験開発・運営体制の構築:中立的な専門機関の設立と国際連携
これまでにない規模と内容を持つ「ベンチマーク試験」を開発・運営するためには、高度な専門性と中立性、そして安定した財政基盤を備えた強固な実施体制が不可欠である。現在、大学入学共通テストを所管している独立行政法人大学入試センター(DNC)3 の機能を大幅に拡充・改編するか、あるいは本試験の特性に特化した新たな専門機関を設立することが考えられる。この機関は、試験問題の設計・開発、膨大な問題バンクの管理、CBTシステムの構築・運用、採点業務の統括、IRT等を用いたスコアの等化処理、試験結果の分析・研究、そして品質管理全般を担うことになる。
このような専門機関の設立や運営にあたっては、米国のETS(Educational Testing Service)やカレッジボード(College Board)、ACT、国際バカロレア機構(IBO)、OECDのPISAといった国際的な大規模評価機関の組織運営、テスト開発プロセス、品質保証システム、ガバナンス体制などが大いに参考になる 13。これらの機関は、長年にわたり大規模評価を実施してきた経験と知見を有しており、特に思考力や主体性といった複雑な能力の測定技術やCBTの運用ノウハウに関しては、積極的な国際連携を通じて最新の動向を導入することが不可欠である。
しかし、新たな評価機関の設立や既存機関の大規模な改革は、単なる技術的な問題に留まらない。そのガバナンス構造、資金調達モデル(国からの交付金、受験料収入 71、その他の事業収入など)、そして文部科学省、大学、高等学校といった主要なステークホルダーとの関係性など、極めて政治的かつ官僚的な調整を要する複雑な課題が伴う。ETS 79 やカレッジボード 80 のような非営利組織としての運営モデルや、その理事会の構成、意思決定プロセスなども参考に、日本独自の文脈に適合した、真に中立的で専門性の高い機関設計が求められる。本政策提言においては、このような機関設立のための具体的なロードマップ、財政計画、そしてその独立性と信頼性を確保するための法的・制度的枠組みを提示する必要がある。
6.2. 評価の公平性・客観性・信頼性の担保:IRT等の統計的等化手法、採点基準の標準化、採点者研修の徹底
年複数回、多様な問題セットを用いて実施される「ベンチマーク試験」において、評価の公平性・客観性・信頼性を担保することは最重要課題である。異なる時期に異なる問題を受験した生徒の成績を公正に比較可能にするためには、項目反応理論(IRT)をはじめとする高度な統計的等化手法の導入が不可欠となる 50。IRTは、各問題の難易度や識別力といった特性と、受験者の能力値を分離して推定することにより、異なるテストフォーム間のスコアを共通の尺度上に位置づけることを可能にする。
思考力・判断力・表現力や主体性等を測るために導入が検討される記述式問題やパフォーマンス課題、ポートフォリオ的要素の評価においては、採点の客観性と信頼性の確保が特に重要となる。共通テストの試行調査(プレテスト)では、国語の記述式問題において採点結果と自己採点との不一致が課題として指摘された経緯がある 4。この教訓を踏まえ、明確かつ具体的な評価規準(ルーブリック)を開発し、それに基づいて採点者に対する徹底的かつ継続的な研修を実施する必要がある 35。採点者間の評価のばらつきを最小限に抑えるため、複数の採点者によるダブル採点や、統計的な監視システムによる採点品質管理(モニタリング)の導入も検討すべきである。
さらに、頻繁な試験実施を支えるためには、質の高い試験問題を安定的に供給するための大規模なアイテムバンクの構築と、その効果的な管理・運用体制が求められる 60。各試験問題は、事前に十分なトライアルテスト(予備調査)を経て、その難易度や識別力、公平性(特定の受験者層に不利にならないか等)が検証されなければならない。また、一度使用された問題が外部に漏洩し、その後の試験の公平性を損なうリスク(アイテム曝露)を管理するため、アイテムの使用頻度を調整したり、定期的に新しい問題と入れ替えたりするアイテムローテーション戦略も必要となる。このようなアイテムの「ライフサイクル」管理と継続的な品質管理は、試験運営機関における高度な専門性と多大なリソースを要する。本提言では、これらの psychometric な側面における品質保証体制の確立を強く求める。
6.3. 受験生の負担軽減策:受験料設定、受験機会の地域格差是正、情報提供とサポート体制
「ベンチマーク試験」が受験生にとって真に有益な制度となるためには、その利用に伴う経済的、地理的、情報的な負担を可能な限り軽減する措置を講じる必要がある。現行の大学入試においても、受験料、交通費、宿泊費などが家計に大きな負担となっている実態がある 114。複数回の受験機会が提供されることはメリットである一方、その都度高額な受験料が必要となれば、経済的に恵まれない家庭の生徒にとっては受験機会の制約に繋がりかねない。
したがって、受験料は可能な限り低廉に設定し、特に低所得者層に対しては受験料の減免措置やバウチャー制度の導入を検討すべきである。また、CBTで実施する場合、試験会場へのアクセスが都市部に偏在し、地方の受験生が不利になることのないよう、全国各地に十分な数の試験会場を整備するか、あるいは公平性とセキュリティを確保した上での遠隔オンライン受験(自宅等での受験)の可能性も探る必要がある 60。
経済的・地理的負担の軽減に加えて、情報格差の是正も極めて重要である。米国のSAT/ACTの事例では、裕福な家庭の生徒ほど、試験戦略や対策講座、複数回受験のメリットに関する情報にアクセスしやすく、結果としてその恩恵をより多く受ける傾向が指摘されている 13。ベンチマーク試験が思考力や主体性といった複雑な能力を評価するものであり、かつ複数回の受験結果を大学が多様な方法で活用するとなれば、試験の特性や効果的な活用方法に関する情報を持たない生徒が不利になる「情報・準備格差」が生じる危険性がある。
この課題に対応するため、試験運営主体は、全ての受験生、保護者、教員に対して、試験の目的、内容、評価規準、結果の解釈方法、複数回受験の戦略的活用法などに関する、分かりやすく質の高い情報を無償で提供する責務を負う。具体的には、詳細な受験案内、豊富なサンプル問題、オンライン学習支援ツール、模擬試験機会などを開発・提供し、学校と連携してこれらが全ての生徒に行き渡るように努めるべきである。特に、地方や教育資源に乏しい地域の生徒に対するアウトリーチ活動やサポート体制の構築が求められる。
6.4. CBT導入に伴う技術的・倫理的課題への対応:インフラ整備、セキュリティ対策、情報リテラシー格差への配慮
CBTの導入は多くのメリットをもたらす一方で、技術的および倫理的な課題も伴う。これらへの適切な対応なしには、試験の公平性と信頼性は確保できない 60。
まず、技術的な課題として、安定した試験実施のためのインフラ整備が挙げられる。全国の高等学校や試験会場に、十分な性能を持つ端末、高速かつ安定したネットワーク環境、そして試験中の技術的トラブルに対応できるサポート体制を整備する必要がある。これには莫大な初期投資と継続的な維持管理費用が必要となる。また、試験問題や解答データ、個人情報などの機密情報を保護するための堅牢なサイバーセキュリティ対策も不可欠である。不正アクセス、データ改ざん、情報漏洩といったリスクを最小限に抑えるための技術的・組織的対策を徹底しなければならない。
次に、倫理的な課題として、情報リテラシー格差への配慮が重要となる。PISA調査などでも生徒のICT活用状況には差が見られるように 118、CBT形式の試験への慣れ不慣れが、本来の学力とは無関係に試験結果に影響を与える可能性がある 61。特に、家庭や学校のICT環境が十分でない生徒や、デジタル機器の操作に不慣れな生徒が不利にならないよう、事前の十分な操作練習機会の提供、直感的で分かりやすいインターフェース設計、試験会場での丁寧なガイダンスとサポートなどが求められる。場合によっては、移行期間中はPBTとの選択制を導入することも検討に値する。
さらに、CBTで収集される膨大な学習データ(解答内容だけでなく、解答プロセスや時間配分など)の取り扱いに関する倫理的配慮も不可欠である。これらのデータは教育改善に役立つ可能性がある一方で、個人情報保護やプライバシーの観点から厳格に管理されなければならない。データの利用目的、範囲、期間、匿名化の基準などを明確に定め、受験生や保護者に対して透明性のある情報開示を行う必要がある。
6.5. 高校教育との調和:過度な試験対策化の抑制と教育課程の尊重
いかなる大学入試制度も、高等学校の教育内容や指導方法に影響を与える。ベンチマーク試験が思考力や主体性といった広範な能力を評価することを目指すとしても、その影響力が高まれば、高等学校において過度な「試験対策」が行われ、結果として教育課程が歪められるリスクは常に存在する 5。
このリスクを抑制するためには、まず試験問題の質が重要となる。単なる知識の暗記や特定の解法パターンの習得だけでは対応できない、真の思考力や応用力を問うような良質な問題設計を追求し続ける必要がある。また、試験で評価される能力が、高等学校の学習指導要領が目指す育成すべき資質・能力と整合していることを明確に示し、高等学校の正規の教育活動を通じて自然と育成されるものであることを強調する必要がある。
複数回・任意受験という制度も、過度な試験対策化を抑制する一助となる可能性がある。年1回の一発勝負の試験に比べて、個々の試験の比重が相対的に下がり、生徒はより平常心で試験に臨みやすくなる。しかし、逆に、受験機会が多いことが「試験慣れ」や「テクニック偏重」を助長したり、生徒が多数の試験準備に追われて「ベンチマーク試験疲れ」に陥り、他の重要な学習活動や学校行事、部活動、あるいは特定の興味関心を深く追求する時間が奪われたりする可能性も否定できない 10。
したがって、試験運営主体は、大学側に対して、ベンチマーク試験の結果を過度に偏重することなく、多面的な評価の一部としてバランス良く活用するよう促す必要がある。また、高等学校に対しては、ベンチマーク試験対策を日常の授業や探究活動の中に自然な形で統合し、生徒の知的好奇心や主体的な学びを引き出すような指導法を推奨すべきである。年3回という試験頻度についても、パイロット運用を通じて、生徒の学習負担や高等学校の教育課程への影響を慎重に見極め、必要に応じて調整することが求められる。
6.6. 段階的導入と検証サイクルの確立
これほど大規模かつ多岐にわたる影響を及ぼす大学入試改革は、一朝一夕に完成するものではなく、慎重な準備と段階的な導入、そして継続的な検証と改善のサイクルを確立することが不可欠である 54。文部科学省が進める現行の大学入試改革においても、有識者会議等を通じた継続的な検討と見直しが行われている 4。
「ベンチマーク試験」システムの導入にあたっては、まず、特定の教科や地域、あるいは希望する学校を対象としたパイロットプログラム(試行実施)から開始することを提案する。このパイロットプログラムを通じて、試験問題の妥当性、CBTシステムの安定性、採点方法の信頼性、受験生の反応、高等学校や大学の受け止め方など、様々な側面からデータを収集し、課題を洗い出す。
収集されたデータとフィードバックに基づき、試験設計や運営方法を改善し、次の段階へと進む。この「計画(Plan)-実行(Do)-評価(Check)-改善(Action)」のPDCAサイクルを繰り返し回すことで、制度の質を着実に高めていく。
過去の大学入試改革においては、準備不足やステークホルダーとのコミュニケーション不足が混乱や批判を招いた事例も散見される 4。このような事態を避けるためには、改革の各段階において、その進捗状況、課題、改善策などを、受験生、保護者、教員、大学関係者、そして広く国民に対して透明性をもって公開し、意見を聴取するプロセスを設けることが極めて重要である。試験運営主体には、試験の技術的な品質(psychometric properties)、公平性、教育現場への影響、教育目標との整合性などに関する定期的な報告書の公表と、外部の専門家による独立した評価委員会の設置を義務付けるべきである。このような透明性と説明責任、そしてフィードバックに基づく柔軟な改善姿勢こそが、本改革に対する社会的な信頼を醸成し、その長期的かつ持続的な成功を担保する鍵となる。
表2:「ベンチマーク試験」導入・運営における主要課題と対応策
課題領域 | 具体的な課題 | 提案される対応策 | 参考となる国際事例/国内研究 |
試験開発・品質管理 | 多様な能力を測る良質な問題の継続的開発、大規模アイテムバンクの構築・管理 | 専門的な問題作成チームの編成、国際的な知見の導入、IRTに基づく項目分析と改善サイクルの確立、アイテム曝露対策 | PISAの問題開発プロセス 37、ETS/College Boardのテスト開発 79、IRT活用事例 62 |
評価の公平性・信頼性 | 複数回実施におけるスコアの等化、記述式・パフォーマンス評価の客観的採点 | IRT等による統計的等化、明確なルーブリック開発、採点者研修の徹底、ダブル採点・AI採点の活用検討 | SAT/ACTのスコア等化 83、PISAの採点品質管理、国内記述式プレテストの課題 4 |
CBT導入と運用 | 全国的なインフラ整備(端末、ネットワーク)、セキュリティ確保、技術サポート体制 | 国・自治体による計画的なICT環境整備、堅牢なセキュリティシステムの構築、技術スタッフの育成・配置、十分な操作練習機会の提供 | 国内CBT導入の課題 60、海外CBT試験事例 |
受験生の負担 | 受験料の経済的負担、地域による受験機会の格差、情報・準備格差 | 受験料の低廉化・減免措置、試験会場の全国均等配置または遠隔受験の導入、質の高い公式情報の無償提供、学校を通じたガイダンス強化 | SAT/ACTのフィーウェーバー制度、複数回受験と格差の問題 13 |
高校教育との連携・影響 | 過度な試験対策化、カリキュラムの歪み、教員負担増 | 試験内容と学習指導要領との整合性確保、探究学習等を促す問題設計、教員研修の充実、試験頻度・内容の柔軟な見直し | ウォッシュバック効果の研究 26、頻繁な試験の教育課程への影響 10 |
運営体制と財政 | 中立的・専門的な試験運営機関の確立、安定的な財政基盤の確保 | 大学入試センターの機能拡充または新専門機関の設立、国費と受験料による財源確保、透明性の高いガバナンス体制 | DNCの運営体制・予算 70、ETS/College Board等の運営モデル 79 |
VII. 結論と政策提言
7.1. 「ベンチマーク試験」導入の意義と実現可能性の再確認
本政策提言で詳述してきた「ベンチマーク試験」構想は、現行の日本の大学入試制度が抱える構造的な課題、すなわち「一発勝負」の重圧、知識偏重からの脱却の遅れ、そして生徒の多面的な能力評価の困難性といった問題に対し、具体的かつ実行可能な解決策を提示するものである。本試験は、文部科学省が推進する高大接続改革の理念、とりわけ「学力の3要素」の育成と評価という目標と完全に合致しており、日本の教育システム全体の質的向上に貢献する潜在力を有している。
受験生にとっては、複数回・任意の受験機会を通じて、精神的負担が軽減されるとともに、継続的な学習努力とその成長の軌跡が評価される道が開かれる。大学にとっては、質の高い標準化された多角的評価情報を得られることで、入試問題作成の負担が軽減され、アドミッション・ポリシーに基づいたより適切な学生選抜が可能となる。高等学校にとっては、思考力・判断力・表現力や主体性といった、これからの社会で求められる能力の育成に、より一層注力する教育的インセンティブとなる。
もちろん、このような大規模な制度改革には、試験開発・運営体制の構築、評価の公平性・信頼性の確保、CBT導入に伴う技術的・倫理的課題、受験生の負担軽減策、高等学校教育との調和など、克服すべき多くの課題が存在する。しかし、これらの課題は、本提言で示したように、国内外の先進事例や研究成果を参考にし、慎重な計画と段階的な導入、そして継続的な検証と改善のサイクルを確立することで、十分に乗り越え可能であると確信する。重要なのは、これらの課題を真正面から受け止め、関係者が知恵を結集して解決に取り組むという強い意志である。
7.2. 関係各機関への具体的な行動計画と提言
「ベンチマーク試験」の円滑な導入と持続可能な運営を実現するため、関係各機関に対して以下の具体的な行動計画を提言する。
- 文部科学省:
- 本政策提言に基づき、「ベンチマーク試験」導入に向けた基本構想を策定し、国民的コンセンサスの形成に努める。
- 試験の開発・運営を担う中立的かつ専門的な機関(既存機関の改編または新設)の設立に向けた法的・財政的措置を講じる。
- CBT導入に必要な全国的なICTインフラ整備計画を策定・推進する。
- 高等学校学習指導要領とベンチマーク試験の評価内容との整合性を確保し、高等学校における「学力の3要素」育成支援策(教員研修、教材開発等)を強化する。
- 大学に対し、ベンチマーク試験結果の適切な活用と、アドミッション・ポリシーの明確化を促す。
- 試験運営主体(新設または改編される専門機関):
- 教育測定学、各教科教育、情報技術等の専門家からなる委員会を設置し、試験の設計、問題開発、評価規準(ルーブリック)策定を行う。
- 大規模かつ高品質なアイテムバンクを構築・維持管理し、IRT等を用いたスコアの等化と信頼性確保に万全を期す。
- CBTシステムの開発・運用・保守体制を確立し、セキュリティ対策を徹底する。
- 採点者の募集・研修・管理システムを構築し、採点の質を保証する。
- 試験結果の分析・研究を継続的に行い、試験の妥当性・信頼性に関する情報を定期的に公開する。
- 受験生、高等学校、大学等、全てのステークホルダーに対し、試験に関する分かりやすい情報提供とサポートを行う。
- 大学:
- 各大学・学部のアドミッション・ポリシーを一層明確化し、ベンチマーク試験の結果をどのように活用するか(評価項目、比重、複数回成績の扱い等)を具体的に定め、公表する。
- ベンチマーク試験では測定困難な、専門分野特有の能力を評価するために大学独自の専門試験を課す場合は、その必要性と評価内容を明確にする。
- ベンチマーク試験が提供する多面的な情報を活用し、ホリスティック・レビュー(総合的評価)の導入・拡充を検討する。
- 入学後の学生の学修成果とベンチマーク試験の結果との関連を分析し、教育プログラムや入試方法の改善に繋げる。
- 高等学校:
- 新学習指導要領の趣旨を踏まえ、「学力の3要素」をバランス良く育成する教育課程を編成・実施する。特に、探究学習やPBL(Project-Based Learning)など、生徒の主体的な学びを促す活動を充実させる。
- 生徒に対し、ベンチマーク試験の意義や活用方法について適切な情報提供と進路指導を行う。
- 試験運営主体や大学と連携し、ベンチマーク試験が高校教育に与える影響についてフィードバックを提供し、制度改善に協力する。
7.3. 持続可能な大学入試改革に向けた展望
「ベンチマーク試験」の導入は、単なる入試制度の一変更に留まらず、日本の教育システム全体、特に高大接続のあり方を大きく変革する可能性を秘めた触媒である。この改革を真に持続可能なものとするためには、短期的な成果に一喜一憂することなく、長期的な視点に立ち、教育の本質に根差した取り組みを継続することが不可欠である。
本試験制度が目指すのは、点数による序列化の強化ではなく、一人ひとりの生徒が持つ多様な能力と可能性を可視化し、その成長を支援することである。そのためには、試験結果の解釈と活用において、常に教育的な配慮が求められる。大学は、ベンチマーク試験のスコアを絶対的なものとして捉えるのではなく、個々の学生の背景や努力の過程、そして将来のポテンシャルを多角的に評価する姿勢を持ち続ける必要がある。
また、社会の変化や教育研究の進展に伴い、評価すべき能力やその評価方法は常に進化していく。本試験制度も、固定的なものではなく、定期的な見直しと改善を通じて、時代の要請に応じた柔軟性と先進性を維持しなければならない。そのためには、試験運営主体、文部科学省、大学、高等学校、そして教育研究機関が緊密に連携し、エビデンスに基づいた対話と協働を継続する体制を構築することが重要である。
最終的に、この「ベンチマーク試験」が、日本の若者たちが自らの未来を主体的に切り拓き、変化の激しい社会において価値を創造していくために必要な力を育む一助となることを強く期待する。それは、知識の量だけでなく、知恵の質、そして学び続ける意欲を尊ぶ教育文化の醸成に向けた、大きな一歩となるであろう。
表3:主要国の大学入試・大規模評価における多面的・複数回評価の先進事例とその日本への示唆
国・機関 | 評価システム名 | 多面的評価の側面 | 複数回受験・結果利用 | 運営体制・資金調達 | 日本への示唆 |
米国 | SAT/ACT | 読解力、数学的思考力、科学的推論力(ACT)、エッセイ(オプション)。近年は知識活用や文脈理解を重視する傾向 23。 | 複数回受験可能。多くの大学がセクション毎の最高点を組み合わせる「スーパースコアリング」を採用 13。 | SATはカレッジボード(非営利団体)、ACTはACT, Inc.(非営利団体)が運営。主な収入源は受験料。ETSがSATの問題作成等を受託 90。 | 複数回受験とスーパースコアリングによる受験生の機会拡大と負担軽減。ただし、受験回数と社会経済的背景の関連性には注意が必要 13。CBT化への移行も進行中。 |
OECD | PISA | 15歳生徒対象。読解力、数学的リテラシー、科学的リテラシーを実生活の文脈で評価。思考力、問題解決能力を重視 37。 | 国際比較調査であり、個人の大学入試に直接利用されるものではないが、3年ごとの調査。 | OECDが統括し、各参加国が国内実施機関(日本は国立教育政策研究所 43)を通じて実施。資金は主に各参加国政府が分担。 | 実社会の文脈で思考力を問う問題設計の先進事例。CBTによる多様な課題形式。国際的な評価基準と教育政策への示唆。 |
国際バカロレア機構(IBO) | IBディプロマプログラム最終試験 | 6教科の筆記試験に加え、知の理論(TOK)、課題論文(EE)、創造性・活動・奉仕(CAS)といったコア科目を通じて、探究力、批判的思考力、論文作成能力、主体性、国際的視野などを総合的に評価 88。 | 最終試験は年2回(5月、11月)実施。再受験も可能。 | スイスの非営利財団。認定校からの年会費、試験料、教材販売、研修事業収入等が主な財源 88。 | 教科の枠を超えた総合的な能力評価と、主体的な学びの成果(CAS、EE)を重視する評価モデル。大学入試でのIBスコア活用。 |
フィンランド | Matriculation Examination (Ylioppilastutkinto) | 高校卒業資格と大学入学資格を兼ねる。母語、第二公用語、外国語、数学、一般科目(理科・人文社会系)から選択。記述式、思考力を問う問題が多い。近年デジタル化(CBT)を推進。 | 年2回実施。複数回受験し、良い方の成績を利用可能。 | 教育文化省傘下のMatriculation Examination Boardが運営。国費と受験料。 | 高校教育の集大成としての位置づけ。思考力・表現力を重視する問題。CBTへの段階的移行と複数回受験機会の提供。 |
中国 | 高考 (Gaokao) | 全国統一大学入学試験。伝統的に知識偏重と批判されてきたが、近年は総合能力評価や科目選択制(例:「3+3」モデル)を導入する改革が進行中。一部地域では高校の学業成績や総合的素質評価も参考にする動き 130。 | 原則年1回。複数回受験は一般的ではないが、一部改革で模索。 | 教育部が統括し、各省が実施。国費。 | 超大規模一斉試験の運営ノウハウ。近年の改革動向(科目選択制、総合評価導入の試み)は、画一性から多様性への移行の難しさを示唆。公平性確保への強い社会的要請。 |
この表は、提案する「ベンチマーク試験」が、国際的な評価改革の潮流と無縁ではなく、むしろそれらの知見を日本の文脈に合わせて取り入れようとするものであることを示唆している。特に、複数回受験の機会提供、思考力や主体性といった多面的な能力の評価、CBTの活用といった要素は、多くの国や評価機関で検討・実践されている方向性である。これらの事例から、制度設計上の具体的な工夫や、導入に伴う課題への対応策について、貴重な教訓を得ることができる。
引用文献
- 大学受験の基礎知識!入試の種類、仕組み、日程は?図版でわかりやすく解説!, 5月 21, 2025にアクセス、 https://shingakunet.com/journal/column/20211001000001/
- 大学入試の種類と仕組み | 栄光ゼミナール公式サイト, 5月 21, 2025にアクセス、 https://www.eikoh.co.jp/daigakujuken/column/c3045/
- 共通テストの基礎知識!一般入試と何が違うの?2025年度入試 …, 5月 21, 2025にアクセス、 https://shingakunet.com/journal/exam/20210910000002/
- 大学入学者選抜に関する最新動向 – 文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/20240801-mxt_daigakuc02-000037448_1.pdf
- 現代日本で歴史の大学入試が抱える問題点 – nippon.com, 5月 21, 2025にアクセス、 https://www.nippon.com/ja/in-depth/a05103/
- 【図解】大学受験はどう変わった? 2020年度までの入試制度の変遷, 5月 21, 2025にアクセス、 https://tankyu-skill.com/article04/20211116.html
- 総合型選抜(AO入試)のメリット・デメリットを徹底解説!推薦入試との違いは?, 5月 21, 2025にアクセス、 https://aoaoi.jp/information/post-5160/
- 総合型選抜(旧AO入試)のメリットとデメリットを他の入試形式と比較した上で解説, 5月 21, 2025にアクセス、 https://whiteacademy-ao.com/blog/merit-and-demerit-for-integrated-selection/
- 受験うつ – 大阪メンタルクリニック, 5月 21, 2025にアクセス、 https://osakamental.com/symptoms/depression/exam-depression
- 単元テストとは?デメリットや教育以外に悪い影響が出る?解説します | 学校向けICT教材 – すらら, 5月 21, 2025にアクセス、 https://surala.jp/school/column/4542/
- 1月 1, 1970にアクセス、 https://kyoiku.sho.jp/167087/
- 第3回 大学入試の公平性を考える – 大學新聞, 5月 21, 2025にアクセス、 https://daigakushinbun.com/post/views/1065
- NBER WORKING PAPER SERIES TAKE TWO! SAT RETAKING AND COLLEGE ENROLLMENT GAPS Joshua Goodman Oded Gurantz Jonathan Smith Working, 5月 21, 2025にアクセス、 https://www.nber.org/system/files/working_papers/w24945/w24945.pdf
- The Positive Impact of Retaking the SAT | Harvard Graduate School of Education, 5月 21, 2025にアクセス、 https://www.gse.harvard.edu/ideas/usable-knowledge/18/10/double-take
- 入試における主体性等評価の意義と課題 ~大阪大学の取組をもとに~, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/20200717-mxt_daigakuc02-000008787_4.pdf
- 各大学における多面的な評価に関する取組事例 – 文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/20200318-mxt_daigakuc02-000005730_8.pdf
- 大学入学共通テストの対策法。背景や基礎知識から各教科のコツ …, 5月 21, 2025にアクセス、 https://shingakunet.com/journal/exam/20201125000005/
- 【大学入試】抑えておきたい!「一般選抜」の基礎と注意点/文理選択が志望大学選びの鍵, 5月 21, 2025にアクセス、 https://www.shozemi.com/column/collegeexam/5188/
- The OECD Learning Compass 2030 | OECD, 5月 21, 2025にアクセス、 https://www.oecd.org/en/data/tools/oecd-learning-compass-2030.html
- resources.finalsite.net, 5月 21, 2025にアクセス、 https://resources.finalsite.net/images/v1706536711/northbrook28net/evmiubs2rv8ogy3urhoj/OECDLearningCompass.pdf
- 【まとめ】eポートフォリオを入試に使う大学一覧|事例7つも紹介 – スタスタ, 5月 21, 2025にアクセス、 https://studystudio.jp/contents/archives/42738
- 探究学習で使える「ポートフォリオ評価」の重要性と実施のポイントについて解説, 5月 21, 2025にアクセス、 https://www.blog.studyvalley.jp/2021/09/10/portfolio/
- SATとACTのスーパースコアリングとは – 現地情報誌ライトハウス – Lighthouse ロサンゼルス, 5月 21, 2025にアクセス、 https://www.us-lighthouse.com/study/education/sat-act.html
- 大学はSATの受験回数を確認できるのか? – Crimson Education JA, 5月 21, 2025にアクセス、 https://www.crimsoneducation.org/ja/blog/can-colleges-see-how-many-times-youve-taken-the-sat/
- 大学併願とは?専願と併願の違いや注意点を解説! – ベスト進学ネット, 5月 21, 2025にアクセス、 https://www.best-shingaku.net/smt/s-matome/daitan/c000561.php
- 【令和5年度 日本語教育能力検定試験 過去問】試験Ⅰ 問題5の解説!, 5月 21, 2025にアクセス、 https://japanese-language-education.com/r5-1-5/
- これからの英語教育の話を続けよう|第15回 「入試が変わらないから英語教育に成果が出ない」に根拠はない:政策効果の観点から見た「外部試験」論議|寺沢拓敬 | 未草 – ひつじ書房, 5月 21, 2025にアクセス、 https://www.hituzi.co.jp/hituzigusa/2019/02/28/letstalk-15/
- 大学入試が新たなステージへ!大学入試改革の背景と保護者の方の最適なサポート方法, 5月 21, 2025にアクセス、 https://www.aphex-group.com/blog/191/
- 高大接続改革は大学入試や高等教育にどう影響する?改革の概要や今後のキャリア形成支援のポイントを解説, 5月 21, 2025にアクセス、 https://mcs.mynavi.jp/column/2023/08/connection/
- 【高校教育/大学入試】高大接続改革とは?何が変わるのかを徹底解説 – StudySearch, 5月 21, 2025にアクセス、 https://study-search.jp/columns/570
- 高校に広まる定期考査廃止の動き – VIEW next ONLINE, 5月 21, 2025にアクセス、 https://view-next.benesse.jp/view_media/web-hs/REPORT%E9%AB%98%E6%A0%A1%E3%81%AB%E5%BA%83%E3%81%BE%E3%82%8B%E5%AE%9A%E6%9C%9F%E8%80%83%E6%9F%BB%E5%BB%83%E6%AD%A2%E3%81%AE%E5%8B%95%E3%81%8D_20240215.pdf
- 個別学力検査における「総合問題」について 1, 5月 21, 2025にアクセス、 https://www.pu-hiroshima.ac.jp/p/introducing/assets/files/pdf/14563.pdf
- 大学入学共通テストとは? – 学研のプライム講座, 5月 21, 2025にアクセス、 https://gpzemi.gakken.jp/gplab/recommend/1275/
- 【2025年度大学入学共通テスト】情報Ⅰの分析と対策ー初実施の …, 5月 21, 2025にアクセス、 https://benesse.jp/juken/202503/20250315-1.html
- 令和4年度 滋賀県パフォーマンステスト事例集, 5月 21, 2025にアクセス、 https://www.pref.shiga.lg.jp/file/attachment/5380160.pdf
- パフォーマンス評価とルーブリックの具体例12選!作成のポイントも解説 – TESOL英語教育ガイド, 5月 21, 2025にアクセス、 https://funfacts.tokyo/2023/12/27/%E3%83%91%E3%83%95%E3%82%A9%E3%83%BC%E3%83%9E%E3%83%B3%E3%82%B9%E8%A9%95%E4%BE%A1%E3%81%A8%E3%83%AB%E3%83%BC%E3%83%96%E3%83%AA%E3%83%83%E3%82%AF%E3%81%AE%E5%85%B7%E4%BD%93%E4%BE%8B%EF%BC%91%EF%BC%92/
- PISAが測ろうとしている「創造的思考力」 – 教育実践研究オフィスF, 5月 21, 2025にアクセス、 https://fn-officef.com/blog/202402/17158/
- PISA(OECD 生徒の学習到達度調査)とは? 日本の現状や課題について解説, 5月 21, 2025にアクセス、 https://www.skymenu.net/media/article/3254/
- www.cshe.nagoya-u.ac.jp, 5月 21, 2025にアクセス、 https://www.cshe.nagoya-u.ac.jp/publications/journal/no17/12.pdf
- パフォーマンス評価を活かした高大接続のための入試 – Kyoto University Research Information Repository, 5月 21, 2025にアクセス、 https://repository.kulib.kyoto-u.ac.jp/dspace/bitstream/2433/219551/1/R.H.E_022_055.pdf
- www.nier.go.jp, 5月 21, 2025にアクセス、 https://www.nier.go.jp/10zireishuu/02_shou_jirei.pdf
- 思考力・判断力・表現力を評価する問題作成手順 – 文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/1412881_4_1.pdf
- PISA2022の結果について – 文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/20240208-mxt_syoto01-000033870_4.pdf
- PISA2022 調査結果のポイント – 一般社団法人 全国PTA連絡協議会, 5月 21, 2025にアクセス、 https://zen-p.net/sg/g352.html
- Performance-Based Assessment: A Comprehensive Overview – EducaSciences, 5月 21, 2025にアクセス、 https://www.educasciences.org/assessment-strategies-performance-based-assessment
- 総合型選抜(旧AO入試)で求められるポートフォリオとは?基本構成と作り方のポイントと共に解説, 5月 21, 2025にアクセス、 https://nennai-nyushi-navi.jp/blogs/portfolio-of-integrated-selection
- eポートフォリオとは?教員が知るべきメリットと課題, 5月 21, 2025にアクセス、 https://kyoin.co.jp/knowledge/e-portfolio/
- パフォーマンス評価とは?メリットやデメリット、運用方法の具体 – kimete – 株式会社武蔵野, 5月 21, 2025にアクセス、 https://business.kimete.jp/column/performancehyouka/
- パフォーマンス評価とは?ISO9001・ISMSのパフォーマンス評価とデメリット – HRMOS, 5月 21, 2025にアクセス、 https://hrmos.co/trend/talent-management/8299/
- CBT試験の精度を高めるIRTとは?仕組みを解説 – イー・コミュニケーションズ, 5月 21, 2025にアクセス、 https://www.e-coms.co.jp/column/IRTandCBT
- 【学校向け】CBTとは?IBTとの違いを含めて特徴やメリットについて解説 | G-Apps.jp, 5月 21, 2025にアクセス、 https://g-apps.jp/ict-education/about-cbt-and-ibt/
- パフォーマンス評価とは?メリット・デメリットと導入の方法まとめ – イー・コミュニケーションズ, 5月 21, 2025にアクセス、 https://www.e-coms.co.jp/column/performance_evaluation_merit
- 全国学力・学習状況調査の結果 – 国立教育政策研究所, 5月 21, 2025にアクセス、 https://www.nier.go.jp/23chousakekkahoukoku/report/data/23summary.pdf
- dl.ndl.go.jp, 5月 21, 2025にアクセス、 https://dl.ndl.go.jp/view/download/digidepo_11389903_po_1073.pdf?contentNo=1
- 1月 1, 1970にアクセス、 https://www.naqa.edu.au/frameworks-resources/assessment-resources/types-of-assessment/portfolio-assessment/
- 1月 1, 1970にアクセス、 https://www.nfer.ac.uk/news-events/nfer-blogs/the-pros-and-cons-of-portfolio-assessment/
- 学習指導要領の改訂のポイントと学習評価(高等学校 総合的な探究の時間), 5月 21, 2025にアクセス、 https://www.nits.go.jp/materials/youryou/files/064_001.pdf
- 新しい学力観に基づく評価方法(記事まとめ) – 教育実践研究オフィスF, 5月 21, 2025にアクセス、 https://fn-officef.com/blog/202405/2668/
- CBTは利点多いが日本的試験文化との調和が課題―入試センターが報告 – Between情報サイト, 5月 21, 2025にアクセス、 https://between.shinken-ad.co.jp/detail/2021/03/cbt.html
- 大学入試センター『大規模入学者選抜におけるCBT活用 … – 文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/20210629-mxt_daigakuc02-000016365_9_1.pdf
- CBTとは?試験や検定、公教育への導入メリットとこれからの課題, 5月 21, 2025にアクセス、 https://www.sprix-cbt.com/column/001.html
- www.dnc.ac.jp, 5月 21, 2025にアクセス、 https://www.dnc.ac.jp/albums/abm.php?d=683&f=abm00001553.pdf&n=%E7%AC%AC%EF%BC%94%E7%AB%A0_IRT%E3%81%AB%E5%9F%BA%E3%81%A5%E3%81%8F%E5%85%B1%E9%80%9A%E3%83%86%E3%82%B9%E3%83%88%E3%81%AE%E5%AE%9F%E6%96%BD.pdf
- IRT(項目反応理論)とは?具体例を用いてわかりやすく解説! – オンライン試験マガジン, 5月 21, 2025にアクセス、 https://wisdombase.share-wis.com/blog/entry/irt
- 教えて!「高校の大学への期待とは?」 – リクルート進学総研, 5月 21, 2025にアクセス、 https://souken.shingakunet.com/secondary/2019/03/post-1e54.html
- SAT・ACTのスコア換算と選び方!試験の違いを徹底解説 – There is no Magic!!, 5月 21, 2025にアクセス、 https://www.path-to-success.net/sat-act-which-to-take
- Sat Superscoring: How It Works and How To Boost Your Score – Crimson Education TW, 5月 21, 2025にアクセス、 https://www.crimsoneducation.org/tw-en/blog/sat-superscoring/
- ACT Score Policies: Which Colleges Superscore & Which Don’t, 5月 21, 2025にアクセス、 https://www.princetonreview.sg/which-colleges-superscore-which-dont/
- 日本の共通試験と 大学入試センターの役割, 5月 21, 2025にアクセス、 https://chega.osaka-u.ac.jp/uploads/2020/04/4_%E8%AA%BF%E6%9F%BB%E3%83%BB%E7%A0%94%E7%A9%B6%E6%88%90%E6%9E%9C1_%E6%97%A5%E6%9C%AC_2-_%E4%B8%AD%E9%96%93%E5%A0%B1%E5%91%8A%E6%9B%B8.pdf
- 大学入学共通テストがめざすもの – J-Stage, 5月 21, 2025にアクセス、 https://www.jstage.jst.go.jp/article/jjphe/4/0/4_2020-031/_html/-char/ja
- 大学入試センター – Wikipedia, 5月 21, 2025にアクセス、 https://ja.wikipedia.org/wiki/%E5%A4%A7%E5%AD%A6%E5%85%A5%E8%A9%A6%E3%82%BB%E3%83%B3%E3%82%BF%E3%83%BC
- 独立行政法人大学入試センターに関する省令 – e-Gov 法令検索, 5月 21, 2025にアクセス、 https://laws.e-gov.go.jp/law/413M60000080029
- 大学入学者選抜関連基礎資料集 – 文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/content/20210629-mxt_daigakuc02-000016365_7_1.pdf
- 1月 1, 1970にアクセス、 https://www.dnc.ac.jp/about/organization/task.html
- 独立行政法人 大学入試センター, 5月 21, 2025にアクセス、 https://www.dnc.ac.jp/
- 1月 1, 1970にアクセス、 https://www.dnc.ac.jp/about/disclosure/info.html
- 諸外国で進む学校の第三者評価機関の設置とそこから得られる示唆, 5月 21, 2025にアクセス、 https://www.jri.co.jp/file/report/jrireview/pdf/11534.pdf
- www.mext.go.jp, 5月 21, 2025にアクセス、 https://www.mext.go.jp/b_menu/shingi/chukyo/chukyo3/043/siryo/__icsFiles/afieldfile/2009/07/16/1282089_2_1.pdf
- COMPASS – IEA.nl, 5月 21, 2025にアクセス、 https://www.iea.nl/sites/default/files/2021-09/Japanese_Compass_brief_10.pdf
- Educational Testing Service (ETS) | IES, 5月 21, 2025にアクセス、 https://ies.ed.gov/about/organization/educational-testing-service-ets
- Exam Security – AP Central – College Board, 5月 21, 2025にアクセス、 https://apcentral.collegeboard.org/exam-administration-ordering-scores/administering-exams/preparing-for-exam-day/exam-security
- Use of auctioning revenues generated under the EU Emissions Trading System, 5月 21, 2025にアクセス、 https://www.eea.europa.eu/en/analysis/indicators/use-of-auctioning-revenues-generated
- Oversight Responsibilities for a College Board of Directors – BoardEffect, 5月 21, 2025にアクセス、 https://www.boardeffect.com/blog/oversight-responsibilities-college-board-of-directors/
- An Investigation of ACT Equating Stability, 5月 21, 2025にアクセス、 https://www.act.org/content/dam/act/unsecured/documents/R1837-ACT-equating-stability-2020-11.pdf
- Why did everyone in the same room get a different ACT test? – Reddit, 5月 21, 2025にアクセス、 https://www.reddit.com/r/ACT/comments/1booxkq/why_did_everyone_in_the_same_room_get_a_different/
- ETSグループ 2024年9月期 決算報告 加藤社長インタビュー – note, 5月 21, 2025にアクセス、 https://note.com/etshd_pr/n/n376c0898cf73
- Reports | College Board: College Board Program Results, 5月 21, 2025にアクセス、 https://reports.collegeboard.org/
- 1月 1, 1970にアクセス、 https://www.ets.org/research/policy_research_reports/publications/report/2009/hptr.html
- Facts and figures – International Baccalaureate®, 5月 21, 2025にアクセス、 https://www.ibo.org/about-the-ib/facts-and-figures/
- About ETS | Mission, Leadership, and Global Impact, 5月 21, 2025にアクセス、 https://www.ets.org/about
- College Board: About Our Organization, 5月 21, 2025にアクセス、 https://about.collegeboard.org/
- 1月 1, 1970にアクセス、 https://www.ets.org/news/annual-report.html
- About ACT | ACT, 5月 21, 2025にアクセス、 https://www.act.org/content/act/en/about-act.html
- 1月 1, 1970にアクセス、 https://satsuite.collegeboard.org/sat/scores/how-sat-is-scored/equating
- 1月 1, 1970にアクセス、 https://www.act.org/content/act/en/research/about-act-scores/understanding-scores.html
- 1月 1, 1970にアクセス、 https://www.ets.org/research/policy_research_reports/fairness_review/overview.html
- Digital SAT Test Security and Fairness – SAT Suite, 5月 21, 2025にアクセス、 https://satsuite.collegeboard.org/sat/test-security-fairness
- 1月 1, 1970にアクセス、 https://www.act.org/content/act/en/research/viewpoints/act-center-for-equity-in-learning.html
- 1月 1, 1970にアクセス、 https://www.oecd.org/pisa/pisaproducts/PISA%202018%20Insights%20and%20Interpretations%20FINAL%20PDF.pdf
- PISA data and methodology | OECD, 5月 21, 2025にアクセス、 https://www.oecd.org/pisa/data/
- 1月 1, 1970にアクセス、 https://www.ets.org/pdfs/research/policy_research_reports/rr-01-24.pdf
- 1月 1, 1970にアクセス、 https://www.act.org/content/dam/act/unsecured/documents/2020/Equity-in-Assessment-Report.pdf
- 1月 1, 1970にアクセス、 https://www.oecd.org/pisa/PISA-2022-Results-Volume-I.pdf
- 1月 1, 1970にアクセス、 https://www.brookings.edu/articles/the-sat-and-act-are-changing-what-to-know/
- 1月 1, 1970にアクセス、 https://www.naep.gov/about-naep/mission-goals
- 1月 1, 1970にアクセス、 https://nces.ed.gov/nationsreportcard/about/inexperienced_reader.aspx
- Educational Testing Service – Wikipedia, 5月 21, 2025にアクセス、 https://en.wikipedia.org/wiki/Educational_Testing_Service
- Governance of Emissions Trading Systems – Open Knowledge Repository, 5月 21, 2025にアクセス、 https://openknowledge.worldbank.org/bitstream/handle/10986/37213/Governance-of-Emissions-Trading-Systems.pdf?sequence=1&isAllowed=y
- 【有報】半期報告書 第1期(2024/10/01~2025/09/30)|株式会社ETSグループ – note, 5月 21, 2025にアクセス、 https://note.com/etshd_pr/n/n5e6dae3dcdfe?magazine_key=m530d4bde968b
- 1月 1, 1970にアクセス、 https://www.ets.org/research/policy_research_reports/fairness_review.html
- How We’re Governed – About Us – College Board, 5月 21, 2025にアクセス、 https://about.collegeboard.org/governance
- 年次決算報告書とは – マネーフォワード クラウド, 5月 21, 2025にアクセス、 https://biz.moneyforward.com/words/2100/
- 1月 1, 1970にアクセス、 https://satsuite.collegeboard.org/sat/scores/sending-scores/score-choice
- 1月 1, 1970にアクセス、 https://satsuite.collegeboard.org/sat/scores/superscoring
- 【専門家監修】受験料だけじゃない!大学受験にかかる費用総額は約40万円!?, 5月 21, 2025にアクセス、 https://benesse.jp/juken/202210/20221027-3.html
- 【大学入試】受験料はいくら?国公立・私立大学別に入学後の費用なども紹介 – 塾選(ジュクセン), 5月 21, 2025にアクセス、 https://bestjuku.com/shingaku/s-article/4008/
- 受験や大学生活っていくらかかるの? | 大学入試の基礎知識 | 河合塾 Kei-Net, 5月 21, 2025にアクセス、 https://www.keinet.ne.jp/exam/basic/proceed/cost.html
- 大学受験費用はズバリいくらかかる?意外と知らないお金の話 – 河合塾マナビス, 5月 21, 2025にアクセス、 https://www.manavis.com/mana_magazine/university-entrance-exam-cost/
- PISAとは?日本の順位と最新動向をくわしく解説 – コエテコ, 5月 21, 2025にアクセス、 https://coeteco.jp/articles/10630
- 全国的な学力調査(全国学力・学習状況調査等):文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/a_menu/shotou/gakuryoku-chousa/index.htm
- ~ 2018 年調査国際結果の要約~ – 国立教育政策研究所, 5月 21, 2025にアクセス、 https://www.nier.go.jp/kokusai/pisa/pdf/2018/03_result.pdf
- PISA(OECD 生徒の学習到達度調査)における上位国・地域の教育制度に関する調査研究(成果報, 5月 21, 2025にアクセス、 https://www.mext.go.jp/component/a_menu/education/micro_detail/__icsFiles/afieldfile/2015/08/24/1361054_01.pdf
- OECD生徒の学習到達度調査(PISA):国立教育政策研究所 National …, 5月 21, 2025にアクセス、 https://www.nier.go.jp/kokusai/pisa/
- 1月 1, 1970にアクセス、 https://www.nier.go.jp/kokusai/pisa/pdf/pisa2022_result_summary.pdf
- 1月 1, 1970にアクセス、 https://www.nier.go.jp/kokusai/pisa/pdf/PISA2022_result_jpn.pdf
- 1月 1, 1970にアクセス、 https://www.oecd.org/pisa/PISA-2022-Results-Volume-II.pdf
- 国際学力調査(PISA、TIMSS):文部科学省, 5月 21, 2025にアクセス、 https://www.mext.go.jp/a_menu/shotou/gakuryoku-chousa/sonota/1344324.htm
- 1月 1, 1970にアクセス、 https://www.mext.go.jp/content/20231205-mxt_syoto01-000033222_1.pdf
- 1月 1, 1970にアクセス、 https://www.mext.go.jp/content/20231205-mxt_syoto01-000033222_16.pdf
- 1月 1, 1970にアクセス、 https://www.mext.go.jp/content/20231205-mxt_syoto01-000033222_20.pdf
- System Reform & Governance – International Higher Education, 5月 21, 2025にアクセス、 https://ihe.bc.edu/system-reform–governance
- China: Gaokao (College Entrance Exam) Current Reform and Future Development, 5月 21, 2025にアクセス、 https://ihe.bc.edu/pub/p5rf35le
参考となるベストプラクティス
1. 米国:SAT (Scholastic Assessment Test) / ACT (American College Testing)
- 概要: SATとACTは、米国の大学進学希望者の多くが受験する全国統一試験です 1。主に読解力、数学的思考力、科学的推論力(ACT)、文章表現力(オプションのエッセイ)などを測定します 3。近年は知識の活用や文脈理解を重視する傾向にあります。
- 複数回受験と結果利用: 受験者は複数回受験することが可能で、多くの大学では各科目の最高点を組み合わせる「スーパースコアリング」という制度を採用しています 3。これにより、受験生は自己ベストを達成する機会を最大限に活用できます。ただし、全てのスコア提出を求める大学や、単一の試験日の最高スコアのみを考慮する大学も存在します 4。
- 運営体制と公平性: SATは非営利団体のカレッジボードが、ACTは同じく非営利団体のACT, Inc.が運営しています 3。主な収入源は受験料です 3。テストの公平性を保つため、統計的な等化処理(equating)が行われ、異なる試験フォーム間のスコア比較を可能にしています 9。また、不正行為防止のためのセキュリティ対策も講じられています 11。
- 日本への示唆と課題:
- 示唆: 複数回受験とスーパースコアリングは、受験生の精神的負担を軽減し、能力発揮の機会を増やす点で参考になります。CBT(コンピュータベースドテスティング)への移行も進んでいます。
- 課題: 受験回数や対策講座へのアクセスが家庭の経済力に影響される可能性があり、教育格差を助長するとの指摘もあります 1。
2. OECD:PISA (Programme for International Student Assessment)
- 概要: PISAは、OECDが3年ごとに実施する15歳生徒を対象とした国際的な学習到達度調査です 12。読解力、数学的リテラシー、科学的リテラシーを、実生活の様々な場面で知識や技能を活用して課題を解決する能力(リテラシー)として測定します 12。思考力や問題解決能力を重視した設計が特徴です 18。
- 評価方法と運営: CBT形式で実施され、多様な課題形式が用いられます 13。OECDが全体を統括し、各参加国が国内の実施機関(日本では国立教育政策研究所)を通じて実施します 13。
- 日本への示唆:
- PISAの評価の枠組みや問題設計は、実社会の文脈で思考力や応用力を測るという点で、「ベンチマーク試験」が目指す方向性と共通しています。
- 国際的な評価基準との比較を通じて、自国の教育の強みや課題を把握し、教育政策に反映させるためのデータを提供します 20。
- ただし、PISAは個人の大学入試に直接利用されるものではなく、教育システム全体の評価を目的としています。
3. 国際バカロレア機構(IBO):IBディプロマプログラム最終試験
- 概要: 国際バカロレア(IB)ディプロマプログラムは、国際的に認められている大学入学資格プログラムです。最終試験では、6教科の筆記試験に加え、「知の理論(TOK)」、「課題論文(EE)」、「創造性・活動・奉仕(CAS)」といったコア科目が課され、探究力、批判的思考力、論文作成能力、主体性、国際的視野などを総合的に評価します 22。
- 実施と評価: 試験は年2回(5月、11月)実施され、再受験も可能です 22。評価は内部評価と外部評価を組み合わせて行われます。
- 運営体制と資金: スイスの非営利財団である国際バカロレア機構が運営し、認定校からの年会費、試験料、教材販売、研修事業収入などが主な財源です 22。
- 日本への示唆:
- 教科の枠を超えた総合的な能力評価や、主体的な学びの成果(CAS、EE)を重視する評価モデルは、「ベンチマーク試験」が目指す多面的評価の参考となります。
- 多くの国の大学でIBスコアが入学資格として認められており、国際的な通用性も高いです。
4. フィンランド:Matriculation Examination (Ylioppilastutkinto)
- 概要: 高校卒業資格と大学入学資格を兼ねる全国統一試験です。母語、第二公用語、外国語、数学、一般科目(理科・人文社会系)から科目を選択します。記述式の問題が多く、思考力を問う内容が中心です。近年、デジタル化(CBT)を推進しています。
- 複数回受験: 年2回実施され、複数回受験して良い方の成績を利用することが可能です。
- 運営体制: 教育文化省傘下のMatriculation Examination Boardが運営し、国費と受験料で賄われています。
- 日本への示唆:
- 高校教育の集大成としての位置づけや、思考力・表現力を重視する問題設計は参考になります。
- CBTへの段階的移行や複数回受験機会の提供も、「ベンチマーク試験」構想と共通する要素です。
5. 中国:高考 (Gaokao)
- 概要: 全国統一大学入学試験で、伝統的に知識偏重と批判されてきましたが、近年は総合能力評価や科目選択制(例:「3+3」モデル)を導入する改革が進行中です 23。一部地域では、高校の学業成績や総合的素質評価も参考にされる動きがあります 23。
- 実施: 原則年1回で、複数回受験は一般的ではありませんが、一部の改革で模索されています 23。
- 運営体制: 教育部が統括し、各省が実施。国費で運営されています 23。
- 日本への示唆と課題:
- 超大規模な一斉試験の運営ノウハウは参考になる可能性があります。
- 近年の改革動向(科目選択制、総合評価導入の試み)は、画一性から多様性への移行の難しさや、公平性確保への強い社会的要請を示唆しています 23。
これらの事例は、国や地域によって歴史的背景や教育制度が異なるため、そのまま日本に導入できるわけではありません。しかし、多面的な能力評価、複数回受験による機会の提供、思考力や主体性の重視といった「ベンチマーク試験」の構想と共通する要素が多く見られ、制度設計や課題解決において有益な示唆を与えてくれます。特に、評価の公平性、CBT導入の課題、受験生の負担軽減策などは、これらの国々でも議論され、様々な工夫が凝らされている点であり、日本での検討においても重要な論点となります。
コメント