教育パラダイムの進化は教育変革を推進している。効果的な学習の基本的側面は、学生に関連性のある、即座で建設的なフィードバックを提供することである。大規模な学生集団に建設的フィードバックを提供することは、学術界が直面する継続的な課題である。したがって、研究者は即座のフィードバックを提供するために自動評価へと転じている。しかし、現在の方法はしばしば範囲が限定的であり、提供される単純な応答は学生の改善を指導するための個人化されたフィードバックを提供することができない。本論文は、大規模言語モデル(LLM)が事前定義された評価基準を用いて学生評価を処理し、個人化されたフィードバックを生成する際のパフォーマンスを調査することで、この制限に対処している。著者は、既存のLLMの力を活用して評価スコアリング、追跡、評価(LLM-MATE)を行い、個人化されたフィードバックを通じて学生の学習を強化することを目指している。
本研究は以下の問題に主に対処している:
大規模言語モデルの強力なテキスト理解と生成能力を、事前定義された評価基準と組み合わせることで、コンピュータサイエンス学生のマルチモーダル評価(テキスト、画像、プログラミング)に対して、個人化され建設的なフィードバックを提供する。
入力: 学生提出の評価課題(テキスト記述、ソフトウェアアーキテクチャ図など) + 評価基準と採点細則 出力: 構造化された個人化フィードバック、以下を含む:
制約条件:
ゼロショット学習戦略:
システムプロンプト + 評価の紹介 + 評価基準 + 学生の回答 + 出力形式要件
プロンプト構造設計:
発見: ChatGPTは個人化された建設的フィードバック生成において良好なパフォーマンスを示した
比較分析:
教員検証結果:
典型的なAIフィードバックの特性:
| 側面 | 既存研究 | 本論文の貢献 |
|---|---|---|
| 評価タイプ | 主に形成的評価に焦点 | 総括的評価に焦点 |
| フィードバック詳細度 | 単純な採点または分類 | 詳細な構造化フィードバック |
| マルチモーダル処理 | ほとんどテキストのみ | テキストと画像を同時処理 |
| 検証方法 | 学生満足度調査 | 専門家信頼度評価 |
本論文は38篇の関連文献を引用しており、主に以下を含む:
核心的参考文献:
技術支援文献:
総合評価: これは実用的応用価値を持つ研究論文である。技術革新と実験規模の面で一定の限界があるものの、教育技術分野にとって価値のある探索と実践経験を提供している。研究方法は合理的であり、結果は信頼性があり、教育評価におけるAI応用の推進に積極的な意義を持つ。