Artificial Intelligence and especially Large Language Models (LLM), such as ChatGPT has revolutionized the way educators work. The results we get from LLMs depend on how we ask them to help us. The process and the technique behind an effective input is called prompt engineering. The aim of this study is to investigate whether science educators in secondary education improve their attitude toward ChatGPT as a learning assistant after appropriate training in prompt engineering. The results of the pilot study presented in this paper show an improvement in the previously mentioned teachers perceptions.
- 논문ID: 2510.08634
- 제목: Exploring Teachers' Perceptions of ChatGPT Through Prompt Engineering
- 저자: Dimitrios Gousopoulos (Panteion University)
- 분류: physics.ed-ph cs.CY
- 발표 시간/학회: 구체적 학회 미표기
- 논문 링크: https://arxiv.org/abs/2510.08634
인공지능, 특히 ChatGPT와 같은 대규모 언어모델(LLM)은 교육자의 업무 방식을 근본적으로 변화시켰다. LLM으로부터 얻는 결과는 우리가 어떻게 도움을 요청하는지에 따라 결정된다. 효과적인 입력 뒤에 숨겨진 과정과 기술을 프롬프트 엔지니어링이라고 한다. 본 연구는 중등교육의 과학 교육자들이 적절한 프롬프트 엔지니어링 교육을 받은 후 학습 보조 도구로서의 ChatGPT에 대한 태도가 개선되는지를 조사하는 것을 목표로 한다. 본 논문에서 제시된 파일럿 연구 결과는 상기 교사들의 인식이 개선되었음을 보여준다.
본 연구가 해결하고자 하는 핵심 문제는 다음과 같다: 중등교육 과학 교사들의 교육 보조 도구로서의 ChatGPT에 대한 태도는 어떠한가, 그리고 프롬프트 엔지니어링 교육이 이러한 태도를 개선할 수 있는가?
- 기술 변혁의 배경: 2017년 Transformer 메커니즘 도입 이후 대규모 언어모델의 교육 분야 적용 가능성이 매우 크다
- 교육 실천의 필요성: ChatGPT는 개인화된 학습, 문제 해결 능력 향상, 물리 개념 이해를 지원할 수 있다
- 인간-기계 협력의 추세: 최적의 AI 강화 학습 환경은 효과적인 인간-기계 협력을 필요로 하며, 교사의 역할은 정보 전달자에서 안내자 및 촉진자로 변화한다
- 기술 사용의 장애물: 교사들의 AI 도구에 대한 인식과 사용 기술에 격차가 존재한다
- 품질 관리 문제: LLM은 복잡한 내용 처리 시 한계가 있으며, 정확성 보장을 위해 인간의 개입이 필요하다
- 교육 훈련의 부재: 교사를 대상으로 한 체계적인 프롬프트 엔지니어링 교육 연구가 부족하다
프롬프트 엔지니어링 교육을 통해 교사들의 ChatGPT에 대한 인식과 사용 능력을 향상시킴으로써, 과학 교육에서 AI의 잠재력을 더욱 효과적으로 발휘하고자 한다.
- 이론적 기여: 프롬프트 엔지니어링 교육이 교사의 AI 태도 개선에 효과적임을 검증했다
- 방법론적 기여: GPEI 방법론(Goal Prompt Evaluation Iteration) 및 다양한 프롬프트 기법의 교육 프레임워크를 제시했다
- 실증적 기여: 중등교육 과학 교사의 ChatGPT에 대한 태도 변화에 대한 정량적 증거를 제공했다
- 실무적 기여: 교사 전문성 개발을 위한 구체적인 AI 도구 교육 방안을 제시했다
입력: 중등교육 과학 교사의 초기 AI 태도
처리: 3주간의 프롬프트 엔지니어링 교육(이론 + 실습)
출력: 교육 후 ChatGPT를 교육 보조 도구로서 인식하는 교사의 태도 변화
제약 조건: 편의 표본 추출을 기반으로 한 소규모 연구(14명의 교사)
- 표본 규모: 14명의 자연과학 교사
- 출처: 공립 및 사립 중고등학교 각각 절반
- 표본 추출 방법: 편의 표본 추출
- 설문지 기초: Nazaretsky 등(2022)의 연구를 기반으로 번역 및 그리스어 환경에 맞게 조정
- 구조: 14개의 5점 리커트 척도 문항
- 차원:
- (a) 교육 환경에서 AI의 이점에 대한 인식
- (b) AI와의 협력을 통한 교수 과정 개선
이론 교육:
- GPEI 방법론(Goal Prompt Evaluation Iteration)
- 프롬프트 엔지니어링 기초 이론
실습 교육:
- The Persona Pattern(페르소나 패턴)
- The Interview Pattern(인터뷰 패턴)
- Chain-of-Thought(사고의 연쇄)
교육 기간: 3주, 주 2회, 회당 2시간
- 체계적 교육 프레임워크: GPEI 방법론을 교사 AI 교육에 처음으로 적용했다
- 다중 모드 프롬프트 기법: 다양한 프롬프트 모드를 통합하여 포괄적인 기술 교육을 제공했다
- 교육 상황화: 프롬프트 엔지니어링 기법을 과학 교육 실무와 결합했다
- 태도 측정: 전후 비교 설계를 채택하여 교육 효과를 정량화했다
- 사전 검사: 교육 전 태도 설문지 완성
- 중재: 3주간의 프롬프트 엔지니어링 교육
- 사후 검사: 교육 후 동일한 설문지 완성
- 주요 지표: 설문지 평균 점수의 중앙값 변화
- 통계 방법: Wilcoxon 부호 순위 검정(비모수 검정)
- 보충 분석: Bootstrap 방법(10,000회 재표본)
전후 비교 설계를 채택하여 참여자가 자신의 대조군 역할을 한다
- 통계 소프트웨어: R 언어
- 유의 수준: p < 0.001
- 신뢰 구간: 95% 신뢰 구간(Bootstrap 방법)
- Wilcoxon 검정 결과: Z = -3.296, p < .001
- 결론: 교육 전후 교사의 태도에 통계적으로 유의한 차이가 존재한다
- 방향성: 교육 후의 중앙값이 교육 전보다 유의하게 높다
- 재표본 횟수: 10,000회
- 95% 신뢰 구간: 0.682, 0.909
- 해석: 신뢰 구간이 0을 포함하지 않으므로 통계적 유의성이 확인된다
- 태도 개선이 명확함: 모든 참여 교사가 교육 후 더욱 긍정적인 태도를 보였다
- 효과의 안정성: Bootstrap 분석이 결과의 견고성을 확인했다
- 실무적 의의: 교사들이 LLM의 능력에 대해 더 큰 신뢰감을 보이고 AI 교육 보조 도구에 대한 인정도가 높아졌다
교육을 통해 교사들은 다음을 수행할 수 있게 되었다:
- Persona Pattern을 사용하여 개인화된 학습 시나리오 설계
- 탐구 기반 물리 활동 개발
- 학생의 학습 어려움 파악
- 학급 수준과 필요에 맞는 평가 문제 생성
- 차별화된 교수 및 포용적 학습 지원
- 개인화된 학습: Mahligawati 등(2023), Yeadon & Hardy(2024)는 ChatGPT가 문제 해결 능력 향상에 미치는 영향을 강조했다
- 상호작용 학습: Zhu 등(2023)이 제시한 4가지 학습 상호작용 유형 프레임워크
- 교수 설계: Mustofa 등(2024)의 AI 보조 교수 설계에 관한 연구
- 긍정적 태도: Beege 등(2024)은 과학 교사들이 ChatGPT에 대해 긍정적인 태도를 가지고 있음을 발견했다
- 교육 필요성: 기존 연구는 체계적인 교사 AI 교육 방안이 부족하다
- 이론적 기초: Schmidt 등(2023)의 프롬프트 엔지니어링 카탈로그
- 교육 적용: Leung(2024)의 교육에서의 프롬프트 엔지니어링 적용 연구
- 가설 검증: 연구 가설이 지지되었으며, 프롬프트 엔지니어링 교육이 실제로 교사의 ChatGPT에 대한 태도를 개선했다
- 실무적 가치: 교육 후 교사들의 AI 도구에 대한 신뢰도와 인정도가 유의하게 향상되었다
- 적용 가능성: 교사들이 프롬프트 엔지니어링 기법을 실제 교수 실무에 적용할 수 있게 되었다
- 표본 규모: 14명의 참여자만 포함되어 결과의 일반화 가능성이 제한된다
- 측정 도구: 그리스어 환경에서의 설문지의 타당도와 신뢰도가 검증되지 않았다
- 교육 기간: 3주의 교육 기간이 상대적으로 짧다
- 연구 설계: 대조군 비교가 부재한다
- 장기 효과: 교육 효과의 지속성이 평가되지 않았다
- 표본 확대: 더 큰 규모의 연구를 수행하여 결과를 검증한다
- 질적 연구: 질적 방법을 채택하여 태도 변화의 영향 요인을 심층적으로 탐색한다
- 도구 검증: 그리스어 환경에서 측정 도구의 심리측정학적 특성을 검증한다
- 장기 추적: 교육 효과의 지속성과 실제 적용 상황을 평가한다
- 대조 실험: 대조군 연구를 설계하여 인과 추론을 강화한다
- 혁신성: 프롬프트 엔지니어링 교육이 교사의 AI 태도에 미치는 영향을 처음으로 체계적으로 연구했다
- 실용성: 구체적이고 실행 가능한 교육 방안과 기법을 제공했다
- 엄밀성: 비모수 검정 및 Bootstrap 분석을 포함한 적절한 통계 방법을 사용했다
- 관련성: 현재 AI 교육 적용의 핵심 문제를 다루고 있다
- 전망성: 교사 전문성 개발을 위한 새로운 방향을 제시했다
- 표본 대표성: 편의 표본 추출과 소규모 표본이 결과의 외적 타당도를 제한한다
- 연구 설계: 대조군이 부재하여 다른 혼동 변수를 배제하기 어렵다
- 측정의 깊이: 태도 설문지만 사용하여 행동 수준의 측정이 부족하다
- 문화적 적응성: 설문지 번역 및 문화적 적응성 검증이 불충분하다
- 메커니즘 해석: 태도 변화 메커니즘에 대한 심층 분석이 부족하다
- 학술적 기여: AI 교육 적용 연구에 새로운 관점과 증거를 제공했다
- 실무 지도: 교육 기관이 AI 교육을 수행할 때 참고할 수 있는 프레임워크를 제공했다
- 정책 시사점: 교사 전문성 개발에 AI 기술 교육을 포함할 것을 지지한다
- 후속 연구: 관련 분야의 추가 연구를 위한 기초를 마련했다
- 교사 교육 기관: 유사한 프레임워크를 사용하여 AI 도구 교육을 수행할 수 있다
- 학교 관리: AI 교육 정책 수립 시 참고할 수 있다
- 연구 기관: 더 큰 규모의 관련 연구를 수행하기 위한 기초를 제공한다
- 기술 개발: 교사 친화적인 AI 도구 개발을 위한 사용자 요구 통찰력을 제공한다
본 연구는 풍부한 관련 문헌을 인용하고 있으며, 주요 내용은 다음과 같다:
- AI 교육 적용: Kasneci 등(2023)의 ChatGPT 교육 기회 및 도전에 관한 종합 분석
- 프롬프트 엔지니어링: Schmidt 등(2023)의 프롬프트 패턴 카탈로그 연구
- 교사 태도 측정: Nazaretsky 등(2022)의 AI 교육 기술 신뢰도 측정 도구
- 물리 교육 AI 적용: Mahligawati 등(2023), Yeadon & Hardy(2024) 등의 관련 연구
본 연구는 과학 교육에서 AI 적용에 대한 중요한 실증적 지지를 제공하며, 일정한 한계가 있음에도 불구하고 향후 관련 연구와 실무를 위한 견고한 기초를 마련했다.