View : 46 Download: 0

중학교 과학 실험 수행에 대한 평가도구 개발

Title
중학교 과학 실험 수행에 대한 평가도구 개발
Authors
박연주
Issue Date
2000
Department/Major
대학원 과학교육학과
Publisher
이화여자대학교 대학원
Degree
Master
Abstract
본 연구의 목적은 중학교 과학 실험 수행 과정에서 학생들을 평가하기 위한 타당하고 신뢰로운 평가도구를 개발하는 것이다. 이를 위하여 실험 수행에 대한 일반적인 평가기준을 개발하였으며, 이를 바탕으로 중학교 과학 2의 네 개의 실험주제에 대한 구체적인 채점기준을 개발하였다. 본 연구에서는 다음의 6단계를 거쳐 실험 수행에 대한 평가도구를 개발하였다. 제 1단계에서는 I·O·E 탐구실험 모형을 개발하였다. I·O·E 는 도입(introduction)-관찰(observation)-설명(explanation)의 3단계를 거치는 탐구실험모형이다. 제 2단계에서는 실험의 수행에서 평가할 탐구과정 요소와 실험기능, 실험태도에 대한 일반적인 평가기준을 개발하였고 개발한 일반적인 평가기준의 타당도를 점검하였다. 타당도를 검증한 결과는 5점 만점에 대한 %로 나타내었다. 탐구과정 요소에 대한 일반적인 평가기준의 내용 타당도는 84%-98%로 나타났고, 실험기능에 대한 일반적인 평가기준의 내용 타당도는 88%, 실험 태도에 대한 일반적인 평가기준의 내용 타당도는 100%로 나타났다. 제 3단계에서는 중학교 과학 2에서 네 개의 실험 주제를 선정하여 탐구실험 프로그램을 개발하였다. 탐구실험 프로그램은 학생용 탐구 실험서와 교사용 실험지도서 두 가지로 구성하였으며, 선정된 실험 주제는 불꽃반응, 공기의 부피와 온도,대기의 조성, 복평형 네 가지이다. 네 개의 실험의 내용 타당도는 80%-93%로나타났다. 제 5단계에서는 개발한 각 탐구실험 프로그램에서 탐구과정 요소, 실험기능, 실함태도를 평가할 수 있는 구체적인 채점기준을 개발하였다. 탐구과정 요소에 대한구체적인 채점기준의 내용 타당도는 82%∼95%로 나타났으며, 채점자간 신뢰도는.71∼1.00으로 나타났다. 실험기능에 대한 구체적인 채점기준의 내용 타당도는80%∼100%로 나타났고, 실험태도에 대한 구체적인 채점기준의 내용 타당도는100%로 나타났다. 제 6단계에서는 본 연구자를 포합한 11명의 연구진이 중학교 과학 1, 2, 3 내용 중에서 개발한 44개의 탐구실험에 대한 구체적인 채점기준의 채점차간 신뢰도를 종합해 보았다. 개발한 채점기준은 관찰하기 47항목, 시공간관계사용하기 4항목, 분류하기 3항목, 수사용하기 16항목, 측정하기 18항목, 의사전달하기 18항목,예측하기 14항목, 추론하기 87항목, 변인통제하기 3항목, 자료해석하기 70항목,결론도출 및 일반화 13항목으로 총 293항목이다. 이들의 채점자간 신뢰도를 탐구과정 요소별로 분석한 결과 시공간관계사용하기, 분류하기, 수사용하기, 측정하기에 대한 구체적인 채점기준의 채점차간 신뢰도는 모두 .72 이상으로 나타났다. 의사전달하기는 18개 항목 중에서 1개 항목, 예측하기는 14개 항목 중에서 2개 항목, 추론하기는 81개 항목 중에서 2개 항목, 변인통제하기는 3개 항목 중에서 2개 항목, 결론도출 및 일반화는 13개 항목 중에서 3개 항목을 제외하고는 채점차간 신뢰도가 모두 .70이상으로 나타났다. 즉 개발한 293개의 항목 중에서 280개항목의 채점자간 신뢰도는 .70 이상으로 나타났다. 이러한 결과로부터 각 탐구과정 요소에 대한 구체적인 채점기준을 개발할 때기준이 되었던 탐구과정 요소에 대한 일반적인 평가기준이 신뢰로운 평가도구라고 할 수 있다. 위와 같은 결과로 볼 때 본 연구에서 개발한 실험 수햄에 대한 평가도구는 타당도와 신뢰도가 높으며, 학교 현장에서 효율적으로 활용될 수 있을 것으로 기대된다. ; The purpose this study is to develop a valid and reliable Evaluation Tools that can assess students performance in middle school science laboratory. Evaluation Tools for Performance Assessment was consisted of general rubric and specific rubric. This study is divided into 6 steps. Step 1, an inquiry model was developed. The model developed in this study is composed of 3 stages: Introduction-Observation-Explanation Step 2, General Rubric for the performance of experiment was developed. And the validity of general rubric for the performance of experiment was investigated. In the analysis of result, it ranged from 84% to 98% that the content validity of general rubric for inquiry process skill and 88% that the content validity of general rubric for manipulable skill and 100% that the content validity of general rubric for experimental attitude. Step 3, 4 practical laboratory tasks were selected and developed to inquiry-oriented experiments. These 4 practical laboratory tasks as follows: flame test, relationship between temperature and volume of gas, composition of atmosphere, equilibrium of radiation. The content validity of inquiry-oriented experiment ranged from 80% to 93%. Step 5, specific rubric for performance of experiment was developed based on general rubric. The validity of specific rubric was investigated. In the analysis of result, and it ranged from 82% to 95% that the content validity of specific rubric for the process skil, and from 80% to 100% that the content validity of specific rubric for manuplitive skill, and 100% that the content validity of specific rubric for attitude. Inter-rater reliability of specific rubric for process skill was investigated. In the analysis of result, it ranged from .71 to 1.00. Step 6, Developed specific rubric for process skill involved 293 items. Specific rubric for Observing involved 47 items, Using Space/Time relationship involved 4 items, Classifying involved 2 items, Using Numbers involved 16 items, Measuring involved 18 items, Communicating involved 18 items, Predicting involved 14 items, inferring involved 87 items, Controlling Variables involved 3 items, Drawing Conclusion involved 13 items, and Interpreting Data involved 70 items. Inter-rater reliability of specific rubric for the reports was investigated . In analysis of the result, it ranged from .71 to 1.00 that the inter-rater reliability of specific rubric for Using Space/Time relationship, Classifying, Using Numbers, Measuring. Except 1 item in Communicating, 2 Items in Predicting, 2 items in inferring, 2 items in Controlling Variables, and 3 items in Drawing Conclusion, inter-rater reliability of specific rubric ranged from .70 to 1.00. In inter-rater reliability of 293 items, inter-rater reliability of 280 item ranged from .70 to 1.00 These suggest that developed Evaluation Tools for Performance Assessment satisfied the reliability and validity requirements for general assessment instrument for students performance in the middle school science.
Fulltext
Show the fulltext
Appears in Collections:
일반대학원 > 과학교육학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
Export
RIS (EndNote)
XLS (Excel)
XML


qrcode

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

BROWSE