서술형 수행평가 문항과 평가기준 개발에 관한 연구
A Study on the Development of Tasks and Assessment Rubrics of Descriptive Performance Assessment for The 5th Graders of Elementary School Mathematics
이화여자대학교 대학원 초등교육학과
Recently problem solving ability has been considered as an important skill, and constructivism appeared as the new theory of knowledge. And these kinds of social changes have been led to educational changes. Especially in mathematics education, after the modernization movement of mathematics education, mathematics educational goals have been set to the extension for mathematical power including mathematical thinking ability and problem solving ability, etc. Also, there has been a call for changing teaching-learning methods and assessment methods to achieve the new mathematics educational goals. Following the changes of assessment methods inside and outside the countries, performance assessment were introduced and popularized since 1997 in Korea. Moreover, Seoul Metropolitan Office of Education announced in June, 2005, that every level of schools should include descriptive performance assessment in its examinations. The purpose of this study was to design and develop tasks and assessment rubrics of descriptive performance assessment for the 5th graders of elementary school mathematics. According to this purpose, the research questions were as follows. 1. What are the tasks of descriptive performance assessment for the 5th graders of elementary school mathematics? 1-1. How are the tasks of descriptive performance assessment developed? 1-2. What are the tasks of descriptive performance assessment for the 5th graders of elementary school mathematics like? 2. What are the assessment rubrics of descriptive performance assessment for the 5th graders of elementary school mathematics? 2-1. How are the assessment rubircs of descriptive performance assessment developed? 2-2. What are the assessment rubrics of descriptive performance assessment for the 5th graders of elementary school mathematics like? 3. How are the results of application of the tasks and the assessment rubrics of descriptive performance assessment developed in this study? The research processes were as follows. First, through literature reviews, the researcher analyzed the organizational characteristics of national mathematics curriculums and textbooks across the countries to identify the characteristics of tasks for this study. Also, performance assessment scoring rubrics were reviewed and analyzed to extract common criteria which have been considered as important factors in national mathematics curriculums. Initially, 14 tasks and the criteria of assessment rubrics for a pilot test were created. Second, educational specialists verified content validity, and the pilot test was performed to select the final tasks and verify the levels of tasks and assessment rubrics. Third, a coefficient of Cronbach α to analyze internal consistency reliability and Pearson's product moment correlation to analyze inter-rater reliability were conducted using SPSS 12.0 for window program. Fourth, the tasks of descriptive performance assesment developed in this study were applied to 227 5th graders' studnets of 7 classes in public elementary schools in Seoul. Fifth, 3 educational specialists evaluated the response data of 200 students except for 27 students who did not respond, and rated 0-4 points for their performance samples based on the assessment rubrics developed in this study. The study results were revealed as follows. First, 7 tasks were finally developed, and the coefficients of Cronbach's α for each educational specialist were .8517, .8170, .8850, which indicated that they are reliable. Second, 'problem understanding', 'problem solving process', 'communication' were selected as the criteria for assessment rubrics. And inter-rater reliability for problem understanding was .513 ~ .911, for problem solving process .524 ~ .843 and for communication .481 ~ .777, which are reliable. Third, the ability of mathematical power covering problem understanding ability, problem solving ability and mathematical communication ability was low. Specifically, problem understanding ability was the highest, problem solving ability was middle, and mathematical communication ability was the lowest. The conclusions derived from this research were follows. The reason why the ability of mathematical power were low was due to the fact that most students in Korea were accustomed to traditional evaluation methods such as a multiple-choice test, etc. Therefore, various performance assessment methods should be developed to evaluate the factors emphasized in mathematics national curriculum such as mathematical communication, problem solving, etc. The assessment results should be reflected in improving teaching-leaning processes and students' mathematical abilities. It eventually should be able to help children to raise their mathematical power. Finally, it is hoped that the tasks and assessment rubrics developed in this study will become a model of the tasks and assessment rubrics of descriptive performance assessment. Theoretical implications regarding these findings of this study are as follows; studying about making data bank of the tasks and the assessment rubrics of descriptive performance assessment, teaching-learning methods to promote mathematical power, and the specific assessment methods that can draw a clear line between linguistic expression ability and mathematical communication ability. Also, teacher should endeavor to develop tasks and assessment rubrics of descriptive performance assessment based on this study and help the descriptive performance assessment to be popularized for all the subjects.; 현대사회에서는 문제해결능력을 중시하는 새로운 인간상에 대한 요구와 함께 구성주의라는 새로운 인식론이 등장하는 등 사회적인 변화가 일어났고, 이는 교육계 내에서의 변화로 이어졌다. 특히 수학교육에서는 수학교육 현대화 운동 이후 단편적인 수학적 지식과 단순하고 반복적인 문제 풀이의 기능 숙달에서 탈피하여 수학적 사고력과 문제해결능력을 포함하는 수학적 힘의 신장을 수학교육의 목표로 정하고, 이를 달성하기 위하여 교수·학습 방법뿐만 아니라 평가 방법의 변화도 뒤따라야 함을 주장하고 있다. 우리나라에서는 1997년부터 수행평가가 도입 및 확산되기 시작되었고, 2005년 6월 서울시 교육청이 2005학년도 2학기부터 서술형 수행평가 문제를 출제하도록 요구함에 따라, 서술형 수행평가 문항 및 평가준거 개발의 중요성이 점차 높아질 것으로 전망된다. 이에 본 연구에서는 서술형 수행평가 문항 및 평가기준 개발 절차를 개발하고 그것에 기초하여 5-가 단계의 내용에 따라 실제적으로 개발해 봄으로써, 그것이 올바르게 정착할 수 있는 기틀을 마련하고자 한다. 이러한 연구목적에 따른 구체적인 연구문제는 다음과 같다. 1. 본 연구에서 개발된 초등학교 5-가 수학교과의 서술형 수행평가 문항은 어떠한가? 1-1. 어떠한 절차에 따라 서술형 수행평가 문항이 개발되었는가? 1-2. 본 연구에서 개발된 초등학교 5-가 수학교과의 서술형 수행평가 문항은 어떻게 구성되었는가? 2. 본 연구에서 개발된 초등학교 5-가 수학교과의 서술형 수행평가 평가기준은 어떠한가? 2-1. 어떠한 절차에 따라 서술형 수행평가 평가기준이 개발되었는가? 2-2. 본 연구에서 개발된 초등학교 5-가 수학교과의 서술형 수행평가 평가기준은 어떻게 구성되었는가? 3. 개발된 초등학교 5-가 수학교과의 서술형 수행평가 문항 및 평가기준을 초등학교 교실현장에 적용한 결과는 어떠한가? 이상의 연구문제에 따른 연구결과는 다음과 같다. 첫째, 서술형 수행평가 문항은 국내․외 수학교육과정의 분석에 기초하여 ① 수학적 개념과 그것을 활용하는 방법을 나타낸 산출물을 통하여 문제해결 과정을 평가할 수 있고, ② 문제해결 과정과 사고과정을 수학적으로 표현할 수 있으며, ③ 하나의 해답을 가지지만 다양한 방법과 전략으로 문제를 해결할 수 있고, ④ 실생활에 기초한 문제 상황을 수학적으로 해석하고 해결하는 것을 평가할 수 있는 문항을 개발하였다. 이러한 절차에 따라 최종적으로 개발된 문항은 5-가 단계의 1단원부터 7단원까지 각 단원별로 활용할 수 있도록 총 7개의 서술형 수행평가 문항이 개발되었다. 각 문항은 각 단원에서 학습한 수학적 개념을 다양한 문제해결전략과 결합하여 해결할 수 있도록 하였으며, 문제해결과정을 수학적으로 표현할 수 있도록 하였다. 본 연구에서 개발한 서술형 수행평가 문항의 각 채점자별 문항내적 일관성 신뢰도인 Cronbach's a 계수는 .8517, .8170, .8850로 나타났고, 이는 문항의 신뢰도가 높음을 의미한다. 둘째, 서술형 수행평가 문항을 평가할 수 있는 평가기준을 개발하였다. 평가기준은 문제이해, 문제해결과정, 의사소통의 세 가지 영역으로 평가준거를 구성하였으며, 각 영역을 수준 1~5로 범주화하여 수준 1은 0점, 수준 5는 4점을 부과하는 것으로 점수화하였다. 그리고 각 평가준거 영역별로 구체적인 척도별 특징과 예시답안을 제시하였다. 채점자간 신뢰도인 Pearson 단순적률 상관계수는 각 채점준거 영역별로 문제이해 영역은 .513~.911, 문제해결과정 영역은 .524~.843, 의사소통 영역은 .481~.777로 높게 나타났다. 셋째, 각 평가준거별· 문항별 평균을 비교해 보면 문제이해능력, 문제해결과정, 의사소통 능력을 포함한 수학적 힘의 능력이 대체적으로 낮게 나타났다. 또한 연구결과를 평가준거별로 보다 구체화하여 보면, 문제이해, 문제해결과정, 의사소통 영역의 순으로 평균 점수가 낮아짐을 알 수 있다. 이러한 연구결과를 종합하여 본 연구에서 얻은 결론은 다음과 같다. 첫째, 채점자간 신뢰도는 각 채점준거 영역별로 문제이해 영역은 .513~.911, 문제해결과정 영역은 .524~.843, 의사소통 영역은 .481~.777로 높게 나타났다. 이는 평가에 앞서 전문가 집단을 대상으로 채점자 훈련을 거침으로써 채점자들로 하여금 평가기준을 내면화하고 일관되게 적용하게 하는데 도움이 된 것으로 분석된다. 그리고 세 가지 영역에서 채점자간 신뢰도를 비교해 보면 의사소통 영역의 것이 가장 낮음을 알 수 있는데, 이는 의사소통 영역이 평가하고자 하는 내용상의 특징 때문인 것으로 추측된다. 의사소통 영역은 풀이과정에 드러난 수학적 내용과 아이디어, 기호 등의 표현이 정확하거나 세련된 정도, 문제해결과정에 대한 설명이 충분한가에 대한 것을 평가하는 준거로, 채점자 훈련을 거쳤다하더라도 각 채점자별로 표현의 정확성이나 설명의 충분성에 대해 생각하는 정도의 차이가 다르기 때문에 채점자간 신뢰도에 영향을 미쳤을 것이다. 둘째, 연구결과를 평가준거별로 보다 구체화하였을 때, 문제이해, 문제해결과정, 의사소통 영역의 순으로 평균 점수가 낮아졌다. 이제까지 우리나라 초등학교 학생들이 객관식 문제나 단답식 문제들을 많이 접함으로써 하나의 정답만을 고르는데 익숙해져 있고 외국의 수학과 교육과정과 수행평가에서 중시되고 있는 수학적 의사소통 능력이 우리나라에서는 중요한 요소로서 다루어지지 않아, 실제 수학과 교수ㆍ학습 과정에서 수학적 의사소통에 대한 교육이 이루어지지 못하기 때문인 것으로 추측된다. 따라서 현재 수학교육의 실제를 담당하는 현장교사들도 국내 · 외적으로 수학교육의 목표로 중시되고 있는 것이 무엇인지 알아야 하며, 그것이 실제 교수 · 학습 과정과 평가에 반영될 수 있도록 노력해야 할 것이다. 그러나 본 연구의 평가기준을 개발할 때에는 서술형 수행평가의 평가기준이 아니라 일반적인 수행평가의 평가준거들을 참고하였다는 한계점이 있다. 이는 아직까지 서술형 수행평가 방법에 대한 구체적인 연구들이 진행되지 못하였기 때문이다. 이와 같은 연구를 바탕으로 다음과 같이 후속연구를 제안하고자 한다. 첫째, 아무리 평가기준이 명료하고 채점자 훈련을 실시하여도 수행평가의 특성상 채점자의 주관성이 개입될 수밖에 없기 때문에, 이를 보완하여 채점의 신뢰도를 확보할 수 있는 구체적인 방안들이 강구되어야 할 것이다. 둘째, 학교 현장에서 서술형 수행평가 문항의 출제가 본격화되고 있는 시점에서, 보다 다양한 내용과 수준을 고려하고 문제이해능력, 문제해결과정, 의사소통 능력을 포괄하는 수학적 힘을 평가해낼 수 있는 서술형 수행평가 문항의 개발이 이루어져야 할 것이다. 그리고 이러한 노력이 개인적인 노력에 그치지 않고 정착할 수 있도록 돕기 위해서, 서술형 수행평가 문항을 문제은행 방식으로 데이터베이스화할 수 있는 노력도 이루어져야 할 것이다. 셋째, 본 연구에서와 같이 서술형 수행평가를 통해서 찾아낸 학생들의 취약점이 개선될 수 있는 교수ㆍ학습 과정과 평가 방법에 대한 연구와 그것의 실제적인 적용 결과와 순환적인 고리를 물고 진행될 수 있는 체제를 개발함으로써, 계속적으로 학생들의 수학적 힘을 신장시킬 수 있도록 하여야 할 것이다. 넷째, 본 연구에서 개발한 수학적 의사소통 영역의 평가기준을 직접 적용하여 평가를 진행하면서 수학적 요소만을 고려하고자 하였지만, 수학적 개념의 이해능력과 문제해결 능력은 뛰어나지만 언어적 능력의 부족으로 자신의 수학적 능력을 제대로 표현하지 못하는 경우가 많음을 발견하였다. 따라서 수학적 능력과 언어적 능력을 정확하게 구분하여, 수학적 의사소통 능력에 대한 평가가 이루어질 수 있는 구체적인 연구가 이루어져야 함을 제안하고자 한다. 또한 이러한 후속적인 연구뿐만 아니라 학교 현장의 교사들도 서술형 수행평가 확대 실시에 대한 요구에 부응하기 위하여, 본 연구에서 제안한 문항 및 평가기준 개발 절차를 참고하여 진정한 의미의 서술형 수행평가가 확대될 수 있는 노력을 기울여야 할 것이다. 또한 본 연구에서 개발한 문항 및 평가기준의 개발 절차를 현장 적용 과정을 통해 계속적인 보완이 이루어져야 할 것이다.
