'이해' 중심 초등 사회과 수행평가 과제 개발 및 양호도 검증

'이해' 중심 초등 사회과 수행평가 과제 개발 및 양호도 검증
Other Titles
Development of Understanding-centered Performance Assessment Task for Social Studies in Elementary School & Verification of Goodness-of-fit
Issue Date
교육대학원 초등교육전공
이화여자대학교 교육대학원
본 연구는 이해 중심 초등 사회과 수행평가 과제를 개발하고, 이를 현장 적용하여 수행평가 과제의 타당도와 신뢰도를 검증하여 개발된 수행평가 과제의 양호도를 규명하는 것을 목적으로 한다. 본 연구에서 다루고자 하는 구체적인 연구 문제는 다음과 같다. 1. 이해 중심 사회과 수행평가 과제는 어떠한 절차로 개발되는가? 1-1. 수행평가의 목표인 ‘이해’는 무엇인가? 1-2. 수행평가 과제의 개발 절차는 무엇인가? 1-3. 수행평가 과제의 채점기준 개발 절차는 무엇인가? 2. 이해 중심 사회과 수행평가 과제와 채점기준의 양호도는 어떠한가? 2-1. 수행평가 과제와 채점기준은 타당한가? 2-2. 수행평가 과제와 채점기준은 신뢰로운가? 본 연구를 위하여 Wiggins와 McTighe가 제시한 이해중심 교육과정 설계모형(UbD)에 따라 ‘이해’를 위한 수행평가 목표를 설정하고, CRESST에서 제시한 수행평가 과제 개발 절차에 따라 수행평가 과제를 개발하였으며, Wiggins와 McTighe가 제시한 수행과제 유형인 GRASPS 요소를 활용하여 과제를 진술하였다. 개발된 수행과제 및 채점기준은 교과 전문가 3인으로부터 수정·보완을 거쳐 내용 타당도를 검증받았다. 내용타당도가 검증된 수행평가 과제를 고양시 B초등학교 4학년 32명을 대상으로 적용하고 수행평가 과제의 공인타당도 및 채점자간 신뢰도를 검증하여 양호도를 규명하였다. 수행평가 과제 개발을 위한 준비 작업으로 사회과 및 수행평가와 관련한 문헌연구와 교사·학습자에 대한 요구조사를 실시하였다. 이러한 과정을 통하여 사회과와 수행평가에서 바람직한 교수·학습 목표와 선호하는 내용, 학습과 평가에 있어서 장애요인 및 실태를 파악하여 연구의 방향을 설정하였다. 본 연구의 이해 중심 수행평가 과제 개발 절차는 CRESST와 UbD의 수행평가 과제 개발 절차에 따라 크게 ‘이해’를 위한 평가 목표 설정, 이해의 여섯 가지 측면 확인, 수행과제 청사진 제작, 타당도 검증, GRASPS 과제 유형의 수행과제 진술, 채점기준 개발, 수업 계획의 일곱 단계로 진행하였으며 과정은 다음과 같다. 1단계인 평가 목표 설정에서는 먼저, 평가 목표로서 ‘이해’를 찾기 위해 현행 교육과정 단원의 목표가 큰 개념에 이르는 ‘이해’를 담은 목표인지 분석하였다. 분석결과 현행 단원의 목표는 큰 개념을 담고 있지 않았으며 관련된 소주제의 내용이 분리되어 있고 수행평가 계획이 명확하지 않았다. 따라서 관련된 소주제의 내용을 묶어 단원 내용 순서를 조정하여 재구성하고「현명한 선택」으로 단원명을 바꾸었다. 재구성한 단원 관련 지식과 기능을 구조화하여 ‘영속적인 이해’로 부터 큰 개념을 찾고, 큰 개념을 중심으로 단원 목표를 설정하였다. 이러한 절차에 의하여「현명한 선택」단원의 궁극적인 목표는 ‘인간의 무한한 욕망과 한정된 자원의 갈등은 선택의 필요를 가져오며, 개인적·사회적 이익을 최대화하기 위해서는 합리적 선택을 해야 함을 의사결정 과정을 통하여 이해한다.’로 설정되었다. 다음으로 설정된 단원 목표를 목표 풀기(unpacking standard)하여 목표에 도달하기 위한 이해, 이해에 이르기 위한 탐구 질문, 구체적인 지식과 기능을 선정하였다. 2단계인 이해의 여섯 가지 측면 확인에서는, 학생들이 단원 평가 목표인 ‘이해’에 도달했는지 확인하기 위한 수행 유형을 설명하기, 해석하기, 적용하기, 관점취하기, 감정이입, 자기지식의 이해의 여섯 가지 측면으로 분석하였다. 이해의 각 측면들이 모두 이해 중심 수행평가 과제로 개발될 수 있으나 본 연구에서는 설명하기와 적용하기 측면에서 수행과제를 선정하였다. 3단계인 이해 중심 수행과제 청사진에서는, 단원의 평가 목표 도달을 확인하기 위한 수행과제의 평가 목표, 목표가 함축한 이해, 평가과제, 평가기준을 담은 수행과제 청사진을 제작하였다. 합리적 선택에 대한 ‘개념의 이해’에 초점을 두고 간학문적 영역의 글쓰기를 통합한 수행과제 1, 의사결정능력에 초점을 두고 개념의 이해를 바탕으로 합리적 결정을 내라는 수행과제 2, 의사결정 과정에 초점을 두고 소득·소비·저축과 합리적 가계운영에 대한 개념 이해를 바탕으로 문제를 해결해 가는 수행과제 3으로 3개의 수행과제를 상세화 하였다. 수행평가 과제의 채점기준은 연구 진술 편의상 6단계에서 논의하였으나 실제에 있어서는 수행과제 청사진의 평가기준 항목을 토대로 수행과제와 함께 제작되었다. 4단계인 수행평가 과제의 타당도 검증에서는, 전문가 3인에게 단원 평가 목표, 수행과제 청사진, 수행과제 활동지, 수행과제 채점기준을 제시하고 수행과제 타당화 검토 준거 질문에 의하여 타당도를 검증받았다. 5단계인 GRASPS 요소에 의한 수행과제 진술에서는 목표(Goals), 역할(Role), 청중(Audience), 상황(Situation), 산출물·수행·목적(Product, Performance, Purpose), 성공을 위한 기준과 준거(Standards and Criteria for Success) 등의 GRASPS 과제 요소에 따라 수행과제를 진술하였다. 6단계인 수행과제 채점기준 개발에서는, 각 수행과제 청사진에서 제시한 기준과 준거에 따라 각 수행과제를 여러 개의 영역으로 나누고 척도를 정한 후, 수행 수준에 따라 채점기준을 진술하였다. 수행과제 1은 채점 영역을 ‘개념의 이해’와 ‘산출물’로 나누고 ‘개념의 이해’ 영역을 다시 세분화 하였고, 수행과제 2는 의사결정, 보고서, 의사소통, 협력학습, 구술발표 영역으로 나누었으며, 수행과제 3은 개념이해, 문제해결, 보고서, 의사소통, 협력학습 영역으로 나누었다. 개발된 채점기준은 전문가 3인을 통해 타당도를 검증 받았다. 7단계인 수업 계획에서는, 단원 목표인 ‘이해’에 이르기 위한 구체적인 수업을 계획하고 학습지를 제작하였다. 단원 목표 도달을 위하여 이해 중심 수행과제 적용을 포함한 총 18차시의 수업을 계획하였으며, 교과서를 포함한 학습 자료와 학습지를 제시하였다. 이처럼 개발된 수행 평가 과제와 채점기준을 현장에 적용하여 양호도를 검증한 결과, 수행평가 과제의 양호도를 뒷받침할 수 있는 다음과 같은 결과를 얻었다. 첫째, 수행평가 과제 및 채점기준의 내용 타당도를 분석한 결과, 본 연구에서 개발한 수행평가 과제는 교육과정에서 제시된 교수학습의 목표와 내용을 반영고 있으며, 고등 사고력의 측정, 실생활 맥락성, 공정성, 채점기준의 명료성, 변별성 등의 수행과제의 타당화 준거를 만족하는 것으로 검증되었다. 둘째, 수행평가 과제와 준거 검사도구인 ‘사회과 개념이해 검사지’와 ‘의사결정능력 검사지’와의 상관계수를 통해 공인타당도를 검증한 결과, 본 연구의 수행평가 과제는 높은 상관은 아니지만 다른 검사도구가 측정하는 ‘개념의 이해’ 및 ‘의사결정능력’과 정적 상관이 있는 것으로 검증되었다. 셋째, 수행평가 과제의 신뢰도를 검증하기 위하여 채점 영역별로 채점자간 신뢰도를 검증한 결과, 수행과제 1의 산출물과 수행과제 2의 협력학습을 제외한 대부분의 영역에서 높은 정적 상관을 나타냈다. 본 연구에서는 이해 중심의 수행평가 과제를 개발하고 현장 적용하여 양호도를 검증함으로써, 개발된 수행평가 과제의 실행 가능성을 확인하였으며, 또한 교수학습 목표와 일치되는 평가 목표로서 ‘이해’의 타당성과 평가 방법으로서 수행평가가 가지는 유용성을 확인할 수 있었다. ‘이해’는 큰 개념을 중심으로 지식과 기능을 관련짓는 것을 목표로 배울 때 습득될 수 있으며 ‘이해’는 정답과 오답이 아닌 정도의 문제이며 수행을 통해 드러나므로 ‘이해’를 위한 평가는 수행평가가 되어야 함을 확인할 수 있었다. 본 연구를 바탕으로 다음과 같은 후속 연구를 제언하고자 한다. 첫째, 본 연구는 수업과 통합된 수행평가 과제로 개발되었기 때문에 수업과 분리하여 개발된 이해 중심 수행평가 과제의 적용 효과를 분석할 수 없어 이해중심 수행과제의 적용 효과를 객관적으로 분석하지 못하였다. 따라서 후속 연구로 수행평가 과제의 적용 효과를 분석하는 연구가 시도되길 바란다. 둘째, 본 연구는 이해 중심 수행평가 과제를 개발하기 위하여 교수 목표와 일치되는 평가 목표로서 ‘이해’를 찾고 목표를 재설정해야 했으며, 목표를 위한 수업계획으로의 수정이 불가피하였다. 전 차시에 걸친 수업을 계획하고 운영하였으나, 상세화된 교수·학습 계획을 제시하지는 못하였다. 따라서 교사들이 이해 중심 수행과제를 활용하기 유용하도록 수업 계획에 따른 교수·학습 지도안이 필요하다. 셋째, 본 연구는 초등 4학년 사회과의 한 단원의 내용을 중심으로 수행평가 과제가 개발되었기 때문에 경제 영역에 집중된 단원 내용을 반영하기 위해 다른 사회과 영역의 학문적 개념을 통합하여 수행평가 과제를 개발하지 못하였다. 따라서 사회과의 여러 영역을 통합한 수행평가 과제 개발과 다른 교과와 통합된 이해 중심 수행평가 과제 개발이 시도되길 바란다. 넷째, 본 연구는 양호도 검증을 위하여 다른 준거 검사지 점수와 개발된 수행평가 과제 점수의 상관계수를 통하여 공인타당도를 검증하였다. 그러나 복잡한 지식과 기능이 녹아 있는 이해 중심 수행과제와 같은 영역을 평가하는 검사지를 찾을 수 없었으며, 공인된 수행평가 과제도 없었다. 따라서 연구자가 개발한 개념 검사지와 학위논문에서 개발된 의사결정능력 검사지를 준거 검사로 사용하였다. 이는 공인타당도가 준거 점수의 타당성에 따라 추정된다는 점을 생각할 때 다소 무리가 있었다고 본다. 그러므로 개발되는 수행평가 과제가 객관성과 신뢰성을 보장받기 위해 다양한 영역을 평가하는 공인된 수행평가 과제의 개발이 이루어지기를 바란다.;This research aims at developing understanding-centered performance assessment task for social studies in elementary school, and examining the goodness-of-fit of performance assessment task closely by verifying validity and reliability through application of the task to the field. This research deals with the following problems. 1. What is the process for developing understanding-centered performance assessment task for social studies? 1-1. What is "understanding" which is the goal of performance assessment? 1-2. What is the process for developing performance assessment task? 1-3. What is the process for developing the grading rubric for performance assessment task? 2. How is the goodness-of-fit of the understanding-centered performance assessment task for social studies and grading rubric? 2-1. Are performance assessment task and grading rubric valid? 2-2. Are performance assessment task and grading rubric reliable? To accomplish the goal of this research, the goal of performance assessment for "understanding" was set up in accordance with the understanding by design model suggested by Wiggins & McTighe, and performance assessment task was developed according to the process for developing performance assessment task suggested by CRESST, and a performance assessment task utilizing GRASPS factor suggested by Wiggins & McTighe was stated. Performance task and grading rubric developed through this research was corrected and supplemented by three experts on social studies, and then its content validity was verified. And the performance task was applied to the class in which 32 students of the fourth grade of B elementary school in Goyang-city were participated, and the goodness-of-fit of performance assessment task was examined closely by verifying concurrent validity and reliability among grades marked by markers. Study of text materials and investigation of requests for teachers and learners were performed in relation to social studies and performance assessment before development of performance assessment. Through such a process, desirable teaching and learning method, preferred content, obstacles and actual states of learning and assessment were investigated and grasped, and direction of research was set up. The process of developing the understanding-centered performance assessment task was set up in accordance with CRESST and understanding by design model, and was composed of six steps: setting up the assessment goal for “understanding”, confirming six aspects of understanding, production of blueprint of performance task, verification of validity, statement of GRASPS task-type performance task and development of the grading rubric. The specific process is as follows. At the first step, that is, step of setting up the assessment goal, the following activities were performed. First, the analysis whether the goal of the chapter “Economic Life at Home”suggested in the present curriculum includes “understanding” which extends to big idea was performed in order to find out “understanding” as the assessment goal. The result of this analysis says that the goal of the chapter “Economic Life at Home” suggested in the present curriculum doesn't include big idea, and the content of sub-subject relating to the chapter is separated from the object of the chapter, and the performance assessment plan is not definite. So this paper readjusted the order of contents of the chapter “Economic Life at Home” and reconstructing the chapter into “Wise Choice” by putting together the contents of sub-subjects concerned. “Enduring understanding” was found out through the structuralization of knowledge and skill relating to the chapter on the basis of relevancy and rank among concepts. Big ideas of knowledge and skill relating to the chapter were found in the enduring understanding, and validity was verified by experts, and the goal of the chapter was set up on the basis of big idea. Through this process, the ultimate goal of the chapter “Wise Choice” was set up as follows: students can understand the fact that the conflict between infinite desire of human and finite resources results in the necessity of choice, and rational choice should be conducted through decision-making process in order to maximize individual and social interest. And then, the understanding for achieving the goal, and the inquiry question and concrete knowledge and skill for achieving understanding were selected through the process of unpacking standard from the established goal of the chapter. At the second step, that is, step of confirming six aspects of understanding, as part of the performance pattern for confirming whether students achieved "understanding" which is the goal of the chapter, various aspects of understanding was analyzed in six fields including explanation, interpretation, application, taking a viewpoint, empathy and self-knowledge. All aspects of understanding were able to be developed into the understanding-centered performance assessment task, but this research selected performance task by considering explanation and application. At the third step, that is, step of production of blueprint of understanding-centric performance task, the blueprint containing goal of assessment of performance task, implied understanding, assessment task and assessment standard was produced to confirm the degree of obtainment of goal of the chapter. Three performance tasks were produced in this research. Performance task 1 was "writing a draft of the speech under the subject of wise choice" by integrating writing functions, which belong to interdisciplinary area, and focusing on "understanding of concept" on rational choice. Performance task 2 was "choosing a bicycle" focusing on decision-making ability on the basis of understanding of concept on rational choice. Performance task 3 was "making a plan of household expenditure" focusing on problem solving through decision-making process on the basis of decision-making ability and understanding of concept on income, consumption, savings and rational household operation. The grading rubric for performance assessment task was handled at the sixth step for the convenience of statement of research. However, in fact, it was made on the basis of the grading rubric of blueprint of performance task when the performance task was made. At the fourth step, that is, step of verification of validity of performance task, the goal of performance task, blueprint of performance task, performance task activity sheets and grading rubric for performance task were submitted to three experts, and the validity was verified through inquiry concerning standard for validation of performance task. At the fifth step, that is, step of statement of GRASPS task-type performance task, goals, role, audience, situation, product, performance, purpose, standards and criteria for success were stated in accordance with GRASPS. At the sixth step, that is, step of development of the grading rubric for performance task, each performance task was divided into many areas according to standards and criteria suggested in blueprint of each performance task, and the index was decided, and then the grading rubric was stated in accordance with performance level. Grading area of performance task 1 was divided into two parts: "understanding of concept" and "product." And "understanding of concept"area was segmented again. Grading area of performance task 2 was divided into five parts: decision-making, report, communication, collaborative learning and oral presentation. Grading area of performance task 3 was divided into five parts: understanding of concept, problem solving, communication and collaborative learning. Validity of grading rubric developed in this research was verified by three experts. Performance assessment task developed through the above-stated process and grading rubric were applied to the field. In consequence, the following results which can prove the goodness-of-fit of performance assessment task were drawn out. First, in result of analyzing content validity of grading rubric and performance assessment task, the following facts were verified. The performance assessment task developed in this research reflects goal and content of teaching and learning suggested in curriculum, and satisfies standards of validation of performance task including measurement of higher-order thinking, contextuality with real life, fairness, clarity of grading rubric and discrimination ability. Second, in result of verifying concurrent validity through correlation coefficient among performance assessment task and other examination tools such as "decision-making ability examination sheet" and "examination sheet of understanding of concept used for social studies", the following facts were verified. Performance assessment task of this research had a positive correlation with "decision-making ability" and "understanding of concept used for social studies" measured through other types of examination tools. Third, in result of verification of reliability among grades of each area marked by markers for verifying reliability of performance assessment task, the following facts were verified. And they showed high positive correlation in most areas except collaborative learning of performance task 1 and 2. This research developed understanding-centric performance assessment task, and verified goodness-of-fit, and, finally, confirmed feasibility of performance assessment task developed. Besides, validity of "understanding" as the assessment goal congruent with the goal of teaching and learning, and usefulness of performance assessment as the method of assessment were confirmed. The researcher of this study suggests the follow-up researches stated below on the basis of this research. First, since this research was developed as the performance assessment task integrated with school lessons, effect of application of understanding-centric performance assessment task developed through separation assessment task and school lessons was not analyzed, and effect of application of understanding-centric performance task was not objectively analyzed. Therefore, the follow-up research for analyzing performance assessment task objectively should be carried out concurrently with and an attempt of using qualitative approach. Second, this research had to find "understanding" as the assessment goal congruent with the goal of teaching and learning, and set up a goal in order to develop understanding-centric performance assessment task. And modification of class plan in accordance with goal was inevitable, but detailed learning plan couldn't be suggested. Therefore, the specialization of goal and class plan which sets the stage for successful completion of performance assessment task is needed. Third, in this research, since the performance assessment task was developed in relation to one chapter of textbook of social studies of the fourth grade of elementary school, the performance assessment task mainly included the content relating to economic area, and the performance assessment task integrating academic concepts of the other areas of social studies could not be developed. Therefore, the performance assessment task integrating various areas of social studies and the understanding-centric performance task integrated with other subjects should be developed. Fourth, this research verified concurrent validity through correlation coefficient between the grade of performance assessment task developed and the grades of examination sheets concerning other criteria in order to verify the goodness-of-fit. Since the accredited performance assessment task did not exist, and finding out the examination sheet which assesses the area such as understanding-centric performance task was failed, the examination sheet of understanding of concept used for social studies developed by researcher on the basis of accredited examination sheet and the decision-making ability examination sheet developed in a thesis for degree were used in this research. Considering that concurrent validity is presumed in accordance with validity of standard grade, it seems that the above-stated method is rather unreasonable. Therefore, it is urgent to develop the accredited performance assessment task which assesses various areas.
