초등교사 평가 준거 개발에 관한 연구
A Research on the Development of a Standard for Teacher Evaluation
대학원 초등교육학과
이화여자대학교 대학원
The success of public education system consists in the effective use of human resources. This is the reason why social and nation concerns with the attainment, development and maintenance of human resources are highly emphasized. For teachers' specialities are hugely influenced by the process of education and their achievements. For this reason, in major developed countries, there have been active discussions of, and great interests in, the cultivation of teacher's abilities and their assessment. Following this global movement, evaluations have been designed for the development of teachers' specialities in Korea. In Korea, the current system for the evaluation of elementary school teachers in Korea consists of the evaluations of work performance multi-dimensional evaluation, of the development of the capabilities of teachers and for the payment of incentives. However, these evaluations take place different times. Furthermore, although the four assessments are different in purpose, the specific domains of each criterion for evaluation and their elements are quite similar. Thus, in the actual field of education, the current system is often criticized for its inefficient and uneconomical character. Also, it is often pointed out that since current criteria for evaluation are described in too abstract and comprehensive terms, there is a high possibility of the involvement of evaluators' merely subjective opinions. This study aimed to find the possibility of achieving the two significant ends of the improvement of speciality and of human management, analysing the current standards for the evaluation of elementary teacher evaluation and unifying the evaluation tools. It also developed an evaluative standard, which is both reflective of the demands of teachers, students and school parents and suitable for the actual field of education. Moreover, the study was meant to provide fundamental sources for the development of the system for teacher evaluation. For this purpose, it analysed the demands of subgroups of each evaluating subject, comparing their perceptions of the standards of evaluation. To fulfill these aims, I raised the following research questions in the first place: 1. How the standards for the evaluation of elementary school teachers should be formed? (1) How should the standard for teacher evaluation by colleagues be formed? (2) How should the standard for teacher evaluation by students be formed? (3) How should the standard for teacher evaluation by school parents be formed? 2. Are the developed evaluative standards valid and reliable? (1) How valid and reliable is the developed standard for evaluation by colleagues? (2) How valid and reliable is the developed standard for evaluation by students? (3) How valid and reliable is the developed standard for evaluation by school parents? 3. What are differences between subgroups pertaining to each evaluating subject in the perception of the criteria of teacher evaluation? (1) How do teachers' perceptions of the criteria differ according to their careers and regions? (2) How do students' perceptions differ according to their regions? (3) How do school parents' perceptions differ according to their regions? In order to solve the aforementioned problems and to develop valid standards for teacher evaluation, I performed the following researches. First, I examined major theories of the system for teacher evaluation, of the standard for the evaluation and of multi-dimensional evaluation. Second, based on the theoretical background and through the first, second and third Delphi-method researches, I developed standards for the evaluation of teachers. Third, I conducted a questionnaire survey concerning the created schemes, and on the basis of the data, I tested their validity and applicability to the actual field of education. Finally, I confirmed whether there are differences in the perception of the schemes according to the factors relevant to each evaluating body. The methods of the present research are as follows. In this study, I chose specialists in the area relevant to the research topic, in consideration of their representative character, appropriateness and professional knowledge and ability, number, etc.: 10 specialists were chosen for the research on evaluation by colleagues, 11 for the research on evaluation by students, and 10 for the research on evaluation by school parents. This study also involves educational specialists (principals, vice-principals and teachers) students and parents of 12 elementary schools: 22 teachers, 22 students and 22 parents were selected at random from each school. 4 schools were selected from each of three regions (a large city, a medium-sized city and a small city). 736 out of 792 questionnaires were returned, and those improperly answered were excluded from the study. Overall, 720 questionnaires - 241 out of them answered by teachers, 238 by students, and 241 by parents - were the objects of analysis. Through the analysis of the result of the first Delphi-method research, I collected opinions and classified them statistically. In the second and third Delphi-method researches, I could obtain basic statistical values and analysed averages, means, standard variations and inter-quartile range, using the SPSS 15.0 program. In the first, second and third Delphi-method researches, I constructed a form in which opinions and additional explanations could be written and used it as a source of qualitative analysis. I employed the SPSS 15.0 program to process the data of the questionnaire survey. Also, I conducted a factor-analysis to test the validity of the standard for evaluation by each evaluating subject. Furthermore, I conducted a KMO test for sample appropriateness and did a Barlett test to measure the validity of the questions constitutive of the evaluation tool. Finally, a one-way ANOVA test was carried out for the analysis of the perceptual differences between the subgroups. In the case of the detection of a difference, I conducted a Scheffe test in order to see between which groups there is the difference. The result of my research, which these procedures made up, can be summarized in the following way. Firstly, as a result of the Delphi-method research, it is confirmed that each specific domain and each element of it are valid. The standard for evaluation by colleagues is composed of 4 criteria, 11 domains and 41 elements; the scheme for evaluation by students comprises 2 criteria, 4 domains and 29 elements; the scheme for evaluation by parents consists of 3 criteria, 6 domains and 32 elements. Specifically, first of all, the criteria constitutive of the standard of evaluation by colleagues are basic attitude, speciality, social relationship and the capability of work performance. The criterion of basic attitude involves the domains of aptitude and of attitude, and the criterion of speciality does the management of classes, the guidance of students' lives and the cultivation of speciality. And the criterion of social relationship contains the relationships with students, with parents and with colleagues, that of the capability of work performance consisting in teaching and school adminstration. Nextly, the criteria for evaluation by students are speciality and social relationship. The former criterion is constituted by the teaching of subject matters, the instruction of learning and the guidance of students' ordinary lives; the latter lies in the relationship with students. Finally, the criteria for evaluation by parents are basic attitude, speciality and social relationship. While the criterion of basic attitude contains the love of students and attitude, the criterion of speciality does the instruction of learning and the guidance of students' life. And the criterion of social relationship is formed out of the relationships with students and with school parents. Secondly, it is shown that generally, the validity and reliability of the domains of the evaluation standards and their elements and questions are high. The result of the factor analysis is as follows: With respect to the factor analysis of the elements of each domain of teacher evaluation by colleagues, 4 factors whose unique values are greater than 1 were extracted. The ratio of the total distribution of the elements of teacher evaluation that can be explained in terms of these factors is 99.6%. As for the names of the factors extracted in accordance with the results of the factor analysis, factor 1 is Speciality (Speciality 3~24), factor 2 is Basic Attitude (Basic Attitude 1~7, Speciality 1,2), factor 3 is Social Relationship (Social Relationship 1~5) and factor 4 is Capability of Work Performance. The reliability of each factor thus acquired is high: factor 1 is .922, factor 2 is .971, factor 3 is .972 and factor 4 is 972. Concerning the factor analysis of the elements of each domain of teacher evaluation by students, 2 factors whose unique values are greater than 1.0 were extracted, and the ratio of the total distribution of the elements of teacher evaluation that are explicable in terms of these factors is 60.48%. As for the names of the factors extracted in accordance with the results of the factor analysis, factor 1 is Speciality (Speciality 1~23) and factor 2 is Social Relationship (Speciality 1~6). The reliability of each factor thus obtained is high, as well: the reliability of factor 1 is .964 and that of factor 2 is .972. As for the factor analysis of the elements of each domain of teacher evaluation by school parents, 3 factors whose unique values are greater than 1.0 were extracted, and the ratio of the total distribution of the elements of teacher evaluation that are explainable in terms of these factors is 61.90%. Names were given to the factors thus extracted: factor 1 was named as Speciality (Speciality 3~20), factor 2 was named as Basic Attitude (Basic Attitude 1~7, Speciality 1), and factor 3 was named as Social Relationship (Social Relationship 1~5). The reliability of each factor is high, too: factor 1 is .972, that of factor 2 is .944 and that of factor 3 is .978. Thirdly, the result of the analysis of the perceptual differences of the subgroups indicates that teachers with longer careers consider the contents related to class management and the guidance of learning as more important criteria of teacher evaluation. On the other hand, teachers with shorter careers lay greater emphasis on social relationship and work performance. Regarding the criteria for teacher evaluation by students, it can be seen that whereas students in large cities find the teaching of the subjects more significant, those in small cities paid more attention to the teacher-student relationship. As for teacher evaluation by school parents, parents in medium-sized cities expressed greater concerns with the instruction of learning, which pertains to the criterion of speciality. By contrast, those in small cities showed greater interests in the relationships with students and with parents. To summarize, it seems that the evaluation standards, which, as a part of this study, were developed for a multidimensional and comprehensive evaluation of teachers, possess high validity and reliability, and thus, can be used as meaningful criteria in the actual field of education. As the results of the present study seem to show, it has unified evaluative elements constitutive of the system for teacher evaluation, and formed a standard for multi-dimensional teacher evaluation in an objective and specific manner. Though the present study focused on the criteria (domains, elements and questions) of teacher evaluation by each evaluating subject, schemes for teacher evaluation centering on variables such as teacher′s career development stage, class size, grade. Finally, one should pursue researches on the effect of teacher evaluation and feedback on the school and the teacher. For, through such researches, future directions of teacher evaluation can be found.;공교육 체제에서의 핵심적인 과제 중의 하나는 인적 자원을 효과적으로 활용하는 것이다. 교육 부문에서도 인적 자원의 확보, 개발, 유지에 대한 사회․국가적 관심과 관리가 강조되고 있다. 교육 활동 수행에 있어서 교사의 전문적 자질은 교육의 과정뿐만 아니라 교육의 성과를 크게 좌우하기 때문이다. 이러한 점에서 주요 선진국에서는 교사의 능력 개발 노력과 평가에 대한 관심과 논의가 강화되고 있다. 세계적 흐름과 궤를 같이 하여 우리 나라에서도 교사의 전문성 개발을 위한 평가를 시행하게 되었다. 우리 나라의 교사 평가 제도는 근무성적평정, 성과상여금제, 교원능력개발평가로 다원적으로 시행되기 때문에 교육 현장에서는 동일 교사를 대상으로 유사한 평가를 중복적으로 실시하는 비효율성과 비 경제 성에 대한 문제점이 제기되고 있다. 평가의 목적은 다르나 평가 준거에 따른 세부 평가 영역 및 요소의 내용은 대동소이한 실정이다. 또한 평가 지표가 너무 포괄적이고 추상적으로 기술되어 있어 평가자의 주관적 판단이 개입될 가능성이 매우 높다는 점 등이 문제점으로 지적되고 있다. 본 연구에서는 현재 시행되고 있는 교사 평가들의 준거를 분석하여 평가 도구를 통합하면서 인사와 전문성 신장이라는 두 가지 목적을 달성할 수 있는 가능성을 찾아보았다. 또한 교육 이해 당사자인 교원과 학생, 학부모의 요구가 반영된 명확한 평가 기준을 설정하여 교육 현장에서 사용하기에 적절한 평가 준거를 개발하였다. 더 나아가 평가 집단의 배경에 따른 인식의 차이 비교를 통하여 집단 별 요구 사항을 분석하여 교사 평가 체제의 발전을 위한 기초 자료를 제공하는 것을 목적으로 하였다. 이러한 연구 목적을 달성하기 위하여 다음과 같은 연구 문제를 설정하였다. 첫째, 초등 교사 평가 준거는 어떠한 요인들로 구성되는가? (1) 교사 평가에서 동료 교원에 의한 평가 준거는 어떠한 요인들로 구성되는가? (2) 교사 평가에서 학생에 의한 평가 준거는 어떠한 요인들로 구성되는가? (3) 교사 평가에서 학부모에 의한 평가 준거는 어떠한 요인들로 구성되는가? 둘째, 개발된 초등 교사 평가 준거의 타당 도와 신뢰도는 어떠한가? (1) 개발된 동료 교원에 의한 교사 평가 준거의 타당 도와 신뢰도는 어떠한가? (2) 개발된 학생에 의한 교사 평가 준거의 타당 도와 신뢰도는 어떠한가? (3) 개발된 학부모에 의한 교사 평가 준거의 타당 도와 신뢰도는 어떠한가? 셋째, 초등 교사 평가 준거에 대한 관련 집단 별 인식의 차이는 어떠한가? (1) 교사 평가 준거에 대한 교원의 경력, 지역별 인식의 차이는 어떠한가? (2) 교사 평가 준거에 대한 학생의 지역별 인식의 차이는 어떠한가? (3) 교사 평가 준거에 대한 학부모의 지역별 인식의 차이는 어떠한가? 이상의 문제점을 해결하고 타당성 있는 평가자 주체 별 교사 평가 준거 개발을 위해 다음과 같은 연구를 실행하였다. 첫째, 교사 평가 제도, 교사 평가 준거, 다면 평가 등에 대한 주요 이론들을 고찰하였다. 둘째, 분석된 이론적 배경을 기초로 1, 2, 3차 델 파이 조사를 통하여 평가 주체 별 교사 평가 준거를 도출하였다. 셋째, 개발된 평가자 주체 별 교사 평가 준거로 설문 조사를 실시하여 타당성 정도와 교육 현장 적용 가능성을 검증하였다. 넷째, 배경 변인에 따른 집단 별 인식 차이가 존재하는지를 검증하였다. 본 연구를 실행하기 위한 연구 방법은 다음과 같다. 연구에서는 관련 분야의 전문가 패널을 선정하기 위하여 연구 주제와 관련된 전문가들의 대표성, 적절성, 전문적 지식과 능력, 적정 인원 수 등을 고려하여 평가자 주체 별로 동료 교원에 의한 교사 평가 10명, 학생에 의한 교사 평가 11명, 학부모에 의한 교사 평가 10명을 조사 대상으로 하였다. 본 설문 조사의 연구 대상은 초등학교 12개교 교원(교장, 교감, 교사), 학생, 학부모이다. 지역별(대도시, 중소 도시, 소도시)로 4개교, 학교별로 교원 22명, 학생 22명, 학부모 22명을 무선 표 집 하여 연구 대상으로 하였다. 총 792부의 설문지 중 736부가 회수되었으나, 회수된 설문지 중에서 불성실하게 응답한 설문지를 제외하고 교원용 241부, 학생용 238부, 학부모용 241부, 총 720부를 분석 대상으로 삼았다. 1차 델 파이 조사 결과 분석을 통해 통계적으로 의견을 수렴하고 분류하였다. 2, 3차 델 파이 조사는 SPSS 15.0 통계 처리 프로그램을 사용하여 기초적인 통계 값을 산출하여 각 평가 영역 및 요소에 대한 평균, 중앙값, 표준편차, 사분범위를 분석하였다. 1, 2, 3차 델 파이 조사에서는 재 진술, 추가할 내용 란 에 항목 이외의 의견이나 부가 설명 등을 기술할 수 있도록 조사 지를 구성하여 질적 분석 자료로도 사용하였다. 설문 조사의 자료 처리를 위하여 SPSS 15.0 프로그램을 사용하였다. 본 설문 조사에서는 평가자 주체 별 교사 평가 준거의 타당성을 검증하기 위하여 요인 분석을 실시하였다. 평가 도구 문항의 타당 도를 측정하기 위하여 KMO 표본 적합도 검증과 Barlett 검증을 실시하였다. 평가 준거의 신뢰도는 Cronbach alpha 계수를 통하여 분석하였다. 평가자 주체 별 교사 평가 준거에 대한 배경 변인 별 인식 차이 분석을 위해 일원변량분석(one-way ANOVA)을 실시하였다. 배경 변인 별 인식에 차이가 있는 것으로 나타나는 경우에는 구체적으로 어느 집단 간에 차이가 있는지를 알아보기 위하여 사후비교검증(Scheffe test)을 수행하였다. 이러한 과정을 통하여 얻어진 연구 결과를 요약하면 다음과 같다. 첫째, 평가자 주체 별 교사 평가 준거에서 동료 교원에 의한 교사 평가는 4준거, 11영역, 41요소, 학생에 의한 교사 평가는 2준거, 4영역, 29요소, 학부모에 의한 교사 평가는 3준거, 6영역, 32요소로 구성되었다. 동료 교원에 의한 평가 준거는 기본 자세, 전문성, 사회적 관계, 업무 능력이다. 기본 자세 준거는 자질․태도 영역, 전문성 준거는 학급 경영․생활 지도․전문성 개발 영역, 사회적 관계 준거는 학생 관계․학부모 관계․동료 관계 영역, 업무 능력 준거는 교무 업무․행정 업무 영역으로 구성되었다. 학생에 의한 교사 평가 준거는 전문성, 관계이다. 전문성 준거는 교과 지도․학습 지도․생활 지도 영역, 관계 준거는 학생 관계 영역으로 구성되었다. 학부모에 의한 교사 평가 준거는 기본 자세, 전문성, 사회적 관계이다. 기본 자세 준거는 학생 애․태도 영역, 전문성 준거는 학습 지도․생활 지도 영역, 사회적 관계 준거는 학생 관계․학부모 관계 영역으로 구성되었다. 둘째, 평가자 주체 별 교사 평가 준거로 설문 조사를 실시하여 요인 분석을 한 결과는 다음과 같다. 동료 교원에 의한 교사 평가 영역별 요소에 대한 요인 분석 결과 각 요인의 고유 값이 1.0 이상인 요인은 4개가 추출되었고, 이들 요인에 의해 설명되는 교사 평가 요소의 총 분산 비율은 99.6%였다. 요인 분석 결과에 따라서 추출된 요인들에 대한 명칭은 요인 1은 전문성(전문성 3~24), 요인 2는 기본 자세(기본 자세1~7, 전문성 1, 2), 요인 3은 사회적 관계(사회적 관계 1~5), 요인 4는 업무 능력(사회적 관계 1, 업무 능력 1~4)으로 명명하였다. 요인 분석을 통해 얻어진 각 요인 별 신뢰도는 요인 1은 .922, 요인 2는 .971, 요인 3은 .971, 요인 4는 .972로 나타나 모든 요인에서 양호하였다. 학생에 의한 교사 평가 영역별 요소에 대한 요인 분석 결과 각 요인의 고유 값이 1.0 이상인 요인은 2개가 추출되었고, 이들 요인에 의해 설명되는 교사 평가 요소의 총 분산 비율은 60.48%였다. 요인 분석 결과에 따라서 추출된 요인들에 대한 명칭은 요인 1은 전문성(전문성 1~23), 요인 2는 관계(전문성 1~6)로 명명하였다. 요인 분석을 통해 얻어진 각 요인 별 신뢰도는 요인 1은 .964, 요인 2는 .972로 나타나 모든 요인 영역에서 양호하였다. 학부모에 의한 교사 평가 영역별 요소에 대한 요인 분석 결과 각 요인의 고유 값이 1.0 이상인 요인은 3개가 추출되었고, 이들 요인에 의해 설명되는 교사 평가 요소의 총 분산 비율은 61.90%였다. 요인 분석 결과에 따라서 추출된 요인들에 대한 명칭은 요인 1의 전문성(전문성 3~20), 요인 2의 기본 자세(기본 자세 1~7, 전문성 1), 요인 3의 사회적 관계(사회적 관계 1~5)로 명명하였다. 요인 분석을 통해 얻어진 각 요인 별 신뢰도는 요인 1은 .972, 요인 2는 .944, 요인 3은 .978로 나타나 모든 요인 영역에서 양호하였다. 셋째, 평가 집단의 배경에 따른 인식 차이 분석 결과 동료 교원에 의한 교사 평가 준거로서 경력이 낮은 교원들은 학급 경영, 학습 지도와 관련된 내용이 더 중요하다고 인식했다. 경력이 많은 교원들은 사회적 관계, 업무 처리에 보다 높은 관심을 보였다. 학생에 의한 교사 평가 준거로서 대도시의 학생들은 교과 지도, 학습 지도와 관련된 내용이 더 중요하다고 인식했고, 소도시의 학생들은 교사와 학생 관계에 보다 높은 관심을 보였다. 학부모에 의한 교사 평가에서 중소 도시의 학부모들은 교사 평가 준거 중 전문성 준거의 학습 지도와 관련된 내용에 높은 관심을 보였고, 소도시의 학부모들은 사회적 관계 준거의 학생 관계, 학부모 관계와 관련된 내용에 높은 관심을 보였다. 이상의 연구 결과를 종합하여 볼 때 교사의 기본 자세, 전문성, 사회적 관계 등을 다면적이고 총체적으로 평가할 수 있도록 개발된 본 연구의 평가자 주체 별 교사 평가 준거는 높은 타당성과 신뢰성을 갖는 유의미한 평가 준거로서 교육 현장에서 사용할 수 있는 유용한 평가 준거가 될 수 있을 것이라 판단된다. 이러한 연구 결과로 볼 때 본 연구는 경제성과 효율성을 추구하여 다원적 교사 평가 제도의 평가 요소들을 통합하였다는 점과 다면 평가 형 교사 평가로서 교사 평가 준거를 객관적이고 구체적으로 구성하였다는 점에서 그 의의가 있다. 본 연구는 평가자 주체 별 교사 평가 준거(영역, 요소, 문항) 중심으로 이루어졌으나 교사 발달 단계, 학급 규모, 학년 등의 변인을 고려하여 다양하게 제작될 필요가 있다. 또한 교사 평가 결과의 활용 및 피드백이 학교와 교사들에게 미치는 영향에 관한 연구를 통해 교사 평가의 나아갈 방향을 탐색해 볼 필요가 있다.
일반대학원 > 초등교육학과 > Theses_Ph.D
