View : 873 Download: 0

A Corpus-based Analysis of Korean University Students' Written English Focusing on Errors

A Corpus-based Analysis of Korean University Students' Written English Focusing on Errors
Other Titles
한국 대학교 영어 학습자의 영작문 코퍼스에 나타난 오류분석
Issue Date
대학원 영어교육학과
이화여자대학교 대학원
The primary purpose of this study is to investigate patterns of errors in Korean university students' written English based on error-tagged learner corpus in order to examine problematic areas for the students. A total of 86 essays from first-year Korean college students were collected for compiling the learner corpus. The errors were identified and coded according to morphology, lexical, syntactic, and mechanical categories. After analysing the overall frequency of errors, patterns shown in errors of students with high and low proficiency of English were compared in order to find differences due to proficiency. In addition, a questionnaire was administered to explore further needs and difficulties students have in writing. The major findings are as follows: First of all, errors were identified according to morphological, lexical, syntactic, and mechanical categories. Morphological errors which consisted of morphological verb errors and noun errors showed that verb tense and omission of articles were problematic areas for students. Both errors were affected by the argumentative/persuasive genre and topic of the essays. In the lexical category, word choice was the most erroneous. Searching for some of these words in the BNC Written corpus showed that students used collocations that could not be found in the native corpus, or in some cases, were found within a context not used in the native corpus. The words that were most prone to error were value, which was often used by students due to the topic of essays, and subordinate conjunction because. The most problematic area in the syntactic category was sentence structure. Students often made sentence structure errors by omitting words. Secondly, patterns shown in errors of high and low proficiency level groups were analysed in regards to morphological, lexical, syntactic, and mechanical categories. Within the morphological category, although both high and low proficiency groups had similar number of errors in verb tenses, analysing them revealed that the high proficiency group's errors were caused by misusing perfect tenses, while low proficiency group's errors were mainly due to students using present tenses. Comparing the errors made by high and low proficiency groups on the lexical category showed that students of both groups often used informal expressions, which indicated their lack of knowledge in written register. For syntactic category, fragments starting with subordinate conjunctions such as because and although which have been notified in many studies as problematic for Korean students (Kosofsky, 1987; Lee, S.-M., 2004; Lee, D.-J., 2004), were found only among students in the low proficiency group. Lastly, for the mechanical category, low proficiency level group made punctuation errors by using commas between coordinating and subordinating conjunctions and the following words, while students of the high proficiency level made errors by omitting commas after transition words and phrases such as for example, for this reason, and furthermore. Thirdly, the result of the questionnaire on students' needs and awareness of errors in English essay writing on a 5-point Likert-type scale revealed that students found vocabulary and grammar to be the most difficult. In addition, students answered that they wanted elaborate feedback on grammar. For the question on selecting the most difficult areas based on the subcategories of errors used for analysis in this study, word choice and determiner were selected by most of the students, which were the two error-prone items that occurred most frequently in the students' essays. However, although students made many errors on noun endings, verb tense and verb form, they were selected only by few students. This suggests that teachers need to raise students' awareness on using these subcategories so that students can monitor and self-correct their errors on them while writing. The pedagogical implications of this study are as follows. First of all, students participating in the research made frequent errors in word choice and determiners, similar to the findings of previous studies (Cowan et al., 2003; Lee, S.-M., 2004; Cha, K.-A., 2004). The contexts in which students frequently make these errors should be compiled into a database so that it can be used in materials by teachers to raise students' awareness on these areas. In addition, extracts from the native corpora can also be applied to supplement the materials in order to enhance students' target-like use of language. Although several studies have indicated the benefits of using the learner corpora in teaching students, there have been less attempts to try them out. Further studies can investigate the outcomes of recycling learner output in the classrooms.;최근 들어 방대한 언어 자료의 집합체인 코퍼스가 언어 교육 및 연구에서 널리 활용되면서 학습자의 언어 자료로 구축한 학습자 코퍼스(learner corpus)에 관한 연구 또한 활발히 진행되어왔다. 학습자 코퍼스를 활용한 연구는 크게 학습자 코퍼스와 원어민 코퍼스(native corpus) 또는 다른 모국어를 사용하는 학습자 코퍼스 간의 대조분석(contrastive interlanguage analysis) 연구와 코퍼스를 활용한 오류 분석(computer-aided error analysis)으로 분류할 수 있는데(Granger, 2002), 비록 연구자가 인식하지 못했던 언어 습득에 있어서 오류가 많이 나타나는 항목을 발견할 수 있다는 장점에도 불구하고 지금까지는 대조분석을 활용한 연구가 대부분이었다. 따라서 본 연구에서는 대학교 1학년 한국 학생들의 영어 작문 자료를 바탕으로 오류태그를 단 학습자 코퍼스(error-tagged learner corpus)를 구축하여 학생들이 흔하게 범하는 오류의 구조(pattern)를 알아보고자 한다. 이러한 연구목적에 따라 총 86개의 에세이에 나타난 오류를 형태(morphology), 어휘(lexical), 통사(syntactic), 철자 및 구두법(mechanical)의 범주(category)로 분류하여 각 오류별로 태그(tag)를 달아 분석하였다. 또한 영어 수준 차이에 따라 나타나는 오류를 살펴보기 위해 상위 학습자와 하위 학습자 집단으로 나누어 오류의 구조를 비교하였고 설문을 통해 학생들이 영어 작문 시에 어려워하는 부분과 필요를 알아보고자 하였다. 실험 결과의 분석과 논의 내용을 정리하면 다음과 같다. 첫째, 동사와 명사의 형태론적 오류에서는 동사 시제 오류와 관사의 생략이 가장 많이 나타났고 이는 에세이 장르에 따른 시제사용과 주제에 따른 빈도수가 높은 단어에 영향을 받은 것으로 드러났다. 어휘적 범주 안에서는 잘못된 단어 선택이 오류가 가장 많았는데, 학생들이 많이 사용한 단어 중 오류 비율이 가장 높은 단어로는 주제와 연관되어 많이 쓰인 value와 종속 접속사(subordinate conjunction) because로 나타났다. 통사적 범주에서 학생들이 가장 흔히 범한 오류는 문장구조(sentence structure)로 그 중 문장 요소를 생략한 오류가 가장 많았다. 둘째, 학생을 상·하 수준별로 구성하여 각 범주별로 나타나는 오류의 비교를 통해 집단에 따라 나타나는 오류의 차이점을 살펴보았다. 형태 범주 안의 오류에서는 두 집단 모두 동사의 시제 오류를 범했는데 하위 집단의 경우 주로 현재시제를 잘못 사용하여 오류가 많이 발생한 반면 상위 집단은 완료시제에서 오류를 많이 보였다. 어휘적 범주 안에서는 상·하 집단 모두 구어적 표현을 많이 사용하여 작문에서 요구되는 문어적 형식에 대한 지식이 부족한 것으로 나타났다. 통사적 범주 안에서는 선행 연구(Kosofsky, 1987; Lee, S.-M., 2004; Lee, D.-J., 2004)에서 많이 지적되었고 오류비율이 높은 단어로 나타난 because, although와 같은 종속 접속사를 사용한 오류는 하위 집단에게만 나타났다. 마지막으로 철자 및 구두법 범주에서는 쉼표 사용에서 차이점이 나타났는데 하위집단은 but, because와 같은 등위 및 종속 접속사와 다음 단어 사이에 쉼표를 사용하여 오류가 많았던 반면 상위 집단은 for example, for this reason, furthermore와 같은 연결사에 대한 쉼표를 생략한 경우가 많았다. 세 번째로, 학습자들이 영어로 작문 시 어려워하는 부분과 오류에 대한 인식을 알아보기 위한 설문조사에서 학생들은 선행 연구 결과와 동일하게 어휘(vocabulary)와 문법이 가장 어렵다고 응답하였고 또한 문법에 대해 보다 자세한 피드백을 받기 원한다고 응답했다. 본 연구에서 사용한 오류 분류 범주 중에서 가장 어려운 요소를 고르는 문항에서 학생들은 단어선택과 한정사가 가장 어렵다고 답하였는데 이는 실제 작문에서 가장 많이 나타났던 오류와 동일하였다. 하지만 명사 어미(noun ending), 동사 시제와 동사 형태(verb form)는 실제 작문에서 오류를 많이 범했음에도 불구하고 학생들이 어렵다고 응답한 항목들 중 하위 순위에 해당하였다. 따라서 학생들에게 영어 작문 시 동사 시제 및 동사 형태에 대한 인식을 높여서 이러한 항목에 대한 오류를 스스로 모니터링하고 자기 수정할 수 있도록 지도하는 것이 필요한 것으로 생각된다. 선행 연구(Cowan et al., 2003; Lee, S.-M., 2004; Cha, K.-A., 2004)에서 지적한 바와 같이 본 연구에서도 빈도수가 가장 높은 오류는 단어선택과 한정사로 나타났는데 이는 연구대상 학생들의 학습 상황이나 주어진 작문의 주제 등 여러 요인을 망라하여 영어 작문 시 학생들에게 어려운 부분임을 시사한다. 따라서 이와 같이 학생들이 습득하기 어려운 요소는 데이터베이스화를 통해 오류가 흔히 나타나는 맥락을 구축하고 학생들의 인식을 높이기 위한 자료중심학습(data-driven learning, DDL)에 활용되어야할 것이다. 특히 본 연구에서와 같이 원어민 코퍼스에서 나타난 콘코던스(concordance) 결과를 함께 제공하여 학생들이 목표언어(target language)에 가까운 언어를 사용할 수 있도록 학습상황을 마련해 주어야할 것이다.
Show the fulltext
Appears in Collections:
일반대학원 > 영어교육학과 > Theses_Master
Files in This Item:
There are no files associated with this item.
RIS (EndNote)
XLS (Excel)
