Exploring mega-corpora: Google Ngram Viewer and the Corpus of Historical American English

Ericson Friginal, Maesha Walker, Janet Beth Randall
2014 EuroAmerican Journal of Applied Linguistics and Languages  
EN The creation of internet-based mega-corpora such as the Corpus of Contemporary American English (COCA), the Corpus of Historical American English (COHA) (Davies, 2011a) and the Google Ngram Viewer (Cohen, 2010) signals a new phase in corpus-based research that provides both novice and expert researchers immediate access to a variety of online texts and time-coded data. This paper explores the applications of these corpora in the analysis of academic word lists, in particular, Coxhead's
more » ... ar, Coxhead's (2000) Academic Word List (AWL). Coxhead (2011) has called for further research on the AWL with larger corpora, noting that learners' use of academic vocabulary needs to address for the AWL to be useful in various contexts. Results show that words on the AWL are declining in overall frequency from 1990 to the present. Implications about the AWL and future directions in corpus-based research utilizing mega-corpora are discussed. ES La creación de megacorpus basados en Internet, tales como el Corpus of Contemporary American English (COCA), el Corpus of Historical American English (COHA) (Davies, 2011a) y el Visor de Ngramas de Google (Cohen, 2010), anuncian una nueva fase en la investigación basada en corpus, pues proporcionan, tanto a investigadores noveles como a expertos, un acceso inmediato a una gran diversidad de textos online y datos codificados con time-code. Este artículo explora las aplicaciones de estos corpus en el análisis de listas de vocabulario académico, en particular, Coxhead's (2000) Academic Word List (AWL). Coxhead (2011) hizo patente la necesidad de seguir investigando las aplicaciones del AWL con corpus más amplios, al apuntar a que el uso de vocabulario académico por parte de los aprendices necesita ser considerado para que el AWL sea útil en diferentes contextos. Los resultados muestran que la frecuencia de uso general de las palabras contenidas en el AWL está disminuyendo desde 1990. Asimismo, se tratan los efectos de esta tendencia en el AWL y las futuras líneas de investigación de estudios que utilizan megacorpus.
doi:10.21283/2376905x.1.4 fatcat:7immdiacibao7ghyu7d3rld5ye