Ir al contenido

Un corpus de referencia ha de ser lo suficientemente extenso para representar todas las variedades relevantes de una lengua. En la versión 3.2, cerrada en junio de 2008 y consultable en la actualidad, la parte escrita del CREA cuenta con casi 140 000 documentos y algo más de 154 millones de formas procedentes de textos de todos los países hispánicos y producidos entre 1975 y 2004.

Uso

corpus_rae

Formato

Un data.frame con 3 variables

Fuente

https://www.rae.es/recursos/banco-de-datos/crea-escrito

Orden

formas ortográficas registradas en el CREA

Frec.absoluta

frecuencia absoluta de la palabra

Frec.normalizada

frecuencia normalizada de la palabra