Construyendo un corpus oral para el gallego. El proyecto CORILGA
Abstract
The CORILGA (Corpus Oral Informatizado de la Lengua Gallega) is a corpus of recordings aligned with their transcription and annotated at different levels (spelling, phonetic, morphological, syntactic...). A complete and thorough recordings and participants data allows, through an online open search engine, to get very accurate search results. This information could be used in language variation and change studies and to create materials for teaching or developing speech technology. El CORILGA (Corpus Oral Informatizado da Lingua Galega) es un corpus de grabaciones alineadas con su transcripción y anotadas en distintos niveles (ortográfico, fonético, morfológico…). Una codificación completa y minuciosa de los datos de las grabaciones y de los informantes permite, mediante un buscador online abierto al público, conseguir unos resultados de búsqueda muy precisos. Esta información se podría utilizar para la realización de estudios de variación y cambio lingüístico, así como para crear materiales para la enseñanza o desarrollar tecnologías del habla.
Collections