DOI: https://doi.org/10.7203/caplletra.69.17270

Les eines computacionals i el disseny de corpus orals: un diàleg vigent


Resum


El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus.


Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissenyar un corpus oral, com ara el grau de detall en què és representat el fenomen oral, la segmentació del discurs, la convivència de diferents sistemes d’etiquetatge simultanis i les particularitats de l’anotació en un context bilingüe o multilingüe.


Paraules clau


corpus oral; anotació stand-off; anotació en línia; segmentació; etiquetatge morfològic

Text complet:

PDF (English)

Enllaços refback

  • No hi ha cap enllaç refback.


Contacte: infocaplletra@uv.es

Versió electrònica ISSN 2386-7159 / Versió impresa ISSN 0214-8188
Llicència internacional Creative Commons 4.0 BY-NC-ND

http://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-nc-nd.png