Les eines computacionals i el disseny de corpus orals: un diàleg vigent

Autors/ores

DOI:

https://doi.org/10.7203/caplletra.69.17270

Paraules clau:

corpus oral, anotació stand-off, anotació en línia, segmentació, etiquetatge morfològic

Resum

El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus.

Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissenyar un corpus oral, com ara el grau de detall en què és representat el fenomen oral, la segmentació del discurs, la convivència de diferents sistemes d’etiquetatge simultanis i les particularitats de l’anotació en un context bilingüe o multilingüe.

Descàrregues

Les dades de descàrrega encara no estan disponibles.

Descàrregues

Publicades

07.10.2020

Com citar

Vázquez Rozas, V., & Barcala, M. (2020). Les eines computacionals i el disseny de corpus orals: un diàleg vigent. Caplletra. Revista Internacional De Filologia, (69), 221–240. https://doi.org/10.7203/caplletra.69.17270
Metrics
Views/Downloads
  • Resum
    730
  • PDF
    220

Número

Secció

ARTICLES MONOGRÀFIC

Metrics