Les eines computacionals i el disseny de corpus orals: un diàleg vigent
DOI:
https://doi.org/10.7203/caplletra.69.17270Paraules clau:
corpus oral, anotació stand-off, anotació en línia, segmentació, etiquetatge morfològicResum
El disseny d’un corpus oral i els processos de registrar, codificar i tractar els materials per construir un recurs útil per a l’anàlisi lingüística, comporta nombroses decisions pel que fa a la teoria i la metodologia. Aquest article s’ocupa d’aquelles etapes de la construcció d’un corpus que més clarament estan condicionades pel processament informàtic necessari que ha de fer el corpus funcional. Per tal de conjugar les expectatives inicials i les possibilitats reals quan usem l’eina, cada característica que pretenem codificar ha de ser mesurada quant a la càrrega de treball que comporta i els mitjans que són requerits per fer-ho possible. Per això, és essencial tenir en compte els recursos disponibles a l’hora de processar i explotar el corpus, ja que tenen un impacte fonamental en les decisions pel que fa a la construcció del corpus.
Basat en l’experiència adquirida en la construcció del corpus ESLORA, l’article analitza alguns dels problemes que sorgeixen en el procés de dissenyar un corpus oral, com ara el grau de detall en què és representat el fenomen oral, la segmentació del discurs, la convivència de diferents sistemes d’etiquetatge simultanis i les particularitats de l’anotació en un context bilingüe o multilingüe.
Descàrregues
Descàrregues
Publicades
Com citar
-
Resum730
-
PDF 220
Número
Secció
Llicència
L’autor o autora que adrece un treball a la redacció de Caplletra perquè siga publicat ha de ser la persona titular legítima dels drets d'explotació. La legitimació per a la publicació del treball ha d’incloure també les imatges, les taules, els gràfics i altres materials que puguen complementar el text, amb independència de si n'és l'autor o autora.
Copyright. Quan publica el treball en la revista, l'autor o autora cedeix a Caplletra. Revista Internacional de Filologia els drets d'explotació (reproducció, distribució i comunicació pública), tant per a l'edició impresa en paper com per a la versió electrònica, que serà accessible mitjançant la xarxa Internet.
Tots els treballs publicats en Caplletra es troben sota una llicència Creative Commons del tipus Reconeixement-NoComercial-SenseObraDerivada 4.0.
RESPONSABILITAT
Caplletra. Revista Internacional de Filologia no s'identifica necessàriament amb els punts de vista mantinguts en els treballs que publica.
Caplletra. Revista Internacional de Filologia declina tota responsabilitat derivada de qualsevol vulneració eventual dels drets de propietat intel·lectual que poguera ser duta a terme pels autors o autores.