Taller práctico sobre la anotación sintáctica de corpus para las lenguas indígenas de las Américas
11 de noviembre del 2021
Universidad Nacional Autónoma de México
San Cristóbal de las Casas, Chiapas, México.
Organizado por:
- Francis M. Tyers, Universidad de Indiana, Bloomington, EEUU
- Robert Henderson, Universidad de Arizona, Tucson, EEUU
Durante los últimos años, se ha aumentado el uso de los bancos de árboles sintácticos en la investigación lingüística y en el procesamiento de lenguaje natural. Los bancos de árboles sintácticos son un tipo de corpus que contiene tanto el texto e información morfológica como anotación sintáctica en la forma de árboles. Para producir un corpus de este tipo se necesita un sistema de anotación que rige la estructura sintáctica de cada construcción lingüística. Invitamos a todos los interesados a participar en este taller práctico, donde introduciremos las bases lingüísticas de la anotación sintáctica basada en Universal Dependencies, un proyecto internacional que tiene anotados más de 150 corpus para más de 100 lenguas. El taller estará dividido en dos partes, por la mañana habrá charlas para introducir el sistema y por la tarde enseñaremos cómo anotar un corpus a partir de cero y resolver dudas concretas sobre el análisis de las lenguas presentes.
Audiencia:
El curso está dirigido a hablantes e investigadores de lenguas indígenas de las Américas que se interesan por crear recursos para el procesamiento computacional de sus lenguas. No es necesario ninguna experiencia previa, pero será útil tener conocimientos de los fundamentos de la lingüística. Será necesario disponer de una computadora portátil. Se recomienda a los participantes que no tengan sus propias computadoras portátiles ponerse en contacto con los organizadores para que podamos hacer otros preparativos.
Temario:
- Teoría de la anotación: morfología y sintaxis de dependencias
- Recopilación y procesamiento de corpus de textos
- Elaboración de directrices de anotación
- Aplicación de directrices de anotación a las lenguas indígenas de las Américas
Programa preliminar:
Hora | Tema |
---|---|
09:00-09:30 | Introducción a Universal Dependencies |
09:30-10:30 | Morfología |
10:30-10:45 | Pausa |
10:45-11:45 | Sintaxis |
11:45-12:30 | Investigación lingüística |
12:30-13:00 | Diseño de proyectos de anotación |
13:00-14:00 | Hora de comida |
14:00-18:00 | Trabajo práctico: Anotación |
19:00-21:00 | Evento social |
Fechas importantes:
- Fecha límite de la inscripción: 23 de agosto del 2021
- Envío de notificaciones: 1 de septiembre del 2021
Inscripción:
La inscripción es gratis para todos los participantes. Por favor rellenar el formulario de inscripción antes de la fecha límite.
Becas:
Hay becas de participación con alojamiento incluido para estudiantes indígeno/as. Las becas consisten en $100 (USD) para transporte para participantes que vienen de México y $200 (USD) para los que vienen de fuera.
Alojamiento:
Hotel Parador Margarita,
Calle Doctor José Felipe Flores No. 39,
Barrio de Guadalupe,
San Cristóbal de las Casas
29200 México
Agradecimientos:
Este taller fue financiado por el Fondo Regional de las Américas de la Asociación de Lingüística Computacional de Norteamérica (NAACL). La foto principal está © 2005 Tjeerd Wiersma bajo licencia CC-BY 2.0.