portico

Programa de Lingüística y Ciencia Cognitiva

Investigación


                        

 

Grupo de Investigación en Lingüística Computacional y Procesamiento de Lenguas Naturales

(GILC-NLP)

La investigación es un componente esencial en el desarrollo de toda disciplina científica. Con este propósito, el Programa de Lingüística y Ciencia Cognitiva auspicia el Grupo de Investigación en Lingüística Computacional y Procesamiento de Lenguas Naturales (GILC-NLP), en el que estudiantes graduados y subgraduados, así como profesores e investigadores de especialidades afines colaboran en proyectos de investigación de lingüística teórica y computacional, procesamiento de lenguas naturales, ciencia cognitiva e inteligencia artificial. Algunas de las áreas de investigación de proyectos desarrollados y de interés en el GILC-NLP son:

• Formalización y modelación computacional de teorías gramaticales (gramáticas de anexión de árboles (TAGs), gramáticas minimalistas, morfología distribuida,…)

• Arquitectura y propiedades formales de componentes de la facultad de lenguaje de acuerdo con la jerarquía de Chomsky (regularidad y subregularidad, recursividad,…)

• Semántica de cuantificadores, construcciones modales y monotonicidad

• Diseño e implementación de analizadores estructurales (parsers) morfológicos y sintácticos (simbólicos, probabilísticos, híbridos)

• Corpus etiquetado(s) con oraciones ambiguas y oraciones no gramaticales que cumpla(n) supuestos estadísticos realistas en inglés o en español.

• Sistemas computacionales de composición semántica e inferencia textual (entailment)

• Análisis pragmático de corpus textuales (cooperación, sentimiento [sentiment], …)

• Aproximación data-céntrica de inteligencia artificial para construcción de corpus con ambigüedad léxica y estructural.

• Aplicación de redes neuronales artificiales y aprendizaje profundo en sistemas de procesamiento de lenguas naturales (etiquetaje, dependencias, análisis estructural…) que indiquen análisis alternativos con sus respectivas probabilidades (likelihood) cuando haya ambigüedad, o indique agramaticalidad con su plausibilidad (likelihood), todo a base de algoritmos de aprendizaje. 

Los productos de varios proyectos del GILC-NLP han resultado en tesis graduadas o han sido publicados y presentados en congresos internacionales.

Como fruto de colaboración interdisciplinaria, el GILC-NLP ha estado activo desde 2012 bajo la supervisión de:

•  J. Fernando Vega-Riveros (ICOM)

•  Hilton Alers-Valentín (LING)

•  Nayda G. Santiago (ICOM)

Actualmente, el GILC-NLP estará trabajando principalmente en el proyeco HASPNeL (Hybryd-Architecture Symbolic Parser and Neural Lexicon) para desarrollar un sistema de analizador sintáctico y una base de datos léxica (lexicón), con una arquitectura modular híbrida que combine métodos de inteligencia artificial simbólica y probabilística. El sistema deberá reconocer casos de ambigüedad estructural (el profesor dijo que había que entregar el informe ayer), produciendo tantos árboles sintácticos como interpretaciones tenga el enunciado. El lexicón se construirá a partir de un corpus, usando tanto etiquetaje manual de rasgos como aprendizaje automatizado. El analizador estructural implementará formalismos sintácticos y usará el lexicón para producir las representaciones arbóreas. La probabilidad de cada representación estructural será determinada mediante redes neuronales. Este sistema servirá también de modelo cognitivo para la facultad de lenguaje humano y podrá incorporar funcionalidades para composición semántica, inferencia textual y análisis estructural en otras lenguas naturales. Además, este sistema podría servir de base en el diseño de otras aplicaciones y tecnologías de lenguaje.

El GILC-NLP se reúne semanalmente en una tertulia informal durante el semestre los jueves de 4:30 a 6:30 pm en Stefani 105A (Zoom https://us02web.zoom.us/j/81440391372?pwd=RjU5aGIwdzhvTGRKcENEV2RLcFl4dz09para mantenernos al corriente de los trabajos de los diferentes equipos de investigación, intercambiar ideas y compartir un buen rato de café y camaradería. Todo miembro interesado de la comunidad académica está cordialmente invitado a asistir a cualquiera de las reuniones sin compromiso alguno y, si así lo desea, a participar en alguno de los proyectos.

 

 

      

 

Centro de Investigaciones Lingüísticas del Caribe (CILC)

El Departamento de Estudios Hispánicos del Recinto Universitario de Mayagüez cuenta además con el Centro de Investigaciones Lingüísticas del Caribe (CILC). Su visión es desarrollar actividades formativas y de investigación en lingüística general, con mayor énfasis en lingüística teórica. Esta integrado por investigadores que trabajan en distintos campos de lingüística formal, principalmente en fonología, sintaxis, semántica y pragmática, así como en sus interfaces y sus procesos de adquisición, y en psicolingüística y análisis del discurso.