Número 112 / Diciembre 2004

Profesores Invitados

Forjadores del II


Para cualquier duda, pregunta,
comentario o contribución a la gacetilla, favor de enviarlo a: gacetilla@pumas.iingen.unam.mx



Eventos del Instituto

Corpus de ingeniería y sus herramientas

Corpus de ingeniería y sus herramientas fue el tema expuesto por Alfonso Medina, Gabriel Garduño y Roberto Saldaña, durante el 2º Seminario de Ingeniería Lingüística.

En su exposición hablaron de la gran cantidad de textos relacionados con ingeniería, ordenados generalmente en subáreas según de su aplicación, pero que carecen de las herramientas para albergar dicha información y poder generar datos para describir cada área.

De hecho la creación del Corpus Lingüístico de Ingeniería nos brinda la oportunidad de estudiar y observar cuestiones relacionadas con el conocimiento de los expertos en este tema, lo que permite analizar la estructura léxica, morfológica y gramatical del lenguaje utilizado en esta área. Así como la elaboración de las herramientas de análisis para operar el corpus y explorar su utilidad en el desarrollo de investigaciones concernientes a las áreas de ingeniería, ingeniería lingüística y lingüística.

Esperamos que el desarrollo de estas herramientas beneficie a los investigadores en sus labores cotidianas y al público en general. La explotación del corpus para investigaciones terminográficas servirá de apoyo para quienes encuentran difícil la redacción de sus artículos, ya que les proporcionará modelos de escritura y estilo.

Entre los resultados obtenidos con la elaboración del corpus de ingeniería y sus herramientas se encuentran la compilación de un corpus de textos electrónicos, el desarrollo de una base de datos bibliográfica y de una herramienta que ayudará en el marcaje semiautomático de los documentos, elaborada por medio de macros en Word, la implementación de un programa en Python que ayudará en la transformación de los documentos que tienen un formato HTML a nuestro formato XML y en el diseño e implementación de las herramientas de análisis del mismo corpus.