Corpus
de ingeniería y sus herramientas
Corpus
de ingeniería y sus herramientas fue el tema expuesto
por Alfonso Medina, Gabriel Garduño y Roberto Saldaña,
durante el 2º Seminario de Ingeniería Lingüística.
En
su exposición hablaron de la gran cantidad de textos
relacionados con ingeniería, ordenados generalmente en
subáreas según de su aplicación, pero que
carecen de las herramientas para albergar dicha información
y poder generar datos para describir cada área.
De
hecho la creación del Corpus Lingüístico
de Ingeniería nos brinda la oportunidad de estudiar y
observar cuestiones relacionadas con el conocimiento de los
expertos en este tema, lo que permite analizar la estructura
léxica, morfológica y gramatical del lenguaje
utilizado en esta área. Así como la elaboración
de las herramientas de análisis para operar el corpus
y explorar su utilidad en el desarrollo de investigaciones concernientes
a las áreas de ingeniería, ingeniería lingüística
y lingüística.
Esperamos
que el desarrollo de estas herramientas beneficie a los investigadores
en sus labores cotidianas y al público en general. La
explotación del corpus para investigaciones terminográficas
servirá de apoyo para quienes encuentran difícil
la redacción de sus artículos, ya que les proporcionará
modelos de escritura y estilo.
Entre
los resultados obtenidos con la elaboración del corpus
de ingeniería y sus herramientas se encuentran la compilación
de un corpus de textos electrónicos, el desarrollo de
una base de datos bibliográfica y de una herramienta
que ayudará en el marcaje semiautomático de los
documentos, elaborada por medio de macros en Word, la implementación
de un programa en Python que ayudará en la transformación
de los documentos que tienen un formato HTML a nuestro formato
XML y en el diseño e implementación de las herramientas
de análisis del mismo corpus.