PuertoTex: un software de minería textual para la creación de resúmenes automáticos en el dominio de ingeniería de puertos y costas basado en ontologías

Autores

  • Amed LEIVA-MEDEROS
  • Sandor DOMÍNGUEZ-VELASCO
  • Jose Antonio SENSO

Palavras-chave:

Autómatas, Desambiguación de textos científicos, Minería de texto, Ontologías, Resumen automático

Resumo

El objeto de este trabajo es elaborar y evaluar los resultados de la implementación de un software basado en ontologías, capaz de generar resúmenes automáticos en el campo de la Ingeniería de Puertos y Costas. Para el desarrollo de la herramienta se emplean diversas técnicas emanadas del análisis de discurso así como técnicas cognitivas, que permiten generar reglas para el tratamiento de los textos. También se apela a la construcción de una ontología que facilite los procesos de etiquetado a partir de las potencialidades de Resource Description Framework y Extensible Makup Language. Se construye un conjunto de agentes que actúa sobre la ontología, de la cual se declaran sus principales elementos. Como producto generado se presenta Puertotex, un software para la construcción de resúmenes automáticos basado en ontologías. La evaluación de los resúmenes generados refleja
la calidad del sistema, que tiene como única limitación su capacidad para trabajar con el dominio objeto de investigación.

Downloads

Não há dados estatísticos.

Referências

AGUIRRE, E. Formalization of concept-relatedness using ontologies: applications in the construction of lexical knowledge bases, word sense disambiguation and automatic spelling correction. 1998. Tesis (Doctoral) - Universidad de País Vasco, San Sebastián, 1998.

D’CUNHA, I. Hacia un modelo lingüístico de resumen automático de artículos médicos en español. 2006. Tesis (Doctoral) - Universidad Pompeu Fabra, Barcelona, 2006.

DIJK, T.; KINTSCH, W. Strategies of discourse comprehension. Orlando: Academic, 1983.

DOMÍNGUEZ, S. Calculus copora. Santa Clara: Universidad Central Marta Abreu de las Villas, 2011.

ENDRES-NIGGEMEYER, B. Simsum: an empirically founded simulation of summarizing. Information Processing and Management, v.36, n.4, p.659-682, 2005.

ENDRES-NIGGEMEYER, B.; MAIRE, E.; SIGEL, A. How to implement a naturalistic model of abstracting: four core working steps of an expert abstractor. Information Processing & Management, v.31, n.5, p.631-674, 1995.

FABER, P.; MÁRQUEZ, C.; VEGA, M. Framing terminology: a process-oriented approach. Meta, v.50, n.4, p.189-213, 2005.

HERNÁNDEZ, A. Indización y resumen. La Habana: Universidad de la Habana, 2006.

HERNÁNDEZ, A. Organización y representación del conocimiento: paradigmas, hipertextos y fundamentación metamodélica. 2007. Tesis (Doctoral Bibliotecología y Ciencia de la Información) - Universidad de la Habana, La Habana, 2007a.

HERNÁNDEZ, A Paradigmas dominantes de la representación de la información y el conocimiento. La Habana: Universidad de la Habana, 2007b.

HERRERA, R. Formatos de comunicación. 2007. Disponible en: <http://fcom.uh.edu.cu>. Acceso en: 16 jul. 2011.

LEIVA, A. et al. An automat for the semantic processing of structured information. In: INTERNATIONAL CONFERENCE OF DESING OF SOFTWARE AND APLICACTIÓN, 9., 2009, Pisa, Italy. Proceedings… Pisa: IEEE, 2009. p.85-89.

LIN, C.; HOVY, E. Automatic evaluation of summaries using n-gram co-ocurrence statistic. In: HUMAN TECHNOLOGYCONFERENCE, 2003, Edmonton, Canada. Proceedings… Edmonton, Canada: HLT-NAACL, 2003. p.71-78.

LUNH, H. The automatic creation of literature abstracts. Journal of Research of Development, v.2, n.2, p.59-165, 1958.

MANCHÓN, E. Evaluación por criterios o heurística. 2002. Disponible en: <http://www.ainda.info/evaluacion_heuristica. html>. Acceso en: 1 enero 2011.

MANN, W.; THOMPSON, S. Rhetorical structure theory: a theory of text organization. Los Angeles: Information Sciences Institute, 1990.

MATHIS, B.; RUSH, J.; YOUNG, C. Improvement of automatic abstracts by the use of structural analysis. Jounal of the American Sciety for Information Science, v.24, n.2, p.101-109, 1973.

METZELTIN, M. De la retórica al análisis del discurso. Revista Electrónica de Estudios Filológicos, n.6, 2003. Disponible en: <http://www.tonosdigital.es/ojs/index.php/tonos/article/view/506>. Acceso en: 1 marzo 2012.

NIELSEN, J. Heuristic evaluation. In: NIELSEN, J.; MACK, R. (Ed.). Usability inspection methods. New York: John Wiley 1994. p.25-52.

NIELSEN, J. How to conduct a heuristic evaluation. 2002a. Available from: <http://www.useit.com/papers/heuristic/heuristic_evaluation.html>. Cited: 26 Jan. 2011.

NIELSEN, J. Ten usability heuristics. 2002b. Available from: <http://www.useit.com/papers/heuristic/heuristic_list.html>. Cited: 21 Jan. 2011.

ONO, K.; SUMITA, K.; MIIKE, S. Abstract generation based on rhetorical structure extraction. In: INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS, 15., 1994, Kyoto, Japan. Proceedings… Kyoto, Japan: DBLP, 1994.

PANECA, F. La prensa remediana del siglo XIX: reflejo de la cultura popular tradicional de la localidad. 2009. Tesis (Doctoral) - Facultad de Humanidades, Universidad Central Marta Abreu de las Villas, Santa Clara, 2009.

PILLEUX, M. Competencia comunicativa y análisis del discurso. Estudios Filológicos, n.36, p.143-152, 2001. Disponible en: <http://www.scielo.cl>. Acceso en: 1 marzo 2012.

PINTO, M. El resumen documental: principios y métodos. Madrid: Fundación Germán Sánchez Ruipérez, 2001.

PINTO, M. Interdisciplinary approaches to the concept and practice of written text documentary content analysis. Journal of Documentation, v.50, n.2, p.405-418, 2004.

RIGAU, G. Resolución automática de la ambigüedad semántica de palabras. Soria, España: Fundación Duques de Soria, 2002.

SALTON, G. On the application of syntactic methodologies in automatic text analysis. Information Processing and Management, v.26, p.73-92, 1996.

SÁNCHEZ-CUADRADO, S. et al. Definición de una metodología para la construcción de sistemas de organización del conocimiento a partir de un corpus documental en lenguaje natural. Procesamiento del Lenguaje Natural, n.39, p.213-220, 2007.

SENSO, J. Representación del conocimiento en la ingeniería de puertos y costas: proyecto investigador. Granada, España: Universidad de Granada, 2009.

SIDOROV, G.; ZAZUETA, O.O. Resolución de anáfora pronominal para el español usando el método de conocimiento limitado. In: ENCUENTRO NACIONAL DE CIENCIAS DE LA COMPUTACIÓN, 7., 2006, San Luís Potosi, Mexico. Anales… San Luís Potosi, Mexico: SMCC, 2006. p.276-281.

Downloads

Publicado

25-05-2012

Como Citar

LEIVA-MEDEROS, A. ., DOMÍNGUEZ-VELASCO, S. ., & SENSO, J. A. . (2012). PuertoTex: un software de minería textual para la creación de resúmenes automáticos en el dominio de ingeniería de puertos y costas basado en ontologías. Transinformação, 24(2). Recuperado de https://seer.sis.puc-campinas.edu.br/transinfo/article/view/6157

Edição

Seção

ARTIGOS