Generación automática de resúmenes basada en representaciones embebidas y optimización multiobjetivo

YANET FORS ISALGUEZ

Resumen La tarea de generacion automatica de resumenes contribuye a mejorar el manejo del creciente exceso de informacion digital existente. Se han propuesto muchas soluciones a la tarea desde la perspectiva de la optimizacion de una funcion de un solo objetivo, para encontrar encontrar el optimo global. Esta es una meta poco realista ya que cuando se consideran multiples objetivos, una solucion que optimiza uno de los objetivos puede inducir el efecto contrario en los demas. Recientemente se han propuesto otras soluciones que involucran objetivos multiples y en con icto, pero que eventualmente se agregan en una funcion lineal, lo que resulta en un problema de optimizacion de un solo objetivo. Ademas, a menudo se utiliza un modelo tpico de bolsa de palabras y se ha hecho poco esfuerzo para incluir las relaciones semanticas entre oraciones para mejorar el rendimiento. En el presente trabajo de tesis se propone un modelo para la generacion automatica de resumenes multidocumentos orientados a consultas. La investigaci on se centra en las formas de representacion de palabras y oraciones que capturen mayor informacion semantica, en particular las representaciones embebidas. Se recomienda el uso de un metodo de representacion de oraciones modeladas como subespacios y que es aplicado por primera vez en una tarea de resumenes. Tambien se plantea abordar la tarea como un problema de optimizaci on multiobjetivo donde se necesitan optimizar ciertos aspectos tales como: maximizar la relevancia y minimizar la redundancia y longitud del resumen. En general propone un metodo novedoso para el resumen orientado a consultas como un problema de optimizacion multiobjetivo que tiene en cuenta el frente de Pareto y se basa en una representacion embebida de oraciones. Los resultados experimentales muestran que el enfoque contribuye a mejorar el rendimiento en la tarea de resumenes. Segun el conocimiento de los autores, el metodo es el primer intento de incluir representaciones embebidas de oraciones en una solucion de optimizacion multiobjetivo, que aplica el enfoque de Pareto al resumen orientado a consultas.

Tipo de documento: Tesis de doctorado

Formato: Adobe PDF

Audiencia: Investigadores

Idioma: Español

Área de conocimiento: INGENIERÍA Y TECNOLOGÍA

Campo disciplinar: CIENCIAS TECNOLÓGICAS

Nivel de acceso: Acceso Abierto