Motivación: Con el advenimiento de la industria 4.0 el volumen de información en formato de texto semiestructurado que manejan los sistemas informáticos es inmenso. Por lo cual, se necesitan de técnicas que automaticen el tratamiento de esa información. En este marco, los avances de la AI y en particular del NLP permiten sacar provecho proveyendo técnicas de identificación de similitud, extracción de información y búsqueda de respuesta a preguntas. Estas técnicas son generales y deben ser ajustadas y combinadas en función de las necesidades puntuales. Algunas caracterÃsticas a considerar son longitud de los textos y tema del que tratan. Objetivos: El objetivo de este proyecto es realizar pruebas de concepto de diferentes técnicas de NLP y AI con el fin de poder identificar similitudes y diferencias (similarities), poder categorizar textos (categorization) y extraer información precisa (information extraction), como asà también obtener respuestas a preguntas (questioning and answering). Resultado esperado (prototipo que se va a mostrar en la Expo-Ciencia 2025): Este proyecto es una continuación del proyecto de NLP en especificaciones técnicas que se viene desarrollando desde el año 2020. Durante este tiempo, se ha desarrollado un prototipo el cual permite editar texto y realizar ciertas tareas (comprobar el estilo de redacción, extraer información, comparar artefactos por similaridad, etc.). En este proyecto, se espera extender la herramienta conforme a los objetivos mencionados.
Juliana Delle Ville, Gabriela Perez, Leandro Antonelli
Facultad de Informática, UNLP.