Título: | Ingeniería de características para el análisis de grandes datos |
Alumno: | Milagros Jacinto |
Inicio: | 1 Abril 2022 |
Fecha de defensa: | 31 Marzo 2023 |
Dirección: | Pons, Claudia Fabiana |
Co-Dirección: | Gabriela Pérez |
Participantes (del LIFIA) | Gabriela Perez, Claudia Pons |
La ingeniería de características (o en inglés, Feature engineering) juega un papel clave en el análisis de grandes datos (big data analytics). Los algoritmos de aprendizaje automático y minería de datos no pueden funcionar sin datos. Se puede lograr poco si hay pocas características para representar los objetos subyacentes, y la calidad de los resultados de esos algoritmos depende en gran medida de la calidad de las características disponibles. La ingeniería de características se ocupa de satisfacer las necesidades de generar y seleccionar una representación de datos eficaz. Objetivos generales e hipótesis: Quedan por descubrir muchos métodos eficaces de generación de características y muchos métodos automáticos de ingeniería de características. Incluso los temas de investigación tradicionales, como la selección de características y el análisis de características, deben volver a verse desde nuevas perspectivas. Hay muchas formas de generar características y, por lo tanto, los métodos de selección y evaluación de características deben manejar esta alta dimensionalidad. Más importante aún, los métodos tradicionales de selección y evaluación de características se limitan principalmente a problemas de clasificación y regresión. Existe la necesidad de desarrollar nuevos métodos de selección y evaluación de características para otras tareas de análisis de datos, como agrupamiento, detección de valores atípicos, minería de patrones, clasificación de características, recomendación, etc. Por último, queda mucho por hacer para transformar la ingeniería de características de un arte a una disciplina de ingeniería madura. Objetivos específicos: Desarrollaremos conceptos y técnicas útiles de ingeniería de características, en los siguientes escenarios: (a) generar características para representar los datos cuando no hay características, (b) generar características efectivas cuando (uno puede estar preocupado que) las características existentes son no es lo suficientemente buenas / competitivas, (c) seleccionar características cuando hay demasiadas características, (d) generar y seleccionar características efectivas para tipos específicos de aplicaciones, y e) comprender los desafíos asociados con, y los enfoques necesarios para manejar, diversos tipos de datos.
Técnicas de Inteligencia Artificial Neuro-simbólica. Financiado por Comisión de Investigaciones Científicas y Facultad de Informática y Universidad Abierta Interamericana. Dirigido por Claudia Pons. CoDirigido por Roxana Giandini. Duración: 1/1/2019-31/12/2023