Level: Undergraduate

Identificación de propiedades biológicas en organismos utilizando técnicas de Machine Learning sobre secuencias de genoma completo

Timeline: Feb 2021 – Nov 2022

•

100% Progress

Thesis Abstract

El avance de la tecnología y los procesos de secuenciación de genomas de las últimas décadas ha logrado poner al alcance de investigadores de todo el mundo grandes volúmenes de datos biológicos, que debido a su gran escala, los mismos resultan difíciles de analizar en su totalidad, por lo cual es intuitivo pensar en Inteligencia Artificial para trabajar con dicha información. Con el objetivo de disminuir la brecha existente entre el investigador y las herramientas de Inteligencia Artificial, se desarrolló un software que permite crear un espacio de trabajo para un organismo biológico, realizar el procesamiento de los genomas correspondientes y permitir la creación y entrenamiento de modelos de Machine Learning desde una interfaz gráfica. Los modelos entrenados luego se analizan para buscar qué patrones determinan el resultado de la propiedad biológica a investigar sobre el organismo biológico en cuestión, y así encontrar los genes de mayor impacto en las predicciones del modelo, permitiendo al investigador el posterior análisis en laboratorio de un gen deseado.

Thesis Profile

Student
Pablo Pizio / Nicolás Ferella
Career / Program
Licenciatura en Informática
Director
Claudia Pons
Co-Director
Dra. Josefina Campos
Thesis Completion Milestone
100%
Download Thesis Manuscript

Scientific Keywords

Keywords:

ADN ; Docker ; Genética ; Genoma ; Inteligencia artificial ; Machine Learning

#artificial intelligence
#ai-assisted development