Nueva herramienta de inteligencia artificial para identificar proteínas virales eucariontes en datos metagenómicos

ALIDA ESMERALDA ZARATE JIMENEZ

Resumen Esta tesis aborda la compleja tarea de identificar virus en datos metagenómicos obtenidos de diversas fuentes biológicas, tales como reservorios animales, muestras ambientales y el cuerpo humano. Los métodos tradicionales de identificación viral enfrentan grandes desafíos debido a la extensa diversidad, la falta de genomas de referencia para muchas especies virales y la rápida evolución de los genomas virales. En respuesta, la investigación reciente ha incrementado el uso de técnicas de inteligencia artificial (IA) para mejorar la precisión y eficiencia en la detección de virus. Sin embargo, los enfoques actuales basados en IA son predominantemente clasificadores binarios, lo que limita la especificidad en la identificación de tipos virales, es decir, la capacidad del modelo para distinguir entre familias, géneros o funciones proteicas, y a menudo estos clasificadores binarios, dependen exclusivamente de datos de secuencias de nucleótidos. Para superar estas limitaciones, esta tesis presenta VirDetect-AI, una herramienta innovadora diseñada específicamente para identificar virus eucariontes en conjuntos de datos metagenómicos. VirDetect-AI emplea una arquitectura avanzada que combina redes neuronales convolucionales (CNNs) y redes neuronales residuales (ResNets), lo cual permite la extracción de características jerárquicas y patrones complejos a partir de datos genómicos de aminoácidos. El modelo muestra un rendimiento sobresaliente en las métricas de evaluación, alcanzando una sensibilidad de 0.97, una precisión de 0.98 y una puntuación F1 de 0.98. Este avance mejora nuestra comprensión de la ecología viral al clasificar con precisión las secuencias metagenómicas en 980 clases de proteínas virales, que abarcan una amplia variedad de géneros virales, familias, funciones de proteínas e información del hospedero. En consecuencia, VirDetect-AI tiene un gran potencial para descubrir nuevos virus, facilitando avances en la taxonomía viral, la monitorización ecológica y la vigilancia de la salud pública.

Tipo de documento: Trabajo de grado, doctorado

Formato: Adobe PDF

Audiencia: Público en general

Idioma: Español

Área de conocimiento: INGENIERÍA Y TECNOLOGÍA

Campo disciplinar: CIENCIAS TECNOLÓGICAS

Nivel de acceso: Acceso Abierto

Colecciones: