Herramienta computacional para la caracterización de matrices CRISPR

EDNA CRUZ FLORES

Resumen Los bacteriófagos o fagos, virus que infectan a las bacterias, son considerados como una potencial herramienta para modular a las comunidades de bacterias, ya sea confiriéndoles ventajas de supervivencia o disminuyendo su población e incluso para erradicarlas. Una de las limitantes para estas aplicaciones es el poco conocimiento de las interacciones infecciosas entre los bacteriófagos y sus bacterias hospederas. Algunos de los enfoques hacen uso de los espaciadores CRISPR como señales de interacción para establecer las relaciones fago – bacteria hospedera, siendo un método muy prometedor. Sin embargo, las predicciones de interacciones a través de los espaciadores no han sido tan favorables (Dion et al., 2021; Edwards et al., 2016; Zhang et al., 2019) dado que los resultados están en función de las herramientas que se utilicen para la identificación del sistema CRISPR-Cas en las secuencias genómicas bacterianas. Así como también, en la homología encontrada entre los espaciadores con los bacteriófagos registrados en las bases de datos de referencia. En el presente trabajo, se planteó como objetivo desarrollar un modelo computacional basado en técnicas de aprendizaje profundo para la identificación de matrices CRISPR en secuencias de nucleótidos bacterianas, y que sea aplicado a la definición de interacciones bacteriófago – bacteria hospedera. El modelo computacional propuesto para la identificación de matrices CRISPR, obtuvo un 96.29% de exactitud, 96.00% de Precisión, Exhaustividad y Puntuación-F1 y 92.04% de Coeficiente de correlación de Mathews sobre el conjunto de prueba. Asimismo, el modelo fue usado en un caso real, caracterizando las matrices CRISPR de la bacteria Actinoalloteichus sp. AHMU CJ021. Los resultados mostraron que se identificaron 1,135 matrices CRISPR con un umbral definido como de mayor certeza, además de otras 1,198 matrices con un segundo umbral, el cual es menos restrictivo. Finalmente, se realizó la extracción de las subsecuencias espaciadoras de las matrices y se les buscó similitud mediante alineamiento con los genomas de bacteriófagos anotados en la base de datos de NCBI Virus. El 47.52% y el 30.23% de los espaciadores en el umbral de “estructuras CRISPR confiables” y en el umbral de “estructuras CRISPR potenciales” respectivamente, encontraron su homólogo con su potencial protoespaciador en los bacteriófagos de la BD. Siendo esta información la que permitió la identificación de las posibles relaciones de interacción. El resto de los espaciadores sin homólogos podrían pertenecer a fragmentos de secuencias de ADN de nuevos fagos aún no han sido identificados.

Tipo de documento: Tesis de maestría

Formato: Adobe PDF

Audiencia: Investigadores

Idioma: Español

Área de conocimiento: CIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA

Campo disciplinar: MATEMÁTICAS

Nivel de acceso: En Embargo