Desarrollo de un nuevo método computacional para discriminar taxonómicamente las secuencias de virus generadas por tecnologías de secuenciación masiva de ADN para estudios de metagenómica

ELIZABETH CADENAS CASTREJON

Desarrollo de un nuevo método computacional para discriminar taxonómicamente las secuencias de virus generadas por tecnologías de secuenciación masiva de ADN para estudios de metagenómica

dc.rights.license	http://creativecommons.org/licenses/by-nc/4.0 - Atribución-NoComercial	es_MX
dc.contributor	LORENA DIAZ GONZALEZ	es_MX
dc.contributor.author	ELIZABETH CADENAS CASTREJON	es_MX
dc.contributor.other	director - Director	es_MX
dc.coverage.spatial	MEX - México	es_MX
dc.date	2023-01-17
dc.date.accessioned	2023-04-21T15:17:32Z
dc.date.available	2023-04-21T15:17:32Z
dc.identifier.uri	http://riaa.uaem.mx/handle/20.500.12055/3570
dc.description	Los virus son agentes microscópicos acelulares que requieren una célula hospedera para sobrevivir. Estos pueden infectar a todas las formas de vida en la Tierra, incluyendo los tres dominios de la vida, eucaria, bacteria y arquea. Los virus han causado algunas de las enfermedades más dramáticas y mortales en la historia humana. Sin embargo, la detección de virus permaneció muy limitada hasta el desarrollo de la metagenómica, la cual es el estudio de los fragmentos de secuencias del genoma de todos los diferentes microorganismos presentes en una muestra que se recupera directamente de un ambiente u hospedero. Los estudios metagenómicos han sido posibles gracias a las tecnologías de secuenciación de nueva generación (NGS; Next-Generation Sequencing), las cuales permiten obtener las secuencias de ADN de todos los ácidos nucleicos presentes en una muestra, generando grandes volúmenes de datos. Estos requieren ser analizados con métodos formales de computación; uno de los análisis es la clasificación taxonómica. La mayoría de los métodos existentes para este tipo de análisis se enfocan en la clasificación de secuencias bacterianas. Las herramientas encargadas de la clasificación de virus tienen una baja sensibilidad, debido a: i) La poca abundancia de las secuencias virales, ya que estas solo representan del 1% al 5% del ADN total obtenido de una muestra. ii) No existen genes marcadores universales, como en las bacterias, que permitan caracterizarlos fácilmente. iii) La mayoría (usualmente, entre el 60% y 99%) de las secuencias de virus obtenidas en cualquier ambiente no tienen similitud con otras secuencias en las bases de datos (BD) de referencia. Aunado a esto, el tiempo de procesamiento generalmente es muy costoso. Con los problemas antes mencionados y aunado al aumento de datos metagenómicos, se han iniciado el uso de nuevas técnicas que sean capaces de trabajar con un gran conjunto de información y encontrar patrones de ellos, como lo son las redes neuronales profundas. El objetivo de este proyecto fue desarrollar un nuevo método computacional que permite discriminar (clasificar) taxonómicamente las lecturas cortas de ADN de virus generadas por tecnologías de secuenciación masiva de ADN para estudios de metagenómica. El método desarrollado considera casi todas las familias virales definidas hasta enero del 2020 (169 para la información de NCBI nt y 127 para RefSeq) e incluye los virus que no pertenecen a ninguna familia viral, es decir, no tiene definida una asignación taxonómica a nivel familia. Dicho método realiza una clasificación a nivel nucleótido e identifica a qué familia pertenecen las secuencias mediante el uso de una red neuronal de convolución (en inglés Convolution Neural Networks, CNN), las cuales son un tipo de red neuronal profunda que identifica patrones en la información, comparte parámetros y reducen la dimensionalidad.	es_MX
dc.format	pdf - Adobe PDF	es_MX
dc.language	spa - Español	es_MX
dc.publisher	El autor	es_MX
dc.rights	embargoedAccess - En Embargo	es_MX
dc.subject	2 - BIOLOGÍA Y QUÍMICA	es_MX
dc.subject.other	23 - QUÍMICA	es_MX
dc.title	Desarrollo de un nuevo método computacional para discriminar taxonómicamente las secuencias de virus generadas por tecnologías de secuenciación masiva de ADN para estudios de metagenómica	es_MX
dc.type	doctoralThesis - Tesis de doctorado	es_MX
uaem.unidad	Centro de Investigación en Ciencias (CInC) - Instituto de Investigación en Ciencias Básicas y Aplicadas (IICBA) - Centro de Investigación en Ciencias (CInC) - Instituto de Investigación en Ciencias Básicas y Aplicadas (IICBA)	es_MX
uaem.programa	Doctorado en Ciencias - Doctorado en Ciencias	es_MX
dc.type.publication	acceptedVersion	es_MX
dc.audience	researchers - Investigadores	es_MX
dc.date.embargoed	2024-07-01
dc.date.received	2023-03-15

Files in this item

Name:: CACESL05T.pdf
Size:: 10.32Mb
Format:: PDF
Description:: Tesis

This item appears in the following Collection(s)

Colección Tesis Posgrado [2885]
Se trata de tesis realizadas por estudiantes egresados de programas de posgrado de nuestra institución.

Show simple item record