Identificación de factores asociados a la letalidad por COVID-19 en México mediante el aprendizaje automático

ALEJANDRO CARVANTES BARRERA

La pandemia por COVID-19 ha tenido un fuerte impacto en la vida cotidiana de la sociedad a nivel global. Por esta razón, surge un fuerte interés por hacer uso de aprendizaje máquina y algoritmos de inteligencia artificial para analizar información de conjuntos de datos con registros de pacientes de COVID-19. En México, para el 15 de abril del 2022, se han reportado 5,737,475 casos positivos, de los cuales, 681,357 fueron hospitalizados y 324,670 fallecieron. Existen diversos estudios análisis epidemiológicos y aplicación de herramientas de aprendizaje automático a nivel global y nacional, entre ellos se encuentran los que buscan identificar factores de riesgo para pacientes de COVID-19 haciendo uso de la técnica SHAP. El objetivo de esta técnica es explicar el resultado obtenido de un modelo de aprendizaje máquina. Es así como se puede conocer el impacto de cada variable en el resultado obtenido por un modelo, a este impacto se le denomina ‘valor de SHAP’. Entonces, analizando estos valores se pretende identificar los factores de riesgo al padecer COVID-19. Sin embargo, trabajos de esta naturaleza en México no son comunes. Este panorama proporciona una oportunidad para identificar factores de riesgo que pudieran estar asociados a la letalidad. En particular, esta metodología se implementó utilizando la base de datos del gobierno federal de México para alimentar modelos computacionales basados en aprendizaje máquina y finalmente calcular los valores de SHAP de dichos modelos. Además, este análisis se aplicó a cada ola epidemiológica habida en México para abordar la oportunidad de analizar el conjunto de datos por olas epidemiológicas. En este contexto, este trabajo presenta una serie de modelos de predicción binaria para la defunción en pacientes con COVID-19 basado en XGBoost. Posteriormente, estos modelos son explicados por medio de SHAP, obteniendo así los valores de SHAP para cada variable, con los cuales se puede llevar a cabo la identificación de factores de riesgo de letalidad. Las variables más importantes en la predicción de la defunción en los pacientes fueron la neumonía y la edad avanzada, las cuales aumentaron el riesgo de fallecer. Con una considerable menor importancia se encontró que los casos registrados en el Instituto Mexicano del Seguro Social (IMSS) presentaron un mayor riesgo de fallecer durante las primeras cuatro olas epidemiológicas de la pandemia. Por el contrario, casos registrados en la Secretaría de Salud de México (SSA) presentaron un menor riesgo de fallecer. Del mismo modo, el pertenecer al género femenino y tener entre 18 a 29 años redujo el riesgo de fallecer al padecer COVID-19. La comorbilidad más notable fue la diabetes y el haber sido intubado en etapas tempranas de la pandemia elevó el riesgo de defunción de manera importante.

Tipo de documento: Tesis de maestría

Formato: Adobe PDF

Audiencia: Investigadores

Idioma: Español

Área de conocimiento: INGENIERÍA Y TECNOLOGÍA

Campo disciplinar: CIENCIAS TECNOLÓGICAS

Nivel de acceso: Acceso Abierto