dc.rights.license | http://creativecommons.org/licenses/by-nc/4.0 - Atribución-NoComercial | es_MX |
dc.contributor | LORENA DIAZ GONZALEZ | es_MX |
dc.contributor.author | JAVIER ALBERTO PEREZ GARZA | es_MX |
dc.contributor.other | director - Director | es_MX |
dc.coverage.spatial | MEX - México | es_MX |
dc.date | 2019-08-21 | |
dc.date.accessioned | 2023-01-16T21:45:42Z | |
dc.date.available | 2023-01-16T21:45:42Z | |
dc.identifier.uri | http://riaa.uaem.mx/handle/20.500.12055/3111 | |
dc.description | El término Big Data es utilizado para definir datos que, por su complejidad, es inadecuado o imposible el uso de sistemas tradicionales para su almacenamiento, procesamiento y analisis. En particular, en Big Data los datos se caracterizan por aparecer en grandes volúmenes, ser generados con gran velocidad, requerir cortos tiempos de procesamiento, provenir de diversas fuentes y presentarse en una gran variedad de formatos. Los avances tecnológicos y la aparición de nuevos dispositivos capaces de generar datos, ha empezado a generar problemas Big Data en múltiples áreas en empresas, industrias y de investigación. La importancia de generar valor de los datos ha llevado a utilizar soluciones computacionales basadas en sistemas distribuidos que permiten escalar las arquitecturas de hardware de acuerdo con las necesidades del problema. En este trabajo, se introducen los fundamentos teóricos y metodológicos de una arquitectura Big Data basada en el ecosistema de Hadoop para el almacenamiento y procesamiento de grandes volúmenes de datos. Además, se presenta el desarrollo de dos soluciones Big Data en áreas donde el crecimiento en el volumen de datos está impulsando la búsqueda de métodos computacionalmente eficientes para el análisis de datos. La primera, en el área de investigación en genómica, utiliza una metodología escalable para procesar bases de datos de ADN de referencia y crear nuevas bases de datos de tamaño reducido mediante el uso de la información filogenética de las secuencias. La segunda, en la industria eléctrica, se utilizan datos de consumo eléctrico generados por medidores inteligentes, sociales y climatológicos para generar un pipeline de algoritmos de aprendizaje de máquina con el objetivo de crear modelos escalables para el pronóstico del consumo eléctrico de
usuarios de la red eléctrica inteligente. | es_MX |
dc.format | pdf - Adobe PDF | es_MX |
dc.language | spa - Español | es_MX |
dc.publisher | El autor | es_MX |
dc.rights | openAccess - Acceso Abierto | es_MX |
dc.subject | 5 - CIENCIAS SOCIALES | es_MX |
dc.subject.other | 63 - SOCIOLOGÍA | es_MX |
dc.title | Almacenamiento y procesamiento de grandes volúmenes de datos en una arquitectura Big Data: aplicaciones en la investigación e industria eléctrica | es_MX |
dc.type | masterThesis - Tesis de maestría | es_MX |
uaem.unidad | Facultad de Contaduría Administración e Informática - Facultad de Contaduría Administración e Informática | es_MX |
uaem.programa | Maestría en Optimización y Cómputo Aplicado - Maestría en Optimización y Cómputo Aplicado | es_MX |
dc.type.publication | acceptedVersion | es_MX |
dc.audience | researchers - Investigadores | es_MX |
dc.date.received | 2019-10-15 | |