dc.rights.license | http://creativecommons.org/licenses/by-nc/4.0 - Atribución-NoComercial | es_MX |
dc.contributor | HERNAN LARRALDE RIDAURA | es_MX |
dc.contributor.author | DIEGO LEONARDO ESPITIA CABREJO | es_MX |
dc.contributor.other | director - Director | es_MX |
dc.coverage.spatial | MEX - México | es_MX |
dc.date | 2019-11-22 | |
dc.date.accessioned | 2019-11-26T15:50:34Z | |
dc.date.available | 2019-11-26T15:50:34Z | |
dc.identifier.uri | http://riaa.uaem.mx/handle/20.500.12055/1024 | |
dc.description | Resumen
En el presente trabajo presentamos los resultados del análisis estadístico de alrededor
de 120 textos escritos en 14 idiomas distintos: Español, Inglés, Alemán, Francés, Turco,
Ruso, Islandés, Checo, Danés, Finlandés, Hebreo, Húngaro, Italiano y Latín; al igual
que de secuencias aleatorias de caracteres que usamos como hipótesis nula.
Para dicho análisis usamos diferentes herramientas. La primera de ellas es la teoría de
redes. Específicamente construimos redes de co ocurrencia de palabras y calculamos,
entre otras propiedades de la red, el Clustering Coefficient. Este nos permite proponer
un método para la identificación automática de lenguas, a la vez que permite establecer
una medida que puede ayudar definir una "distancia" entre idiomas.
Por otro lado, encontrando la posición de las palabras en el texto y haciendo estadística
sobre la distancia (dada en número de palabras) entre dos repeticiones de un término,
proponemos un método que permite encontrar de manera automática las palabras
clave del texto. Si usamos dicho método en un mismo documento, pero escrito en
diferentes idiomas, podemos correlacionar de manera precisa las mismas palabras
claves en los diferentes lenguajes, estableciendo así que las palabras claves identificadas
por éste método, parecen ser invariantes ante la traducción. | es_MX |
dc.format | pdf - Adobe PDF | es_MX |
dc.language | spa - Español | es_MX |
dc.publisher | El autor | es_MX |
dc.rights | openAccess - Acceso Abierto | es_MX |
dc.subject | 7 - INGENIERÍA Y TECNOLOGÍA | es_MX |
dc.subject.other | 33 - CIENCIAS TECNOLÓGICAS | es_MX |
dc.title | Análisis estadístico de textos tesis | es_MX |
dc.type | doctoralThesis - Tesis de doctorado | es_MX |
uaem.unidad | Instituto de Investigación en Ciencias Básicas y Aplicadas (IICBA) - Instituto de Investigación en Ciencias Básicas y Aplicadas (IICBA) | es_MX |
uaem.programa | Doctorado en Ciencias - Doctorado en Ciencias | es_MX |
dc.type.publication | acceptedVersion | es_MX |
dc.audience | researchers - Investigadores | es_MX |