Efecto del sesgo del contenido de GC genómico de organismos procariotas en las estructuras secundarias de sus proteínas

DIANA BARCELÓ ANTEMATE

Una de las principales características de los genomas procariotas es la proporción en que las bases Guanina-Citosina se utilizan en sus secuencias genómicas. Esto se conoce como el contenido de GC genómico y varía ampliamente, desde valores tan pequeños de 13% hasta valores tan grandes de 74%. Diversos estudios en microorganismos han demostrado que el contenido de GC genómico influye en la composición de aminoácidos de sus proteínas a nivel de su estructura primaria. Desde Sueoka¹, se ha observado que el sesgo que impone el contenido de GC genómico es particularmente importante en la composición de aminoácidos codificados por codones altos y bajos en contenido de GC, como Ala, Gly y Pro, y como Lys, Asn e Ile, respectivamente. En nuestro estudio, ampliamos estos resultados considerando el efecto del contenido de GC genómico en las estructuras secundarias de las proteínas. El presente estudio se realizó a través de un análisis bioinformático cuyos resultados se presentan y discuten en cuatro partes. Primero, a partir de un primer grupo de 192 procariotas con contenido de GC genómico del 20% al 74% se observó la distribución filogenética, obteniendo características propias de cada filo estudiado. Segundo, con los genomas y proteomas del primer grupo de estudio, y basados en los parámetros conformacionales de Chou y Fasman²˒³, encontramos que la tendencia de un aminoácido a formar parte de una estructura secundaria de proteínas no es absoluto, sino que varía según el contenido de GC genómico. Tercero, se identificó que la composición de las estructuras secundarias de los proteomas del primer grupo de estudio varía en relación con el contenido de GC genómico; esto es, a medida que aumenta el contenido genómico de GC los lazos aumentan, mientras que las hélices alfa y las hojas beta disminuyen. Cuarto, a partir de un segundo grupo de 1,544 procariotas se realizó un estudio donde se impusieron criterios estrictos de agrupación de proteínas ortólogas y descubrimos que, para algunos COGs el contenido de GC de los genes sesga la composición de las estructuras secundarias de las proteínas que codifican.

One of the main characteristics of prokaryotic genomes is the ratio in which Guanine-Cytosine bases are used in their genomic sequences. This is known as the genomic GC content and varies widely, from values as small as 13% to values as large as 74%. Several studies in microorganisms have demonstrated that the genomic GC content influences the amino acid composition of their proteins at their primary structural level. Since Sueoka¹, it has been observed that the bias imposed by genomic GC content is particularly important in the composition of amino acids encoded by codons high and low in GC, such as Ala, Gly, and Pro, and such as Lys, Asn, and Ile respectively. In our study, we extend these results by considering the effect of the genomic GC content on the secondary structure of proteins. The present study was conducted through a bioinformatics analysis whose results are presented and discussed in four parts. First, from the first group of 192 prokaryotes with a genomic GC content of 20 to 74%, the phylogenetic distribution was observed, obtaining characteristics of each phylum studied. Second, with the genomes and proteome of the first study group and based on studies of Chou and Fasman's conformational parameters²˒³, we found that the tendency of an amino acid to form part of a secondary structure of proteins is not absolute but varies according to the genomic GC content. Third, it was identified that the composition of the secondary structures of the proteomes of the first study group varies in relation to the genomic GC content; that is, as the genomic GC content increases, coils increase, while alpha-helices and beta-sheets decrease. Four, from a second group of 1,544 prokaryotes, we did a study where were imposed strict criteria of orthologous protein clustering and we found that, for some COGs the GC content of genes biases the composition of secondary structures of the proteins for which they code.

Tipo de documento: Tesis de doctorado

Formato: Adobe PDF

Audiencia: Investigadores

Idioma: Español

Área de conocimiento: BIOLOGÍA Y QUÍMICA

Campo disciplinar: CIENCIAS DE LA VIDA

Nivel de acceso: Acceso Abierto