Estructura residual en la región intrínsecamente desordenada de escargot

TERESA HERNANDEZ SEGURA

Resumen Las proteínas y regiones intrínsecamente desordenadas (IDPs e IDRs por sus siglas en inglés, respectivamente) no adoptan una estructura tridimensional bien definida en condiciones fisiológicas. Estas proteínas participan en muchas funciones biológicas y algunas de ellas están asociadas a diferentes enfermedades. Pequeñas regiones conocidas como MoRFs (Molecular Recognition Features, en inglés) pueden ser encontradas en IDPs o IDRs. Los MoRFs son regiones desordenadas que se encuentran en una constante transición estructural de orden y desorden, lo cual hace difícil su estudio con herramientas experimentales, ya que la mayoría de estas proporcionan información promedio del ensamble de diferentes conformaciones. Sin embargo, herramientas computacionales como las simulaciones de dinámica molecular (MD) permiten estudiarlas y caracterizar su ensamble conformacional a nivel atómico. En este proyecto estudiamos la proteína Escargot (Esg) de Drosophila melanogaster, la cual es un factor de transcripción de la familia Snail, y regula múltiples funciones, entre ellas el desarrollo del sistema nervioso. Estructuralmente, el dominio C-terminal de Esg es una región conservada que presenta dedos de Zn2+ e interactúa con ácidos nucleicos, mientras que el dominio N-terminal es una IDR. Actualmente, hay poca información estructural del Nterminal de Esg; la única anotación funcional en esta región consiste en dos motivos (PDLS-K) que interactúan con la proteína de unión a C-terminal (CtBP). Sin embargo, el Nterminal de Esg ha sido asociado a funciones como degradación de proteínas, donde los dedos de Zn2+ no son necesarios. En este trabajo, presentamos el primer estudio bioinformático estructural del N-terminal de Esg de Drosophila melanogaster y diferentes ortólogos. Los resultados muestran que comparten un extremo N-terminal divergente a nivel de secuencia, pero probablemente conservado a nivel de desorden y estructura. Las regiones predichas como ordenadas presentan características de probables MoRFs, los cuales pudieran ser importantes para ejercer sus funciones como factores de transcripción. Por otra parte, presentamos el primer estudio estructural computacional del N-terminal de Esg de Drosophila melanogaster, en el cual investigamos la presencia de MoRFs. Analizamos una región de ~45 aminoácidos con probabilidad a formar estructuras ordenadas. A través de 54 μs de simulaciones de dinámica molecular (MD) usando CHARMM36 y el modelo de solvente implícito Generalizado de Born (GBSA), caracterizamos el espacio conformacional de esta región y encontramos un MoRF de ~16 aminoácidos. El MoRF adopta estructura de a-hélice y presenta pocos contactos de largo alcance. También evaluamos y simulamos algunas mutaciones puntuales durante 24 μs de MD para probar la estabilidad del a-MoRF. Nuestros resultados mostraron que las mutaciones no desestabilizan el MoRF y llevan a una ganancia modesta de estructura residual, la cual puede ser efecto del campo de fuerza y modelo de solvente usado, y/o de contactos de largo alcance. Considerando lo anterior, se realizaron simulaciones de MD en solvente explícito simulando únicamente la región del a-MoRF. Los resultados muestran una labilidad distinta para la hélice silvestre y dos mutantes desestabilizantes, los cuales correlacionan con datos experimentales obtenidos por dicroísmo circular (CD).

Abstract Intrinsically disordered proteins (IDPs) and regions (IDRs) lack a stable, well-defined structure in physiological conditions. These proteins are involved in multiple biological functions and some of them are associated to different diseases. Short regions known as MoRFs (Molecular Recognition Features) can be found in IDPs or IDRs. MoRFs are disordered regions that are in a constant structural transition of order and disorder, which is difficult the study with experimental methods, because the results are usually ensembleaveraged over the interconverting conformations. However, computational approaches like molecular dynamics simulations (MD) allow the study and characterization of conformational ensembles of IDPs with atomic detailed information. In this project we studied the Escargot protein (Esg) of Drosophila melanogaster, which is a transcription factor of the Snail family that regulates multiple cellular functions, including the development of the nervous system. Structurally, the C-terminal domain of Esg is a conserved and ordered region that has zinc fingers and interacts with nucleic acids, while the N-terminal domain of Esg is an IDR. Actually, there is not much structural information of the N-terminal domain of Esg; the only functional annotation in this region consists of two (P-DLS-K) motifs that interact with the C-terminal binding protein (CtBP). However, the N-terminal domain of Esg has been associated to functions like protein degradation, where zinc fingers are not necessary. In this work, we present the first bioinformatics structural study of the N-terminal domain of Esg of Drosophila melanogaster and diferent orthologs. The results show that they share a divergent N-terminal domain at the sequence level, but are probably conserved at the disorder and structure level. The predicted regions as ordered present features of probable MoRFs, which could be important in the role as transcription factors. In addition, we show the first structural computational study of the Nterminal domain of Esg of Drosophila melanogaster, where we researched the presence of MoRFs. We analized a region of ~45 amino acids with probability to form ordered structures. Through of 54 μs of molecular dynamics (MD) simulations using CHARMM36 and Generalized Born Implicit Solvent (GBSA), we characterized the conformational landscape of this region and we found a MoRF of ~16 amino acids. The MoRF adopts the structure of an α-helix and has few long-range contacts. We also evaluate and simulate some point mutations during 24 μs of MD to probe the stability of the α-MoRF. Our results show that the mutations do not destabilize the MoRF and lead to modest gains of residual structure, which could result from the force field and solvent model used, and/or long- range contacts. Considering this, simulations of MD were carried out with explicit solvent only of the α-MoRF region. The results show a different lability of the wild-type helix and two destabilizing mutants, which correlates with experimental data obtained by circular dicroism (CD).

Tipo de documento: Tesis de doctorado

Formato: Adobe PDF

Audiencia: Investigadores

Idioma: Español

Área de conocimiento: INGENIERÍA Y TECNOLOGÍA

Campo disciplinar: CIENCIAS TECNOLÓGICAS

Nivel de acceso: Acceso Abierto