Ingeniería de proteínas (2018-2019)
​
PETasa de Ideonella sakaiensis
9. Preparar un conjunto de funciones biotools que permitan automatizar el cálculo de distancias interatómicas, ángulos de enlace y ángulos de torsión a partir de las coordenadas proporcionadas desde un TPDB. Con ayuda de estas herramientas, desarrollar una aplicación Free Pascal/Lazarus que permita construir el diagrama de Ramachandran de la proteína importada. Analizar con este programa algunas de las estructuras de la proteína asignada e incluir el procedimiento y los resultados obtenidos en el CPA. Para confirmar la corrección de los cálculos, incluya también una tabla de ejemplo de los diez primeros residuos, con los valores de torsión calculados y los observados directamente mediante la herramienta “set picking torsión” de RASMOL.
En las proteínas, por cada enlace peptídico se forman tres ángulos de torsión o diedros denominados phi (Φ), psi (Ψ) y omega (ω). Éstos permiten a la molécula tomar múltiples conformaciones.

En la siguiente figura se muestran los ángulos de libre rotación con los que la proteína podría adoptar un número ilimitado de conformaciones, sin embargo, a mayoría de las cadenas polipeptídicas se pliegan adoptando una conformación particular. Esto es debido principalmente a que los átomos asociados al enlace peptídico (amarillo), que tiene cierto carácter de doble enlace, se encuentran en el mismo plano y, por tanto, el enlace peptídico no puede girar libremente.
​
De esta forma, la planaridad del enlace peptídico hace que sea el valor de ω 180º en casi todos los enlaces peptídicos de la cadena principal. Solo en algunos casos ω es de 0º. Esto ocurre generalmente para un enlace peptídico cis el cual implica un residuo de prolina [1]. Por otro lado, los ángulos Φ y Ψ toman valores entre -180º y 180º, donde el signo positivo o negativo depende de la oración, si el giro es menor a 180º en el sentido de las manecillas del relojes, es positivo mientras que si es menor a 180º en sentido anti-horario el signo será negativo. También hay que aclarar que no todos los valores de Φ y Ψ están permitidos ya que pueden existir impedimentos estéricos entre los átomos de las cadenas laterales.
Debido a estos impedimentos en la naturaleza se observan tres tipos de orientaciones: helicoidal, laminar y aleatoria. Las dos primeras son disposiciones geométricas ordenadas que se deben a la repetición sucesiva de un valor similar de Φ y Ψ en enlaces consecutivos. Una buena herramienta para determinar qué combinaciones están “permitidas” y predecir la estructura secundaria de las proteínas a partir de los ángulos de torsión son los diagramas de Ramachandran.
​
El gráfico de Ramachandran fue creado por el bioquímico hindú Gopalasamudram Narayana Ramachandran junto con Viswanathan Sasisekharan, que usaban uso modelos de pequeños polipéptidos para variar sistemáticamente estos ángulos con el objeto de encontrar conformaciones estables. En él se pueden visualizar todas las combinaciones posibles de ángulos diedros Φ versus ángulos Ψ de los residuos de un polipéptido, y que contribuyen a la conformación de la estructura de las proteínas. Este gráfico permite, por lo tanto, como dijimos anteriormente, aproximar a priori cuál será la estructura secundaria del péptido, ya que existen combinaciones de ángulos típicas para cada estructura (α-hélice y hoja-β).
Para construir este diagrama los átomos fueron considerados como esferas rígidas con dimensiones correspondientes a su radio de van der Waals. Por lo tanto, los ángulos que causaban una colisión de las esferas correspondían a ángulos prohibidos y correspondían a conformaciones no permitidas de la cadena polipeptídica [1].
En este gráfico, que ha sido fuertemente validado, se puede observar cómo en el primer cuadrante se encuentran las combinaciones que originan una hélice α levógira o a hacia la izquierda; en el segundo cuadrante se hallan las combinaciones de láminas β (paralelas y antiparalelas); en el tercer cuadrante se hallan la hélice α dextrógira o hacia la derecha y los giros o bucles (loops). En el cuarto cuadrante y zonas blancas (no coloreadas o sin puntos) corresponden a conformaciones donde los átomos del polipeptido están más cercanos que sus radios de van der Waals y, por lo tanto, estas regiones son estericamente no permitidas para todos los aminoácidos, excepto para glicina, el cual es el único aminoácido que no presenta cadena lateral [2].
​
En la imagen las regiones azules intensas corresponden a conformaciones donde no hay impedimentos estericos, es decir estas son zonas permitidas mientras que las zonas azules claras muestran las regiones permitidas sí en los cálculos se usan radios de van der Waals ligeramente más pequeños, es decir se permite que los átomos puedan estar un poco mas cercanos. Los L-aminoácidos no pueden formar una hélice levógira pero ocasionalmente residuos individuales pueden adoptar esta conformación. Estos residuos generalmente son glicina pero también pueden ser asparragina y acido aspártico en los que la cadena lateral forma un puente hidrógeno con la cadena principal y así estabiliza esta conformación desfavorable [2].
​
​

​
​
El objetivo de esta actividad es desarrollar un programa, en el lenguaje de programación Pascal, que permita hacer de forma automática el cálculo de distancias interatómicas, ángulos de enlace y ángulos de torsión a partir de las coordenadas proporcionadas por un fichero en formato PDB.
​
El programa creado es rama.exe y permite cargar uno o varios ficheros en formato PDB, introducir la información que estos ficheros contienen en una estructura TProteinPDB y, a partir de los datos de las coordenadas de los átomos, realizar los cálculos necesarios para obtener los ángulos de torsión Φ y Ψ, según la IUPAC, y representarlos en un diagrama de Ramachandran.
​
Como nos referimos anteriormente este diagrama es una forma de visualizar las regiones energéticamente permitidas para los ángulos diedros del esqueleto de una proteína. Así, nos permite determinar cuántos residuos se encuentran formando parte de una estructura secundaria determinado, y cuántos presentan unos ángulos de torsión forzados de acuerdo con la estructura de la proteína de la que disponemos, de modo que cuantos más residuos presenten ángulos forzados, más probable será que la estructura de la proteína no sea la más adecuada.
​
Para construir dicho programa se han empleado varias funciones de la librería biotools:
​
-
CargarPorteina: para generar la estructura TProteinPDB a partir de un archivo PDB.
​
-
getRamachandran: para obtener los ángulos diedros e cada residuo de la proteína o subunidad, sin tener en cuenta el primer y último residuo pues no se puede calcular el phi y el psi de éstos respectivamente.
​
-
plotXY: para representar el diagrama de Ramachandran usando los ángulos de torsión obtenidos por la función anterior.
​
​

La interfaz del programa se muestra en la figura 1.
​
Usando este programa para el fichero 5xjh.pdb, se obtuvo el diagrama siguiente (figura 2, 3A), que podemos comparar con un diagrama de Ramachandran de los libros de texto donde se observan las regiones permitidas y aquellas que corresponden a las de ciertas estructuras secundarias de las proteínas. Además si comparamos el gráfico obtenido con el diagrama de Ramachandran obtenido gracias a la herramienta molprobity.biochem.duke.edu (figura 3B), podemos apreciar que son bastante similares, habiendo algunos residuos diferentes en el nuestro.


Cómo podemos ver que la mayor parte de los residuos de nuestra proteína caen dentro de las zonas permitidas del diagrama, especialmente en las regiones que corresponden a las láminas β y a las α-hélices, estructuras que predominan en la PETasa. También hay algunos residuos que caen en regiones menos comunes, como en la de las de hélices α levógiras.
Podemos ver que no hay una apenas residuos que aparecen en zonas prohibidas del diagrama, lo que indicaría que la estructura cristalográfica de la que disponemos, reflejada en el PDB, es bastante buena, sin presentar residuos en posiciones en las que se encuentran forzados. Como conclusión de estos resultados podemos destacar que el diagrama de Ramachandra podría ser y es uno de los parámetros a tener en cuenta para determinar la calidad de un modelo proteico a partir de los datos de la nube electrónica dada por la cristalografía.
​
​
Además existen algunos residuos, como la prolina y la glicina, que presentan ciertas peculiaridades en cuento a sus ángulos de torsión. Estos residuos son especiales porque la prolina tiene una cadena lateral cíclica, por lo que la rotación alrededor del enlace está limitada por su inclusión en el anillo de pirrolidina. Así, los valores de Φ están restringidos a unos valores dependiendo si es la forma cis o trans; y por lo tanto, la prolina es el residuo de aminoácido más restringido conformacionalmente. La glicina no tiene cadena lateral y, por lo tanto, es el menos impedido estéricamente en comparación con otros aminoácidos. Este hecho le permite cubrir una amplia gama de área en la parcela. Así, algunos residuos de glicina toman conformaciones que podrían estar prohibidas a otros residuos, apareciendo algunas en nuestro diagrama.
En la siguiente figura 4 podemos ver los diagramas de Ramachandran de las glicinas (A) y prolinas(B) de la proteína representada en el fichero 5xjh.pdb
​
​
​
​
​
​
​

Asimismo, este programa nos permite comparar los diagramas de Ramachandran de distintas proteínas. Por ejemplo, podemos obtener también el diagrama de Ramachandran de la cutinasa (4CG1.pdb) de Thermobifida fusca (en color rosa), una de las proteínas con mayor homología estructural con la PETasa de Ideonella sakaiensis (en color amarillo), que presenta un diagrama de Ramachandran muy similar (Figura 5).

De forma general también podemos ver que los diagramas de Ramachadran para distintas proteínas son muy similares, donde destacan principalmente, por ser mayoritarias, las estructuras secundarias de α-hélice y lámina β. Así en las siguientes figuras se muestran el diagrama de Ramachandran de distintas proteínas que no tienen ninguna relación con la PETasa pero que las conformaciones, en cuanto a ángulos de torsión se refiere de los residuos, caen en las zonas permitidas del diagrama. Así en la siguiente figura 6 se presenta el diagrama de A) aquaporina humana (4CSK.pdb), B) la GFP o proteína fluorescente verde de Aequorea Victoria (1ema.pdb) y C) la nucleasa Cas9 de S. Pyogenes (4cmp.pdb). Con estos diagramas podemos observar que en la aquaporina predominan las α-hélices, como en la GFP hay una gran presencia de láminas β que conforman la estructura en barril y unos pocos residuos conforman α-hélices, siendo estos los imprescindibles para mantener el cromóforo en el interior de la estructura; y la Cas9, que presenta tanto α-hélices como láminas β, apareciendo incluso residuos con valores de ángulo de torsión típicas de α-hélices levógiras.

Bibliografía
​
[1] http://www2.udec.cl/~jmartine/Capitulo3.htm
[2] https://es.wikipedia.org/wiki/Gr%C3%A1fico_de_Ramachandran