Ingeniería de proteínas (2018-2019)
​
PETasa de Ideonella sakaiensis
12. Calcular el RMSD correspondiente a las tres primeras cisteínas de la proteína asignada y elabore un informe en que se interpreten en términos estructurales los resultados obtenidos.
​
La mayoría del proteoma está formado por secuencias de aminoácidos que, debido a la selección evolutiva, forman esencialmente, de manera reproducible, la misma estructura tridimensional. Esta observación desmontó la base del paradigma de "una secuencia - una estructura" que dominó es estudio de las proteínas durante mucho tiempo. Sin embargo, la creciente obtención de datos sobre la estructura de proteínas en bases de datos, ha puesto de manifiesto que estas macromoléculas poseen mucho más que una estructura rígida única y única, y que diversos ciertos grados de flexibilidad así como conservación de la estructura es crítica para su funcionamiento. En consecuencia, la cuantificación de las diferencias estructurales de una manera sensible se convierte en esencial [1].
​
Existe un abanico de métodos que nos permiten calcular de forma cuantitativa el parecido o similitud entre dos estructuras, sin embargo alguno de estos métodos, como los que implican algoritmos de superposición requieren altos costes computacionales pues es necesario encontrar una superposición óptima, lo que es una tarea ambigua y difícil ya que tiene múltiples soluciones que optimizan parámetros específicos Por lo tanto, todos los métodos dependientes de la superposición sufren esta ambigüedad [1].
​
Ahora bien, existen medidas de esta similitud, que aun teniendo como base los algoritmos de superposición, requieren una menor carga computacional. Estos se basan en la medida de la distancia entre los puntos de referencia en el modelo y el resto de puntos de dicho modelo, es decir, construir una tabla bidimensional en el que se calcule la distancia que existe entre cada átomo de la estructura. Hay que tener en cuenta que las distancias intermoleculares para un modelo proteico dado son invariables e independientes de las coordenadas de los átomos. Este cálculo para estructuras proteicas grandes y completas aun es costoso, aunque no se puede comparar con buscar mediante traslaciones y rotaciones una superposición óptima. Una vez que se ha construido esa tabla de distancias para una estructura y otra, qué se quiere comparar, se necesita una medida de comparación. Ésta será el la desviación cuadrática media (RMSD) de las posiciones atómicas o distancias entre los distintos átomos de las estructuras.
​
El RMSD, como hemos dicho, lo vamos a utilizar para obtener una medida comparativa de la distancia media entre los átomos de "superpuestas proteínas”, que queremos conocer la similitud de estructura. Éste se calcula, una vez que se tiene la matriz de distancias para cada estructura, utilizando la siguiente fórmula

donde, la dij es la distancia entre los elementos i y j en el primer residuo o estructura que se está empleando en la comparación, la d’ij es la distancia entre los elementos i y j del segundo residuo o estructura y n es el número total de elementos que se tienen en cuenta en la comparación.
​
De esta manera, cuanto más pequeño en valor sea el RMSD, más similar será la geometría espacial de los residuos o estructuras tridimensional.
​
Una vez explicado y puesto en contexto la actividad, el objetivo de ésta es comparar y conocer la similitud entre tres residuos de cisteína en nuestra proteína PETasa (5xjh.pdb) usando el método explicado.
​
Para conseguir este objetivo se ha desarrollado un programa en Lázarus/Pascal denominado RMSD.exe, que permite calcular la desviación cuadrática media entre las tres primeras cisteínas de un fichero .pdb. Para ésto, en el programa se carga el fichero en el formato ya dicho y él realiza la búsqueda de todas las cisteínas de la proteína. Posteriormente obtiene sus coordenadas espaciales y calcula el RMSD por pares empleando la función biotools RMSDCys que implementa en su algoritmo la fórmula descrita. Por último, muestra por pantalla el RMSD de comparación entre la cisteínas 1-2, 2-3 y 1-3.

La interfaz gráfica del programa se muestra en la figura 1
​
Con éste obtenemos los valores de RMSD entre las cisteínas, las cuales se muestran en la figura 2. Además en ella se realiza una comparación de las cisteínas en PyMOL donde se pueden comprobar los resultados obtenidos por el RMSD.
​
Éstos revelan que la primera y la tercera cisteína deberían ser mucho más similares estructuralmente entre sí que la segunda cisteína con cualquiera de las otras dos, siendo en orden descendente de similitud la segunda y la tercera, y la primera y segunda. Esto se puede ligeramente comprobar de forma visual ya que entre la 1º y 3º varía exclusivamente la posición del oxígeno (rojo) y ligeramente la posición del azufre (amarillo); luego entre la 2º y la 3º varía de manera considerable la posición del azufre y, por ultimo, entre la 1º y la 2º existe una diferencia brutal entre las posiciones relativas tanto del oxígeno como del S.
​
Estos resultados podrían estar relacionados con la hibridación sp3 del CH2-SH, que si no hay impedimentos estéricos el S, girará libremente y es ahí donde principalmente radican las diferencias geométricas y de similitud.
