Ingeniería de proteínas (2018-2019)
PETasa de Ideonella sakaiensis
15. Elabore una herramienta informática que permita calcular la antipatía de hidrofobicidad de un segmento de secuencia peptídica mediante el cálculo de momentos de Eisenberg y mediante el espectro de potencias de Fourier de Stroud. Compare los resultados de ambos procedimientos obteniendo las gráficas correspondientes al perfil antipático de un segmento de secuencia C-terminal de 20 residuos de la proteína asignada
Sería conveniente empezar esta actividad con una pequeña introducción teórica acerca de lo que significa hidrofobicidad, perfil hidrofóbico y antipatía de hidrofobicidad.
Así, en primer lugar, podemos definir la hidrofobicidad como una propiedad o, más bien, una interacción que se produce por omisión y consiste en la tendencia de las sustancias no polares a formar estructuras más ordenadas, denominadas clatratos, en una disolución acuosa para excluir las moléculas de agua. En concreto, las interacciones entre las moléculas hidrofóbicas favorecen que se produzcan puentes de hidrógeno entre las moléculas de agua desplazadas, resultando así en una disminución de la entropía y energía libre del sistema. En cambio, cuando una sustancia es polar o hidrofílica, ocurre lo contrario, produciéndose una interacción favorable con las moléculas de agua del disolvente [1].
La hidrofobicidad podría ser, entonces, una característica de las moléculas o grupos químicos de éstas que determina la mayor o menor capacidad que tienen para interaccionar con otras moléculas polares, como el agua.
En el caso de las proteínas ocurre algo parecido pero más complejo debido a que éstas presentan residuos con cadenas polares y apolares, que cuando es introducida en una solución acuosa, éstos sufrirán interacciones favorables o desfavorables, provocando cambios en la estructura secundaria/terciaria de la proteína. Así, los residuos más hidrofílicos estarán expuestos hacia la superficie mientras que los hidrofóbicos se introducirán en el interior de la estructura proteica, escapando del disolvente. Como estas interacciones hidrofóbicas provocan cambios en la estructura, será muy importante para el plegamiento de la misma [2].
Sin embargo, es difícil establecer un criterio de hidrofobicidad para asignarle un valor de hidrofobicidad a cada residuo (ya que solamente se tiene que tener en cuenta la cadena lateral del aminoácido). De esta forma, existen diferentes escalas hidrofóbicas (subjetivas, porque se establece un valor arbitrario dependiendo de parámetro como cargas o a/polaridad de los residuos), como las que se nos proporcionan en la asignatura y muchas otras. La representación de la hidrofobicidad dada a cada aminoácido/residuo de una proteína es lo que se conoce como perfil hidrofóbico.
El análisis de la forma de los perfiles proporciona información sobre la estructura parcial (estructura secundaria) de la proteína. Por ejemplo, si un tramo de 30 aminoácidos presenta un valle de hidrofobicidad (hidrofóbicos), estos aminoácidos pueden ser parte de la hélice α que se extiende a través de una bicapa lipídica, que está compuesta de ácidos grasos hidrófobos. Por el contrario, los aminoácidos con baja hidrofobicidad indican que estos residuos están en contacto con el disolvente o el agua, y que, por lo tanto, es probable que residan en la superficie externa de la proteína. Por lo tanto, éstos podrían convertirse en una potente posible herramienta predictiva de estructuras proteicas.
Uno de los objetivos que nos proponemos en esta actividad es realizar el perfil hidrofóbico de nuestra proteína PETasa (5xjh.pdb) utilizando alguna de las escalas hidrofóbicas existentes. Sin embargo, si empleamos estas tablas directamente y representamos el perfil para cada residuo obtendríamos una representación muy ruidosa. Para solucionar esto y suavizar el gráfico usaremos el método basado en el algoritmo de Kyle-Doolittle.
En este algoritmo se calcula el valor de hidrofobicidad de cada residuo mediante el promedio de la hidrofobicidad del mismo y la de los residuos adyacentes en la secuencia de la proteína para un tamaño de semiventana (numero de residuos a la izquierda o derecha del residuo para el que calculamos la hidrofobicidad) determinado por el usuario, que en nuestro caso será por defecto 4, que nos permitirá predecir estructuras de láminas β o hélices α, mientras que semiventanas mayores nos pueden ayudara a predecir dominios más grandes como los transmembrana (semiventana de 10-15).
Empleando este algoritmo se ha creado una función en la librería biotools, denominada kytedoolittle, que será utilizada en el programa que ha se ha desarrollado en Lázarus/Pascal (hidrofobicidad.exe). En este programa el usuario tiene que cargar un fichero en formato pdb, una tabla hidrofóbica con el siguiente formato (figura 1) (las letras se corresponden al código de una letra del residuo) y escoger el tamaño de semiventana para obtener el perfil hidrofóbico.

A continuación, se presenta el perfil hidrofóbico de nuestra proteína PETasa (5xjh.pdb) usando la escala hidrofóbica de Kytedoolittle, usando una semiventana de 4 y otra de 10 (figura 2 A y B, respectivamente).
De estas imágenes, en concreto la 2A, no podemos en principio deducir cual son las distintas estructuras secundarias de la proteína pero si podemos apreciar que aquellas hélices que están implicadas en la union del sustrato PET de la enzima, son extremadamente hidrofóbicos según nuestra escala. Estas hélices son la 2, 3, 4 y 6, marcadas con flechas rojas, y forman una hendidura hidrofóbica. Además podemos ver que en esta caso las láminas β presentan residuos mas polares o menos hidrofóbicos, estando debido esto a que se encuentran mayoritariamente en la superficie de la enzima, la cual de primeras es soluble (flechas verdes).
La figura 2B en la que se ha aumentado el tamaño de ventana se observa un gráfico suavizados donde se acentúan las diferencias de polaridad.

Continuando con la actividad habría que referirnos a la antipatía de hidrofobicidad. El concepto de anfipatía de hidrofobicidad o axial hace referencia a la lateralización de una variable, en este caso la hidrofobicidad, a lo largo de un segmento de proteína, es decir, a la presencia, en una misma región, de residuos con hidrofobicidadades muy dispares. Sin embargo se puede decir que no necesariamente existe una relación entre la hidrofobicidad de una estructura secundaria y su anfipatía de hidrofobicidad ya que este valor va a depender de las diferencias de hidrofobicidad de los residuos que forman la estructura y como este conformada la proteína en su conjunto [3].
Para determinar la antipatía se pueden usar dos aproximaciones: el enfoque de Eisenberg y el de Stroud.
La aproximación de Eisenberg es una aproximación de carácter físico en el que la hidrofobicidad de cada aminoácido se trata como un vector. Así, considerando una hélice α de una proteína, la hidrofobicidad de cada residuo es vista como vector que apunta en diferentes direcciones a medida que recorremos la estructura, de forma que la hidrofobicidad neta del segmento podría verse como la suma de cada uno de los vectores individuales separados una determinada distancia angular (delta, δ), la cual dependerá de la estructura estudiada en cuestión (180 para láminas β y 100º para hélice α).
Esto se denominará momento hidrofóbico y será la suma algebraica de todos los vectores de hidrofobicidad de los residuos contenidos en la ventana que se asignará como promedio al aminoácido central de la ventana [3].
La formula que usaremos en la función de biotools como en el programa anterior es la siguiente, donde µh es el momento hidrofóbico; Hn, la hidrofobicidad residual; δ, la distancia angular; y n el número de aminoácido de la secuencia analizada.

Por otro lado, la aproximácion de Stroud para la determinación de la anfipatía de hidrofobicidad hace uso de la transformada de Fourier aplicada al perfil hidrofóbico de una proteína para obtener una curva en el dominio de frecuencia (espectro de potencia de Fourier) en la que ahora las hidrofobicidades son vistas como amplitudes, y la distancia angular que separaba cada residuo de la secuencia como frecuencia. La teoría propuesta por Stroud dice que la estructura secundaria que adopta una proteína es precisamente la que maximiza la anfipatía, para una distancia angular [3].
La formula usada en el programa para su cálculo es la siguiente, donde I es el espectro de potencias; hj la hidrofobicidad residual; (k), la media de la hidrofobicidad de los residuos del segmento estudiado; j, el número de aminoácido de la secuencia analizada; y v la distancia angular.

Ambas funciones reciben la secuencia de la región a estudiar en código de una letra, una tabla hidrofóbica, el tamaño de semiventana y un valor de distancia angular que dependerá de la estructura secundaria a estudiar.
A continuación, ejecutamos el programa desarrollado y mencionado anteriormente de forma completa. En la figura 3 se muestra la interfaz gráfica del programa y en la figura 4 y 5 se muestra la antipatía de nuestra proteína mediante Eisenberg y Stroud para una distancia angular de 100º y 180º, respectivamente.
Como vemos, los dos gráficos obtenidos son prácticamente iguales entre sí. Sin embargo, se trata de perfiles muy ruidosos en los que es difícil establecer una relación clara entre anfipatía de hidrofobicidad y estructura secundaria, aunque parece intuirse picos más pronunciados donde hay hélices α. De igual forma ocurre si visualizamos los mismos gráficos ahora estableciendo como distancia angular 180º, observándose picos pronunciados donde hay láminas beta. Además si comparamos la antipatía de las las hélices alfa con la de las láminas beta observamos que las segundas presentan una mayor anfipatía, que puede deberse a la la alternancia de residuos hacia el interior y exterior proteico.



Bibliografía
[1] https://en.wikipedia.org/wiki/Hydrophobicity_scales
[2] Jamadagni, S. N., Godawat, R. & Garde, S. Hydrophobicity of Proteins and Interfaces: Insights from Density Fluctuations. Annu. Rev. Chem. Biomol. Eng. 2, 147–171 (2011).
[3] Apuntes de la asignatura de Ingeniería de Proteínas