Ingeniería de proteínas (2018-2019)
PETasa de Ideonella sakaiensis
14. Elaborar una aplicación informática que permita predecir (“asignar”) los posibles enlaces disulfuro presentes en una proteína a partir de sus datos estructurales contenidos en el PDB. Realizar un breve muestreo con media docena de proteínas y comentar los resultados obtenidos en términos de aciertos positivos, aciertos negativos, falsos positivos y falsos negativos.
El objetivo de esta actividad es desarrollar una aplicación en Lázarus/Pascal capaz de predecir entre qué residuos de cisteína se producen puentes disulfuro. El programa se denomina disulfuro.exe y utiliza algunas de las funciones desarrolladas en la librería biotools, siendo la más destacable tabladistanciasCys, que no permite obtener una tabla bidimensional de distancias entre los azufres de los residuos de cisteína.
Los puentes o enlace disulfuro (figura 1) son una unión covalente entre dos átomos de azufre. Este tipo de enlaces se forman por la oxidación de dos grupos sulfhidrilo (SH), cada uno perteneciente a una molécula de cisteína. En el caso de bacterias estos son más escasos en las proteínas debido al ambiente tan reductor de su citoplasma, mientras que en eucariotas este ambiente es menor y se favorece la formación de puentes disulfuro para aumentar la estabilidad de la proteína.

Para la predicción de éstos, primero se debe introducir en el programa una proteína en formato pdb y éste busca y guarda todos los átomos de azufre de las cisteínas, que se denominan, en el fichero pdb, SG. A continuación, se lleva a cabo el cálculo de las distancias entre todos los átomos de azufre de todas las cisteínas de la proteína. Ahora, una vez que el usuario ha establecido un valor umbral de manera que, si la distancia es menor de ese valor se considera que se produce un puente disulfuro entre los residuos a los que pertenece, se muestra por pantalla la predicción de éstos.
De forma adicional, el programa selecciona del fichero pdb el campo 'SSBOND', donde se indica la distancia existente entre los residuos de cisteína que participan en los puentes disulfuro predichos. Viendo los valores de estas distancias en varios ficheros pdb se ha determinado que el valor umbral adecuado es de 2,2 Å, y así evitaremos tanto falsos positivos como falsos negativos.
De esta forma, la interfaz de nuestro programa se muestra en la figura 2.

Además de la proteína asignada se aplicará este programa a una media docena de proteínas aportadas por el profesor para confirmar el buen funcionamiento de el programa de predicción de puentes disulfuros. Mostraremos los resultados según lo da nuestro programa y veremos si predice todos aquellos enlaces que presenta según el fichero pdb. Las proteínas usadas serán:
1. PETasa de Ideonella sakaiensis (5xjh.pdb). Predice los dos puentes disulfuros que tiene sin errores

2. Lectina (proteína A de unión a manosa de rata (1AFD.pdb). Predice de forma correcta los 6 puentes disulfuros, 2 por cada subunidad idéntica de la lectina.

3. Complejo 7-α-hidroxiesteroide deshidrogenasa de E. coli (1AHI.pdb). Esta proteína no presenta ningún puente disulfuro.

4. Veneno acutolisina de Deinagkistrodon acutus (serpiente venenosa) (1BUD.pdb). Esta proteína presenta 3 puentes disulfuro, los cuales son todos predichos.

5. Chaperona de vaca (2QWQ.pdb). Esta proteína presenta un único puente disulfuro, el cual es predicho de manera correcta.

6. Oxidorreductasa de E. coli (2ZUP.pdb). Esta proteína presenta un único puente disulfuro, el cual es predicho de manera adecuada

7. Complejo formado por (A) el receptor de factor 1 estimulante de colonias y (B) el factor 1 estimulante de colonias producido por macrófagos humanos (4WRM.pdb). Estas proteína s acomplejadas presentan una gran cantidad de puentes disulfuros, habiendo 4 en A y 3 en B. Estos son predichos de manera correcta sin error.

Concluyendo, podemos confirmar que nuestro programa predice de forma efectiva y correcta todos los puentes disulfuro anotados en los PDBs y ninguno más para la distancia umbral de 2,2 Å. Por tanto, esta potente herramienta predice la posible existencia de puentes disulfuro con un 100% de probabilidad de acierto, sin producir falsos positivos ni falsos negativos. Probablemente, esto se debe al hecho de que dos cisteínas, simplemente por el hecho de que sus átomos de azufre se encuentren lo suficientemente cerca, pueden formar un puente disulfuro siempre que el estado de oxidación del medio que las rodea sea el adecuado. Como consecuencia, es muy sencillo predecir los puentes disulfuro que una proteína puede llegar a tener.
También hay que tener en cuenta que si aumenta o disminuimos esta distancia umbral se pueden obviar algunos enlaces disulfuros. Por ejemplo, si establecemos una menor a la anterior, como 2,1 Å, uno de los enlaces de PETasa no se habría predicho, incurriendo en un falso negativo. Al igual ocurriría si el umbral es muy elevado, donde encontraríamos falsos positivos. Por lo tanto, siempre que queramos hacer una predicción hay que optimizar en este caso el parámetro de la distancia entre S de las cisteínas, llegando a un compromiso para minimizar los errores.