6 min. de lectura

 

Los ganadores del Nobel de Química este año fueron David Baker de la Universidad de Washington (EE.UU.) por el diseño computacional de proteínas (Rosetta) y Demis Hassabis y John M. Jumper, ambos de Google DeepMind en Reino Unido, por la predicción de estructuras de proteínas (también conocido como AlphaFold).

Este premio a AlphaFold y Rosetta son derivaciones del Nobel de Física de 2024, ya que ambos utilizan deep learning, un método de machine learning en el campo de la inteligencia artificial (IA), aplicado al estudio de la estructura de las proteínas.

¿Por qué es importante estudiar la estructura de proteínas?

Las proteínas son las moléculas que ejercen la mayoría de las funciones celulares. Son cadenas de aminoácidos, y existen 20 diferentes aminoácidos cuya “mezcla” hacen toda la variedad de proteínas conocidas (sin ir de hondo en aminoácidos raros o modificaciones postraduccionales). La secuencia de aminoácidos determina la estructura secundaria y luego la estructura terciaria de la proteína.

La estructura de las proteínas es importante porque determina la función de estas.

Estructura de las proteínas
Fuente: Royal Swedish Academy of Sciences

Por muchos años, determinar la estructura de las proteínas fue un trabajo arduo de científicos estructurales. La técnica estándar para determinar la estructura de proteínas era la cristalografía de rayos X, la cual sigue siendo muy empleada. Esta técnica consiste en disparar un rayo X a un cristal de una proteína y estudiar los patrones de difracción. Sin embargo, no todas las proteínas forman buenos cristales, haciendo este paso el mayor obstáculo.

En 2017, Jacques Dubochet, Joachim Frank y Richard Henderson obtuvieron el Nobel de Química por la técnica de criomicroscopía electrónica, que consiste en utilizar un rayo de electrones pero esta vez en moléculas que han sido congeladas (de ahí el nombre “crio”) en solución (Cressey & Callaway, 2017). Esta técnica de microscopía logra tanta resolución que es posible determinar no solo la estructura de las proteínas, sino que con proteómica visual, es posible determinar la identidad de una proteína o proteínas que forma parte de un complejo. Esto último es posible gracias a la ayuda de AlphaFold o programas similares.

AlphaFold predice la estructura de todas las proteínas conocidas

Siguiendo con la tarea de determinar la estructura de proteínas, se sabe que la secuencia de aminoácidos es la que finalmente determina esta estructura. Por tanto, existían tablas de probabilidades que hablaban de hélice alfa o hoja beta, los dos tipos de estructura secundaria de las proteínas. El aminoácido prolina generalmente se encuentra indicando un giro en la estructura, por ejemplo. Ciertos aminoácidos son más probables de ser encontrados en hélices alfa y por ende de formar estructuras que atraviesan la membrana de la célula, como poros o proteínas de superficie.

Un equipo de Google llamado DeepMind, del que forman parte Hassabis y Jumper, lanzó en 2021 el AlphaFold2 (Jumper et al., 2021). Este modelo utiliza deep learning para predecir con un sorprendente grado de exactitud la estructura de proteínas. Usando estructuras conocidas e iteraciones (ciclos) sobre la predicción es posible predecir la estructura de una proteína con bastante exactitud. Cabe mencionar que esto es posible a bases de datos como Protein Data Bank (PDB), donde los científicos ponen a disposición de la comunidad las estructuras que logran resolver mediante métodos experimentales.

DeepMind hizo su debut con AlphaFold en 2018, cuando participaron en un concurso de predicción de estructura de proteínas llamado Critical Assessment of Protein Structure Prediction (CASP), pero fue su participación en 2020 con AlphaFold2 la que se llevó todos los elogios, ya que no hubo ningún otro equipo en compararse a ellos. El concurso consiste en predecir la estructura de ciertas proteínas por métodos computacionales y luego compararlas con la estructura conocida por métodos experimentales como la cristalografía. Las predicciones hechas por AlphaFold2 fueron tan exactas que se superponían perfectamente con la estructura real (Callaway, 2020).

En 2021, poco después de ser lanzada, AlphaFold publicó la predicción de las estructuras de todas las proteínas del ser humano (Tunyasuvunakool et al., 2021), una verdadera revolución.

Anteriormente, se necesitaba una computadora de gran capacidad para instalar la base de datos de proteínas y poder utilizar AlphaFold2 de manera local, ya que la predicción era mejor que la hecha en los servidores disponibles. Desde este año, AlphaFold3 posee un servidor donde se pueden encontrar las predicciones de las proteínas anotadas y además se puede utilizar el servidor online para predecir estructuras de proteínas solas y complejos de varias proteínas. AlphaFold3, lanzada en 2024, no solo es capaz de predecir lo mismo que AlphaFold2, sino que también predice complejos que incluyen iones y moléculas de ADN o ARN e incluso interacciones proteína-proteína, expandiendo enormemente las posibilidades.

A partir de AlphaFold, muchos otros modelos que utilizan IA han sido generados. Es posible, por ejemplo, predecir la estructura de proteínas del sistema inmune, como receptores o anticuerpos, y así identificar, por ejemplo, cuáles se unen a los mismos antígenos y usarlos no solo para investigación sino también en aplicaciones clínicas. Este es el caso de IGFold (Ruffolo et al., 2023) o ImmuneBuilder (Abanades et al., 2023), por citar algunos.

Fuente: Jumper et al. (2021)

La misma DeepMind ha creado un spin-off para el descubrimiento de drogas: Isomorphic Labs, el cual ya tiene convenios con dos farmacéuticas (Criddle et al, 2024). El uso de IA en la industria farmacéutica podría acelerar enormemente el tiempo de desarrollo de fármacos, a la vez que reducir los costos al reducir el espectro de drogas a testear en las primeras fases.

En el caso de su uso en conjunto con la criomicroscopía electrónica que mencionamos anteriormente, gracias a la predicción de una estructura en AlphaFold, podemos acomodar dichos modelos encima de un tomograma y así inferir si se trata de la misma proteína. Los programas desarrollados para analizar este tipo de imágenes hacen este proceso de manera automática, dando al final un candidato o lista de posibles candidatos que pueden corresponder a dicha proteína en la célula.

Rosetta o cómo ser un arquitecto de proteínas

Podemos predecir entonces la estructura de proteínas a partir de la secuencia, pero ¿podemos diseñar una proteína de cero para que tenga cierto plegamiento y por ende realice cierta función?

David Baker es un biólogo computacional de la Universidad de Washington que se llevó la mitad del Nobel de Química de este año por el diseño computacional de proteínas (The Nobel Prize in Chemistry 2024, 2014). En 2003, Baker publicó la primera proteína diseñada de novo (desde cero), llamada Top7 (Kuhlman et al., 2003). Mediante diseño computacional, él y sus colaboradores predijeron la estructura de la proteína de 93 residuos y la clonaron. Luego, determinaron la estructura de la misma de manera experimental usando cristalografía de rayos X, confirmando que la proteína tenía la estructura predicha.

Fuente: Royal Swedish Academy of Sciences

David es el autor de varios artículos sobre el diseño racional de proteínas y es el fundador de Rosetta, un software y modelo colaborativo que ayuda no solo a analizar estructura de proteínas sino a diseñarlas de novo (Rosetta Commons – The Hub for Rosetta Modeling Software). Esto último ha permitido diseñar proteínas que no se encuentran en la naturaleza y utilizarlas como biosensores, drogas e incluso como agentes neutralizantes de COVID y vacunas (Jacobsen, 2021).

Rosetta ofrece cursos y talleres. David también ayudó a crear un juego llamado Foldit, en el que personas sin conocimientos de ciencias pueden dilucidar cómo se pliegan proteínas y ayudar así a científicos (Foldit). Algunas personas que han participado del juego incluso aparecen como coautores en algunos artículos científicos (Gray, 2024).

Fuente: Rosetta Commons.

Resumiendo, ¿por qué es importante la estructura de las proteínas? Porque la estructura determina la función de una proteína.

¿Por qué es importante saber su función? Además de conocer más sobre biología elemental, al saber que ciertas proteínas funcionan dependiendo de su forma, podemos crear nuestras propias proteínas que hagan lo que nosotros deseamos, como detectar drogas o curar enfermedades.

El premio Nobel de Química de este año celebra dos líneas de investigación que han llevado el estudio de las proteínas a un nuevo nivel gracias a innovadores métodos de IA.

Referencias

  • Abanades, B., Wong, W. K., Boyles, F., Georges, G., Bujotzek, A., & Deane, C. M. (2023). ImmuneBuilder: Deep-Learning models for predicting the structures of immune proteins. Communications Biology, 6(1), 1–8. https://doi.org/10.1038/s42003-023-04927-7
  • Abramson, J., Adler, J., Dunger, J., Evans, R., Green, T., Pritzel, A., Ronneberger, O., Willmore, L., Ballard, A. J., Bambrick, J., Bodenstein, S. W., Evans, D. A., Hung, C.-C., O’Neill, M., Reiman, D., Tunyasuvunakool, K., Wu, Z., Žemgulytė, A., Arvaniti, E., … Jumper, J. M. (2024). Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 630(8016), 493–500. https://doi.org/10.1038/s41586-024-07487-w
  • Callaway, E. (2020). ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures. Nature, 588(7837), 203–204. https://doi.org/10.1038/d41586-020-03348-4
  • Cressey, D., & Callaway, E. (2017). Cryo-electron microscopy wins chemistry Nobel. Nature, 550(7675), 167–167. https://doi.org/10.1038/nature.2017.22738
  • Criddle, C., Kuchler, H. and Murgia, M. (2024). DeepMind spin-off aims to halve drug discovery times following Big Pharma deals. Financial Times. Retrieved 11 November 2024, from https://www.ft.com/content/a08e4ad9-5277-4860-9df2-d5df2ad1e57d
  • Gray, L. (2024). Biochemist David Baker receives Nobel Prize. UW Medicine | Newsroom. Retrieved 10 October 2024, from https://newsroom.uw.edu/news-releases/biochemist-david-baker-receives-nobel-prize
  • Jacobsen, R. (2021, July 1). Artificial Proteins Never Seen in the Natural World Are Becoming New COVID Vaccines and Medicines. Scientific American. https://www.scientificamerican.com/article/artificial-proteins-never-seen-in-the-natural-world-are-becoming-new-covid-vaccines-and-medicines/
  • Jumper, J., Evans, R., Pritzel, A., Green, T., Figurnov, M., Ronneberger, O., Tunyasuvunakool, K., Bates, R., Žídek, A., Potapenko, A., Bridgland, A., Meyer, C., Kohl, S. A. A., Ballard, A. J., Cowie, A., Romera-Paredes, B., Nikolov, S., Jain, R., Adler, J., … Hassabis, D. (2021). Highly accurate protein structure prediction with AlphaFold. Nature, 596(7873), Article 7873. https://doi.org/10.1038/s41586-021-03819-2
  • Kuhlman, B., Dantas, G., Ireton, G. C., Varani, G., Stoddard, B. L., & Baker, D. (2003). Design of a Novel Globular Protein Fold with Atomic-Level Accuracy. Science, 302(5649), 1364–1368. https://doi.org/10.1126/science.1089427
  • Rosetta Commons – The hub for Rosetta modeling software. (n.d.). Retrieved 10 October 2024, from https://rosettacommons.org/
  • Ruffolo, J. A., Chu, L.-S., Mahajan, S. P., & Gray, J. J. (2023). Fast, accurate antibody structure prediction from deep learning on massive set of natural antibodies. Nature Communications, 14(1), 2389. https://doi.org/10.1038/s41467-023-38063-x
  • Tunyasuvunakool, K., Adler, J., Wu, Z., Green, T., Zielinski, M., Žídek, A., Bridgland, A., Cowie, A., Meyer, C., Laydon, A., Velankar, S., Kleywegt, G. J., Bateman, A., Evans, R., Pritzel, A., Figurnov, M., Ronneberger, O., Bates, R., Kohl, S. A. A., … Hassabis, D. (2021). Highly accurate protein structure prediction for the human proteome. Nature, 596(7873), 590–596. https://doi.org/10.1038/s41586-021-03828-1
  • Varadi, M., Bertoni, D., Magana, P., Paramval, U., Pidruchna, I., Radhakrishnan, M., Tsenkov, M., Nair, S., Mirdita, M., Yeo, J., Kovalevskiy, O., Tunyasuvunakool, K., Laydon, A., Žídek, A., Tomlinson, H., Hariharan, D., Abrahamson, J., Green, T., Jumper, J., … Velankar, S. (2024). AlphaFold Protein Structure Database in 2024: Providing structure coverage for over 214 million protein sequences. Nucleic Acids Research, 52(D1), D368–D375. https://doi.org/10.1093/nar/gkad1011

¿Qué te pareció este artículo?

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (1 votos, promedio: 5,00 de 5)

Columnista de ciencias biológicas, biotecnología, microbiología, educación y ciencia en Chile y Alemania.
Doctora en biotecnología molecular por la Universidad de Chile, exbecaria del programa "Don Carlos Antonio López". Bioquímica y bioquímica clínica egresada de la Universidad Nacional de Asunción, fue presidenta de Estudiantes de Bioquímica Asociados del Paraguay. Actualmente es investigadora Post doctoral de la Universidad de Freiburg (Alemania), trabajando con microorganismos extremófilos y desarrollo de herramientas de edición genética como CRISPR.

Compartir artículo:

Dejar un comentario

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí