Entrevista: Karin strauss
“Ya hemos almacenado un gigabyte de datos en ADN sintético”
El volumen de información que genera la humanidad no deja de crecer, cada vez a mayor velocidad. Más pronto que tarde, nuestros actuales sistemas de almacenamiento de datos serán insuficientes. La solución al problema pasa por la biotecnología y el ADN sintético.
Según un estudio de la consultora IDC, el universo digital ocupará 44 billones de gigabytes en 2020, diez veces más que en 2013. Con ese ritmo de crecimiento, dentro de pocos años nuestros soportes de almacenamiento actuales podrían verse desbordados ante semejante avalancha de datos. A este problema se añade el de que la información registrada en los soportes físicos que conocemos se deteriora con el paso del tiempo y se pierde.
Afortunadamente, la ciencia bioinformática anuncia aplicaciones que nos permitirán guardar todos nuestros datos en uno de los almacenes más capaces y duraderos: el ADN. El gigante informático Microsoft y la Universidad de Washington están trabajando juntos en ese campo en la Escuela Paul G. Allen de Informática e Ingeniería de Seattle, gracias al esfuerzo de investigadores tan entusiastas como la doctora Karin Strauss o los doctores Luis Henrique Ceze y Chris Takahashi, entre otros destacados científicos.
Allí, en Seattle, encontramos a la citada Karin Strauss, joven y activa científica. Su investigación sobre el almacenamiento de datos en ADN ha sido reseñada en publicaciones como The New York Times, The Wall Street Journal, MIT Technology Review y Scientific American, y gracias a ella fue elegida como una de las cien personas más creativas en el mundo de los negocios seleccionadas por la revista Fast Company en 2016.
La idea casi suena a ciencia ficción. ¿Cuándo y dónde empezaron a imaginar los científicos la posibilidad de almacenar información en la molécula de la herencia?
Es cierto que suena a ciencia ficción, pero ya hemos guardado un gigabyte de datos en ADN, y esta cantidad seguirá creciendo. La idea de registrar información directamente en moléculas se remonta a los años 50. Richard Feynman predijo el almacenamiento de información molecular en su famosa conferencia Hay mucho espacio en el fondo, pero no llegó a sugerir que usáramos ADN como material de ingeniería para ello. Esa idea fue sugerida por [Norbert] Wiener en los años 60. ¿Podemos decir que con la bioinformática ha nacido una nueva rama de la ciencia? Yo diría que la rama de la ciencia y la ingeniería que hizo posible el almacenamiento de datos en ADN es la biotecnología, que es más amplia que la bioinformática. La mayoría de los profanos en la materia sabemos muy poco sobre las cualidades del ADN. ¿Podrías resumirnos cómo se realiza el proceso físico de grabar casi cualquier cosa –una foto, un texto, un vídeo, una canción...– en él? Creemos que el ADN es un medio atractivo para almacenar información debido a su alta densidad –1 exabyte (1.000 millones de gigabytes) en una pulgada cúbica–; a su du
rabilidad, pues el ADN se conserva en estado natural durante miles de años–; y a su eterna relevancia, ya que ahora que sabemos cómo leer el ADN (secuenciación), siempre tendremos lectores para sus usos clínicos en el ADN biológico/humano.
La informática/ingeniería y la biotecnología nos dieron las herramientas que necesitamos para almacenar información en ADN sintético. Lo primero que hay que entender es que estamos utilizando el ADN como material por sí mismo, no en células u organismos, y que el ADN que empleamos se fabrica según las especificaciones. Partimos de datos digitales, que son una secuencia de bits, y utilizamos los cuatro nucleótidos naturales del ADN –los bloques básicos del ADN: A, C, G, T– para crear series de ADN que representan esas secuencias de bits. El proceso de escritura para el almacenamiento de ADN fabrica –sintetiza– esas secuencias de ADN, y luego las guardamos. La lectura de los datos implica secuenciar –leer– las moléculas de ADN y decodificarlas de nuevo para obtener los datos digitales originales. Tanto los procesos de síntesis como los de secuenciación son una práctica estándar en biotecnología, desde la investigación hasta el diagnóstico y las terapias. Es, sin embargo, un proceso lento, ya que el ADN necesita ser secuenciado para recuperar los datos, así que el almacenamiento en ADN es mejor para el archivo a largo plazo de los datos, o lo que se conoce como almacenamiento en frío.
Sabemos que este proceso es posible porque las primeras demostraciones prácticas ya han tenido lugar. ¿Podrías recordarnos los experimentos más exitosos llevados a cabo hasta ahora?
Como se mencionó con anterioridad, recientemente hemos alcanzado la marca de 1 gigabyte en el almacenamiento de datos en ADN sintético. También hemos demostrado un proceso totalmente automatizado de almacenamiento de información en el ADN de principio a fin. Todos los resultados se pueden encontrar en nuestra página web (www.cs.washington.edu). EL CINE EN LOS GENES. Los primeros datos que se lograron almacenar en ADN mostraban el poco definido galope de un caballo. En 2005, Seth Shipman, biólogo de la Escuela de Medicina de Harvard, logró, píxel a píxel, grabar un archivo gif –compuesto por cinco fotogramas de 36 x 26 píxeles cada uno– en el genoma de bacterias E. coli mediante el sistema de edición de genes CRISPR, asociando a secuencias de nucleótidos cada píxel de la imagen animada. A la izquierda, una de las imágenes originales; a la derecha, la obtenida a partir de la información leída en el genoma.
¿Cuáles son los países y centros de investigación donde esta nueva tecnología está más avanzada?
Microsoft tiene la suerte de mantener importantes colaboraciones con la Universidad de Washington y la Escuela Politécnica Federal de Zúrich (Suiza). Nuestro equipo es bastante amplio, abarca todas las áreas: desde teoría de codificación y algoritmos hasta arquitectura informática, ingeniería mecánica y eléctrica, biología molecular y química. También colaboramos con Twist Bioscience (empresa pública que fabrica ADN sintético), con sede en San Francisco. Hay otros grupos trabajando en ello en Harvard, en el Instituto Europeo de Bioinformática (Inglaterra), en la Universidad de Illinois, en el Centro del Genoma de Nueva York y en algunas start-ups.
Las aplicaciones de big data, en combinación con la inteligencia artificial (IA), van a traer grandes cambios a nuestra vida cotidiana. Obviamente, la posibilidad de elevar geométricamente nuestras capacidades de almacenamiento de información puede ser el complemento ideal para estas tecnologías. ¿Microsoft y otras empresas líderes
prevén que estos nuevos descubrimientos se comercialicen en un periodo de tiempo relativamente corto?
La cantidad de datos que generamos ha crecido significativamente, y tecnologías como el almacenamiento de datos en ADN prometen ayudarnos a almacenar una mayor proporción de esta información. Estamos en los inicios de esta investigación, y, aunque nos animan nuestros primeros hallazgos, de momento no tenemos nada más que compartir sobre los planes futuros.
Parece que este sistema revolucionario presenta dos grandes inconvenientes. El primero, su alto precio. Se calcula que, con el uso de esta tecnología, almacenar la información de un par de Blu-ray costaría alrededor de un millón de euros. El segundo problema es su lentitud de operación. ¿Existen indicios de que ambos problemas podrán resolverse en un corto periodo de tiempo? Requerirá ingeniería adicional y economías de escala, pero no creemos que haya razones fundamentales por las que no se puedan superar dichas limitaciones. La buena noticia es que ambos problemas están relacionados entre sí, de modo que las soluciones al problema de la producción –velocidad– también reducirán el coste total de la operación.
“Confiar a los seres humanos las operaciones cotidianas de almacenamiento de datos en ADN podría propiciar errores”
Se dice que el proceso no requiere electricidad. Escribir y leer las moléculas sí consume electricidad. Para el almacenamiento en ADN, en cambio, se puede prescindir de ella, siempre y cuando este esté encapsulado adecuadamente. Dado que el objetivo es conservar información durante largos periodos, la mayor parte del tiempo solo se almacena, no se escribe ni se lee.
Hemos visto en vuestros laboratorios algunas fotografías de una extraña máquina (en la imagen de arriba) que se asemeja a las que manejan en las películas de ciencia ficción de serie B esos típicos sabios locos que quieren conquistar el mundo. Bromas aparte... ¿La habéis construido vosotros? ¿Puedes decirnos en qué se emplea? Hemos construido un prototipo inicial de una solución totalmente automatizada para el almacenamiento de información en ADN. Nuestro objetivo no era crear una máquina de producción bonita o elegante, sino una prueba económica que nos permitiera demostrar que el almacenamiento de datos en ADN puede automatizarse por completo, ya que confiar en los seres humanos en las operaciones cotidianas podría propiciar errores. Con el diseño modular y abierto también se puede utilizar la plataforma para experimentar más con los componentes y otros usos del sistema automatizado.
En los últimos tiempos se ha señalado muy a menudo que, en todo el mundo, existe una aparente falta de interés por parte de las mujeres en realizar estudios universitarios de carácter científico o técnico, lo que se traduce en un menor número de mujeres en laboratorios y centros de investigación, ya sea en ciencias o en ingeniería. ¿Qué piensas de esto? ¿Crees que se podría hacer algo para equiparar a los dos sexos?
Todos tenemos un papel que desempeñar para animar a las mujeres y a las minorías subrepresentadas a participar en la ciencia y la ingeniería, ya que la diversidad permite cubrir más terreno. Hay mucho por hacer en este terreno, y se debería comenzar desde la primera infancia, despertando el interés de los niños por la ciencia y la ingeniería –donde estoy segura de que MUY INTERESANTE desempeña un papel positivo– hasta dirigir a las mentes jóvenes hacia la educación técnica de pregrado y posgrado, utilizando todas las vías para retener a las mujeres profesionales de STEM (acrónimo en ingles de ciencia, tecnología, ingeniería y matemáticas) y a las minorías infrarrepresentadas en la industria y los centros académicos. En nuestro proyecto, tenemos la suerte de trabajar con un grupo muy variado de personas que aprecian y apoyan la diversidad y la inclusión de muchas maneras.