Los investigadores crean una línea integrada para realizar estudios de cribado genético
Los ingenieros genéticos de hoy en día tienen una plétora de recursos a su disposición: un número cada vez mayor de conjuntos de datos masivos disponibles en línea, herramientas de edición de genes de alta precisión como CRISPR y métodos de secuenciación de genes baratos. Pero la proliferación de nuevas tecnologías no ha venido acompañada de una hoja de ruta clara que ayude a los investigadores a determinar qué genes deben dirigirse a ellos, qué herramientas utilizar y cómo interpretar sus resultados. Así que un equipo de científicos e ingenieros del Instituto Wyss de Ingeniería Inspirada en la Biología de Harvard, la Facultad de Medicina de Harvard (HMS) y el Laboratorio de Medios del MIT decidieron crear una.
El equipo de Wyss ha creado un procedimiento integrado para realizar estudios de cribado genético, que abarca todos los pasos del proceso, desde la identificación de los genes objetivo de interés hasta la clonación y el cribado de los mismos de forma rápida y eficiente. El protocolo, denominado Sequencing-based Target Ascertainment and Modular Perturbation Screening (STAMPScreen), se describe en Cell Reports Methods, y los algoritmos de código abierto asociados están disponibles en GitHub.
"STAMPScreen es un flujo de trabajo racionalizado que facilita a los investigadores la identificación de genes de interés y la realización de cribados genéticos sin tener que adivinar qué herramienta utilizar o qué experimentos realizar para obtener los resultados que desean", dijo el autor correspondiente Pranam Chatterjee, Ph.D., Es totalmente compatible con muchas bases de datos y sistemas existentes, y esperamos que muchos científicos puedan aprovechar STAMPScreen para ahorrar tiempo y mejorar la calidad de sus resultados".
La frustración es la madre de la invenciónInvestigadores crean una prueba diagnóstica para identificar espermatozoides funcionales en hombres infértiles
En qué consiste el Cribado Genético Preimplantacional (PGS)
Chatterjee y Christian Kramme, uno de los primeros autores del artículo, estaban frustrados. Los dos científicos trataban de explorar los fundamentos genéticos de distintos aspectos de la biología -como la fertilidad, el envejecimiento y la inmunidad- combinando los puntos fuertes de los métodos digitales (piense en algoritmos) y la ingeniería genética (piense en la secuenciación de genes). Pero no dejaban de encontrar problemas con las distintas herramientas y protocolos que utilizaban, habituales en los laboratorios científicos.
Los algoritmos que pretendían cribar los genes de un organismo para identificar los que tenían un impacto significativo en un determinado proceso biológico podían decir cuándo cambiaba el patrón de expresión de un gen, pero no proporcionaban ninguna información sobre la causa de ese cambio. Cuando querían probar una lista de genes candidatos en células vivas, no estaba claro de inmediato qué tipo de experimento debían realizar. Además, muchas de las herramientas disponibles para insertar genes en las células y analizarlos eran caras, largas e inflexibles.
Utilizaba métodos conocidos como Golden Gate y Gateway para clonar genes en vectores para experimentos de cribado, y me llevaba meses y miles de dólares clonar 50 genes. Además, con Gateway no podía poner un código de barras a los genes para identificar cuál entraba en cada vector, lo que era un requisito crucial para mi diseño experimental basado en la secuenciación. Pensamos que tenía que haber una forma mejor de hacer este tipo de investigación y, al no encontrarla, asumimos el reto de crearla nosotros mismos."
Christian Kramme, coprimer autor del estudio y estudiante de posgrado del Instituto Wyss de Ingeniería Inspirada en la Biología de Harvard
Kramme se asoció con el coprimer autor y miembro del laboratorio de Church, Alexandru Plesa, que estaba experimentando frustraciones idénticas en la fabricación de vectores genéticos para su proyecto. Kramme, Plesa y Chatterjee se pusieron manos a la obra para esbozar lo que se necesitaría para crear una plataforma integral de cribado genético que sirviera para todos sus proyectos, que abarcaban desde la ingeniería de proteínas hasta la fertilidad y el envejecimiento.
De los bits a la mesa de trabajo
Para mejorar la fase más temprana de la investigación genética -la identificación de los genes de interés para el estudio-, el equipo creó dos nuevos algoritmos para ayudar a satisfacer la necesidad de herramientas computacionales que puedan analizar y extraer información de los conjuntos de datos cada vez más grandes que se están generando mediante la secuenciación de próxima generación (NGS). El primer algoritmo toma los datos estándar sobre el nivel de expresión de un gen y los combina con información sobre el estado de la célula, así como información sobre qué proteínas se sabe que interactúan con el gen. El algoritmo otorga una alta puntuación a los genes que están muy conectados con otros genes y cuya actividad está correlacionada con grandes cambios a nivel celular. El segundo algoritmo proporciona más información de alto nivel al generar redes que representan los cambios dinámicos en la expresión de los genes durante la diferenciación del tipo de célula y, a continuación, aplicar medidas de centralidad, como el algoritmo PageRank de Google, para clasificar los reguladores clave del proceso.
"La parte computacional de los estudios genéticos es como un juego de Jenga: si cada bloque de la torre representa un gen, buscamos los genes que forman la base de la torre de Jenga, los que sostienen todo el conjunto. La mayoría de los algoritmos sólo pueden decir qué genes están en la misma fila que los demás, pero los nuestros permiten determinar a qué altura de la torre se encuentran, de modo que se pueden identificar rápidamente los que más influyen en el estado de la célula en cuestión", explica Chatterjee.
Una vez identificados los genes objetivo, el protocolo STAMPScreen pasa del ordenador portátil al laboratorio, donde se realizan experimentos para interrumpir esos genes en las células y ver qué efecto tiene esa perturbación en la célula. El equipo de investigadores evaluó sistemáticamente múltiples herramientas de perturbación de genes, como el ADN complementario (ADNc) y varias versiones de CRISPR, en células madre pluripotentes inducidas humanas (hiPSC), las primeras comparaciones directas que se conocen realizadas íntegramente en este tipo de célula tan versátil, aunque difícil.
A continuación, crearon una nueva herramienta que permite utilizar CRISPR y ADNc dentro de la misma célula para desbloquear las sinergias entre ambos métodos. Por ejemplo, CRISPR puede utilizarse para desactivar la expresión de todas las isoformas de un gen, y el ADNc puede utilizarse para expresar secuencialmente cada isoforma de forma individual, lo que permite realizar estudios genéticos más matizados y reducir en gran medida la expresión de fondo de los genes que no son el objetivo.
Escaneo de códigos de barras de bibliotecas
El siguiente paso en muchos experimentos genéticos es generar una biblioteca de exploración para introducir genes en las células y observar sus efectos. Normalmente, los fragmentos de genes se insertan en plásmidos bacterianos (trozos circulares de ADN) utilizando métodos que funcionan bien para trozos pequeños de ADN, pero que son engorrosos cuando se insertan genes más grandes. Muchos de los métodos existentes también se basan en una técnica llamada Gateway, que utiliza un proceso llamado recombinación de fagos lambda y la producción de una toxina para eliminar cualquier bacteria que no haya recibido un plásmido con el gen de interés. La toxina de estos plásmidos suele ser complicada de trabajar en el laboratorio y puede inactivarse sin querer cuando se añade una secuencia de "código de barras" a un vector para ayudar a los investigadores a identificar qué plásmido portador del gen ha recibido el vector.
Kramme y Plesa estaban trabajando con Gateway cuando se dieron cuenta de que estos problemas podían resolverse si eliminaban la toxina y la sustituían por secuencias cortas en el plásmido que fueran reconocidas y cortadas por un tipo de enzimas llamadas meganucleasas. Las secuencias de reconocimiento de las meganucleasas no aparecen en los genes de ningún organismo conocido, lo que garantiza que la enzima no cortará accidentalmente el propio gen insertado durante la clonación. Estas secuencias de reconocimiento se pierden de forma natural cuando un plásmido recibe un gen de interés, lo que hace que esos plásmidos sean inmunes a la meganucleasa. Sin embargo, los plásmidos que no reciben con éxito el gen de interés conservan estas secuencias de reconocimiento y se cortan en pedazos cuando se añade una meganucleasa, dejando sólo un conjunto puro de plásmidos que contienen el gen insertado. El nuevo método, bautizado por los investigadores como MegaGate, tuvo una tasa de éxito en la clonación del 99,8% y también les permitió codificar sus vectores con facilidad.
"MegaGate no sólo resuelve muchos de los problemas que nos encontrábamos con los métodos de clonación más antiguos, sino que también es compatible con muchas bibliotecas de genes existentes, como TFome y hORFeome. Básicamente, se puede tomar Gateway y meganucleasas de la estantería, juntarlas con una biblioteca de genes y una biblioteca de vectores de destino con código de barras, y dos horas después se tienen los genes de interés con código de barras. Hemos clonado casi 1.500 genes con él y todavía no hemos tenido ningún fallo", dijo Plesa, que es estudiante de posgrado en el Instituto Wyss y en el HMS.
Por último, los investigadores demostraron que sus vectores con código de barras podían insertarse con éxito en hiPSC vivas, y que los grupos de células podían analizarse mediante NGS para determinar qué genes suministrados se expresaban en el grupo. También utilizaron con éxito diversos métodos, como RNA-Seq, TAR-Seq y Barcode-Seq, para leer tanto los códigos de barras genéticos como los transcriptomas completos de las hiPSC, permitiendo a los investigadores utilizar la herramienta con la que estén más familiarizados.
El equipo anticipa que STAMPScreen podría resultar útil para una amplia variedad de estudios, incluyendo estudios de vías y redes reguladoras de genes, cribado de factores de diferenciación, caracterización de fármacos y vías complejas, y modelización de mutaciones. STAMPScreen también es modular, lo que permite a los científicos integrar diferentes partes del mismo en sus propios flujos de trabajo.
"Hay un tesoro de información en los conjuntos de datos genéticos disponibles públicamente, pero esa información sólo se entenderá si utilizamos las herramientas y los métodos adecuados para analizarla. STAMPScreen ayudará a los investigadores a llegar más rápido a los momentos de eureka y a acelerar el ritmo de la innovación en ingeniería genética", ha dicho el autor principal, George Church, doctor y miembro del cuerpo docente de Wyss, que también es profesor de Genética en HMS y de Ciencias de la Salud y Tecnología en Harvard y el MIT.
"En el Instituto Wyss buscamos soluciones impactantes a problemas urgentes, pero sabemos que para llegar a la luna hay que construir primero un cohete. Este proyecto es un gran ejemplo de cómo nuestra comunidad innova sobre la marcha para hacer posible avances científicos que cambiarán el mundo para mejor", dijo el director fundador de Wyss, el doctor Don Ingber, que también es el profesor Judah Folkman de Biología Vascular en el HMS y el Programa de Biología Vascular en el Hospital Infantil de Boston, así como profesor de Bioingeniería en la Escuela de Ingeniería y Ciencias Aplicadas John A. Paulson de Harvard.