ES2950676T3

ES2950676T3 - Reparación de enlace de plantillas a endonucleasas para modificación de genes

Info

Publication number: ES2950676T3
Application number: ES18703730T
Authority: ES
Inventors: Mathias Labs
Original assignee: KWS SAAT SE and Co KGaA
Current assignee: KWS SAAT SE and Co KGaA
Priority date: 2017-01-30
Filing date: 2018-01-30
Publication date: 2023-10-11
Anticipated expiration: 2038-01-30
Also published as: CN110475866A; EP3574101A1; JP2020505074A; DK3574101T3; DK3574101T5; EA201991809A1; BR112019015578A2; AU2018212624A1; US20190352626A1; KR20190112771A; WO2018138385A1; EP3574101B1; CA3052099A1

Abstract

La presente invención se refiere a complejos moleculares artificiales que comprenden al menos una nucleasa específica de sitio e interactúan directamente con ella al menos un dominio de acoplamiento de plantilla de reparación, interactuando dicho dominio de acoplamiento de plantilla de reparación con al menos una secuencia de ácido nucleico de plantilla de reparación. El complejo artificial puede comprender además al menos un dominio de interacción. Los complejos moleculares artificiales están configurados para mediar en la reparación de una secuencia diana de ADN en un organismo procariótico o eucariota con alta precisión de forma dirigida y, por lo tanto, pueden usarse para la ingeniería genética en una célula u organismo procariótico o eucariota, o para la edición de un virus. genoma. Además se proporcionan métodos para modificar al menos una secuencia diana de ADN en una célula procariótica o eucariota o un genoma viral, por ejemplo, para el desarrollo de rasgos o para tratar una enfermedad. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Reparación de enlace de plantillas a endonucleasas para modificación de genes

Campo técnico

La presente invención se refiere a complejos moleculares artificiales y particularmente a usos de los mismos que comprenden al menos una nucleasa específica del sitio e interactúa directamente con el al menos un dominio de acoplamiento de la plantilla de reparación, interactuando dicho dominio de acoplamiento de la plantilla de reparación con al menos una secuencia de ácido nucleico de la plantilla de reparación. Un complejo artificial puede comprender además al menos un dominio de interacción. Los complejos moleculares artificiales están configurados para mediar en la reparación de una secuencia objetivo de ADN en un organismo o genoma procariota o eucariota o viral con alta precisión de una manera dirigida y, por lo tanto, pueden usarse para la modificación del genoma en una célula u organismo procariota o eucariota o modificación del genoma con un genoma procariota, eucariota o viral in vivo o in vitro. Además se proporcionan métodos para modificar al menos una secuencia objetivo de ADN en una célula procariota o eucariota, o un genoma viral, por ejemplo, para el desarrollo de rasgos o para el tratamiento de una enfermedad. Además, se proporciona un método para fabricar una planta, una célula de la planta, un material de la planta o un derivado, o una progenie del mismo que comprende o edita por lo menos un complejo molecular artificial. Por lo tanto, se proporciona el uso de un complejo molecular artificial adecuado para cualquier nucleasa específica del sitio que dirige una plantilla de reparación en estrecha proximidad física a una secuencia objetivo de ADN que se modificará para permitir la disponibilidad inmediata de una plantilla de reparación in situ en el sitio de una ruptura inducida de cadena doble de ADN para garantizar una alta eficiencia y previsibilidad para una variedad de enfoques de modificación del genoma.

Antecedentes de la invención

La edición de genes de precisión o la modificación del genoma ha evolucionado como una de las áreas más importantes de la ingeniería genética que permite la manipulación direccionada y dirigida al sitio de un genoma de interés. Un requisito previo indispensable para la modificación del genoma dirigida al sitio son las nucleasas programables, que pueden usarse para romper un ácido nucleico de interés en una posición definida para inducir una ruptura de cadena doble (DSB) o una o más rupturas de una sola cadena. Alternativamente, dichas nucleasas pueden ser variantes quiméricas o mutadas, que ya no comprenden una función de nucleasa, sino que funcionan como moléculas de reconocimiento en combinación con otra enzima. Esas nucleasas o variantes de las mismas son, por lo tanto, clave para cualquier enfoque de edición de genes o modificación del genoma. En los últimos años, se han desarrollado muchas nucleasas adecuadas, especialmente endonucleasas confeccionadas que comprenden meganucleasas, nucleasas con dedos de zinc, nucleasas TALE, nucleasas Argonauta, derivadas, por ejemplo, de Natronobacterium gregoryi, y nucleasas CRISPR, que comprenden, por ejemplo, nucleasas Cas, Cpf1, CasX o CasY como parte del sistema de repeticiones palindrómicas cortas agrupadas regularmente interespaciadas (CRISPR).

Las CRISPR (repeticiones palindrómicas cortas agrupadas regularmente interespaciadas) en su entorno natural evolucionaron originalmente en bacterias donde el sistema de CRISPR cumple el papel de un sistema inmunitario adaptativo para defenderse contra el ataque viral. Tras la exposición a un virus, segmentos cortos de ADN viral se integran en el locus de CRISPR. El ARN se transcribe a partir de una parte del locus de CRISPR que incluye la secuencia viral. Ese ARN, que contiene una secuencia complementaria al genoma viral, media en el direccionamiento de una proteína efectora de CRISPR a una secuencia objetivo en el genoma viral. La proteína efectora de CRISPR se escinde y, por lo tanto, interfiere con la replicación del objetivo viral. En los últimos años, el sistema de CRISPR se ha adaptado con éxito para la edición de genes o la modificación del genoma también en células eucariotas. La edición en células animales y las aplicaciones terapéuticas para seres humanos son actualmente de gran importancia para la investigación. La modificación específica de genomas animales y vegetales complejos todavía representa una tarea exigente.

Un sistema de CRISPR en su entorno natural describe un complejo molecular que comprende al menos un ARN no codificante pequeño e individual en combinación con una nucleasa Cas u otra nucleasa de CRISPR tal como una nucleasa Cpf1 (Zetsche et al., "Cpf1 Is a Single RNA-Guides Endonuclease of a Class 2 CRISPR-Cas System", Cell, 163, págs. 1-13, octubre de 2015) que puede producir una ruptura específica de cadena doble de ADN. En la actualidad, los sistemas de CRISPR se clasifican en dos clases que comprenden cinco tipos de sistemas de CRISPR, el sistema Tipo II, por ejemplo, que usa Cas9 como efector y el sistema Tipo V que usa Cpf1 como molécula efectora (Makarova et al., Nature Rev. Microbial., 2015). En los sistemas de CRISPR artificiales, un ARN no codificante sintético y una nucleasa de CRISPR y/u opcionalmente una nucleasa de CRISPR modificada, modificada para actuar como nickasa o que carece de cualquier función de nucleasa, se puede usar en combinación con al menos un ARN guía sintético o artificial o ARNg que combina la función de un ARNcr y/o un ARNtracr (Makarova et al., 2015, citado anteriormente). La respuesta inmune mediada por CRISPR/Cas en sistemas naturales requiere CRISPR-ARN (ARNcr), donde la maduración de este ARN guía, que controla la activación específica de la nucleasa de CRISPR, varía significativamente entre los diversos sistemas de CRISPR que se han caracterizado hasta el momento. En primer lugar, el ADN invasor, también conocido como espaciador, se integra entre dos regiones repetidas adyacentes en el extremo proximal del locus de CRISPR. Los sistemas de CRISPR de tipo II codifican una nucleasa Cas9 como enzima clave para la etapa de interferencia, cuyos sistemas contienen un ARNcr y también un ARN transactivador (ARNtracr) como motivo guía. Estos se hibridan y forman regiones de ARN de cadena doble (dc) que son reconocidas por la ARNasa III y se pueden escindir para formar ARNcr maduros. Estos, a su vez, se asocian con la molécula de Cas para dirigir la nucleasa específicamente a la región de ácido nucleico objetivo. Las moléculas de ARNg recombinantes pueden comprender tanto la región de reconocimiento de ADN variable como también la región de interacción de Cas, y pueden modificarse específicamente, independientemente del ácido nucleico objetivo específico y la nucleasa Cas deseada. Como mecanismo de seguridad adicional, los PAM (motivos adyacentes al protoespaciador) deben estar presentes en la región del ácido nucleico objetivo; estas son secuencias de ADN que siguen directamente del ADN reconocido por el complejo Cas9/ARN. La secuencia del PAM para la Cas9 de Streptococcus pyogenes se ha descrito como "NGG" o "NAG" (código estándar de nucleótidos de la IUPAC) (Jinek et al., "A programmable dual-RNAguided DNA endonuclease in adaptive bacterial immunity", Science 2012, 337: 816-821). La secuencia de PAM para Cas9 de estafilococo aureus es "NNGRRT" o "NNGRR(N)". Se conocen otras variantes de sistemas de CRISPR/Cas9. Por lo tanto, una Cas9 de Neisseria meningitidis escinde en la secuencia de PAM NNNNGATT. Una Cas9 de Streptococcus thermophilus escinde en la secuencia de PAM NNAGAAW. Recientemente, se ha descrito otro motivo PAM NNNNRYAC para un sistema de CRISPR de Campylobacter (documento WO 2016/021973 A1). Para las nucleasas Cpf1 se ha descrito que el complejo Cpf1-ARNcr escinde eficientemente el ADN objetivo seguido de un PAM corto rico en T en contraste con los PAM comúnmente ricos en G reconocidos por los sistemas de Cas9 (Zetsche et al., citado anteriormente). Además, mediante el uso de polipéptidos de CRISPR modificados, se pueden obtener roturas de cadena sencillas específicas. El uso combinado de nickasas Cas con varios ARNg recombinantes también puede inducir roturas de cadena doble de ADN altamente específicas por medio de doble corte de ADN. Mediante el uso de dos ARNg, además, se puede optimizar la especificidad de la unión del ADN y, por lo tanto, la escisión del ADN.

En la actualidad, por ejemplo, los sistemas de tipo II que dependen de Cas9, o una variante o cualquier forma quimérica del mismo, como endonucleasa, se han modificado para la modificación del genoma. Los sistemas de CRISPR sintéticos que constan de dos componentes, un ARN guía (ARNg) también llamado ARN guía único (ARNgu) y una endonucleasa asociada a CRISPR no específica, se pueden usar para generar células o animales con eliminación génica al coexpresar un ARNg específico para el gen al que se dirige y capaz de asociarse con la endonucleasa Cas9. En particular, el ARNg es una molécula artificial que comprende un dominio que interactúa con Cas o cualquier otra proteína efectora de CRISPR o una variante o un fragmento catalíticamente activo de la misma y otro dominio que interactúa con el ácido nucleico objetivo de interés y, por lo tanto, representa una fusión sintética de ARNcr y ARNtracr. ("ARN guía único" (ARNgu) o simplemente "ARNg"; Jinek et al., 2012, citado anteriormente). El objetivo genómico puede ser cualquier secuencia de ADN de ~20 nucleótidos, siempre que el objetivo esté presente inmediatamente secuencia arriba de un PAM. La secuencia de PAM es de gran importancia para la unión al objetivo y la secuencia exacta depende de la especie de Cas9 y, por ejemplo, lee 5' NGG 3' o 5' NAG 3' (código estándar de nucleótidos de la IUPAC) (Jinek et al., 2012, citado anteriormente) para una Cas9 derivada de Streptococcus pyogenes. Usando nucleasas Cas modificadas, se pueden introducir roturas de cadena sencillas específicas en una secuencia objetivo de interés. El uso combinado de tal nickasa Cas con diferentes rupturas de cadena doble de ADN altamente específicas del sitio de los ARNg recombinantes puede introducirse usando un sistema de doble corte. El uso de uno o más ARNg puede aumentar aún más la especificidad general y reducir los efectos fuera del objetivo.

Una vez expresada, la proteína Cas9 y el ARNg forman un complejo de ribonucleoproteína a través de interacciones entre el dominio de la "estructura" del ARNg y los surcos cargados positivamente expuestos en la superficie en Cas9. Es importante destacar que la secuencia "espadadora" del ARNg permanece libre para interactuar con el ADN objetivo. El complejo Cas9-ARNg se unirá a cualquier secuencia genómica con un PAM, pero la medida en que el espaciador de ARNg coincida con el ADN objetivo determina si Cas9 cortará. Una vez que el complejo Cas9-ARNg se une a un objetivo de ADN putativo, una secuencia de "semilla" en el extremo 3' de la secuencia de direccionamiento de ARNg comienza a hibridarse con el ADN objetivo. Si las secuencias de semilla y de ADN objetivo coinciden, el ARNg continuará hibridándose con el ADN objetivo en una dirección de 3' a 5' (en relación con la polaridad del ARNg).

Recientemente, los sistemas de CRISPR/Cpf1 modificados además de los sistemas de CRISPR/Cas9 se vuelven cada vez más importantes para la modificación específica del genoma (véase Zetsche et al., citado anteriormente y el documento EP 3 009 511 A2). El sistema Tipo V junto con el sistema Tipo II pertenece a los sistemas de CRISPR Clase 2 (Makarova and Koonin Methods mol. Biol., 2015, 1311:47-753). La proteína efectora Cpf1 es una proteína grande (alrededor de 1,300 aminoácidos) que contiene un dominio de nucleasa similar a RuvC homólogo al dominio correspondiente de Cas9 junto con una contraparte del grupo característico rico en arginina de Cas9. Sin embargo, Cpf1 carece del dominio de nucleasa de HNH que está presente en todas las proteínas Cas9, y el dominio similar a RuvC es contiguo en la secuencia de Cpf1, en contraste con Cas9, donde contiene insertos largos que incluyen el dominio de HNH (Chylinski, 2014; Makarova, 2015). Los efectores Cpf1 poseen ciertas diferencias sobre los efectores Cas9, a saber, no se requieren ARNcr transactivadores adicionales (ARNtracr) para el procesamiento de matriz CRISPR, escisión eficiente del ADN objetivo por PAM cortos ricos en T (en contraste con Cas9, donde el PAM es seguido por un secuencia rica en G), y la introducción de roturas de cadena doble de ADN escalonadas por Cpf1. Muy recientemente, se han identificado sistemas de CRISPR-Cas novedosos adicionales basados en CasX y CasY que, debido al tamaño relativamente pequeño de la proteína efectora, son de interés específico para muchos enfoques de edición de genes o modificación del genoma (Burstein et al., "New CRISPR-Cas systems from uncultivated microbes", Nature, diciembre de 2016). La especificidad de los sistemas de CRISPR está determinada en gran parte por la especificidad de la secuencia de direccionamiento del ARNg para el objetivo genómico en comparación con el resto del genoma.

El reino Plantae comprende especies de alta heterogeneidad y diversidad dadas las diferencias genómicas y fenotípicas de algas verdes, briofitas, pteridofitas y plantas terrestres. Los genomas de las plantas y su complejidad representan un desafío para la edición de genes de alta precisión o la modificación del genoma. Zea mays (maíz), por ejemplo, tiene la mayor producción mundial de todos los cultivos de granos, con un rendimiento de 875 millones de toneladas en 2012. Tiene un gran genoma de alrededor de 2.4 gigabases (Gb) con un número de cromosomas haploides de 10 (Schnable et al., 2009; Zhang et al., 2009). Triticum aestivum (trigo para pan), por ejemplo, es hexaploide, con un tamaño de genoma estimado en ~17 Gb. Beta vulgaris ssp. vulgaris (remolacha azucarera) tiene un tamaño de genoma que oscila entre aproximadamente 470 megabases (Mb) y aproximadamente 569 Mb. La arquitectura y composición específicas de las células vegetales y el desarrollo peculiar de las plantas exige una adaptación específica para las herramientas de modificación del genoma cuando se pretende que se utilicen para modificar una secuencia objetivo dentro de una célula de la planta. Por lo tanto, las herramientas de modificación del genoma y los principios asociados con las mismas establecidos para sistemas animales, particularmente mamíferos, no funcionarán necesariamente en una célula de la planta de interés y existe la necesidad de estrategias específicas para establecer la tecnología para lograr una amplia aplicación en plantas.

Asimismo, los genomas de los animales, y en especial de los mamíferos, son complejos, comprendiendo por ejemplo 2.7 Gb para el genoma de Mus musculus o 3.2 Gb para el genoma de Homo sapiens. Especialmente, cuando los enfoques de edición de genes o modificación del genoma basados en CRISPR están destinados a ser utilizados para la edición precisa de genes o la modificación de objetivos del genoma dentro del genoma humano, existe una necesidad urgente de proporcionar una alta especificidad, ya que cualquier tipo de efecto fuera del objetivo podría ser altamente perjudicial.

Otro aspecto a considerar críticamente para la modificación del genoma es el mecanismo de reparación necesario después de la escisión de un sitio de interés genómico, ya que las roturas de cadena doble (DSB) o las lesiones del ADN en general son perjudiciales para la integridad de un genoma. Las DSB en el material genómico pueden ser causadas por radiación ionizante, productos químicos, oxidación, enzimas y roturas de una sola cadena durante la replicación y representan una forma grave de daño en el ADN que puede provocar la pérdida de genes, el estancamiento de la replicación del ADN y la muerte celular. Por lo tanto, es de gran importancia que la maquinaria celular proporcione mecanismos de reparación de rotura de cadena doble (DSB). Las células poseen mecanismos intrínsecos para intentar reparar cualquier daño en el ADN de cadena doble o sencilla. Los mecanismos de reparación de DSB se han dividido en dos tipos básicos principales, unión de extremos no homólogos (NHEJ) y recombinación homóloga (HR). Los mecanismos de reparación basados en homología en general suelen denominarse reparación dirigida por homología (HOR).

NHEJ es la respuesta nuclear dominante en animales y plantas que no requiere secuencias homólogas, pero a menudo es propensa a errores y, por lo tanto, potencialmente mutagénica (Wyman C., Kanaar R. "DNA double-strand break repair: all's well that ends well", Annu. Rev. Genet. 2006; 40, 363-83). La reparación por HOR requiere homología, pero esas vías HOR que utilizan un cromosoma intacto para reparar el roto, es decir, la reparación de roturas de cadena doble y la hibridación de cadenas dependiente de la síntesis, son muy precisas. En la vía clásica de reparación de DSB, los extremos 3' invaden una plantilla homóloga intacta y luego sirven como cebador para la síntesis de reparación de ADN, lo que en última instancia conduce a la formación de uniones dobles de Holliday (dHJ). Las dHJ son estructuras ramificadas de cuatro cadenas que se forman cuando el alargamiento de la cadena invasiva "captura" y sintetiza ADN del segundo extremo de DSB. Las HJ individuales se resuelven mediante escisión en una de dos formas. La hibridación de cadenas dependiente de la síntesis es conservadora y da como resultado exclusivamente eventos sin cruce. Esto significa que todas las secuencias recién sintetizadas están presentes en la misma molécula. A diferencia de la vía de reparación de NHEJ, luego de la invasión de la cadena y la formación del bucle D en la hibridación de la cadena dependiente de la síntesis, la parte recién sintetizada de la cadena invasiva se desplaza de la plantilla y regresa al extremo procesado de la cadena no invasora en el otro extremo de DSB . El extremo 3' de la cadena no invasiva se alarga y se liga para llenar el espacio. Existe una vía adicional de HOR, llamada vía de reparación inducida por rotura que aún no se ha caracterizado por completo. Una característica central de esta vía es la presencia de un solo extremo invasivo en una DSB que puede usarse para la reparación.

Otra vía de HOR es la hibridación de cadena sencilla (SSA). SSA no es conservativa y ocurre entre repeticiones directas >30 pb y da como resultado eliminaciones. En los últimos años, la unión de extremos mediada por microhomología (MMEJ) ha sido reconocida como un tipo distinto de reparación de DSB en eucariotas. Solo se necesitan regiones de homología muy cortas (2-14 pb) para esta vía, y normalmente deja eliminaciones como SSA. También se ha distinguido genéticamente de las vías HR y NHEJ y en células de mamíferos actúa como respaldo para NHEJ (Kwon, T, Huq, E. y Herrin, DL (2010). "Microhomology-mediated and nonhomologous repair of a double-strand break in the chloroplast genome of Arabidopsis". Proceedings of the National Academy of Sciences of the United States of America, 107(31), 13954-13959). En resumen, HR/HOR emplea un tramo homólogo de ADN en una cromátida hermana como plantilla. Por lo tanto, proporciona alta fidelidad, sin embargo, menos eficiencia. NHEJ, por el contrario, es altamente eficiente y una vía sencilla que puede volver a unir los dos extremos independientemente de una homología significativa, mientras que esta eficiencia va acompañada del inconveniente de que este proceso es propenso a errores y puede estar asociado con inserciones o eliminaciones.

Para los enfoques de edición de genes o modificación del genoma que buscan influir en las vías de reparación natural, se requiere el diseño físico de una plantilla de reparación (RT), que es un parámetro importante. Puede ser posible proporcionar la RT como ADNcs o parcialmente ADNcd. Los protocolos actuales que se basan en herramientas de CRISPR para la edición del genoma en combinación con una plantilla de reparación (RT) se basan exclusivamente en la provisión separada de la RT del ácido nucleico, ya sea de doble o de una sola cadena, que a su vez reconoce la ruptura en el ADN que se va a reparar únicamente por emparejamiento de bases e hibridación. Sin embargo, la disponibilidad física y temporal de la RT en el sitio donde se induce una ruptura del ADN no puede controlarse mediante los métodos actualmente disponibles, ya que esos métodos no proporcionan la provisión espacial y temporal precisa de la RT en la configuración, concentración y, por lo tanto, estequiometría correcta en el compartimento donde debe tener lugar la reparación, preferiblemente inmediatamente después de la inducción de una ruptura de ADN específica para controlar específicamente no solo la ruptura, sino también el evento de reparación.

Al igual que las nucleasas CRISPR/Cas, las endonucleasas Argonauta ("Argonautas") están involucradas en la defensa contra ácidos nucleicos extraños mediante el uso de guías de ácidos nucleicos para especificar una secuencia objetivo, que luego es escindida por el componente de proteína Argonauta. Específicamente, una Argonauta puede unirse y escindir un ácido nucleico objetivo formando un complejo con un ácido nucleico dirigido a ácido nucleico diseñado o sintético, donde la escisión del ácido nucleico objetivo puede introducir roturas de cadena doble en el ácido nucleico objetivo. Al igual que el sistema de Cas9, las guías de ácidos nucleicos de Argonautas proporcionan un método sencillo para programar la especificidad de la secuencia de endonucleasas. Sin embargo, las moléculas cortas de ARNcs son utilizadas como guías por muchas Argonautas eucariotas sin ninguna restricción de reconocimiento de estructura secundaria, como las presentes en la interacción Cas9-ARN guía único (ARNgu, ARNg). La abundancia de ARNcs en la mayoría de las células eucariotas, por lo tanto, hace que el direccionamiento específico de las Argonautas eucariotas guiadas por ARN sea un desafío potencial. Por el contrario, algunas Argonautas de procariotas se guían por moléculas cortas de ADNcs fosforiladas en 5' (Swarts, DC et al. DNA-guided DNA interference by a prokaryotic Argonaute. Nature 507, 258-261, 2014; Swarts, D.C. et al. Argonaute of the archaeon Pyrococcus furiosus is a DNAguided nuclease that targets cognate DNA Nucleic Acids Res. 43, 5120-5129, 2015) y, por lo tanto, inherentemente tienen un menor potencial de ser engañados por los ácidos nucleicos derivados de la célula huésped debido a la escasez de moléculas cortas de ADNcs presentes en las células eucariotas. Por lo tanto, las endonucleasas Argonauta guiadas por ADN tienen potencial para su aplicación en la edición del genoma de eucariotas. Sin embargo, el uso del sistema de Argonauta de Natronobacterium gregoryi (NgAgo) en plantas no se ha demostrado previamente.

En la bibliografía, se ha documentado que la recombinación homóloga entre dos secuencias ocurre con más frecuencia si las secuencias están muy próximas dentro del núcleo en lugar de con una cantidad significativa de separación. Por ejemplo, el análisis en Arabidopsis de la tasa de edición de genes obtenida entre las moléculas donantes cromosómicamente ubicadas y los objetivos fue mayor en ambos casos en los que el donante existía en el mismo cromosoma que el objetivo que en los otros casos en los que los dos loci estaban ubicados en cromosomas distintos (Fauser et al., 2012). Sin embargo, estos hallazgos nunca se han explotado de manera racional para optimizar la edición de genes basada en endonucleasas específicas del sitio o los enfoques de modificación del genoma en células eucariotas.

El documento EP 2 958 996 A1 busca superar el problema de la reparación específica de DSB al proporcionar un inhibidor de los mecanismos de NHEJ en la célula para aumentar la alteración génica mediada por una nucleasa (p. ej., ZFN o TALEN) o un sistema de nucleasa (p. ej., CRISPR/Cas). Mediante la inhibición de las actividades enzimáticas críticas de estas vías de reparación del ADN de NHEJ, utilizando inhibidores de moléculas pequeñas de la subunidad catalítica de proteína quinasa dependiente de ADN (ADN-PKc) y/o poli-(ADP-ribosa) polimerasa 1/2 (PARP1/2), el nivel de interrupción de genes por nucleasas aumenta al obligar a las células a recurrir a vías de reparación más propensas a errores que la NHEJ clásica, tal como NHEJ alternativa y/o unión final mediada por microhomología. Por lo tanto, se agrega una sustancia química adicional en el curso de la edición del genoma, lo que, sin embargo, podría ser una desventaja para varios tipos de células y ensayos. Esto también podría afectar la integridad del genoma de las células tratadas y/o el potencial regenerativo.

Ma et al. (2016, JCB, 214(5):529, "CRISPR-Cas9 nuclear dynamics and target recognition in living cells") usó un ARNgu modificado en 3' que permitió la unión basada en aptámeros de un informador fluorescente para estudiar la dinámica de Cas9 y la dinámica del ARNgu hacia un objetivo telomérico. Notablemente, la modificación dentro de la secuencia de ARNtracr no tuvo efecto sobre el direccionamiento. Solo el truncamiento posterior de la secuencia de ARNtracr condujo a ARNgu desestabilizado independientemente de la modificación del aptámero.

Por lo tanto, existe una necesidad constante de proporcionar herramientas de CRISPR adecuadas, en particular herramientas optimizadas para la edición de precisión de plantas, especialmente plantas de cultivo importantes, que combinen la división del genoma de alta precisión, por ejemplo, al proporcionar ARNg optimizados para el sitio objetivo en una célula de interés y proporcionando simultáneamente la posibilidad de mediar HOR altamente precisa y, por lo tanto, la reparación dirigida de una DSB, que es imperativa para controlar una intervención de edición de genes o modificación del genoma.

Por lo tanto, el objetivo es presentar nuevas estrategias para proporcionar plantillas de reparación para la edición precisa del genoma, especialmente adecuadas para células eucariotas, incluidas células de levadura, animales y vegetales, pero también adecuadas para células procariotas, por ejemplo, para modificación metabólica y varios otros fines o para la modificación de genomas virales, por ejemplo, para atenuar un virus o para reducir la virulencia de un virus. A pesar de los tremendos avances de la edición del genoma en biotecnología, por ejemplo, para enfoques terapéuticos, terapia génica o modificación del genoma de plantas o microbios para el desarrollo de rasgos específicos, todavía existen problemas y preocupaciones importantes con respecto a la especificidad de una modificación del genoma objetivo que se va a introducir o efectos fuera del objetivo. Este problema está pero sin limitarse a asociado con el grado de precisión que se puede obtener al inducir una ruptura y la reparación asociada de un ácido nucleico objetivo genómico de interés.

Dado que cualquier tipo de enfoque de edición de genes o modificación del genoma que induce una DSB introduce una ruptura de ADN potencialmente dañina y posiblemente un mecanismo de reparación de ADN no deseado que conduce a intercambios de ácido nucleico no deseados, existe una necesidad constante de desarrollar métodos y herramientas más eficientes para lograr edición de genes altamente precisa y controlada o modificación del genoma, lo que también implica el uso de plantillas de reparación de ADN (RT) dirigidas.

Otro problema frecuentemente asociado con la provisión de modificación exitosa del genoma sin mediar efectos fuera del objetivo es la disponibilidad física de una plantilla de reparación en el sitio de la DSB exactamente en el momento en que se produce la ruptura y, por lo tanto, debe repararse. Por lo general, el evento de edición deseado se ve superado por la reparación a través de la vía de unión de extremos no homólogos (NHEJ) o a través de la recombinación con la secuencia homóloga endógena como se detalló anteriormente. Dependiendo del organismo objetivo que se va a modificar, esto exige una estrategia concertada para introducir una herramienta de edición de genes o modificación del genoma junto con una plantilla de reparación de interés para que todas las herramientas puedan, en el momento adecuado, llegar al compartimento dentro de una célula que contiene el genoma, es decir, preferiblemente el núcleo, o cualquier otro compartimento portador del genoma, como las mitocondrias. Un método para superar parcialmente esta limitación es amplificar la plantilla de reparación y, por lo tanto, aumentar la abundancia de la plantilla en el núcleo y, presumiblemente, hacer que esté más disponible para reparar la DSB con la ayuda de un vector de geminivirus (véase, por ejemplo, Mach, Plant Cell. 2014, doi:10.1105/tpc.114.122606; y Baltes et al., Plant Cell. 2014, doi:10.1105/tpc.113.119792). Sin embargo, la plantilla de reparación se suministra como una entidad física separada y, por lo tanto, no existe un mecanismo de control que asegure que la plantilla de reparación estará realmente presente en el lugar donde se necesita la reparación del ADN exactamente en el momento en que una endonucleasa introduce una DSB.

Con respecto a las aplicaciones de CRISPR, existe la sugerencia frecuente de usar nucleótidos de ADNcs libres como plantillas de reparación o plantillas de reparación transmitidas por plásmidos, pero no se divulga ni sugiere ninguna estrategia que garantice que la plantilla de reparación entre en contacto físico con la DSB que se va a reparar in situ cuando se genera una DSB.

Las interacciones biotina-estreptavidina y biotina-avidina se encuentran entre las más estables de la naturaleza, con una constante de disociación Kd de 10'15 M. La asociación se basa en una estructura homotetramérica entre la proteína avidina o estreptavidina (~16.5 y 13.2 kDa por subunidad, respectivamente) y la vitamina biotina, presente universalmente, pero poco abundante. Los complejos homotetraméricos de estreptavidina o avidina se forman espontáneamente y son capaces de unirse a cuatro moléculas de biotina con bajas constantes de disociación. En al menos dos intentos, la tetramerización espontánea pudo superarse con una disminución de la afinidad de unión (Laitinen et al. 2003, "Rational Design of an Active Avidin Monomer". Journal of Biological Chemistry 278(6): 4010 4014; Mann et al. 2016, "Cell labeling and proximity dependent biotinylation with engineered monomeric streptavidin". TECHNOLOGY 4(3): 1-7). Asimismo, se demostró que la biotinilación de una nucleasa es posible al incluir una señal de biotinilación en la secuencia (Kay et al., 2009, "High-throughput Biotinylation of Proteins". Methods in molecular biology (Clifton, N.J.) 498: 185-196). BirA es una posible enzima biotinilada para la expresión de proteínas bacterianas, pero la biotinilación también ocurre en plantas superiores. Tissot et al. 1996, "Protein biotinylation in higher plants: Characterization of biotin holocarboxylase synthetase activity from pea (Pisum sativum) leaves", Biochemical Journal 314(Pt 2): 391-395).

Los fragmentos variables de cadena sencilla (Fvcs) representan proteínas de fusión de las regiones variables de la cadena pesada (V^h) y cadenas ligeras (V^l) de inmunoglobulinas, conectadas con un péptido enlazador corto de diez a aproximadamente 25 aminoácidos y se conocen como moléculas de unión versátiles de alta afinidad. Los fragmentos variables de cadena sencilla divalentes (o bivalentes) (di-Fvcs, bi-Fvcs) pueden modificarse mediante la unión de dos Fvcs. Esto se puede lograr mediante la producción de una sola cadena peptídica con dos regiones V^hy dos V^l, produciendo Fvcs en tándem (Kufer et al., 2004, Trends in Biotechnology, 22(5), 238-244; Xiong et al., 2006, Protein Engineering Design and Selection, 19(8), 359-367).

Sin embargo, hasta ahora, estos hallazgos sobre las capacidades de las moléculas biotiniladas y sus compañeros de unión afines, o sobre otros pares de unión molecular de alta afinidad, como por ejemplo anticuerpos o fragmentos variables de cadena sencilla y sus compañeros afines para la modificación dirigida del genoma utilizando nucleasas específicas del sitio y una plantilla de reparación no han sido explotadas.

El documento WO 2015/191693 A2 divulga sistemas de suministro para células de mamíferos en los que una plantilla de reparación puede unirse a un ARN guía. El documento WO 2016/065364 A1 divulga un sistema similar en las células T y describe además la unión de un nucleótido donante a una endonucleasa.

En este punto, se hacen evidentes las diferencias peculiares de suministro de herramientas de edición de genes o modificación del genoma y/o plantillas de reparación de acuerdo con sea necesario para diferentes células objetivo. En este sentido, las células vegetales tienen ciertas características distintivas, incluidas las paredes celulares, lo que hace que la edición de genes o la modificación del genoma en células vegetales sea una tarea completamente diferente a la edición de genes o la modificación del genoma tal como se establece para las células de animales/mamíferos, como el suministro de herramientas de edición del genoma y/o las de reparación están mediadas por diferentes métodos de transformación, transfección y/o transducción que para otras células eucariotas. Estas peculiaridades, sin embargo, deben tenerse en cuenta para lograr una edición de alta precisión del genoma de la planta. Por lo tanto, era un objetivo de la presente invención superar la necesidad pronunciada de proporcionar nuevas herramientas y métodos adecuados para la edición genómica de alta precisión en células eucariotas, incluidas las células vegetales, particularmente en el campo de la edición genómica mediada por CRISPR y Argonauta para superar la continua limitación en el campo de la edición de genes con respecto a la disponibilidad física de la plantilla de reparación en el sitio y el momento en que se repara la DSB y, por lo tanto, la competencia por los mecanismos de reparación del ADN a través de la vía de unión final no homóloga (NHEJ) o a través de la recombinación con una secuencia homóloga (endógena) (HR/HOR). La presente divulgación proporciona un kit de herramientas simplificado de nucleasa dirigida al sitio adecuado para cualquier nucleasa específica del sitio y que no se limita a las nucleasas CRISPR o Argonauta guiadas por ácido nucleico, que se puede utilizar para la edición del genoma dirigida al sitio en células eucariotas o procariotas o para cualquier genoma de procariota, eucariota o viral al proporcionar una molécula o un complejo molecular que unifica las propiedades de la plantilla de reconocimiento, escisión y reparación del ADN y, al mismo tiempo, se puede administrar fácilmente al sitio objetivo, es decir, una célula procariota, un genoma de eucariota o viral, particularmente el genoma de una célula animal, en particular una célula de mamífero, o de una célula de la planta, ya que el grado de precisión que debe lograrse durante la edición del genoma de células animales o vegetales todavía tiene que mejorarse para cumplir con requisitos necesariamente altamente reguladores como los establecidos por las autoridades de suministro médica y alimentaria. El riesgo de integraciones fuera del objetivo de los complejos moleculares artificiales como se divulga en este documento es menor que para una plantilla de reparación de ADNcs o ADNcd introducida como moléculas libres en la célula. Además, era un objetivo proporcionar una herramienta de suministro que esté específicamente optimizada para transferir una construcción específica de una planta para edición del genoma con la ayuda de un método de suministro específico de la planta. Además, era un objetivo proporcionar un enfoque que pueda basarse en la actividad de edición transitoria utilizando ARN y nucleasas específicas de sitio proporcionados de forma transitoria, si se desea, debido a la sensibilidad en ciertas jurisdicciones hacia cualquier forma de modificación genética que integre ADN extraño como un producto intermedio en el proceso de producción. Era un objetivo de la presente invención proporcionar un método de edición de genes o de modificación del genoma, que es superior a los métodos recientes en el sentido de que ahorra tiempo con respecto a la prueba de nuevos objetivos, ya que no debería requerir una clonación engorrosa y pruebas previas.

Resumen

La presente invención es como se define en las reivindicaciones.

Los objetivos identificados anteriormente se han logrado de acuerdo con la presente invención resolviendo el problema de la disponibilidad de la plantilla de reparación suministrando la plantilla de reparación al sitio de la DSB acoplándola directamente como "carga" al complejo de nucleasa, mientras que el espectro de nucleasas adecuado para este enfoque se ha incrementado drásticamente al proporcionar complejos moleculares artificiales, que se basan en cualquier nucleasa específica del sitio (SSN) de interés. Dirigir la plantilla de reparación a la rotura de cadena doble en el momento en que se realiza la rotura se hace in situ proporcionando al menos un dominio de acoplamiento de la plantilla de reparación (RTDD) junto con al menos una SSN, en donde el dominio de acoplamiento de la plantilla de reparación está configurado para interactuar directamente con al menos una secuencia de ácido nucleico (RT) de la plantilla de reparación aumentando la disponibilidad local de la plantilla de reparación (RT) para explotación en reparación de la rotura. Por lo tanto, los complejos moleculares artificiales de acuerdo con la presente invención no solo ayudan a proporcionar plantillas de reparación personalizadas, sino que además pueden ayudar a aumentar la frecuencia y/o la especificidad de los eventos de edición de genes. Por lo tanto, esta idea combina las funcionalidades de la nucleasa específica del sitio y las plantillas de reparación en un solo complejo molecular para la escisión simultánea del genoma y la reparación dirigida combinada con herramientas y métodos de suministro específicos para suministrar la herramienta o herramientas de edición del genoma y/o la plantilla de reparación en un compartimiento de interés en una célula objetivo. Por lo tanto, este sistema permite una mayor especificidad y, por lo tanto, reduce los efectos fuera del objetivo de los enfoques de edición actuales, que es necesario para minimizar la escisión fuera del objetivo en genomas de animales grandes, particularmente mamíferos o, a veces, incluso en plantas más complejas.

Específicamente, los objetivos anteriores se han logrado proporcionando, en un primer aspecto de la presente divulgación, un complejo molecular artificial que comprende (a) al menos una nucleasa específica del sitio (SSN) o un fragmento catalíticamente activo de la misma, o una secuencia de ácido nucleico que la codifica, e interactúa directamente con ella (b) al menos un dominio de acoplamiento de la plantilla de reparación (RTDD), o una secuencia de ácido nucleico que codifica al mismo, en donde el dominio de acoplamiento de la plantilla de reparación está configurado para interactuar directamente con al menos una secuencia de ácido nucleico de la plantilla de reparación (RT); (c) que comprende opcionalmente al menos un dominio de interacción (IA), o una secuencia de ácido nucleico que codifica el mismo, en donde al menos un dominio de interacción interactúa directamente con al menos una nucleasa específica del sitio o el fragmento catalíticamente activo de la misma, y en donde al menos un dominio de interacción está configurado para proporcionar al menos una de las funcionalidades seleccionadas del grupo que consiste en (i) interacción con al menos un dominio de acoplamiento de la plantilla de reparación; y/o (ii) interacción con al menos una secuencia de ácido nucleico de la plantilla de reparación; y/o (iii) interacción específica de secuencia con ADN genómico; en donde al menos una secuencia de ácido nucleico de la plantilla de reparación comprende al menos una parte que es complementaria a al menos una secuencia de complementariedad genómica, y en donde al menos una secuencia de ácido nucleico de la plantilla de reparación está configurada para mediar en la reparación de una secuencia objetivo de ADN.

En una realización de acuerdo con los diversos aspectos de la presente divulgación, se proporciona un complejo molecular artificial, en donde la nucleasa específica del sitio, o la secuencia de ácido nucleico que codifica la misma, se selecciona de al menos una nucleasa de CRISPR, incluidas nucleasas Cas o Cpf1, una TALEN, una ZFN, una meganucleasa, una endonucleasa de restricción, incluida una endonucleasa de restricción de clase IIS, incluida Fokl o una variante de la misma, o dos endonucleasas de corte específicas de sitio, o una variante o un fragmento catalíticamente activo de las mismas.

En otra realización de la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos un dominio de acoplamiento de la plantilla de reparación, o la secuencia de ácido nucleico que codifica el mismo, se selecciona de al menos uno de biotina, un aptámero, un tinte de ADN, ARN o proteína, que comprende fluoróforos, que comprende fluoresceína o una variante de la misma, maleimidas o tetraxolio (XTT), una secuencia de ácido nucleico guía configurada específicamente para interactuar con al menos una secuencia de ácido nucleico de la plantilla de reparación, una estreptavidina o una variante de los mismos, tal como una estreptavidina monomérica, una avidina o una variante de la misma, una etiqueta de afinidad, tal como una etiqueta de estreptavidina, un anticuerpo, un fragmento variable de cadena sencilla (Fvcs), un anticuerpo de un solo dominio (nanocuerpo), una anticalina, una proteína VirD2 de Agrobacterium o un dominio de la misma, una VPg de Picornavirus, una topoisomerasa o un dominio de la misma, una proteína del fago A PhiX174, una proteína PhiX A*, una proteína VirE2 o un dominio de la misma, o digoxigenina. Otro sistema bien conocido para la interacción es una etiqueta de SNAP, por ejemplo, fusionado con una dCas9 como la ofrecida por New England Biolabs Inc. (www.neb.com). La etiqueta de Sn a P puede unirse a una serie de fluoróforos, biotina y otros conjugados. El objetivo principal es permitir la visualización, pero también sería útil para vincular la plantilla de reparación.

En otra realización más del primer aspecto anterior de acuerdo con la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos un dominio de interacción, o la secuencia de ácido nucleico que codifica el mismo, se selecciona de al menos uno de un dominio de unión al ADN, una estreptavidina o una variante de la misma, tal como una estreptavidina monomérica, avidina o una variante de las mismas, una etiqueta de afinidad, una señal de biotinilación, un sitio aceptor de biotina, una etiqueta de estreptavidina, un anticuerpo, una variable de cadena sencilla (Fvcs), un anticuerpo de un solo dominio (nanocuerpo), una anticalina, biotina, un aptámero, un tinte de ADN, ARN o proteína, que comprende fluoróforos, que comprende fluoresceína o una variante de la misma, maleimidas o tetraxolio (XTT), un secuencia de ácido nucleico guía configurada específicamente para interactuar con al menos una secuencia de ácido nucleico de la plantilla de reparación, una proteína VirD2 de Agrobacterium o un dominio de la misma, una VPg de Picornavirus, una topoisomerasa o un dominio de la misma, una proteína del fago A PhiX174, una proteína PhiX A*, una proteína VirE2 o un dominio de la misma, o digoxigenina.

En otra realización más de la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos una nucleasa específica del sitio y/o al menos un dominio de interacción comprende al menos una secuencia de localización nuclear, una secuencia de localización de plástidos, tal como una secuencia de localización de mitocondrias o una secuencia de localización de cloroplastos.

En otra realización de acuerdo con los diversos aspectos de la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación comprende al menos una parte final, tal como el extremo 3', en donde esta parte final no interactúa con ningún otro componente del complejo molecular artificial y, por lo tanto, está configurado para hibridarse con al menos una secuencia de complementariedad genómica para mediar en la reparación de la secuencia objetivo de ADN, y/o en donde al menos una secuencia de ácido nucleico de la plantilla de reparación se proporciona como plásmido .

En otra realización más de la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos una nucleasa específica del sitio o el fragmento catalíticamente activo de la misma, o la secuencia que codifica la misma, se selecciona de una nucleasa de CRISPR, tal como de una nucleasa Cas o Cpf1, o una nucleasa Fokl, o un fragmento catalítico de la misma, y al menos un dominio de interacción, o la secuencia que codifica el mismo, se selecciona de un fragmento variable de cadena sencilla o una estreptavidina monomérica.

Además, se proporciona, en otra realización de la presente divulgación, un complejo molecular artificial, en donde el complejo comprende al menos una secuencia de ácido nucleico guía que representa al menos un dominio de acoplamiento de la plantilla de reparación, en donde cada uno de al menos una de las secuencias de ácido nucleico guía comprende (i) una primera parte de secuencia que es complementaria a una secuencia objetivo de ADN de reconocimiento, y (ii) una segunda parte de secuencia, donde la segunda parte de secuencia está configurada para interactuar con al menos una nucleasa específica del sitio, y (iii) en donde al menos una secuencia de ácido nucleico guía está asociada físicamente con al menos una secuencia de ácido nucleico de la plantilla de reparación y, por lo tanto, forma una secuencia de ácido nucleico híbrida que comprende o consiste en al menos un ARN o ADN y al menos otra secuencia de ácido nucleico de ADN, y (iv) opcionalmente que comprende una región enlazadora entre al menos una secuencia de ácido nucleico guía y al menos una secuencia de ácido nucleico de la plantilla de reparación, por ejemplo en donde la secuencia de ácido nucleico de la plantilla de reparación está asociada con la secuencia de ácido nucleico guía en el extremo 3' de la secuencia de ácido nucleico guía, y/o en donde la secuencia de ácido nucleico de la plantilla de reparación está asociada con el extremo 5' de la secuencia de ácido nucleico guía, y/o en donde la secuencia de ácido nucleico de la plantilla de reparación está ubicada dentro de la secuencia de ácido nucleico guía.

En otra realización de la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación y/o al menos una secuencia de ácido nucleico guía comprenden una secuencia de nucleótidos seleccionada de una secuencia natural o no natural de nucleótidos, que incluye una secuencia de nucleótidos sintética, que comprende opcionalmente modificaciones de la cadena principal y/o de la base, en donde la secuencia de ácido nucleico guía comprende una secuencia de nucleótidos de ARN o ADN de cadena sencilla o parcialmente de cadena sencilla, y en donde al menos un secuencia de ácido nucleico de la plantilla de reparación comprende una secuencia de nucleótidos de ADN de cadena sencilla o cadena doble.

En otra realización adicional de acuerdo con los diversos aspectos de la presente divulgación, se proporciona un complejo molecular artificial, en donde al menos una nucleasa específica del sitio, o la secuencia que codifica la misma, y al menos un dominio de interacción, o la secuencia que codifica el mismo, y/o al menos un dominio de acoplamiento de la plantilla de reparación, o la secuencia que codifica el mismo, están conectados por al menos un dominio enlazador.

En una de las realizaciones proporcionadas de acuerdo con la presente divulgación, al menos una nucleasa específica del sitio o el fragmento catalíticamente activo de la misma, o la secuencia que codifica la misma, se selecciona independientemente del grupo que consiste en un polipéptido Cas de Streptococcus spp., incluido Streptococcus pyogenes, Streptococcus thermophilus, Staphylococcus aureus, o Neisseria spp., incluido Neisseria meningitides, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Roseburia, Parvibaculum, Nitratifractor, Mycoplasma, Campylobacter, Candidates Micrarchaeum acidiphilum ARMAN-1, Parcubacterias (GenBank: APG80656.1), Sulfolobus spp., incluyendo Sulfolobus islandicus HVE10/4 (GenBank: ADX81770.1) o REY15A (GenBank: ADX84852.1), y Candidates Parvarchaeum acidiphilum ARMAN-4, un polipéptido Cpf1 de una arquea o una bacteria, incluido un polipéptido Cpf1 de Acidaminococcus spp., incluido Acidaminococcus sp. BV3L6, Lachnospiraceae spp., incluido la bacteria Lachnospiraceae ND2006, la bacteria Lachnospiraceae MC2017, la bacteria Lachnospiraceae MA2020, Butyrivibrio proteoclasticus, Candidatus spp., Methanoplasma termitum, Leptospira inadai, Moraxella bovoculi 237, la bacteria Peregrinibacteria g W2011_GWA2_33_10, bacteria Parcubacteria GW2011_GWC2_44_17, Smithella sp. SCADC, Smithella sp. SC_K08D17, Francisella spp., incluida Francisella novicida U112, Eubacterium eligens, Prevotella spp., o Porphyromonas spp., o una nucleasa Argonauta de Natronobacterium gregoryi (GenBank: AFZ73749.1), Microcistis aeruginosa (Secuencia de referencia del NCBI: WP_012265209.1 o Secuencia de referencia del N^cBI: WP_002747795.1 o Secuencia de referencia del NCBI: WP_012265209.1), Halogeométricum pallidum (GenBank: ELZ29017.1), Natrialaba asiática (secuencia de referencia del NCBI: WP_006111085.1), Natronorubrum tibetense (secuencia de referencia del ⁿC^bI: WP_006090832.1), Natrinema pellirubrum (secuencia de referencia del NCBI: WP_006183335.1), o Synechococcus spp. (secuencia de referencia del NCBI: WP_011378069.1) o variantes y/o fragmentos funcionales y/o combinaciones de los mismos, incluidas nickasas o nucleasas que carecen de actividad endonucleolítica.

En un segundo aspecto de acuerdo con la presente divulgación, se proporciona un complejo molecular artificial de acuerdo con cualquiera de las realizaciones anteriores para su uso en un método de tratamiento de una enfermedad, en donde la enfermedad se caracteriza por al menos una mutación genómica y el complejo molecular artificial está configurado para dirigirse y reparar al menos una mutación genómica. Por lo tanto, se proporciona un método para tratar una enfermedad utilizando el complejo molecular artificial de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la enfermedad se caracteriza por al menos una mutación genómica y el complejo molecular artificial está configurado para dirigirse y reparar al menos una mutación genómica.

En un aspecto, se proporciona una planta, una célula de la planta, un material de la planta o un derivado, o una progenie del mismo que comprende o edita por lo menos un complejo molecular artificial de acuerdo con cualquiera de los aspectos y/o realizaciones precedentes.

En otro aspecto, se proporciona un método para modificar al menos una secuencia objetivo de ADN que comprende las siguientes etapas: (i) proporcionar al menos una célula y/o genoma procariota, eucariota o viral (las realizaciones de la presente invención están relacionadas con al menos una célula y/o genoma vegetal) que comprende al menos una secuencia de complementariedad genómica y al menos una secuencia objetivo de ADN en una región genómica de interés; (ii) proporcionar al menos un complejo molecular artificial como se define en cualquiera de los aspectos y/o realizaciones precedentes; (iii) poner en contacto al menos un complejo molecular artificial con al menos una secuencia objetivo de ADN en condiciones adecuadas para conseguir (a) la interacción de al menos una nucleasa específica del sitio con al menos una secuencia objetivo de ADN; y (b) emparejamiento de bases complementarias de al menos una secuencia de ácido nucleico de la plantilla de reparación con al menos una secuencia de complementariedad genómica para lograr el reconocimiento de al menos una secuencia de complementariedad y la inducción de al menos una rotura de ADN por al menos una nucleasa específica del sitio, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación dirige la reparación dirigida por homología en el sitio de al menos una secuencia objetivo de ADN; y (iv) obtener al menos una célula y/o genoma procariota, eucariota o viral que comprende una modificación en al menos una secuencia objetivo de ADN; en donde, en realizaciones de la presente invención, al menos un dominio de acoplamiento de la plantilla de reparación, o la secuencia de ácido nucleico que codifica el mismo, se selecciona de una proteína VirD2 de Agrobacterium.

En una realización del aspecto anterior, se proporciona un método para modificar al menos una secuencia objetivo de ADN, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación y/o al menos un dominio de acoplamiento de la plantilla de reparación del complejo molecular artificial es/se proporcionan a al menos una célula y/o genoma procariota, eucariota o viral (al menos una célula y/o genoma vegetal en realizaciones de la invención) independientemente de al menos una nucleasa específica del sitio de al menos un complejo molecular y se ensambla o se ensambla parcialmente al menos un complejo molecular artificial, dentro de al menos una célula procariota o eucariota.

En una realización adicional del aspecto anterior, se proporciona un método para modificar al menos una secuencia objetivo de ADN, en donde al menos un complejo molecular artificial es un complejo molecular artificial ensamblado ex vivo.

En una realización adicional del aspecto anterior, se proporciona un método para modificar al menos una secuencia objetivo de ADN, en donde al menos una célula eucariota es una célula de la planta, preferiblemente una célula de la planta de una planta seleccionada del grupo que consiste en Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea spp., incluyendo Zea mays, Setaria italica, Oryza minuta, Oryza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Secale cereale, Triticale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta spp., incluyendo Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Nicotiana benthamiana, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Marus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine nexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oleracea, Brassica rapa, Raphanus sativus, Brassica juncacea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Gossypium sp., Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, Helianthus annuus, Helianthus tuberosus y Allium tuberosum o cualquier variedad o subespecie perteneciente a una de las plantas antes mencionadas.

En una realización adicional, se proporciona un método para modificar al menos una secuencia objetivo de ADN, en donde la modificación de al menos una secuencia objetivo de ADN provoca una edición de características seleccionada del grupo que consiste en mejora del rendimiento, tolerancia al estrés abiótico, incluido el estrés por sequía, estrés osmótico, estrés por calor, estrés por frío, estrés oxidativo, estrés por metales pesados, estrés por sal o anegamiento, tolerancia al estrés biótico, incluida la tolerancia a insectos, tolerancia a bacterias, tolerancia a virus, tolerancia a hongos o tolerancia a nematodos, resistencia a herbicidas, incluidos glifosato, glufosinato, inhibidores de ALS y Dicamba, resistencia al aplastamiento, tiempo de floración, resistencia al desmoronamiento, color de la semilla, composición del endospermo, contenido nutricional o modificación metabólica, incluida la edición del genoma para permitir un enfoque farmacológico molecular en al menos una célula de la planta.

Además se proporciona un método para modificar al menos una secuencia objetivo de ADN que comprende adicionalmente la siguiente etapa: (v) identificar y/o seleccionar al menos un genoma y/o célula procariota, eucariota o viral que comprende la modificación en al menos una secuencia objetivo de ADN.

En otro aspecto más, se proporciona un método para fabricar una planta o célula de la planta que comprende las siguientes etapas: (i) realizar un método de acuerdo con cualquiera de los aspectos y/o realizaciones anteriores, en donde al menos una célula eucariota es una célula de la planta; (ii) obtener al menos una planta o, de acuerdo con la presente divulgación, una progenie de la misma a partir de al menos una célula de la planta de la etapa (i); (iii) opcionalmente: determinar la modificación en al menos una secuencia objetivo de ADN en al menos una célula de al menos una planta o una progenie de la misma.

En una realización, se proporciona un método para fabricar una planta o célula de la planta, en donde al menos una planta o célula de la planta se selecciona de una planta monocotiledónea o dicotiledónea, preferiblemente, en donde la planta se selecciona del grupo que consiste en Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea spp., incluyendo Zea mays, Setaria italica, Oryza minuta, Oryza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Secale cereale, Triticale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta spp., incluyendo Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Nicotiana benthamiana, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Marus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine nexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oleracea, Brassica rapa, Raphanus sativus, Brassica juncacea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Gossypium sp., Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, Helianthus annuus, Helianthus tuberosus y Allium tuberosum, o cualquier variedad o subespecie perteneciente a una de las plantas antes mencionadas.

En un aspecto adicional, se proporciona el uso de al menos un complejo molecular artificial de acuerdo con cualquiera de los aspectos y/o realizaciones anteriores para la modificación del genoma en una célula, genoma u organismo procariota, eucariota o viral, por ejemplo en un célula de la planta u organismo, en donde las realizaciones de la invención se refieren a la modificación del genoma en una célula de la planta u organismo.

Aspectos adicionales de la presente divulgación pueden derivarse de la descripción detallada posterior, los dibujos, la lista de secuencias así como el conjunto de reivindicaciones adjunto.

Breve descripción de los dibujos

La Figura 1 A a D (Fig. 1 A a D) muestra ejemplos de posibles configuraciones y diferentes formas de asociación para diferentes híbridos de ARN-ADN o secuencias de ácido nucleico de ADN-ADN, representando la parte de ácido nucleico guía al menos un dominio de acoplamiento de la plantilla de reparación (RTDD) y/o al menos un dominio de interacción (la SSN) de acuerdo con la presente divulgación. (A) Asociación no covalente por emparejamiento de bases de Watson-Crick de una plantilla de reparación (RT) de cadena sencilla (ADNcs) a una molécula de ácido nucleico guía que contiene la secuencia que funciona como ARNgu o ARNtracr o como un ADNg. (B) Asociación covalente de una RT de cadena sencilla (ADNcs) a la molécula de ácido nucleico guía. Esta forma se puede fabricar mediante síntesis secuencial de la molécula de ácido nucleico guía de RTDD y las porciones de RT como una sola molécula, o mediante la unión de porciones separadas para formar una sola molécula. (C) Asociación no covalente de una RT de cadena doble (ADNcd) a la molécula de ácido nucleico guía. (D) Asociación covalente de una RT de cadena doble (ADNcd) a la molécula de ácido nucleico guía.

La Figura 2 A a C (Fig. 2 A a C) muestra ejemplos de posibles ubicaciones donde la RT se puede unir o asociar con una molécula de ácido nucleico guía como al menos una RTDD y/o al menos un la SSN de acuerdo con la presente divulgación. (A) Asociación covalente o no covalente de la RT de cadena sencilla o doble con el extremo 3' de la molécula de ácido nucleico guía. (B) Asociación covalente o no covalente de la RT de cadena sencilla o doble con el extremo 5' de la molécula de ácido nucleico guía. (D) Asociación covalente o no covalente de la RT de cadena sencilla o doble interna a la molécula de ácido nucleico guía. La parte de la plantilla de reparación (RT) se muestra en blanco en esta y todas las demás figuras.

La Figura 3 A a E (Fig. 3 A a E) muestra un ejemplo para la introducción paso a paso de una edición en una secuencia genómica de interés con el complejo de nucleasa específico del sitio (SSN) divulgado en el presente documento, usando una realización de la asociación covalente de la RT con el extremo 3' de la molécula de ácido nucleico guía como ejemplo. (A) Esquema de la molécula de ácido nucleico guía en complejo con una SSN, por ejemplo, NgAgo, Cas, incluidos Cas9, CasX o CasY, o Cpf1. (B) Esquema del complejo unido al ADN objetivo (ADN genómico (ADNg)) e indicación de los sitios de corte (triángulos negros). (C) Esquema del ADN objetivo escindido. (D) Esquema del ADN objetivo escindido liberado por la SSN e interactuando con la plantilla de reparación (RT) mediante el emparejamiento de bases complementario de Watson-Crick. (E) Esquema del sitio objetivo reparado (ADNg), incluidas las ediciones copiadas de la RT durante la recombinación homóloga. La parte de la plantilla de reparación (RT) se muestra en blanco en todas las figuras.

Las Figuras 4 A a C (Fig. 4 A a C) muestran un ejemplo para el diseño de una proteína de fusión de una endonucleasa guiada por ácido nucleico como SSN y una proteína o dominio proteico como dominio de interacción (la SSN) con capacidad para unirse directa o indirectamente una plantilla de reparación (RT). (A) Esquema de dicha proteína de fusión como un complejo con el ADN objetivo. (B) Esquema del complejo después de que se introdujo la ruptura de cadena doble. La endonucleasa guiada por ácido nucleico se separa del ADN objetivo. La plantilla de reparación de ácido nucleico fusionado forma un complejo con la región objetivo de una manera basada en la homología. (C) Esquema del ADN objetivo después de que se produjera la reparación dirigida por homología. En particular, el enfoque presentado utiliza más de un RTDD para agregar más precisión al complejo de modificación del genoma.

La Figura 5 muestra en el panel izquierdo una nucleasa purificada (en este caso, una nucleasa de CRISPR) que se fusionó con un RTDD1 y se expresó en E. coli. Corrió en un gel SDS de gradiente continuo desnaturalizante (4-10%) y muestra la cantidad y la pureza de la proteína. La proteína se tiñó en este gel. El panel derecho muestra la vinculación. Este es un gel de acrilamida no desnaturalizante al 4% (Blue Native PAGE) y en el presente documento el ADN se tiñe con GelRed. La plantilla de reparación marcada con FAM (RTDD2-) se incubó en el tampón de nucleasa sin o con la nucleasa-RTDD1 que se muestra a la izquierda. Si la proteína estaba presente, se producía anclaje como se observa por la detección de ADN en un nivel de peso molecular más alto (flecha).

La Figura 6 muestra en la línea 1 una parte de la secuencia de tipo silvestre del sitio objetivo (la secuencia de longitud completa representa la SEQ ID NO: 47), en las líneas 2 y 3, ejemplos de ocurrencia de INDEL (las secuencias de longitud completa representan las SEQ ID NO: 48 y 49), en la línea 4 el evento HDR correcto (la secuencia de longitud completa representa la SEQ ID NO: 50) y en la línea 5 muestra la plantilla de reparación (la secuencia de longitud completa representa la SEQ ID NO: 51).

La Figura 7 muestra una comparación de la eficiencia de HDR normalizada cuando la plantilla de reparación no lo está (columna izquierda) y está conectada a la nucleasa (columna derecha).

Definiciones

Debe señalarse que, como se usa en este documento, las formas singulares "un", "uno, una" y "el, la" incluyen referencias en plural a menos que el contexto indique claramente lo contrario. Por ejemplo, la referencia a un componente pretende incluir también la composición de una pluralidad de componentes. Las referencias a una composición que contiene "un" constituyente pretenden incluir otros constituyentes además del mencionado. En otras palabras, los términos "un", "uno, una" y "el, la" no denotan una limitación de cantidad, sino que denotan la presencia de "al menos uno" del elemento referenciado. Se pretende que cada término contemple su significado más amplio tal como lo entienden los expertos en la materia e incluye todos los equivalentes técnicos que funcionan de manera similar para lograr un propósito similar.

Los intervalos pueden expresarse en el presente documento desde "alrededor de" o "aproximadamente" o "sustancialmente" un valor particular y/o hasta "alrededor de" o "aproximadamente" o "sustancialmente" otro valor particular. Cuando se expresa tal intervalo, otras realizaciones ejemplares incluyen desde un valor particular y/o hasta otro valor particular. Además, el término "alrededor de" significa dentro de un intervalo de error aceptable para el valor particular determinado por un experto en la materia, que dependerá en parte de cómo se mida o determine el valor, es decir, las limitaciones del sistema de medición. Por ejemplo, "aproximadamente" puede significar dentro de una desviación estándar aceptable, de acuerdo con la práctica en la técnica. Alternativamente, "aproximadamente" puede significar un intervalo de hasta ±20 %, preferiblemente hasta ±10 %, más preferiblemente hasta ±5 % y aún más preferiblemente hasta ±1 % de un valor dado. Alternativamente, particularmente con respecto a sistemas o procesos biológicos, el término puede significar dentro de un orden de magnitud, preferiblemente dentro de 2 veces, de un valor. Cuando se describen valores particulares en la solicitud y las reivindicaciones, a menos que se indique lo contrario, el término "aproximadamente" está implícito y en este contexto significa dentro de un intervalo de error aceptable para el valor particular.

Por "que comprende", "que contiene" o "que incluye" se entiende que al menos el compuesto, elemento, partícula o etapa del método mencionado está presente en la composición, el artículo o el método, pero no excluye la presencia de otros compuestos, materiales, partículas, etapas del método, incluso si los otros compuestos, materiales, partículas, etapas del método tienen la misma función que se nombra.

Como se usa en el presente documento, "ácido nucleico" significa un polinucleótido e incluye un polímero de cadena sencilla o doble de bases de desoxirribonucleótidos o ribonucleótidos. Los ácidos nucleicos también pueden incluir fragmentos y nucleótidos modificados. Por lo tanto, los términos "polinucleótido", "secuencia de ácido nucleico", "secuencia de nucleótidos" y "fragmento de ácido nucleico" se usan indistintamente para indicar un polímero de ARN y/o ADN que es de cadena sencilla o cadena doble, que contiene opcionalmente bases nucleotídicas no naturales o alteradas. Los nucleótidos (que generalmente se encuentran en su forma de monofosfato 5') se denominan por su designación de una sola letra de la siguiente manera: "A" para adenosina o desoxiadenosina (para ARN o ADN, respectivamente), "C" para citosina o desoxicitosina, "G" para guanosina o desoxiguanosina, "U" para uridina, "T" para desoxitimidina, "R" para purinas (A o G), "Y" para pirimidinas (C o T), "K" para G o T, "H" para A o C o T, "I" para inosina y "N" para cualquier nucleótido. Un ácido nucleico puede comprender nucleótidos. Un ácido nucleico puede ser exógeno o endógeno a una célula. Un ácido nucleico puede existir en un entorno libre de células. Un ácido nucleico puede ser un gen o un fragmento del mismo, pero el ácido nucleico no necesariamente tiene que codificar un gen. Un ácido nucleico puede ser ADN. Un ácido nucleico puede ser ARN. Un ácido nucleico puede comprender uno o más análogos (p. ej., estructura alterada, azúcar o nucleobase). Algunos ejemplos no limitativos de análogos incluyen: 5-bromouracilo, ácido nucleico peptídico nucleico, ácido nucleico xeno nucleico, morfolinos, ácidos nucleicos bloqueados, ácidos nucleicos de glicol, ácidos nucleicos de treosa, dideoxinucleótidos, cordicepina, 7-deaza-GTP, fluoróforos (p. ej., rodamina o fluoresceína unida al azúcar), nucleótidos que contienen tiol, nucleótidos unidos a biotina, análogos de bases fluorescentes, islas de CpG, metil-7-guanosina, nucleótidos metilados, inosina, tiouridina, 20 pseudourdina, dihidrouridina, queuosina y wyosina. Un ácido nucleico de acuerdo con la presente invención se puede conectar mediante enlaces fosfodiéster, por ejemplo, como los que se producen de forma natural, o mediante enlaces fosforotioato, o una mezcla de ambos.

Los términos "ARN guía", "ARNg" o "ARN guía único" o "ARNgu" se usan indistintamente en este documento y se refieren a una fusión sintética de un ARN de CRISPR (ARNcr) y un ARNcr transactivador (ARNtracr), o el término se refiere a una única molécula de ARN que consta únicamente de un ARNcr y/o un ARNtracr, o el término se refiere a un ARNg que comprende individualmente una fracción de ARNcr o ARNtracr. Por lo tanto, la fracción tracr y ARNcr no necesariamente tienen que estar presentes en una molécula de ARN unida covalentemente, pero también pueden estar compuestos por dos moléculas de ARN individuales, que pueden asociarse o pueden asociarse por interacción no covalente o covalente para proporcionar un ARNg de acuerdo con la presente divulgación. Los términos "ADNg" o "ADNgu" o "ADN guía" se usan indistintamente en este documento y se refieren a una molécula de ácido nucleico que interactúa con una nucleasa Argonauta. Tanto los ARNg como los ADNg, tal como se divulga en el presente documento, se denominan "ácido o ácidos nucleicos de guía" o "ácido o ácidos nucleicos guía" debido a su capacidad para interactuar con una nucleasa específica del sitio y para ayudar a dirigirse a dicha nucleasa específica del sitio a un sitio objetivo genómico.

Los términos "edición de genes", "edición del genoma" y "modificación del genoma" se usan indistintamente en este documento y se refieren a estrategias y técnicas para la modificación específica dirigida de cualquier información genética o genoma de un organismo vivo. Como tal, los términos comprenden la edición de genes, pero también la edición de regiones distintas de las regiones codificantes de genes de un genoma. Comprende además la edición o modificación de la información nuclear (si está presente) así como otra información genética de una célula. Además, los términos "edición del genoma" y "modificación del genoma" también comprenden una edición o modificación epigenética, es decir, la modificación específica de, por ejemplo, metilación, modificación de histonas o ARN no codificantes que posiblemente causen cambios hereditarios en la expresión génica.

Los términos "nucleótido" y "ácido nucleico" con referencia a una secuencia o una molécula se usan indistintamente en el presente documento y se refieren a un ADN o ARN de cadena sencilla o de cadena doble de origen natural o sintético. Por lo tanto, el término secuencia de nucleótidos se utiliza para cualquier secuencia de ADN o ARN independientemente de su longitud, de modo que el término comprende cualquier secuencia de nucleótidos que comprenda al menos un nucleótido, pero también cualquier tipo de oligonucleótido o polinucleótido mayor. El o los términos se refieren así a secuencias de ácidos desoxirribonucleicos (ADN) y/o ácidos ribonucleicos (ARN) naturales y/o sintéticos, que pueden comprender opcionalmente análogos de ácidos nucleicos sintéticos. Un ácido nucleico de acuerdo con la presente divulgación puede optimizarse opcionalmente por codones. La optimización de codones implica que el uso de codones de un ADN o ^aRⁿse adapta al de una célula u organismo de interés para mejorar la tasa de transcripción de dicho ácido nucleico recombinante en la célula u organismo de interés. El experto en la materia es muy consciente del hecho de que un ácido nucleico objetivo puede modificarse en una posición debido a la degeneración del codón, mientras que esta modificación aún conducirá a la misma secuencia de aminoácidos en esa posición después de la traducción, lo que se logra mediante la optimización del codón para tener en cuenta el uso de codones específicos de especies de una célula u organismo objetivo. Las secuencias de ácido nucleico de acuerdo con la presente solicitud pueden portar una optimización de codones específica para la siguiente lista no limitativa de organismos: Hordeum vulgare, Sorghum bicolor, Secale cereale, Triticale, Saccharum officinarium, Zea mays, Setaria italic, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Triticale, Hordeum bulbosum, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Malus domestica, Beta vulgaris, Helianthus annuus, Daucus glochidiatus, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Erythranthe guttata, Genlisea aurea, Nicotiana sylvestris, Nicotiana tabacum, Nicotiana tomentosiformis, Nicotiana benthamiana, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Cucumis sativus, Marus notabilis, Arabidopsis thaliana, Arabidopsis lyrata, Arabidopsis arenosa, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olmarabidopsis pumila, Arabis hirsuta, Brassica napus, Brassica oleracea, Brassica rapa, Brassica juncacea, Brassica nigra, Raphanus sativus, Eruca vesicaria sativa, Citrus sinensis, Jatropha curcas, Glycine max, Gossypium ssp., Populus trichocarpa, Mus musculus, Rattus norvegicus o Homo sapiens.

Como se usa en el presente documento, "no nativo" o "de origen no natural" o "artificial" puede referirse a una secuencia de ácido nucleico o polipéptido, o cualquier otra biomolécula como biotina o fluoresceína que no se encuentra en un ácido nucleico o proteína nativos. No nativo puede referirse a etiquetas de afinidad. No nativo puede referirse a fusiones. No nativo puede referirse a una secuencia de ácido nucleico o polipéptido natural que comprende mutaciones, inserciones y/o eliminaciones. Una secuencia no nativa puede exhibir y/o codificar una actividad (p. ej., actividad enzimática, actividad de metiltransferasa, actividad de acetiltransferasa, actividad de quinasa, actividad de ubiquitinación, etc.) que también puede exhibir el ácido nucleico y/o la secuencia polipeptídica para que se fusiona la secuencia no nativa. Una secuencia polipeptídica o de ácido nucleico no nativa se puede unir a una secuencia polipeptídica o de ácido nucleico natural (o una variante de la misma) mediante modificación genética para generar una secuencia polipeptídica o de ácido nucleico quimérica que codifica un ácido nucleico quimérico y/o polipéptido. Una secuencia no nativa puede referirse a una secuencia de extensión de hibridación en 3'.

Como se usa en el presente documento, "nucleótido" generalmente puede referirse a una combinación de baseazúcar-fosfato. Un nucleótido puede comprender un nucleótido sintético. Un nucleótido puede comprender un análogo de nucleótido sintético. Los nucleótidos pueden ser unidades monoméricas de una secuencia de ácido nucleico (por ejemplo, ácido desoxirribonucleico (ADN) y ácido ribonucleico (ARN)). El término nucleótido puede incluir los trifosfatos de ribonucleósido trifosfato de adenosina (ATP), trifosfato de uridina (UTP), trifosfato de citosina (CTP), trifosfato de guanosina (GTP), trifosfato de inosina (ITP) y trifosfatos de desoxirribonucleósidos tales como dATP, dCTP, dITP, dUTP, dGTP, dTTP, o derivados de los mismos. Dichos derivados pueden incluir, por ejemplo y sin limitación, [aS]dATP, 7-deaza-dGTP y 7-deaza-dATP, y derivados de nucleótidos que confieren resistencia a la nucleasa en la molécula de ácido nucleico que los contiene. El término nucleótido tal como se usa en el presente documento puede referirse a trifosfatos de didesoxirribonucleósido (ddNTP) y sus derivados. Los ejemplos ilustrativos de trifosfatos de didesoxirribonucleósido pueden incluir, pero sin limitarse a, ddATP, ddCTP, ddGTP, ddITP y ddTTP. Un nucleótido puede estar sin marcar o marcado de forma detectable mediante técnicas bien conocidas. El etiquetado también se puede realizar con puntos cuánticos. Las etiquetas detectables pueden incluir, por ejemplo, isótopos radiactivos, etiquetas fluorescentes, etiquetas quimioluminiscentes, etiquetas bioluminiscentes y etiquetas enzimáticas. Las etiquetas fluorescentes de nucleótidos pueden incluir, pero sin limitarse a, fluoresceína, 5-carboxifluoresceína (FAM), 2',7',5-dimetoxi-4',5-dicloro-6-carboxifluoresceína (JOE), rodamina, 6-carboxirrodamina (R6G), N,N,N',N'-tetrametil-6-carboxirrodamina (TAMRA), 6-carboxi-X-rodamina (ROX), ácido 4-(4'-dimetilaminofenilazo)benzoico (DABCYL), azul cascada, verde Oregón, Rojo Texas, cianina y ácido 5-(2'-aminoetil)aminonaftaleno-1-sulfónico (EDANS).

Como se usa en el presente documento, "fusión" puede referirse a una proteína y/o ácido nucleico que comprende una o más secuencias no nativas (p. ej., fracciones). Una fusión puede estar en el extremo terminal N o terminal C de la proteína modificada, o en ambos, o dentro de la molécula como un dominio separado. Para las moléculas de ácido nucleico, la molécula de fusión se puede unir en el extremo 5' o 3', o en cualquier posición intermedia adecuada. Una fusión puede ser una fusión transcripcional y/o traduccional. Una fusión puede comprender una o más de las mismas secuencias no nativas. Una fusión puede comprender una o más secuencias no nativas diferentes. Una fusión puede ser una quimera. Una fusión puede comprender una etiqueta de afinidad de ácido nucleico. Una fusión puede comprender un código de barras. Una fusión puede comprender una etiqueta de afinidad peptídica. Una fusión puede proporcionar la localización subcelular del Argonauta (p. ej., una señal de localización nuclear (NLS) para dirigirse al núcleo, una señal de localización mitocondrial para dirigirse a las mitocondrias, una señal de localización de cloroplastos para dirigirse a un cloroplasto, una señal de retención del retículo endoplásmico (ER) 15 y similares). Una fusión puede proporcionar una secuencia no nativa (por ejemplo, una etiqueta de afinidad) que se puede usar para rastrear o purificar. Una fusión puede ser una molécula pequeña como la biotina o un tinte como los tintes Alexa flúor, el tinte Cianina3, el tinte Cianina5. La fusión puede proporcionar una mayor o menor estabilidad. En algunas realizaciones, una fusión puede comprender un marcador detectable, que incluye una fracción que puede proporcionar una señal detectable. Los marcadores y/o fracciones detectables adecuados que pueden proporcionar una señal detectable pueden incluir, pero sin limitarse a, una enzima, un radioisótopo, un miembro de un par de unión específica; un fluoróforo; un informador fluorescente o proteína fluorescente; un punto cuántico; y similares. Una fusión puede comprender un miembro de un par FRET, o un par donante/aceptor de fluoróforo/punto cuántico. Una fusión puede comprender una enzima. Las enzimas adecuadas pueden incluir, pero sin limitarse a, peroxidasa de rábano picante, luciferasa, beta-25 galactosidasa y similares. Una fusión puede comprender una proteína fluorescente. Las proteínas fluorescentes adecuadas pueden incluir, pero sin limitarse a, una proteína fluorescente verde (GFP), (p. ej., una GFP de Aequoria victoria, proteínas fluorescentes de Anguilla japónica, o un mutante o derivado de la misma), una proteína fluorescente roja, proteína fluorescente amarilla, una proteína fluorescente amarilla verdosa (p. ej., mNeonGreen derivada de una proteína fluorescente tetramérica del cefalocordado Branchiostoma lanceolatum) cualquiera de una variedad de proteínas fluorescentes y coloreadas. Una fusión puede comprender una nanopartícula. Las nanopartículas adecuadas pueden incluir nanopartículas fluorescentes o luminiscentes y nanopartículas magnéticas o nanodiamantes, opcionalmente unidas a una nanopartícula. Se puede detectar cualquier propiedad o característica óptica o magnética de la o las nanopartículas. Una fusión puede comprender una helicasa, una nucleasa (por ejemplo, Fokl), una endonucleasa, una exonucleasa (por ejemplo, una 5'-exonucleasa y/o 3'-exonucleasa), una ligasa, una nickasa, una nucleasa-helicasa (por ejemplo, Cas3), una ADN metiltransferasa (p. ej., Dam) o ADN desmetilasa, una histona metiltransferasa, una histona desmetilasa, una acetilasa (incluyendo, por ejemplo, y sin limitación, una histona acetilasa), una desacetilasa (incluyendo, por ejemplo, y sin limitación, una histona desacetilasa), una fosfatasa, una quinasa, un (co)activador de la transcripción, un (co)factor de transcripción, una subunidad de la ARN polimerasa, un represor de la transcripción, una proteína de unión al ADN, una proteína estructurante del ADN, un ARN largo no codificante, una proteína de reparación de ADN (p. ej., una proteína implicada en la reparación de roturas de cadena sencilla o cadena doble, p. ej., proteínas implicadas en la reparación por escisión de bases, reparación por escisión de nucleótidos, reparación de desajustes, NHEJ, HR, unión de extremos mediada por microhomología (MMEJ) y/o uniones de extremos no homólogas alternativos (ANHEJ), como por ejemplo, y sin limitación, reguladores de h R y señales de ensamblaje de complejos de HR), una proteína marcadora, una proteína informadora, una proteína fluorescente, una proteína de unión a ligando (p. ej., mCherry o una proteína de unión a metales pesados), un péptido señal (p. ej., secuencia de señal Tat), una proteína o péptido de direccionamiento, una secuencia de localización subcelular (p. ej., secuencia de localización nuclear, secuencia de localización de cloroplasto) y/o un epítopo de anticuerpo, o cualquier combinación de los mismos.

El término "fragmento catalíticamente activo", tal como se usa en el presente documento para referirse a secuencias de aminoácidos, denota la secuencia central derivada de una secuencia dada de aminoácidos plantilla, o una secuencia de ácido nucleico que codifica la misma, que comprende todo o parte del sitio activo de la secuencia de plantilla con la condición de que el fragmento catalíticamente activo resultante todavía posea la actividad que caracteriza a la secuencia de plantilla, de la que es responsable el sitio activo de la enzima nativa o una variante de la misma. Dichas modificaciones son adecuadas para generar secuencias de aminoácidos menos voluminosas que todavía tienen la misma actividad que una secuencia de plantilla, lo que hace que el fragmento catalíticamente activo sea una herramienta más versátil o más estable y estéricamente menos exigente.

Una "variante" de cualquier nucleasa específica del sitio divulgada en el presente documento representa una molécula que comprende al menos una mutación, eliminación o inserción en comparación con la nucleasa específica del sitio de tipo silvestre para alterar la actividad de la nucleasa de tipo silvestre como ocurre de forma natural. Una "variante" puede, como ejemplo no limitante, ser una Cas9 catalíticamente inactiva (dCas9), o una nucleasa específica del sitio, que ha sido modificada para funcionar como nickasa.

El término "construcción de suministro" o "vector de suministro" como se usa en el presente documento se refiere a cualquier medio biológico o químico usado como carga para transportar un ácido nucleico, incluido un ácido nucleico híbrido que comprende ARN y ADN, y/o una secuencia de aminoácidos de interés en una célula objetivo, tal como una célula eucariota. El término vector o construcción de suministro como se usa en el presente documento se refiere por lo tanto a un medio de transporte para suministrar una construcción genética o recombinante de acuerdo con la presente divulgación en una célula, tejido, órgano u organismo objetivo. Por lo tanto, un vector puede comprender secuencias de ácido nucleico, que comprenden opcionalmente secuencias como secuencias reguladoras o secuencias de localización para el suministro, ya sea directa o indirectamente, en una célula objetivo de interés o en una estructura objetivo vegetal en el compartimento celular deseado de una planta. También puede usarse un vector para introducir una secuencia de aminoácidos o un complejo ribonucleomolecular en una célula objetivo o estructura objetivo. Usualmente, un vector como se usa en el presente documento puede ser un vector plasmídico. Además, de acuerdo con ciertas realizaciones preferidas de acuerdo con la presente divulgación, se lleva a cabo una introducción directa de una construcción o secuencia o complejo de interés. El término introducción directa implica que la célula objetivo deseada o la estructura objetivo que contiene una secuencia objetivo de ADN que se va a modificar de acuerdo con la presente divulgación se transforma o transduce o transfecta directamente en la célula objetivo específica de interés, donde el material entregado con el vector de suministro ejerce su efecto. El término introducción indirecta implica que la introducción se logra en una estructura, por ejemplo, células de hojas o células de órganos o tejidos, que no representan en sí mismas la célula objetivo real o la estructura de interés a transformar, pero esas estructuras sirven como base para la propagación sistémica y la transferencia del vector, que comprende preferiblemente una construcción genética de acuerdo con la presente divulgación a la estructura objetivo real, por ejemplo, una célula o tejido meristemático, o una célula madre o tejido. En caso de que el término vector se utilice en el contexto de la transfección de secuencias de aminoácidos y/o secuencias nucleicas, incluidas las secuencias de ácido nucleico híbridos, en una célula objetivo, el término vector implica agentes adecuados para la transfección de péptidos o proteínas, como por ejemplo mezclas de lípidos iónicos, péptidos de penetración celular (CPP) o bombardeo de partículas. En el contexto de la introducción de material de ácido nucleico, el término vector no solo puede implicar vectores de plásmidos, sino también materiales portadores adecuados que pueden servir como base para la introducción de ácidos nucleicos y/o suministro de secuencias de aminoácidos en una célula objetivo de interés, por ejemplo mediante bombardeo de partículas. Dicho material portador comprende, entre otros, partículas de oro o tungsteno. Finalmente, el término vector también implica el uso de vectores virales para la introducción de al menos una construcción genética de acuerdo con la presente divulgación como, por ejemplo, virus modificados, por ejemplo, derivados de las siguientes cepas de virus: vectores adenoviral o viral adeno-asociado (AAV), vectores lentivirales, virus del herpes simple (HSV-1), virus vaccinia, virus Sendai, virus Sindbis, alfavirus del bosque Semliki, virus de Epstein-Barr (EBV), virus del estriado del maíz (MSV), virus del mosaico estriado de la cebada (BSMV), virus del mosaico del bromo (BMV, números de acceso: a Rn 1: X58456; ARN₂: X58457; ARN3: X58458), virus del estriado del maíz (MSpV), virus del estriado fino del maíz (MYDV), virus amarillo del enanismo del maíz (MYDV), virus del mosaico del enanismo del maíz (MDMV), virus de ARN de cadena positiva de la familia Benyviridae, p. ej, virus de la vena amarilla necrótica de la remolacha (números de acceso: A ^rN 1: NC_003514; ARN₂: NC_003515; ARN3: NC_003516; ARN4: NC_003517) o de la familia Bromoviridae, p. ej., virus del género del virus del mosaico de la alfalfa (números de acceso: ARN1: Nc_001495; ARN₂: NC_002024; ARN3: NC_002025) o del género Bromovirus, por ejemplo, BMV (citado anteriormente), o del género Cucumovirus, p. ej., virus del mosaico del pepino (números de acceso: ARN1: NC_002034; ARN₂: NC_002035; ARN3: NC_001440), o del género Oleavirus, virus ADNcd de la familia Caulimoviridae, particularmente de la familia Badnavirus o Caulimovirus, por ejemplo, diferentes virus del estriado del banano (p. ej., números de acceso: NC_007002, NC_015507, NC_006955 o NC_003381) o virus del mosaico de la coliflor (número de acceso: NC_001497), o virus del género Cavemovirus, Petuvirus, Rosadnavirus, Solendovirus, Soymovirus o Tungrovirus, virus de ARN de cadena positiva de la familia Closteroviridae, p. ej., del género Ampelovirus, Crinivirus, p. ej., virus amarillos infecciosos de la lechuga (números de acceso: a Rn 1: NC_003617; ARN₂: NC_003618) o virus de la clorosis del tomate (números de acceso: ARN 1: NC_007340; ARN₂: NC_007341), Closterovirus, p. ej, virus amarillos de la remolacha (número de acceso: NC_001598), o Velarivirus, virus de ADN de cadena sencilla (+/-) de la familia Geminiviridae, p. ej., virus de la familia Becurtovirus, Begomovirus, p. ej., virus del mosaico amarillo dorado del frijol, virus del brote rizado del tabaco, virus del rizo de la hoja moteada del tabaco, virus del moteado clorótico del tomate, virus de la hoja enana del tomate, virus del mosaico dorado del tomate, virus del rizo de la hoja del tomate, virus del moteado del tomate, o virus de la mancha amarilla del tomate, o Geminiviridae del género Curtovirus, p. ej., virus de la punta rizada de la remolacha, o Geminiviridae del género Topocuvirus, Turncurtvirus o Mastrevirus, p. ej, virus del estriado del maíz (citado anteriormente), virus del enanismo amarillo del tabaco, virus del enanismo del trigo, virus de ARN de cadena positiva de la familia Luteoviridae, p. ej., del género Luteovirus, p. ej., virus del enanismo amarillo de la cebada-PAV (número de acceso: NC_004750), o del género Polerovirus, p. ej, virus del enrollado de la patata (número de acceso: NC_001747), virus de ADN de cadena sencilla de la familia Nanoviridae, que comprende el género Nanovirus o Babuvirus, virus de ARN de cadena doble de la familia Partiviridae, que comprende entre otros las familias Alfapartitivirus, Betapartitivirus o Deltapartitivirus, viroides de la familia Pospiviroididae, virus de ARN de cadena positiva de la familia Potyviridae, por ejemplo, que comprende el género Brambyvirus, Bymovirus, Ipomovirus, Macluravirus, Poacevirus, p. ej., virus del mosaico del Triticum (número de acceso: n C_012799), o Potyviridae del género Potivirus, p. ej., virus del mosaico de la remolacha (número de acceso: NC_005304), virus del mosaico enano del maíz (número de acceso: NC_003377), virus Y de la patata (número de acceso: NC_001616), o virus del mosaico del maíz (número de acceso: NC_018833), o Potyviridae del género Tritimovirus, p. ej., virus del mosaico de la raya del bromo (número de acceso: NC_003501) o virus del mosaico estriado del trigo (número de acceso: NC_001886), virus de ARN de cadena sencilla de la familia Pseudoviridae, p. ej., del género Pseudovirus, o Sirevirus, virus de ARN de cadena doble de la familia Reoviridae, por ejemplo, virus del enanismo del arroz (números de acceso: ARN1: NC_003773; ARN₂: NC_003774; ARN3: NC_003772; ARN4: NC_003761; RNAS: NC_003762; ARN6: NC_003763; ARN7: NC_003760; ARN8: NC_003764; ARN9: NC_003765; ARN10: NC_003766; ARN11: NC_003767; ARN 12: NC_003768), virus de ARN de cadena positiva de la familia Tombusviridae, por ejemplo, que comprende el género Alfanecrovirus, Aureusvirus, Betanecrovirus, Carmovirus, Diantovirus, Gallantivirus, Macanavirus, Machlomovirus, Panicovirus, Tombusvirus, Umbravirus o del orden Zeavirus, p. ej., virus del estriado necrótico del maíz (número de acceso: NC_007729), o virus de ARN de cadena positiva de la familia Virgaviridae, ej., virus del género Furovirus, Hordeivirus, p. ej., virus del mosaico estriado de la cebada (números de acceso: ARN1: N^c_003469; ARN₂: NC_003481; ARN3: ⁿC_003478), o del género Pecluvirus, Pomovirus, Tobamovirus o Tobravirus, p. ej., virus del traqueteo del tabaco (números de acceso: ARN1: NC_003805; ARN₂: NC_003811), así como virus de ARN de cadena negativa del orden Mononegavirales, particularmente de la familia Rhabdoviridae, p. ej., virus del mosaico estriado amarillo de la cebada (número de acceso: KM213865) o virus amarillos necróticos de la lechuga (número de acceso/espécimen: NC_007642/ AJ867584), virus de ARN de cadena positiva del orden Picornavirales, particularmente de la familia Secoviridae, ej., del género Comovirus, Fabavirus, Nepovirus, Cheravirus, Sadwavirus, Sequivirus, Torradovirus, o Waikavirus, virus de ARN de cadena positiva del orden Timovirales, particularmente de la familia Alfaflexiviridae, p. ej., virus del género Allexivirus, Lolavirus, Mandarivirus, o Potexvirus, Tymovirales, particularmente de la familia Betaflexiviridae, p. ej., virus del género Capillovirus, Carlavirus, Citrivirus, Foveavirus, Tepovirus, o Vitivirus, virus de ARN de cadena positiva del orden Timovirales, particularmente de la familia Tymoviridae, p. ej., virus del orden Maculavirus, Marafivirus, o Timovirus, y vectores bacterianos, como por ejemplo Agrobacterium spp., como por ejemplo Agrobacterium tumefaciens. Finalmente, el término vector también implica agentes de transporte químico adecuados para introducir secuencias de ácido nucleico lineales (de cadena sencilla o doble) en una célula objetivo combinada con un método de introducción física, que incluye construcciones de suministro polimérico o basadas en lípidos.

Las construcciones o vectores de suministro adecuados comprenden, por lo tanto, medios biológicos para suministrar secuencias de nucleótidos en una célula objetivo, incluidos los vectores virales, Agrobacterium spp., o construcciones de suministro químico, incluidas nanopartículas, por ejemplo, nanopartículas de sílice mesoporosas (MSNP), polímeros catiónicos, incluidos enfoques basados en polímeros PEI (polietilenimina) o polímeros como DEAE-dextrano, o unión superficial no covalente de PEI para generar superficies catiónicas, lípidos o vesículas poliméricas, o combinaciones de los mismos. Las vesículas lipídicas o poliméricas se pueden seleccionar, por ejemplo, de lípidos, liposomas, sistemas de encapsulación de lípidos, nanopartículas, formulaciones de partículas de lípidos de ácido nucleico pequeño, polímeros y polimerosomas.

Los términos "construcción genética" o "construcción recombinante" se utilizan en el presente documento para referirse a una construcción que comprende, entre otros, plásmidos o vectores de plásmidos, cósmidos, levaduras artificiales o cromosomas artificiales bacterianos (YAC y BAC), fagémidos, vectores basados en fagos bacterianos, un casete de expresión, secuencias de ácido nucleico de cadena sencilla o de cadena doble aisladas, que comprenden secuencias de ADN y ARN, o secuencias de aminoácidos, vectores virales, incluidos virus modificados, y una combinación o una mezcla de los mismos, para la introducción o transformación, transfección o transducción en cualquier célula objetivo procariota o eucariota, incluida una planta, célula de la planta, tejido, órgano o material de acuerdo con el presente divulgación. Una construcción recombinante de acuerdo con la presente divulgación puede comprender un dominio efector, ya sea en forma de un ácido nucleico o una secuencia de aminoácidos, en donde un dominio efector representa una molécula, que puede ejercer un efecto en una célula objetivo e incluye un transgén, una molécula de ARN de cadena sencilla o de cadena doble, incluido un ARN guía ((ARNg(u)), un miARN o un ARNip, o una secuencia de aminoácidos, que incluye, entre otros, una enzima o un fragmento catalíticamente activo de la misma, una proteína de unión, un anticuerpo, un factor de transcripción, una nucleasa, tal como una nucleasa específica del sitio, y similares. Además, la construcción recombinante puede comprender secuencias reguladoras y/o secuencias de localización. La construcción recombinante puede integrarse en un vector, incluido un vector plasmídico, y/o puede estar presente aislado de una estructura de vector, por ejemplo, en forma de una secuencia polipeptídica o como un ácido nucleico de cadena sencilla o cadena doble no conectado al vector. Después de su introducción, por ejemplo, por transformación, la construcción genética puede persistir extracromosómicamente, es decir, no integrada en el genoma de la célula objetivo, por ejemplo, en forma de ADN de cadena doble o de cadena sencilla, un ARN de cadena doble o de cadena sencilla o como una secuencia de aminoácidos. Alternativamente, la construcción genética, o partes de la misma, de acuerdo con la presente divulgación, pueden integrarse de forma estable en el genoma de una célula objetivo, incluido el genoma nuclear o elementos genéticos adicionales de una célula objetivo, incluido el genoma de plástidos como mitocondrias o cloroplastos. El término vector de plásmido como se usa en esta conexión se refiere a una construcción genética obtenida originalmente de un plásmido. Un plásmido generalmente se refiere a un elemento extracromosómico circular de replicación autónoma en forma de una secuencia de ácido nucleico de cadena doble. En el campo de la ingeniería genética, estos plásmidos se someten rutinariamente a modificaciones dirigidas insertando, por ejemplo, genes que codifican resistencia contra un antibiótico o un herbicida, un gen que codifica una secuencia de ácido nucleico objetivo, una secuencia de localización, una secuencia reguladora, una secuencia de etiqueta, un gen marcador, incluyendo un marcador antibiótico o un marcador fluorescente, y similares. Se mantienen los componentes estructurales del plásmido original, como el origen de la replicación. De acuerdo con ciertas realizaciones de la presente invención, la secuencia de localización puede comprender una secuencia de localización nuclear, una secuencia de localización de plástidos, preferiblemente una secuencia de localización de mitocondrias o una secuencia de localización de cloroplastos. Dichas secuencias de localización están disponibles para el experto en el campo de la biotecnología vegetal. Una variedad de vectores de plásmidos para uso en diferentes células objetivo de interés está disponible comercialmente y la modificación de los mismos es conocida por los expertos en el campo respectivo.

El término "genética(mente) modificado" o "manipulación genética" o "genética(mente) manipulado" se utiliza en el presente documento en un sentido amplio y significa cualquier modificación de una secuencia de ácido nucleico o una secuencia de aminoácidos, una célula objetivo, tejido, órgano u organismo, que se logra mediante la intervención humana, ya sea directa o indirectamente, para influir en el material genético endógeno o el transcriptoma o el proteoma de una célula, tejido, órgano u organismo objetivo para modificarlo de manera intencionada de modo que difiera de su estado tal como se encuentra sin intervención humana, mientras que el término edición del genoma se refiere específicamente a una manipulación dirigida del genoma de una célula objetivo. La intervención humana puede tener lugar in vitro o in vivo, o ambos. Se pueden incluir modificaciones adicionales, por ejemplo, una o más mutaciones puntuales, por ejemplo, para la modificación de proteínas específicas o para la optimización de codones, eliminación o eliminaciones y una o más inserción o inserciones o eliminación o eliminaciones de al menos una molécula de ácido nucleico o aminoácido (incluida también la recombinación homóloga), la modificación de un ácido nucleico o una secuencia de aminoácidos, o una combinación de los mismos. Los términos también comprenderán una molécula de ácido nucleico o una molécula de aminoácido o una célula huésped o un organismo, incluida una planta o un material de la planta de la misma que es similar a una secuencia comparable, organismo o material que se encuentra en la naturaleza, pero que han sido construidos por al menos una etapa de manipulación intencional.

Una "manipulación genética dirigida" o edición de genes o edición de genomas "dirigida" o "dirigida al sitio" como se usa en este documento es, por lo tanto, el resultado de una "manipulación genética", que se efectúa de manera dirigida, es decir, al menos una posición específica en una célula objetivo y bajo las circunstancias adecuadas específicas para lograr un efecto deseado en al menos una célula, tal como una célula de la planta, que se va a manipular.

El término "transgénico", como se usa de acuerdo con la presente divulgación, se refiere a un animal, una célula, tejido u órgano animal, una planta, una célula, un tejido, un órgano o material de la planta que comprende un gen o una construcción genética, que comprende un transgén que ha sido transferido a la planta, a la célula, al órgano tisular o al material de la planta por medios naturales o por medio de técnicas de ingeniería genética de otro organismo. El término "transgén" comprende una secuencia de ácido nucleico, que incluye ADN o ARN o una combinación o mezcla de los mismos. Por lo tanto, el término "transgén" no se restringe a una secuencia comúnmente identificada como gen, es decir, una secuencia que codifica una proteína. También puede referirse, por ejemplo, a una secuencia de ADN o ARN que no codifica una proteína. Por lo tanto, el término transgénico generalmente implica que el ácido nucleico respectivo introducido en una célula de interés no está presente de forma natural en la célula procariota o eucariota objetivo respectiva, incluida una célula bacteriana, una célula de levadura, una célula fúngica, un animal o una célula animal, una planta, célula, tejido, órgano o material de la planta. Los términos transgén o transgénico, tal como se utilizan en el presente documento, se refieren a una secuencia de ácido nucleico o una secuencia de aminoácidos que se toma del genoma de un organismo, o se produce sintéticamente, y que luego se introduce en otro organismo, de forma transitoria o estable, por técnicas artificiales de biología molecular, genética y similares.

El término "planta" o "célula de la planta", como se usa en el presente documento, se refiere a un organismo vegetal, un órgano vegetal, tejidos vegetales diferenciados e indiferenciados, células vegetales, semillas y derivados y progenie de los mismos. Las células vegetales incluyen, sin limitación, por ejemplo, células de semillas, de embriones maduros e inmaduros, tejidos meristemáticos, plántulas, tejidos callosos en diferentes estados de diferenciación, hojas, flores, raíces, brotes, gametofitos, esporofitos, polen, tubos polínicos y microsporas, protoplastos, macroalgas y microalgas. Las diferentes células vegetales pueden ser haploides, diploides, tetraploides, hexaploides o poliploides.

"Sujeto", como se usa en este documento, puede significar un animal humano o no humano. El término incluye, pero no se limita a, mamíferos (p. ej., humanos, otros primates, cerdos, roedores (p. ej., ratones y ratas o hámsteres), conejos, conejillos de indias, vacas, caballos, gatos, perros, ovejas y cabras). En una realización, el sujeto es un ser humano.

"Tratar'', "que trata" y "tratamiento", como se usa en el presente documento, generalmente significa obtener un efecto farmacológico y/o fisiológico deseado. El efecto puede ser profiláctico en términos de prevención total o parcial de una enfermedad o síntoma de la misma y/o puede ser terapéutico en términos de cura parcial o completa de una enfermedad y/o efecto adverso atribuible a la enfermedad. "Tratamiento", como se usa en el presente documento, cubre cualquier tratamiento de una enfermedad o síntoma en un mamífero, e incluye: (a) prevenir que la enfermedad o síntoma ocurra en un sujeto que puede estar predispuesto a adquirir la enfermedad o síntoma pero que aún no ha sido diagnosticado de tenerlos; (b) inhibir la enfermedad o síntoma, es decir, detener su desarrollo; o (c) aliviar la enfermedad, es decir, provocar la regresión de la enfermedad. El agente terapéutico puede administrarse antes, durante o después del inicio de la enfermedad o lesión. El tratamiento de la enfermedad en curso, donde el tratamiento estabiliza o reduce los síntomas clínicos indeseables del paciente, es de particular interés. Dicho tratamiento se realiza deseablemente antes de la pérdida completa de la función en los tejidos afectados. La terapia en cuestión se administrará deseablemente durante la etapa sintomática de la enfermedad y, en algunos casos, después de la etapa sintomática de la enfermedad.

Un "material de la planta", tal como se usa en el presente documento, se refiere a cualquier material que se puede obtener de una planta durante cualquier etapa de desarrollo. El material de la planta puede obtenerse in planta o de un cultivo in vitro de la planta o de un tejido vegetal o de un órgano de la misma. Por lo tanto, el término comprende células, tejidos y órganos vegetales, así como estructuras vegetales desarrolladas, así como componentes subcelulares como ácidos nucleicos, polipéptidos y todas las sustancias o metabolitos químicos de las plantas que se pueden encontrar dentro de una célula o compartimento vegetal y/o que pueden ser producidos por la planta, o que pueden obtenerse de un extracto de cualquier célula de la planta, tejido o una planta en cualquier etapa de desarrollo. El término también comprende un derivado del material de la planta, por ejemplo, un protoplasto, derivado de al menos una célula de la planta comprendida por el material de la planta. Por lo tanto, el término también comprende células meristemáticas o un tejido meristemático de una planta.

Como se usa en el presente documento, los términos "mutación" y "modificación" se usan indistintamente para referirse a una eliminación, inserción, adición, sustitución, edición, ruptura de cadena y/o introducción de un aducto en el contexto de la manipulación de ácidos nucleicos in vivo o in vitro. Una eliminación se define como un cambio en una secuencia de ácido nucleico en donde uno o más nucleótidos están ausentes. Una inserción o adición es ese cambio en una secuencia de ácido nucleico que ha resultado en la adición de uno o más nucleótidos. Una "sustitución" o edición resulta del reemplazo de uno o más nucleótidos por una molécula que es una molécula diferente del uno o más nucleótidos reemplazados. Por ejemplo, un ácido nucleico puede ser reemplazado por un ácido nucleico diferente como se ejemplifica mediante el reemplazo de una timina por una citosina, adenina, guanina o uridina. Las transiciones de pirimidina por pirimidina (p. ej., sustituciones de nucleótidos C por T o T por C) o de purina por purina (p. ej., sustituciones de nucleótidos G por A o AporG) se denominan transiciones, mientras que pirimidina por purina o purina por pirimidina (p. ej., G porT o G por C por A por T o AporC) se denominan transversiones. Alternativamente, un ácido nucleico puede ser reemplazado por un ácido nucleico modificado como se ejemplifica mediante el reemplazo de una timina por timina glicol. Las mutaciones pueden resultar en un desajuste. El término desajuste se refiere a una interacción no covalente entre dos ácidos nucleicos, residiendo cada ácido nucleico en una secuencia de nucleótidos o molécula de ácido nucleico diferente, que no sigue las reglas de emparejamiento de bases. Por ejemplo, para las secuencias parcialmente complementarias 5'-AGT-3' y 5'-AAT-3', está presente un desajuste G-A(una transición).

El término "rotura de cadena" cuando se hace referencia a una secuencia de ácido nucleico de cadena doble, por ejemplo, una secuencia genómica como secuencia objetivo de ADN, incluye una rotura de una sola cadena y/o una rotura de cadena doble. Una rotura de cadena sencilla (una muesca) se refiere a una interrupción en una de las dos cadenas de la secuencia de ácido nucleico de cadena doble. Esto contrasta con una ruptura de cadena doble que se refiere a una interrupción en ambas cadenas de la secuencia de ácido nucleico de cadena doble. Las roturas de cadenas de acuerdo con la presente divulgación pueden introducirse en una secuencia de ácido nucleico de cadena doble mediante incisión enzimática en una posición de interés de la base del ácido nucleico usando una endonucleasa adecuada, incluida una endonucleasa de CRISPR o una variante de la misma, donde la variante puede ser una versión mutada o truncada de la proteína o endonucleasa de tipo silvestre, que todavía puede ejercer la función enzimática de la proteína de tipo silvestre.

"Complementario" o "complementariedad", tal como se usa en el presente documento, describe la relación entre dos ADN, dos ARN o, con respecto a las secuencias híbridas de acuerdo con la presente divulgación, entre una región de ácido nucleico de ARN y ADN. Definidas por las nucleobases del ADN o el ARN, dos regiones de ácido nucleico pueden hibridarse entre sí de acuerdo con el modelo de llave y candado. Para este fin, aplican los principios de emparejamiento de bases de W&tson-Crick que tienen las bases complementarias: adenina y timina/uracilo, así como guanina y citosina, respectivamente. Además, también el emparejamiento no Watson-Crick, como el emparejamiento inverso de Watson-Crick, Hoogsteen, inverso de Hoogsteen y Wobble, están comprendidos por el término "complementario" como se usa en este documento, siempre que los respectivos pares de bases puedan formar enlaces de hidrógeno entre sí, es decir, dos cadenas de ácido nucleico diferentes pueden hibridar entre sí basándose en dicha complementariedad. No se requiere una complementariedad perfecta en el sentido de que dos tramos de secuencia se alineen al 100 % entre sí en una longitud determinada, ya que el experto en la materia es consciente del hecho de que la hibridación de ácidos nucleicos se ve afectada por factores tales como el grado y la duración de la complementariedad entre los ácidos nucleicos, la rigurosidad de las condiciones implicadas, la Tm del híbrido formado y la relación G:C dentro de los ácidos nucleicos, etc. Además, los factores estéricos pueden influir en el hecho de que dos secuencias, aunque no sean 100% complementarias entre sí, se hibridarán. Por lo tanto, dos secuencias de ácido nucleico complementarias de acuerdo con la presente divulgación pueden tener al menos el 70 %, al menos el 71 %, al menos el 72 %, al menos el 73 %, al menos el 74 %, al menos el 75 %, al menos el 76 %, al menos al menos el 77 %, al menos el 78 %, al menos el 79 %, al menos el 80 %, al menos el 81 %, al menos el 82 %, al menos el 83 %, al menos el 84 %, al menos el 85 %, al menos el 86 %, al menos al menos 87 %, al menos 88 %, al menos 89 %, al menos 90 %, al menos 91 %, al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos al menos 97%, al menos 98% o al menos 99% de homología de secuencia o complementariedad entre sí y aún pueden hibridarse entre sí en condiciones de rigurosidad media. Las condiciones de rigurosidad "media" se refieren a NaCl 0.165-0.330 M en un intervalo de temperatura de 20 a 29 °C por debajo de la Tm, donde Tm se define como la Tm para una secuencia de ADN que se puede estimar a través del cálculo de uso común:

Tm = 81.5+16.6logio ([Na+]/1,0+0.7[Na+])+0.41 (%[G+C])-(500/n)-P-F,

donde Tm = temperatura de fusión en °C, [Na+] = concentración molar de iones de sodio, % de [G+C] = porcentaje de bases G+C en la secuencia de ADN, n = longitud de la secuencia de ADN en bases P = corrección de temperatura para el % de pares de bases desajustadas (~1 °C por 1 % de desajuste), y F = corrección para la concentración de formamida (= 0.63°C por 1% de [formamida]).

El término "introducción transitoria" como se usa en el presente documento se refiere a la introducción transitoria de al menos una secuencia de ácido nucleico de acuerdo con la presente divulgación, preferiblemente incorporada en un vector de suministro o en una construcción recombinante, con o sin la ayuda de un vector de suministro, en una estructura objetivo, por ejemplo, una célula de la planta, en donde al menos una secuencia de ácido nucleico se introduce en condiciones de reacción adecuadas de modo que no ocurra integración de al menos una secuencia de ácido nucleico en el material de ácido nucleico endógeno de una estructura objetivo, el genoma como un todo, de modo que al menos una secuencia de ácido nucleico no se integrará en el ADN endógeno de la célula objetivo. Como consecuencia, en el caso de una introducción transitoria, la construcción genética introducida no se heredará a una progenie de la estructura objetivo, por ejemplo, una célula procariota, animal o vegetal. Al menos una secuencia de ácido nucleico o los productos resultantes de su transcripción o traducción solo están presentes temporalmente, es decir, de manera transitoria, en forma constitutiva o inducible, y por lo tanto solo pueden ser activos en la célula objetivo para ejercer su efecto durante un tiempo limitado. Por lo tanto, al menos una secuencia de ácido nucleico introducida a través de la introducción transitoria no será heredable para la progenie de una célula. Sin embargo, el efecto que una secuencia de ácido nucleico introdujo de forma transitoria puede heredarse potencialmente a la progenie de la célula objetivo.

El término "integración estable" o "integrado de forma estable", como se usa en el presente documento, se refiere a la integración estable de al menos una secuencia de ácido nucleico de acuerdo con la presente divulgación, preferiblemente incorporada en un vector de suministro o en una construcción recombinante. La integración puede tener lugar en el genoma nuclear de una célula objetivo o en cualquier otro material extranuclear genómico dentro de un compartimento de célula eucariota de interés, por ejemplo, una mitocondria o un plástido de célula de la planta. Por lo tanto, una construcción recombinante integrada de forma estable será heredable a la progenie de una célula objetivo modificada de este modo. Dependiendo de la naturaleza de la construcción genética, todo o parte de la construcción genética se integrará de manera estable, ya que la construcción genética puede comprender varias regiones de interés que comprenden una región objetivo que se integrará de manera estable, así como otras regiones, entre otras, necesarias para el transporte, el suministro, el mantenimiento y la localización correcta de la construcción genética dentro de una célula de la planta, cuyas regiones, sin embargo, no se integrarán en sí mismas, sino que servirán como carga para que la región de interés se integre de manera estable como lo conoce un experto en la materia. La integración estable de al menos una construcción genética de acuerdo con la presente divulgación en al menos una célula o tejido hematopoyético o meristemático conducirá en consecuencia a la herencia de la región genómica modificada de la estructura objetivo, es decir, una región objetivo de ADN, a la progenie de la célula modificada a través de todas las etapas de desarrollo de dicha al menos una célula hematopoyética o meristemática, lo que puede ser favorable para enfoques, donde se desea una modificación genética dirigida y el rendimiento del tipo de célula final resultante de la diferenciación y el desarrollo de al menos una célula meristemática hematopoyética. Lograr, por ejemplo, una integración estable en al menos una célula meristemática de la inflorescencia inmadura de una planta puede conducir por lo tanto a la herencia estable de la característica genética introducida en el gameto del polen o del óvulo resultante del desarrollo de al menos una célula meristemática de la inflorescencia inmadura. La integración estable en al menos una célula hematopoyética pluripotente o cualquier célula pluripotente o multipotente conducirá igualmente a una herencia estable de la característica genética introducida.

El término "bombardeo de partículas", como se usa en el presente documento, también denominado transfección biolística o transferencia de genes mediada por micropartículas, se refiere a un método de suministro físico para transferir una micropartícula o nanopartícula recubierta que comprende un ácido nucleico o una construcción genética de interés a una célula o tejido objetivo. La micro o nanopartícula funciona como un proyectil y se dispara contra la estructura objetivo de interés a alta presión utilizando un dispositivo adecuado, a menudo llamado "pistola de genes". La transformación a través del bombardeo de partículas utiliza un microproyectil de metal cubierto con el gen de interés, que luego se dispara sobre las células objetivo utilizando un equipo conocido como "pistola de genes" (Sandford et al. 1987) a alta velocidad lo suficientemente rápido como para penetrar la pared celular de un tejido objetivo, pero no lo suficientemente duro como para causar la muerte celular. Para los protoplastos, a los que se les ha quitado completamente la pared celular, las condiciones son lógicamente diferentes. El ácido nucleico precipitado o la construcción genética en al menos un microproyectil se libera en la célula después del bombardeo y se integra en el genoma o se expresa transitoriamente de acuerdo con la definición dada anteriormente. La aceleración de los microproyectiles se logra mediante una descarga eléctrica de alto voltaje o gas comprimido (helio). En cuanto a las partículas metálicas utilizadas, es obligatorio que no sean tóxicas, no reactivas y que tengan un diámetro menor que el de la célula objetivo. Los más utilizados son el oro o el tungsteno. Hay mucha información disponible públicamente de los fabricantes y proveedores de pistolas génicas y sistemas asociados con respecto a su uso general.

El término "derivado" o "descendiente" o "progenie" como se usa en el presente documento en el contexto de una célula procariota o eucariota, tal como una célula animal y/o una planta o una célula de la planta o material de la planta de acuerdo con la presente divulgación se refiere a los descendientes de dicha célula o material que resulten de la propagación reproductiva natural, incluida la reproducción sexual y asexual. Es bien conocido por el experto en la materia que dicha propagación puede conducir a la introducción de mutaciones en el genoma de un organismo resultantes de fenómenos naturales que dan como resultado un descendiente o progenie, que es genómicamente diferente al organismo o célula parental, sin embargo, todavía pertenece al mismo género/especie y posee en su mayoría las mismas características que la célula huésped recombinante original. Dichos derivados o descendientes o progenie resultantes de fenómenos naturales durante la reproducción o regeneración están así comprendidos por el término de la presente divulgación. Además, el término "derivado" puede implicar, en el contexto de una sustancia o molécula en lugar de referirse a una célula u organismo, obtenido directamente o mediante modificación indirectamente de otro. Esto podría implicar una secuencia de ácido nucleico derivada de una célula o un metabolito vegetal obtenido de una célula o material. Estos términos, por lo tanto, no se refieren a ningún derivado, descendiente o progenitor arbitrario, sino más bien a un derivado, descendiente o progenitor asociado filogenéticamente con, es decir, basado en, una célula progenitora o virus o una molécula del mismo, mientras que esta relación entre el derivado, descendiente o progenitor y el "padre" es claramente deducible por un experto en la materia.

Además, los términos "derivado", "derivado de" o "que se deriva" tal como se utilizan en el presente documento en el contexto de una secuencia biológica (ácido nucleico o aminoácido) o molécula o complejo implican que la secuencia respectiva se basa en una secuencia de referencia, por ejemplo, de la lista de secuencias, o un número de acceso a la base de datos, o la estructura de andamio respectiva, es decir, que se origina a partir de dicha secuencia, mientras que la secuencia de referencia puede comprender más secuencias, por ejemplo, el genoma completo o una secuencia codificante de poliproteína completa, de un virus, mientras que la secuencia "derivada de" la secuencia nativa sólo puede comprender un fragmento aislado de la misma, o un fragmento coherente de la misma. En este contexto, puede decirse que una molécula de ADNc o un ARN se "deriva de" una secuencia de ADN que sirve como plantilla molecular. El experto en la materia puede así definir fácilmente una secuencia "derivada de" una secuencia de referencia que, mediante el alineamiento de secuencias a nivel de ADN o de aminoácidos, tendrá una alta identidad con la secuencia de referencia respectiva y que tendrá tramos coherentes de ADN/aminoácidos en común con la secuencia de referencia respectiva (>75 % de identidad de consulta para una longitud dada de la molécula alineada siempre que la secuencia derivada sea la consulta y la secuencia de referencia represente al sujeto durante una alineación de secuencia). El experto en la materia puede, por lo tanto, clonar las secuencias respectivas basándose en la divulgación proporcionada en el presente documento por medio de reacciones en cadena de la polimerasa y similares en un sistema de vector adecuado de interés, o usar una secuencia como armazón de vector. Por lo tanto, el término "derivado de" no es una secuencia arbitraria, sino una secuencia que corresponde a una secuencia de referencia de la que se deriva, mientras que ciertas diferencias, por ejemplo, ciertas mutaciones que ocurren naturalmente durante la replicación de una construcción recombinante dentro de una célula huésped, no pueden excluirse y están así comprendidos por el término "derivados de". Además, varios tramos de secuencia de una secuencia progenitora pueden concatenarse en una secuencia derivada del progenitor. Los diferentes tramos tendrán una homología alta (preferiblemente más del 90%) o incluso del 100% con la secuencia original. El experto en la materia es muy consciente del hecho de que una secuencia de los complejos moleculares artificiales de acuerdo con la presente divulgación, cuando se proporciona o se proporciona parcialmente como secuencia de ácido nucleico, se transcribirá y, opcionalmente, se traducirá in vivo y posiblemente será digerido y/o procesado adicionalmente dentro de una célula huésped (escisión de péptidos señal, biotinilación endógena, etc.) de modo que el término "derivado de" indica una correlación con la secuencia utilizada originalmente de acuerdo con la divulgación de la presente invención.

El término "región objetivo", "sitio objetivo", "estructura objetivo", "construcción objetivo", "ácido nucleico objetivo" o "célula/tejido/organismo objetivo", o "región objetivo de ADN" como se usa en el presente documento se refiere a un objetivo que puede ser cualquier región genómica dentro de cualquier compartimento de una célula objetivo.

El término "secuencia reguladora", como se usa en el presente documento, se refiere a un ácido nucleico o una secuencia de aminoácidos, que puede dirigir la transcripción y/o traducción y/o modificación de una secuencia de ácido nucleico de interés.

Los términos "proteína", "aminoácido" o "polipéptido" se usan indistintamente en el presente documento y se refieren a una secuencia de aminoácidos que tiene una función enzimática catalítica o un efecto estructural o funcional. El término "aminoácido" o "secuencia de aminoácidos" o "molécula de aminoácidos" comprende cualquier proteína, péptido, polipéptido y enzima natural o sintetizada químicamente o una proteína, péptido, polipéptido y enzima modificada, en donde el término "modificada" comprende cualquier modificación química o enzimática de la proteína, péptido, polipéptido y enzima, incluyendo truncamientos de una secuencia de tipo silvestre a una parte más corta, pero aún activa.

De acuerdo con la presente divulgación, pueden emplearse técnicas convencionales de biología molecular, microbiología y ADN recombinante dentro de la experiencia en la técnica. Tales técnicas se explican completamente en la bibliografía. Véase, por ejemplo, Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (herein "Sambrook et al., 1989"); DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985); Oligonucleotide Synthesis (M.J. Gait ed.

1984); Nucleic Acid Hybridization (B.D. Hames & SJ. Higgins eds. (1985); Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984); Animal Cell Culture (RI. Freshney, ed. (1986); Immobilized Cells and Enzymes (IRL Press, (1986); B. Perbal, A Practical Guide to Molecular Cloning (1984); F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994); entre otros.

Siempre que la presente divulgación se relacione con el porcentaje de homología o identidad de secuencias de ácido nucleico o aminoácidos, estos valores definen los obtenidos mediante el uso del programa EMBOSS Water Pairwise Sequence Alignments (nucleótido) (www.ebi.ac.uk/Tools/psa /emboss_water/nucleótido.html) ácidos nucleicos o el programa EMBOSS Water Pairwise Sequence Alignments (proteína) (www.ebi.ac.uk/Tools/psa/emboss_water/) para secuencias de aminoácidos. Esas herramientas proporcionadas por el Instituto Europeo de Bioinformática (EBI) del Laboratorio Europeo de Biología Molecular (EMBL) para alineaciones de secuencias locales utilizan un algoritmo de Smith-Waterman modificado (véase www.ebi.ac.uk/Tools/psa/ y Smith, TF y Waterman, MS "Identification of common molecular subsequences" Journal of Molecular Biology, 1981 147 (1): 195-197). Al realizar una alineación, se utilizan los parámetros predeterminados definidos por el EMBL-EBI. Esos parámetros son (i) para secuencias de aminoácidos: Matriz = BLOSUM62, penalización por apertura de brecha = 10 y penalización por extensión de brecha = 0.5 o (ii) para secuencias de ácido nucleico: Matriz = DNAfull, penalización por apertura de brecha = 10 y penalización por extensión de brecha = 0.5.

Descripción detallada

La presente invención está definida por el objeto del conjunto de reivindicaciones adjunto.

De acuerdo con el primer aspecto de la presente divulgación, se proporciona un complejo molecular artificial que comprende (a) al menos una nucleasa específica del sitio (SSN) o un fragmento catalíticamente activo de la misma, o una secuencia de ácido nucleico que la codifica, y directamente interactuando con el mismo (b) al menos un dominio de acoplamiento de la plantilla de reparación (RTDD) o una secuencia de ácido nucleico que lo codifica, en donde el dominio de acoplamiento de la plantilla de reparación está configurado para interactuar directamente con al menos una secuencia de ácido nucleico de la plantilla de reparación (RT); (c) que comprende opcionalmente al menos un dominio de interacción (la SSN), o una secuencia de ácido nucleico que codifica el mismo, en donde al menos un dominio de interacción interactúa directamente con al menos una nucleasa específica del sitio o el fragmento catalíticamente activo de la misma, y en donde al menos un dominio de interacción está configurado para proporcionar al menos una de las funcionalidades seleccionadas del grupo que consiste en (i) interacción con al menos un dominio de acoplamiento de la plantilla de reparación; y/o (ii) interacción con al menos una secuencia de ácido nucleico de la plantilla de reparación; y/o (iii) interacción específica de secuencia con ADN genómico; en donde al menos una secuencia de ácido nucleico de la plantilla de reparación comprende al menos una parte que es complementaria con al menos una secuencia de complementariedad genómica, y en donde al menos una secuencia de ácido nucleico de la plantilla de reparación está configurada para mediar en la reparación de una secuencia objetivo de ADN.

La presente invención se basa en una nucleasa específica del sitio (SSN). Esta nucleasa se caracteriza por tener una función de nucleasa y una función de reconocimiento de ADN. La función de reconocimiento de ADN puede ser intrínseca a la nucleasa en forma de un dominio que media en el reconocimiento o la unión del ADN, o puede ser asistida por moléculas guía adicionales, por ejemplo, para CRISPR guiado por ácido nucleico (guiado por ARN) o nucleasas Argonauta (guiado por ADN), pero la presente invención no está restringida al uso de las nucleasas guiadas por ácido nucleico mencionadas anteriormente y, por lo tanto, aumenta el alcance de la aplicación de la modificación del genoma dirigida a cualquier nucleasa específica del sitio que no sea CRISPR o Argonauta. Otra parte del sistema artificial de acuerdo con la presente divulgación es al menos una secuencia de ácido nucleico de la plantilla de reparación (RT), ya que los productos y métodos de la presente divulgación se centran principalmente en hacer que una RT esté físicamente disponible en un sitio de una ruptura de cadena doble inducida por una SSN. Además, la presente invención se basa en un dominio de acoplamiento de plantillas de reparación (RTDD) como parte de un sistema molecular optimizado. Este RTDD cumple la función de poner directa o indirectamente la SSN y al menos una RT en estrecho contacto para permitir una modificación del genoma eficiente y dirigida.

El RTDD de la presente divulgación está asociado covalente o no covalentemente con la RT, es decir, interactúa directamente con la RT a nivel molecular. Simultáneamente, el RTDD interactúa directamente con al menos una SSN y, por lo tanto, representa la molécula o dominio de enlace entre la SSN y la RT. Para el RTDD, hay varias configuraciones posibles. En una realización, el RTDD está asociado directamente con la SSN. Por ejemplo, si la SSN es una nucleasa de CRISPR, el RTDD puede ser un ARNg, o si la SSN es una nucleasa Argonauta, el RTDD puede ser un ADNg. En otra realización, el RTDd puede ser parte del propio SSN, o puede ser parte de la RT, representando el RTDD una parte específica de la RT o de la SSN. En estas realizaciones, la SSN puede comprender un dominio como parte de su secuencia de aminoácidos, que puede interactuar con un aptámero que porta una RT. Por lo tanto, en ciertas realizaciones, no existe un dominio de interacción separado, ya que la propia nucleasa específica del sitio comprende un dominio para la interacción con un RTDD. Por lo tanto, el RTDD puede ser un aptámero asociado con la secuencia de ácido nucleico de RT, en donde el aptámero se reconoce y, por lo tanto, puede interactuar específicamente con la SSN y/o un dominio de interacción adicional.

Además, se prevén interacciones covalentes y no covalentes entre los componentes del complejo molecular artificial de acuerdo con la presente divulgación.

En otra realización de la presente divulgación, el complejo molecular artificial comprende un dominio de interacción (la SSN) adicional. En esta configuración, el RTDD se puede asociar con el dominio de interacción adicional para ciertas realizaciones. El dominio de interacción interactúa directamente, es decir, está físicamente asociado, ya sea de forma covalente como molécula de fusión o no covalentemente, con la SSN y proporciona una funcionalidad adicional al complejo molecular. El dominio de interacción puede ser un dominio de proteína que comprende funciones de unión/reconocimiento de ADN, es decir, puede ser un dominio que es capaz de interactuar con un sitio objetivo de ADN genómico de una manera específica del sitio, o el dominio de interacción puede configurarse específicamente para interactuar con un RTDD y/o la RT Por ejemplo, el dominio de interacción puede comprender una función intrínseca de unión y reconocimiento de ADN sin tener la propia función de nucleasa para interactuar específicamente con un ADN genómico. En otra realización, el dominio de interacción puede funcionar como compañero de interacción altamente específico para un RTDD asociado con una RT como se detalla más adelante. Al agregar este reconocimiento de ADN adicional o funcionalidad de interacción de RTDD al complejo molecular al agregar un dominio de interacción, se proporciona otro nivel de especificidad para la modificación del genoma además de la mera funcionalidad de una SSN sola.

En última instancia, particularmente el RTDD que interactúa directamente con una RT y además los dominios de interacción que se detallan a continuación proporcionan un juego de herramientas versátil para (i) poner una RT en estrecho contacto con una SSN de interés y, por lo tanto, muy cerca de la ruptura de cadena doble inducida por al menos una SSN para proporcionar un sistema molecular en forma de un complejo molecular artificial que tiene (ii) un intervalo de direccionamiento superior y mayor precisión adecuado para una variedad de enfoques de modificación del genoma personalizados en eucariotas y procariotas para lograr resultados optimizados para la modificación del genoma, modificación metabólica, desarrollo de rasgos en plantas y para aplicaciones terapéuticas.

Los diversos aspectos y realizaciones de la presente divulgación, por lo tanto, se basan todos en la provisión de una enzima inductora de rotura de cadena doble adecuada, o dos nickasas, como SSN, así como una secuencia de ácido nucleico de la plantilla de reparación (RT) diseñada adecuadamente, en donde la esencia de la presente divulgación es el hecho de que la SSN y la RT se acercan mucho para dirigir un evento de modificación del genoma de una manera específica.

En una realización de la presente divulgación, al menos un RTDD es un ARNg o ADNg de CRISPR y está interactuando directamente o asociado con una plantilla de reparación para construir una secuencia de ácido nucleico híbrida de ARN-ADN o ADN del RTDD y ADN de la RT

Un "complejo molecular artificial" de acuerdo con la presente divulgación representa por tanto un complejo que comprende al menos un componente de aminoácido, es decir, una SSN y opcionalmente un dominio de interacción, un RTDD y un plantilla de reparación (RT) de base de ácido nucleico. En el estado ensamblado, el complejo normalmente comprenderá al menos un componente que comprende un aminoácido (proteína), es decir, al menos una SSN, y un componente que comprende un ácido nucleico, es decir, la RT. Al menos un RTDD y, opcionalmente, al menos un dominio de interacción también puede comprender aminoácidos y/o ácidos nucleicos como bloques de construcción, pero debido a las funciones de dichos componentes dentro del complejo molecular, es posible un mayor espectro de moléculas, incluidos los bloques de construcción sintéticos o combinaciones de diferentes biomoléculas y/o moléculas sintéticas.

El complejo molecular artificial de acuerdo con la presente divulgación supera así la desventaja de los conjugados de oligonucleótido (RT)-enzima (SSN) que no pueden autoensamblarse in vivo, limitando así severamente su utilidad para la edición del genoma in vivo mediante la adición de al menos un dominio mediador de interacción adicional, es decir, un RTDD y, opcionalmente, un IA que garantiza una estrecha asociación de la RT y la SSN y un ensamblaje perfecto del complejo molecular in vivo, o en general en condiciones fisiológicas, in vivo e in vitro cuando se trabaja con al menos una célula intacta que porta un ADN objetivo genómico (genómico, incluidas las regiones codificantes y no codificantes, incluidas las regiones objetivo nucleares, plástidos y episomales y los sitios objetivo epigenéticos) de interés para ser modificado.

En una realización de la presente divulgación, el complejo molecular artificial se puede proporcionar y ensamblar completamente in vivo, por ejemplo, proporcionando las construcciones necesarias para sintetizar y ensamblar posteriormente el complejo dentro de una célula huésped. En otra realización, el complejo molecular artificial se puede proporcionar como complejo molecular ensamblado ex vivo, que posteriormente se introduce en una célula huésped de interés in vivo, o que se pone en contacto con una molécula objetivo genómica de interés in vitro. En otra realización más, se pueden producir partes del complejo molecular artificial ex vivo y se pueden fabricar piezas in vivo, por ejemplo, después de la introducción de un vector de suministro adecuado que porta un plásmido para la transcripción y/o expresión de un componente del complejo molecular artificial, y el complejo molecular artificial final que ejerce su función se ensamblará in vivo basado en la función de reconocimiento intrínseco mediada por el RTDD.

Una "interacción" o "interacción directa" entre cualquiera de los componentes del complejo molecular artificial de acuerdo con la presente divulgación implica, por lo tanto, cualquier interacción o enlace covalente o no covalente entre dos componentes del complejo molecular artificial. Un enlace covalente, a nivel de ácido nucleico, podría implicar así un enlace fosfodiéster o fosforotioato entre nucleótidos de una molécula de ácido nucleico. Además, un enlace covalente puede ser un puente disulfuro entre un aminoácido y otro aminoácido y/o una molécula de ácido nucleico modificada, aunque puede contemplarse cualquier enlace covalente natural o artificial de acuerdo con la presente divulgación. Las interacciones no covalentes comprenden interacciones electrostáticas, incluidas las iónicas, los enlaces de hidrógeno o los enlaces de halógeno, las fuerzas de van-der-Waals, incluidas las fuerzas dipolo-dipolo, dipolo inducido por dipolo, las fuerzas de dispersión de London, los efectos n y los efectos hidrófobos. En particular, puede estar presente más de un tipo de interacción dentro de los componentes del complejo molecular artificial de acuerdo con la presente divulgación. Por ejemplo, la SSN, por ejemplo, una nucleasa de CRISPR, podría interactuar a través de una interacción o interacciones no covalentes con un ARNg como RTDD. El RTDD podría estar unido covalentemente a una plantilla de reparación RT En otra realización, una proteína de fusión Argonauta como SSN puede fusionarse covalentemente con un fragmento de anticuerpo variable de cadena sencilla como dominio de interacción (IA). La SSN puede, entre otros, ser específico para la fluoresceína y, por lo tanto, puede interactuar de forma no covalente con la fluoresceína RTDD. La fluoresceína y dicho ácido nucleico RT de la plantilla de reparación marcado se pueden proporcionar como fusión covalente sintética. En otra realización, la asociación de los diferentes componentes está mediada por interacciones no covalentes, p. ej., el la SSN. En una realización, el RTDD puede ser un aptámero, por ejemplo, una secuencia que proporcione la función del aptámero en la plantilla de reparación. En otra realización, una extensión de un ácido nucleico guía que permite la hibridación con la plantilla de reparación puede funcionar como al menos un RTDD. Si se define un ácido nucleico guía como RTDD, dicha realización usa más de un RTDD. En otra realización adicional, el extremo 3' o 5' del ácido nucleico guía utilizado para la ligadura con la plantilla de reparación puede configurarse específicamente para funcionar como RTDD.

De acuerdo con la presente divulgación, los diferentes componentes del complejo molecular artificial pueden comprender bloques de construcción artificiales naturales y/o sintéticos.

Una nucleasa específica del sitio (SSN) de acuerdo con las diversas realizaciones de la presente divulgación, o la secuencia de ácido nucleico que codifica la misma, puede ser cualquier nucleasa natural o diseñada que sea capaz de reconocer y escindir el ADN de una manera específica del sitio. . Dado que muchos SSN tendrán una gran cantidad de sitios de división potenciales dentro de un genoma de un organismo o virus, son deseables tales SSN con un patrón de división definido o SSN de diseño con patrones de división personalizados. Por lo tanto, los SSN incluyen nucleasas específicas del sitio para técnicas de edición del genoma, como dedos de zinc de diseño, efectores de tipo activador de la transcripción (TALE), meganucleasas (de búsqueda), nucleasas derivadas del sistema CRISPR, incluidas las nucleasas Cas o Cpf1, o nucleasas Argonauta, así como raras endonucleasas de corte, o dos endonucleasas de corte específicas de sitio, incluida una endonucleasa de restricción de clase IIS, incluida Fokl o una variante de la misma, o dos endonucleasas de corte específicas de sitio, o una variante o un fragmento catalíticamente activo de las mismas, o cualquier variante o una endonucleasa catalíticamente activa fragmento de los SSN antes mencionados. Por lo tanto, de acuerdo con la presente divulgación, puede estar presente más de una SSN, o una secuencia de ácido nucleico que codifica el mismo, mientras que las moléculas en suma pueden inducir una ruptura de cadena doble de ADN dirigida, o dos rupturas consecutivas de una sola cadena en una secuencia objetivo de ADN.

La "secuencia objetivo de ADN" de acuerdo con la presente invención/divulgación puede ser cualquier región dentro de un ADN de cadena doble, genómico o basado en plásmido, donde se induce una ruptura de ADN objetivo y se repara posteriormente con la ayuda de la plantilla de reparación (RT) de acuerdo con la presente invención/divulgación. Aunque una "secuencia objetivo de ADN" se origina a partir de una secuencia endógena, la edición o ingeniería de dicha secuencia se puede realizar in vitro presentando la secuencia relevante en una molécula que comprende el ADN genómico, preferiblemente en un plásmido. En dichas realizaciones, el locus de interés objetivo puede estar comprendido en una molécula de a Dn dentro de una célula. La célula puede ser una célula procariota o una célula eucariota, o un genoma viral en un plásmido dentro de una célula procariota o una célula huésped eucariota utilizada para la propagación del virus. La célula puede ser una célula de mamífero. La célula de mamífero puede ser una célula de primate no humano, bovina, porcina, de roedor o de ratón. La célula puede ser una célula eucariota no de mamífero tal como aves, peces o gambas. La célula también puede ser una célula de la planta. La célula de la planta puede ser de una planta de cultivo tal como mandioca, maíz, sorgo, trigo, soja, algodón, remolacha azucarera o arroz. La célula de la planta también puede ser de un alga, un árbol o un vegetal. La modificación introducida en la célula por la presente invención puede ser tal que la célula y la progenie de la célula se alteren para mejorar la producción de productos biológicos tales como un anticuerpo, almidón, alcohol u otra producción celular deseada. La modificación introducida en la célula por la presente invención puede ser tal que la célula y la progenie de la célula incluyan una alteración que cambie el producto biológico producido. En otra realización, la "secuencia objetivo de ADN" puede ser un lugar epigenético de interés.

Una "secuencia de complementariedad genómica" de acuerdo con la presente invención se refiere a la parte de la secuencia de una RT de acuerdo con la presente divulgación que se puede alinear por medio del emparejamiento de bases complementarias. La "secuencia objetivo de ADN" y la "secuencia de complementariedad genómica" pueden así superponerse o incluso ser iguales, pero para ciertas realizaciones, dichas secuencias pueden ser diferentes, por ejemplo en el caso de que al menos una SSN tenga un sitio de corte secuencia arriba o corriente abajo de la parte de "secuencia de complementariedad genómica" de la RT

En cualquiera de las realizaciones descritas, la rotura de cadena puede ser una rotura de cadena doble, o pueden ser dos roturas de una sola cadena.

En ciertas realizaciones, el componente SSN y, opcionalmente, el componente la SSN del complejo molecular artificial se administrarán a una célula huésped o a un sistema de ensayo que comprenda una región genómica de interés para modificarse a través de una administración conjunta de proteínas con el RTDD etiquetado o asociado. oligonucleótido plantilla de reparación en una realización, o en otra realización como una expresión basada en plásmido de la proteína de fusión y la posterior exposición a la plantilla de reparación marcada con RTDD. Se puede proporcionar conjuntamente un RTDD adicional en caso de que se prevea más de un RTDD, por ejemplo, siendo un RTDD una molécula guía de ácido nucleico y otro RTDD siendo una molécula, por ejemplo, biotina o un marcador, por ejemplo, fluoresceína, asociado con la RT Los enfoques basados en plásmidos o vectores de acuerdo con la presente invención también incluyen aquellos de una línea de expresión estable de la SSN y/o el la SSN y/o una proteína de fusión del mismo.

En una realización de la presente divulgación, el complejo molecular artificial comprende dos moléculas SSN, siendo una SSN una nucleasa activa y el otro SSN una molécula deficiente en nucleasa catalíticamente inactiva, en donde la SSN inactivo funcionará como compañero de interacción para un RTDD/ RT Dicha configuración del complejo molecular artificial puede mejorar la especificidad para ciertas secuencias objetivo de ADN de interés.

En otra realización de la presente divulgación, una proteína de fusión o un Cpf1 activo asociado de forma no covalente y un dCas9 inactivo como dominio de interacción pueden proporcionarse como SSN. El ARNg para Cas9 como RTDD puede dirigirse a la plantilla de reparación o una extensión de la misma, formando un complejo Cpf1-dCas9-RT El ARNcr (Cpf1) apunta al locus genómico definido para el corte de cadena doble para iniciar HDR.

Asimismo, se puede utilizar como dominio de interacción una proteína con dedos de zinc altamente activa, una megaTAL o una meganucleasa inactiva.

En una realización de acuerdo con los diversos aspectos de la presente divulgación, al menos un dominio de acoplamiento de la plantilla de reparación (RTDD), o la secuencia de ácido nucleico que codifica el mismo, o al menos un complejo molecular artificial se selecciona de al menos uno de biotina , un aptámero, un tinte de ADN, ARN o proteína, que comprende fluoróforos, que comprende fluoresceína o una variante de la misma, maleimidas o tetraxolio (XTT), una secuencia de ácido nucleico guía configurada específicamente para interactuar con al menos una secuencia de ácido nucleico de la plantilla de reparación, una estreptavidina, o una variante de la misma, como una estreptavidina monomérica, una avidina o una variante de la misma, una etiqueta de afinidad, como una etiqueta de estreptavidina, un anticuerpo, un fragmento variable de cadena única (Fvcs), un dominio único anticuerpo (nanocuerpo), una anticalina, una proteína VirD2 de Agrobacterium o un dominio de la misma (véase, por ejemplo, SEQ ID NO: 33), una VPg de Picornavirus, una topoisomerasa o un dominio de la misma, una proteína del fago A PhiX174, una proteína PhiX A*, una proteína VirE2 o un dominio de la misma, o digoxigenina. Por lo tanto, el RTDD puede ser una molécula de origen natural o sintética que no se restringe a un ácido nucleico o una molécula de aminoácido. El RTDD es, por lo tanto, más bien un mediador de interacción específico del complejo molecular artificial de la presente divulgación, que puede modificarse de una manera versátil para acoplar al menos una SSN de interés y al menos una plantilla de reparación específica para una región de interés de complementariedad genómica y que porta opcionalmente un inserto de interés para introducirlo en una secuencia objetivo de ADN de interés escindida por al menos una SSN. Para realizaciones que usan SSN basados en CRISPR o Argonauta, el RTDD puede ser una secuencia de ácido nucleico guía. Un RTDD de acuerdo con la presente divulgación puede ser, por tanto, una molécula perteneciente a diversas clases de moléculas artificiales o naturales. El RTDD se define así por su capacidad para interactuar directamente con al menos una secuencia de ácido nucleico de la plantilla de reparación (RT) y, además, al interactuar directamente con al menos una SSN. El RTDD es, por lo tanto, el enlazador molecular dentro del complejo molecular artificial que proporciona una estrecha proximidad física de la RT y la SSN y, debido a su doble interacción con la RT y la s Sn , garantiza la asociación del complejo molecular artificial in vitro e in vivo mediante interacciones moleculares altamente específicas. Para ciertas realizaciones, puede estar presente más de un RTDD que porta más de un RT.

En otra realización de la presente divulgación, el complejo molecular artificial comprende un dominio de interacción, en donde al menos un dominio de interacción, o la secuencia de ácido nucleico que codifica el mismo, se selecciona de al menos uno de los dominios de unión al ADN, una estreptavidina, o una variante de la misma, tal como una estreptavidina monomérica, avidina o una variante de la misma, una etiqueta de afinidad, una señal de biotinilación, un sitio aceptor de biotina, una etiqueta de estreptavidina, un anticuerpo, un fragmento variable de cadena sencilla (Fvcs), un anticuerpo de un solo dominio (nanocuerpo), una anticalina, biotina, un aptámero, un tinte de ADN, ARN o proteína, que comprende fluoróforos, que comprende fluoresceína o una variante de la misma, maleimidas o tetraxolio (XTT), una secuencia de ácido nucleico guía configurada específicamente para interactuar con al menos una secuencia de ácido nucleico de la plantilla de reparación, una proteína VirD2 de Agrobacterium o un dominio de la misma, una VPg de Picornavirus, una topoisomerasa o un dominio de la misma, una proteína del fago A PhiX174, una proteína PhiX A*, una proteína VirE2 o una dominio del mismo, o digoxigenina.

En particular, un RTDD y un dominio de interacción se pueden seleccionar de una clase de moléculas comparables y superpuestas debido al hecho de que el dominio de interacción es un componente opcional, que además puede optimizar la especificidad o la eficiencia de un complejo molecular artificial de acuerdo con la presente divulgación. La presencia de un dominio de interacción puede ser importante para las realizaciones que utilizan complejos moleculares artificiales, donde no se utiliza ninguna nucleasa guiada por ácido nucleico como SSN, o donde la SSN porta una o más mutaciones que modifican la actividad intrínseca de reconocimiento, unión o escisión del ADN de la SSN.

En otra realización más, la presencia de un dominio de interacción puede ser favorable para usarse en combinación con cualquier tipo de SSN para aumentar aún más el intervalo de orientación, la eficiencia de unión y/o escisión, la tasa de escisión o la precisión de la orientación a una secuencia objetivo de ADN de interés, ya que el dominio de interacción como componente adicional dentro del complejo molecular artificial puede añadir una funcionalidad ampliada al complejo y, por lo tanto, puede ampliar el alcance de su aplicabilidad. Particularmente para la modificación del genoma en eucariotas superiores que comprenden genomas complejos, la presencia de un componente adicional, es decir, el dominio de interacción, puede ser de gran importancia para lograr una precisión mejorada de la escisión del ADN y, mediada por la RT de acuerdo con la presente divulgación, reparación dirigida. En ciertas realizaciones de la presente divulgación, el IA puede representar un compañero de unión altamente específico para un compañero de molécula que no está involucrado en la modificación del genoma en sí, donde el compañero de molécula o el compañero de unión afín representa un RTDD que está asociado con una RT. Por lo tanto, el nivel adicional de agregar un dominio IA, así como un compañero afín RTDD, puede agregar significativamente más especificidad de unión y disponibilidad de RT al complejo molecular artificial para mejorar el resultado de un enfoque de modificación del genoma específico.

El dominio de interacción (IA) de acuerdo con la presente invención/divulgación tiene varias funcionalidades seleccionadas del grupo que consiste en (i) interacción con al menos un dominio de acoplamiento de la plantilla de reparación; y/o (ii) interacción con al menos una secuencia de ácido nucleico de la plantilla de reparación; y/o (iii) interacción específica de secuencia con ADN genómico. Se puede unificar más de una de estas funcionalidades dentro de un IA específico.

Se podría considerar el uso de un IA que represente una proteína o polipéptido que tenga capacidades de unión intrínsecas de alta especificidad y alta afinidad para un ligando afín, por ejemplo, un ligando sintético, incluida la fluoresceína para una biomolécula, incluida la biotina o la digoxigenina y sus variantes, para un aptámero o un antígeno/epítopo. El término "antígeno", como se usa en este documento y como se usa comúnmente en el campo de la inmunología, se refiere a una molécula "generadora de anticuerpos", es decir, una sustancia, que puede provocar una respuesta inmunitaria adaptativa. Por lo tanto, un antígeno es una molécula que se une a un receptor específico de antígeno, ya sea un receptor de células T o de células B o una variante del mismo, por ejemplo, un nanocuerpo o un anticuerpo de fragmento variable de cadena única, anticuerpos biespecíficos, un di-Fvcs en tándem, un diacuerpo, un tri-Fvcs en tándem (trivalente) o un triacuerpo (trivalente). Un antígeno suele ser un (poli)péptido, pero también puede ser un polisacárido o un lípido, posiblemente combinado con una proteína o una molécula portadora de polisacárido. Mediado por esta propiedad intrínseca de vinculación/reconocimiento del IA, se puede elegir un IA de interés que reconocerá específicamente un RTDD de una manera muy específica y el IA se puede conectar o fusionar, de forma covalente o no covalente, con una SSN. La inclusión de dicho IA añade un nivel adicional de especificidad al complejo molecular artificial de la presente divulgación y garantiza que la RT que interactúa directamente con el RTDD se asociará específicamente con el complejo SSN-IA mediado por la asociación IA-RTDD altamente específica. Lo más deseable es que el IA y el RTDD afín tengan una constante de afinidad alta o afinidad de unión y, por lo tanto, una constante de disociación baja (Kd) entre sí en condiciones fisiológicas, es decir, un valor de Kd en el intervalo bajo de |^jM o nM, y por debajo. El IA puede ser una molécula monovalente, divalente, trivalente o multivalente que tenga una o más especificidades (fragmento derivado de anticuerpo trivalente), respectivamente, o que tenga más de un sitio de unión (estreptavidina tetramérica). En estas realizaciones, más de un RTDD y/o RT pueden estar presentes y presentaron al menos una SSN con el complejo molecular artificial. Son deseables los IA que tienen constantes de disociación bajas (Kd), es decir, que a su vez tienen una alta afinidad por su ligando afín. Por lo general, las constantes de disociación por debajo del nivel pico molar como resultado de interacciones de unión no covalente entre dos moléculas, es decir, la forma de interacción típica entre una proteína y un ligando, son raras. Sin embargo, hay algunas excepciones importantes. La biotina y la avidina natural se unen con una constante de disociación de aproximadamente 10-15 M, que representa una afinidad tan alta que no es adecuada para aplicaciones donde se pretende una unión reversible. Los anticuerpos comerciales o Fvcs pueden tener valores de Kd en el intervalo de 10 14 M - 10-6 M. Para los fines de la presente divulgación, un par IA-RTDD debería tener una constante de disociación baja, es decir, una afinidad alta.

Además, en ciertas realizaciones de la presente divulgación, el IA puede interactuar directamente con la RT. Cuando la secuencia de ácido nucleico de la RT comprende un tramo, por ejemplo, un aptámero basado en un ácido nucleico, esta secuencia puede ser reconocida por un compañero de unión afín, el IA, que luego puede interactuar con la RT de una manera altamente específica. Además, el IA puede ser una molécula divalente, o trivalente o multivalente que tenga más de una especificidad de unión. Una parte del IA puede configurarse para interactuar con el RTDD, y una parte puede configurarse para interactuar con la RT, mientras que el IA está asociado con la SSN, de modo que una asociación aún más estrecha de la RT y la SSN durante la modificación del genoma puede lograrse.

En otra realización de la presente divulgación, el IA puede ser una molécula de unión que tiene la capacidad de interacción específica de secuencia con un ADN genómico. Esto agregará más especificidad durante el direccionamiento de un complejo molecular artificial a una secuencia objetivo de ADN. Además, esto permite el uso de SSN modificadas para que se pueda proporcionar una SSN con actividad de escisión optimizada, mientras que el IA media la función de direccionamiento del complejo molecular artificial a una secuencia objetivo de ADN con alta precisión, mientras que la SSN y/o el IA pueden interactuar con un RTDD interactuando y presentando así la RT al sitio, donde se inducirá una ruptura de cadena doble. En una realización, el IA puede ser un dominio de unión a ADN o un motivo de unión a ADN diseñado para formar parte de una proteína de fusión en el extremo terminal N o C de al menos una nucleasa SSN o una variante de la misma. Un enlazador basado en aminoácidos permitirá flexibilidad y evitará obstáculos estéricos para la unión al ADN o la actividad de la nucleasa. Los posibles dominios de unión al ADN también podrían ser dedos de zinc (Roy et al., 2012), tal como un dedo de zinc con Cys2/His2 (Kubo et al., 1998), TALEN (Hubbard et al., 2015) o proteínas Argonauta o Cas9 inactivadas capaces de unirse al ADN altamente específico. Cualquiera de estos dominios de unión a ADN se dirigiría idealmente a una secuencia fuera de la secuencia de interés flanqueada por el brazo de homología para evitar el impedimento estérico de la interacción y, por lo tanto, puede agregar otro nivel de especificidad al complejo molecular artificial de la presente divulgación.

En una realización adicional de la presente divulgación, se puede usar más de un dominio IA dentro del complejo molecular artificial, es decir, un IA se usa como ligante de alta especificidad y afinidad para un RTDD, y un IA se usa como dominio adicional de unión al ADN, ambos IA están directamente en interacción con, es decir, están asociados covalente o no covalentemente con al menos una SSN del complejo molecular artificial.

En una realización de la presente divulgación, al menos una SSN y/o al menos un IA comprenden una señal de biotinilación o un sitio aceptor de biotinilación o una etiqueta de estreptavidina. La señal/sitio relevante se puede biotinilar in vitro o in vivo por enzimas/agentes biotinilantes endógenos (BirA) o exógenos, o en una etapa de biotinilación in vitro, y la señal/sitio biotinilado y/o la etiqueta de estreptavidina pueden reconocerse y unirse a una estreptavidina o avidina, o una variante modificada de las mismas, o una variante monomérica de las mismas, donde la estreptavidina o avidina o la variante de las mismas se asociará con una RT de interés. Como se sabe que la avidina interactúa de forma no específica con el ADN (Morpurgo et al., 2004), podrían ser deseables variantes modificadas de avidina o estreptavidina o variantes de las mismas.

Particularmente para las SSN que no dependen de los ARN/ADN guías, la capacidad de unión adicional y, por lo tanto, la capacidad de direccionamiento de RT de la estreptavidina monomérica o Fvcs con una especificidad de unión determinada puede aumentar drásticamente el intervalo de SSN adecuadas para la modificación del genoma si se usa en combinación con los RTDD y/o los lA de acuerdo con la presente divulgación.

En una realización, la biotina se puede fusionar con el ADN plantilla de reparación mediante kits comercialmente disponibles o como parte de un proceso de síntesis de terceros como RTDD. El uso de una secuencia de estreptavidina o avidina modificada garantiza que no se produzcan complejos entre proteínas y que se una, una plantilla de ADN de reparación biotinilada por proteína. Luego, la plantilla de reparación se une a la estreptavidina o cualquier variante de la misma como dominio de interacción (Niemeyer et al. 1999, "Functionalization of covalent DNA-streptavidin conjugates by means of biotinylated modulator components". Bioconjug Chem 10(5): 708-719), en donde el dominio de interacción interactúa directamente con la SSN, por ejemplo, proporcionando la SSN y la estreptavidina como molécula de fusión. En otra realización, la SSN puede comprender una señal o péptido de biotinilación y la biotinilación procederá in vivo en una célula huésped. En esta realización, la estreptavidina o la avidina, o una variante de las mismas, pueden funcionar como la propia RTDD al estar unida a una RT. Una secuencia de ejemplo que codifica una estreptavidina monomérica (mSA) adecuada como dominio de interacción o como RTDD de acuerdo con la presente divulgación se muestra en SEQ ID NO: 34. Por lo tanto, mSA fusionada con una SSN podría entenderse como un RTDD o como un dominio de interacción de acuerdo con la presente divulgación. En otra realización, la SSN puede portar una etiqueta de estreptavidina, siendo reconocida la etiqueta por una variante de estreptavidina que funciona como dominio de interacción o como RTDD, respectivamente. Las enzimas de estreptavidina o avidina adecuadas, o variantes de las mismas, o vectores que las codifican, están disponibles para los expertos, por ejemplo, de IBA LifeSciences (Gottingen, Alemania), Addgene (Cambridge, MA, EE. UU.), Intregrated DNA Technologies (Coralville, IA, EE. UU.) o GeneArt (ThermoFisher; Waltham, MA, EE. UU.). Otra secuencia de ejemplo para una construcción de estreptavidina monomérica que codifica mSA adecuada como IA o RTDD de acuerdo con la presente divulgación se muestra en la SEQ ID NO: 42.

En alguna realización de la presente divulgación, la interacción o unión o asociación entre el RTDD y la SSN y/o el dominio de interacción resulta de una interacción de un par de unión seleccionado de la interacción no covalente de un par de unión seleccionado de, pero no limitado a: biotina-avidina; biotina-estreptavidina; formas de avidina modificadas con biotina; proteína-proteína; interacciones proteína-ácido nucleico; interacciones ligando-receptor; interacciones ligando-sustrato; anticuerpo-antígeno; anticuerpo-antígeno de cadena sencilla; anticuerpo o anticuerpo de cadena sencilla-hapteno; proteína de unión hormona-hormona; receptor-agonista; antagonista receptor-receptor; IgG-proteína A; cofactor enzima-enzima; inhibidor de enzima-enzima; ADN de cadena sencilla-VirE2; StickyC-ADNcd; RISC (complejo de silenciamiento inducido por ARN)-ARN; proteína de cubierta viral-ácido nucleico; anticuerpo de fragmento variable de cadena sencilla anti-fluoresceína (Fvcs anti-FAM)-fluoresceína; fragmento variable de cadena sencilla (Fvcs) antidigoxigenina (DIG), inmunoglobina (DIG-Fvcs)-digoxigenina (DIG) y Proteína de unión a VirD2 de agrobacterium o cualquier combinación o variación de la misma. En particular, los anticuerpos y fragmentos de anticuerpos o derivados como Fvcs, nanocuerpos o diacuerpos que tienen especificidades personalizadas y altas afinidades (en el intervalo μM o incluso fM) están disponibles comercialmente, en particular tales anticuerpos o fragmentos o variantes de los mismos que se unen a colorantes clásicos, como la fluoresceína, o derivados de los mismos.

En una realización de la presente divulgación, el dominio de interacción de acuerdo con la presente divulgación se selecciona de una cremallera de leucina, una secuencia de aptámero, dCas9, dCPF1, una meganucleasa, un dedo de zinc o una construcción TALE. En esta realización, al menos una SSN y el ADN de RT pueden interactuar directamente a través de un dominio de unión a ADN intermedio o un motivo de unión a ADN diseñado para ser parte de una proteína de fusión en el extremo terminal N y/o C de la SSN. Un enlazador basado en aminoácidos permitirá flexibilidad y evitará obstáculos estéricos para la unión al ADN o la actividad de la nucleasa. Los posibles dominios de unión al ADN también podrían ser dedos de zinc (Roy et al., 2012, "Prediction of DNA-binding specificity in zinc finger proteins." J Biosci 37(3): 483-491), tal como un dedo de zinc con Cys2/His2 (Kubo et al. 1998, "Cys2/His2 zinc-finger protein family of petunia: evolution and general mechanism of target-sequence recognition." Nucleic Acids Research 26(2): 608-615), TALEN (Hubbard et al. 2015, "Continuous directed evolution of DNA-binding proteins to improve TALEN specificity." Nat Methods 12(10): 939-942) o proteínas Argonauta o Cas inactivadas capaces de unirse al ADN altamente específico. Cualquiera de estos dominios de unión a ADN como dominios de interacción puede ayudar adicionalmente a dirigirse a una secuencia fuera de la secuencia de interés flanqueada por el brazo de homología para evitar el impedimento estérico de la interacción. Dichos dominios de interacción pueden cumplir la función de aumentar la unión al ADN del complejo molecular artificial de la presente divulgación y/o permitir la provisión de sitios de acoplamiento adicionales para el enlace RTDD/RT para proporcionar un complejo altamente específico adecuado para la modificación del genoma.

De acuerdo con determinadas realizaciones de la presente divulgación, al menos una SSN de acuerdo con la presente divulgación puede fusionarse con un dominio de unión al ADN, es decir, una proteína o un fragmento de la misma, o una secuencia génica que codifica dicha proteína o un fragmento de la proteína, que se unen a moléculas de ADN o se unen a otras moléculas celulares, incluidas, pero sin limitarse a, proteína de unión a maltosa (MBP), etiqueta S, fusiones de dominio de unión alADN (DBD) Lex A, fusiones de dominio de unión de ADN GAL4 y fusiones de proteínas BP16 al virus del herpes simple (HSV).

En ciertas realizaciones de la presente divulgación, puede haber más de un RTDD. El primer RTDD podría ser un mSA o un fragmento variable de cadena sencilla (Fvcs), mientras que el segundo RTDD podría ser biotina o el ligando afín del Fvcs. En una realización, utilizando un sistema SSN basado en CRISPR o Argonauta, el primer RTDD es una secuencia de ácido nucleico guía, y el segundo RTDD es una biotina o fluoresceína o cualquier otra fracción compañera de unión de alta afinidad unida a un RT, en donde una estreptavidina monomérica o un Fvcs u otro compañero de unión a proteína afín representa un IA que reconoce el segundo RTDD y se une al mismo con alta afinidad. Este diseño del complejo molecular artificial de acuerdo con la presente divulgación permite la máxima flexibilidad para poner una RT en estrecho contacto con un efector SSN proporcionando simultáneamente una alta disponibilidad de RT y sin pérdida de la RT, ya que los RTDD proporcionan interacciones fuertes y fiables con la RT y la SSN para lograr eventos de modificación del genoma de precisión.

En una realización de la presente divulgación, la unión de la plantilla de reparación a la SSN puede lograrse mediante un anticuerpo de fragmento variable de cadena sencilla (Fvcs) contra el colorante fluoresceína. El Fvcs que se une específicamente a la fluoresceína y los derivados de la fluoresceína se fusiona con la SSN en forma de proteína híbrida (Schenk et al. 2007, "Generation and Application of a fluorescein-specific single-chain antibody". Biochimie 89(11): 1304-1311). En otra realización, la SSN puede comprender una molécula de fluoresceína que interactúa con la misma y el Fvcs específico de fluoresceína afín puede proporcionarse como una fusión con una RT y puede unirse a la fluoresceína asociada con la SSN. Por lo tanto, el Fvcs puede funcionar como RTDD o como dominio de interacción de acuerdo con la presente divulgación.

En otras realizaciones de la presente divulgación, puede usarse cualquier Fvcs con una especificidad de unión diferente.

Los pares de Fvcs-ligando adecuados se seleccionan del grupo que consiste en un Fvcs y fluoresceína (FAM) o cualquier derivado o variante de FAM, un Fvcs que reconoce la digoxigenina (DIG), un Fvcs personalizado que reconoce un epítopo/antígeno en una SSN de interés, y similares. Una secuencia de ejemplo que codifica una secuencia codificante de Fvcs con capacidad de unión a fluoresceína se muestra en la SEQ ID NO: 43.

En otra realización de la presente divulgación, una secuencia de aptámero está diseñada para interactuar específicamente con al menos una SSN. En esta realización, la secuencia del aptámero se puede unir de forma covalente o no covalente a una secuencia de la plantilla de reparación de interés para permitir una asociación directa entre la SSN y el aptámero como RTDD sin crear una proteína de fusión y/o utilizar un dominio de interacción adicional. En realizaciones, donde no se usa un dominio de interacción separado, el RTDD que interactúa con la RT comprende un motivo de nucleótido capaz de interactuar específicamente, es decir, unirse o enlazarse a un dominio de al menos una proteína SSN, o un dominio específico del mismo configurado para interactuar con el RTDD: En algunas realizaciones, la interacción se selecciona, pero no se limita a: Proteína de dedo de zinc-motivo de dedo de zinc; dominio de reconocimiento de enzimas de restricción-secuencia de reconocimiento de enzimas de restricción; dominio de unión a ADN del factor de transcripción-motivo de ADN; represor-operador; promotor de la cremallera de leucina; dominio de caja de hélice E de bucle de hélice; motivos de unión de ^aRⁿque comprenden dominios de motivos ricos en arginina, dominios de proteínas ap, dominios de motivos de reconocimiento de ARN (RRM), dominios de homología K, motivos de unión de ARN de cadena doble, dedos de zinc de unión a ARN y secuencia de ARN específica afín a enzimas dirigidas a ARN; del Tallo IIB de la proteína inversa del VIH- del elemento de respuesta inversa del VIH (RRE); bucle I del dominio de unión principal a Tat del virus de la inmunodeficiencia bovina (BIV) de la secuencia del elemento de respuesta que actúa en trans del VIB (TAR); Phage lambda, phi21 y proteínas P22 N, las horquillas del bucle de cajaB en los sitios de utilización de N (nut) en sus respectivos ARN.

En la medida en que la presente invención se refiere al uso de un Argonauta como nucleasa específica del sitio, además de las ventajas de una molécula de ADN guía, el suministro de la endonucleasa NgAgo se ve facilitado por su pequeño tamaño. La proteína de tipo silvestre (WT) (Número de acceso de GenBank AFZ73749) tiene 887 aminoácidos, o aproximadamente 2/3 del tamaño de Cas9 de Streptococcus pyogenes. Esto simplifica la clonación y el ensamblaje del vector, puede aumentar los niveles de expresión de la nucleasa en las células y reduce el desafío de expresar la proteína desde plataformas altamente sensibles al tamaño, como virus, incluidos virus de ADN o ARN. Al igual que otras endonucleasas guiadas por ácidos nucleicos, las SSN NgAgo generalmente requieren un mínimo de dos componentes para la mutagénesis dirigida en células vegetales: un ADN guía de cadena sencilla fosforilado en 5' y la proteína endonucleasa NgAgo. Para ediciones, inserciones o reemplazos de secuencia específicas, también se puede proporcionar a la célula de la planta una plantilla de ADN que codifica los cambios de secuencia deseados para introducir cambios a través de las vías de reparación NHEJ o HR. Los eventos de edición exitosos se detectan con mayor frecuencia mediante cambios fenotípicos (como la eliminación o la introducción de un gen que da como resultado un fenotipo visible), mediante métodos basados en PCR (tales como PCR de enriquecimiento, digestión con PCR o ensayos de endonucleasa T7EI o Surveyor), o por secuenciación de próxima generación dirigida (NGS; también conocida como secuenciación profunda). En una realización específica, la endonucleasa Argonauta modificada es activa a una temperatura de aproximadamente 20 °C a aproximadamente 35 °C. En una realización específica, la endonucleasa Argonauta modificada es activa a una temperatura de aproximadamente 23 °C a aproximadamente 32 °C. Las proteínas Argonauta que pueden funcionar como endonucleasas pueden comprender tres dominios funcionales clave: un dominio de endonucleasa PIWI, un dominio PAZ y un dominio MID. El dominio PIWI puede parecerse a una nucleasa. La nucleasa puede ser una RNasa H o una ribonucleasa guiada por ADN. El dominio PIWI puede compartir un motivo de unión de cationes divalentes para la catálisis exhibido por otras nucleasas que pueden escindir el ARN y el ADN. El motivo de unión de cationes divalentes puede contener cuatro aminoácidos conservados evolutivamente cargados negativamente. Los cuatro aminoácidos conservados evolutivamente cargados negativamente pueden ser aspartato-glutamato-aspartato-aspartato (DEDD). Los cuatro aminoácidos conservados evolutivamente cargados negativamente pueden formar una tétrada catalítica que se une a dos iones Mg2+ y escinde un ácido nucleico objetivo en productos que portan un grupo 3' hidroxilo y 5' fosfato. El dominio PIWI puede comprender además uno o más aminoácidos seleccionados de un residuo básico. El dominio PIWI puede comprender además uno o más aminoácidos seleccionados de histidina, arginina, lisina y una combinación de los mismos. La histidina, la arginina y/o la lisina pueden desempeñar un papel importante en la catálisis y/o la escisión. La escisión del ácido nucleico objetivo por Argonauta puede ocurrir en un solo enlace fosfodiéster. En algunos casos, uno o más cationes de magnesio y/o manganeso pueden facilitar la escisión del ácido nucleico objetivo, donde un primer catión puede atacar nucleofílicamente y activar una molécula de agua y un segundo catión puede estabilizar el estado de transición y el grupo saliente. Para ciertas nucleasas Argonauta, la longitud del ADNg proporcionará la afinidad entre Argonauta y el ADNg guía.

Las proteínas argonauta adecuadas de acuerdo con la presente divulgación se muestran con las SEQ ID NOs: 19 y 20, o puede comprender una secuencia que tiene al menos 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 % , 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95 %, 96%, 97%, 98% o 99% de homología de secuencia con la misma siempre que la secuencia homóloga aún cumpla la función de la proteína argonauta de la que se deriva, es decir, de la que se origina. Otras secuencias de argonautas adecuadas se divulgan en la solicitud estadounidense provisional n.° 62/345,448 que se incorporan en el presente documento como referencia. Se pueden derivar otras secuencias de Argonauta adecuadas a partir de una secuencia de acuerdo con las SEQ ID NOs: 21 a 29 o una secuencia que tenga al menos 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78 %, 79 % , 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96 %, 97%, 98% o 99% de homología de secuencia con las mismas.

Un Argonauta puede comprender un dominio de unión a ácido nucleico. El dominio de unión a ácido nucleico puede comprender una región que hace contacto con un ácido nucleico. Un dominio de unión a ácido nucleico puede comprender un ácido nucleico. Un dominio de unión a ácido nucleico puede comprender un material proteico. Un dominio de unión a ácido nucleico puede comprender un ácido nucleico y un material proteico. Un dominio de unión a ácido nucleico puede comprender ADN. Un dominio de unión a ácido nucleico puede comprender ADN de cadena sencilla. Los ejemplos de dominios de unión a ácidos nucleicos pueden incluir, pero sin limitarse a, un dominio de hélice-giro-hélice, un dominio de dedo de zinc, un dominio de cremallera de leucina (bZIP), un dominio de hélice alada, un dominio de hélice-giro-hélice alada, un dominio hélice-bucle-hélice, un dominio HMG-caja, un dominio Wor3, un dominio de inmunoglobulina, un dominio B3 o un dominio TALE. Un dominio de unión a ácido nucleico puede ser un dominio de una proteína Argonauta. Una proteína Argonauta puede ser una Argonauta eucariota o una Argonauta procariota. Una proteína Argonauta puede unirse a ARN o ADN, o tanto a ARN como a ADN. Una proteína Argonauta puede escindir ARN o ADN, o tanto ARN como ADN. En algunos casos, una proteína Argonauta se une a un ADN y lo escinde. En algunos casos, la proteína Argonauta se une a un ADN de cadena doble y escinde un ADN de cadena doble. En algunos casos, se pueden unir dos o más dominios de unión a ácidos nucleicos. La unión de una pluralidad de dominios de unión a ácidos nucleicos puede proporcionar una mayor especificidad de direccionamiento de polinucleótidos. Se pueden unir dos o más dominios de unión a ácidos nucleicos a través de uno o más enlazadores. El enlazador puede ser un enlazador flexible. Los enlazadores pueden comprender 1, 2, 3, 4, 5, 6 , 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19, 20, 21, 22, 23, 24 , 25, 30, 35, 40 o más aminoácidos de longitud. El dominio enlazador puede comprender glicina y/o serina, y en algunas realizaciones puede consistir o puede consistir esencialmente en glicina y/o serina. Los enlazadores pueden ser un enlazador de ácido nucleico que puede comprender nucleótidos. Un enlazador de ácido nucleico puede unir dos dominios de unión a ADN. Un enlazador de ácido nucleico puede tener como máximo 5, 10, 15, 20, 25, 30, 35, 40, 45 o 50 o más nucleótidos de longitud. Un enlazador de ácido nucleico puede tener al menos 5, 10, 15, 30, 35, 40, 45 o 50 o más nucleótidos de longitud. Los dominios de unión a ácidos nucleicos pueden unirse a secuencias de ácido nucleico. Los dominios de unión a ácidos nucleicos pueden unirse a ácidos nucleicos mediante hibridación. Los dominios de unión a ácidos nucleicos pueden modificarse (por ejemplo, modificarse para hibridar con una secuencia en un genoma). Un dominio de unión a ácido nucleico puede modificarse mediante técnicas de clonación molecular (p. ej., evolución dirigida, mutación específica del sitio y mutagénesis racional).

En ciertas realizaciones de la presente divulgación, la SSN de acuerdo con la presente divulgación será una nucleasa de CRISPR, que incluye Cas o Cpf1, o una nucleasa Argonauta, o una variante o un fragmento catalíticamente activo de la misma. Las secuencias de nucleasa de CRISPR adecuadas se seleccionan del grupo que consta de las SEQ ID NOs: 19 a 29, o 35 a 41 o una secuencia que tenga al menos 66 %, 67 %, 68 %, 69 %, 70 %, 71 %, 72 %, 73 %, 74 %, 75 %, 76 %, 77 %, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98% o 99% de homología de secuencia con las mismas. Otros efectores Cas o Cpf1 adecuados pueden derivarse de un organismo de un género que comprende Streptococcus, Campylobacter, Candidatus Micrarchaeum acidiphilum ARMAN-1, Parcubacterias (GenBank: APG80656.1), Sulfolobus spp., incluyendo Sulfolobus islandicus HVE10/4 (GenBank: ADX81770.1) o REY15A (GenBank: ADX84852.1), Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Camobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacillus, Methylobacterium o Acidaminococcus, por ejemplo, de S. mutans, S. agalactiae, S. equisimilis, S. sanguinis, S. pneumoniae; C. jejuni, C. coli; N. salsuginis, N. tergarcus; S. auricularis, S. carnosus; N. meningitides, N. gonorrhoeae; L. monocytogenes, L. ivanovii; C. botulinum, C. difficile, C. tetani, C. sordellii.

En una realización de la presente divulgación, al menos una nucleasa específica del sitio o el fragmento catalíticamente activo de la misma como parte del complejo molecular artificial de la presente divulgación, o la secuencia que codifica la misma, se selecciona independientemente del grupo que consiste en un polipéptido cas de Streptococcus spp., incluido Streptococcus pyogenes, Streptococcus thermophilus, Staphylococcus aureus, o Neisseria spp., incluido Neisseria meningitides, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Roseburia, Parvibaculum, Nitratifractor, Mycoplasma y Campylobacter, Candidatus Micrarchaeum acidiphilum ARMAN-1, Parcubacterias (GenBank: APG80656.1), Sulfolobus spp., incluyendo Sulfolobus islandicus HVE10/4 (GenBank: ADX81770.1) o REY15A (GenBank: ADX84852.1), un polipéptido Cpf1 de una arquea o una bacteria, incluido un polipéptido Cpf1 de Acidaminococcus spp., incluido Acidaminococcus sp. BV3L6, Lachnospiraceae spp., incluido bacteria Lachnospiraceae ND2006, bacteria Lachnospiraceae MC2017, bacteria Lachnospiraceae MA2020, Butyrivibrio proteoclasticus, Candidatus spp., Methanoplasma termitum, Leptospira inadai, Moraxella bovoculi 237, Bacteria Peregrinibacteria GW2011_Gw A2_33_10, Bacteria Parcubacteria GW2011_GWC2_44_17, Smithella sp. SCADC, Smithella sp. SC_K08D17, Francisella spp., incluida Francisella novicida U112, Eubacterium eligens, Prevotella spp., o Porphyromonas spp., o una nucleasa Argonauta de Natronobacterium gregoryi (GenBank: AFZ73749.1), Microcistis aeruginosa (secuencia de referencia del NCBI: WP_012265209.1 o secuencia de referencia del NCBI: W p_002747795.1 o secuencia de referencia del NCBI: WP_012265209.1), Halogeometricum pallidum (GenBank: ELZ29017.1), Natrialaba asiática (secuencia de referencia del NCBI: WP_006111085.1), Natronorubrum tibetense (secuencia de referencia del NCBI: WP_006090832.1), Natrinema pellirubrum (secuencia de referencia del NCBI: WP_006183335.1), o Synechococcus spp. (secuencia de referencia del NCBI: WP_011378069.1) o variantes y/o fragmentos funcionales y/o combinaciones de los mismos, incluidas nickasas o nucleasas que carecen de actividad endonucleolítica.

En realizaciones adicionales de la invención que usan al menos un efector Cpf1 como SSN, un motivo adyacente al protoespaciador (PAM) o un motivo similar a PAM dirige la unión del complejo de proteína efectora al locus objetivo de interés. En una realización que usa al menos un efector Cpf1 como SSN, el PAM es 5' TTN, donde N es A/C/G o T En otra realización preferida de la invención, el PAM es 5' TTTv , donde V es A/C o G. En ciertas realizaciones, el PAM es 5' TTN, donde N es A/C/G o T y el PAM está ubicado secuencia arriba del extremo 5' del protoespaciador. En ciertas realizaciones de la invención, el PAM es 5' CTA, y el PAM está ubicado secuencia arriba del extremo 5' del protoespaciador o el locus objetivo. En ciertas realizaciones, se proporciona un intervalo específico ampliado para las nucleasas de edición del genoma guiadas por ARN donde los PAM ricos en T de la familia Cpfl permiten el direccionamiento y edición de genomas ricos en AT

En ciertas realizaciones, la enzima de CRISPR está modificada y puede comprender una o más mutaciones que reducen o eliminan la actividad de una nucleasa. Asimismo, la presente invención contempla métodos de uso de dos o más nickasas, en particular un enfoque de nickasa dual o doble para generar una rotura de cadena doble de ADN específica.

En realizaciones que usan complejos de proteína efectora Cpf1 dentro del complejo molecular artificial de acuerdo con la presente divulgación, se puede usar un efector Cpf1 que tiene uno o más componentes de ácido nucleico no naturales o diseñados o modificados u optimizados, o la proteína codificada. En una realización preferida, el componente de ácido nucleico del complejo puede comprender una secuencia guía unida a una secuencia de repetición directa, en donde la secuencia de repetición directa comprende uno o más bucles de tallo o estructuras secundarias optimizadas. En una realización preferida, la repetición directa tiene una longitud mínima de 16 nucleótidos y un bucle de tallo único. En realizaciones adicionales, la repetición directa tiene una longitud superior a 16 nucleótidos, preferiblemente más de 17 nucleótidos, y tiene más de un bucle de tallo o estructuras secundarias optimizadas. En una realización preferida, la repetición directa puede modificarse para comprender uno o más aptámeros de ARN de unión a proteínas. En una realización preferida, se pueden incluir uno o más aptámeros como parte de una estructura secundaria optimizada. Dichos aptámeros pueden ser capaces de unirse a una proteína de cubierta de bacteriófago. La proteína de la cubierta del bacteriófago se puede seleccionar del grupo que comprende QP, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, Fl, ID2, NL95 , TW19, Ap205, (pCb5, (pCb8r, $Cb12r, $Cb23r, 7s y PRR1. En una realización preferida, la proteína de la cubierta del bacteriófago es MS2.

En ciertas realizaciones, la divulgación también proporciona que una o más mutaciones o las dos o más mutaciones estén en un fragmento catalíticamente activo de al menos una proteína efectora SSN que comprende un dominio RuvC. En algunas realizaciones de la presente divulgación, el dominio RuvC puede comprender un dominio RuvCl, RuvCll o RuvCIII, o un dominio catalíticamente activo que es homólogo a un dominio RuvCl, RuvCll o RuvClll, etc., o a cualquier dominio relevante como se describe en cualquiera de los métodos descritos en el presente documento. La proteína efectora SSN puede comprender uno o más dominios funcionales heterólogos. El uno o más dominios funcionales heterólogos del complejo molecular artificial pueden comprender uno o más dominios de señal de localización nuclear (NLS). El uno o más dominios funcionales heterólogos pueden comprender al menos dos o más dominios NLS. El uno o más dominios NLS se pueden colocar en o cerca o en la proximidad de un extremo de la proteína efectora (p. ej., Cpf1) y si hay dos o más NLS, cada uno de los dos se puede colocar cerca o en la proximidad. a un extremo de la proteína efectora (por ejemplo, Cpf1). El uno o más dominios funcionales heterólogos pueden comprender uno o más dominios de activación transcripcional. En una realización de la presente divulgación, el dominio de activación transcripcional puede comprender VP64. El uno o más dominios funcionales heterólogos pueden comprender uno o más dominios de represión transcripcional. En una realización de la presente divulgación, el dominio de represión transcripcional comprende un dominio KRAB o un dominio SID (por ejemplo, SID4X). El uno o más dominios funcionales heterólogos pueden comprender uno o más dominios de nucleasa como SSN. En una realización, la SSN puede comprender Fok1 o un fragmento catalíticamente activo o una variante del mismo.

En una realización preferida de la presente invención, al menos una nucleasa específica del sitio o la variante o fragmento catalíticamente activo de la misma del complejo molecular artificial de acuerdo con la presente divulgación, o la secuencia que codifica la misma, se selecciona de una nucleasa de CRISPR, preferiblemente de una nucleasa Cas o Cpf1, o una nucleasa Fokl, o un fragmento catalítico de la misma, y al menos un dominio de interacción, o la secuencia que codifica el mismo, se selecciona de un fragmento variable de cadena sencilla o una estreptavidina monomérica.

En una realización, el complejo molecular artificial de acuerdo con la presente divulgación comprende al menos una SSN derivada de CRISPR o Argonauta, o una variante o un fragmento catalíticamente activo del mismo, y al menos una secuencia de ácido nucleico guía que representa al menos un dominio de acoplamiento de la plantilla de reparación, en donde cada una de las al menos una secuencia de ácido nucleico guía comprende (i) una primera parte de la secuencia que es complementaria a una secuencia objetivo de ADN de reconocimiento, y (ii) una segunda parte de la secuencia, en donde la segunda parte de la secuencia está configurada para interactuar con al menos una nucleasa específica del sitio, y (iii) en donde al menos una secuencia de ácido nucleico guía está asociada físicamente con al menos una secuencia de ácido nucleico de la plantilla de reparación y, por lo tanto, forma una secuencia de ácido nucleico híbrida que comprende o consiste en al menos un ARN o a Dn y al menos una secuencia de ácido nucleico de ADN adicional, y (iv) opcionalmente que comprende una región enlazadora entre al menos una secuencia de ácido nucleico guía y al menos una secuencia de ácido nucleico de la plantilla de reparación, por ejemplo en donde la secuencia de ácido nucleico de la plantilla de reparación está asociada con la secuencia de ácido nucleico guía en el extremo 3' de la secuencia de ácido nucleico guía, y/o donde la secuencia de ácido nucleico de la plantilla de reparación está asociada con el extremo 5' de la secuencia de ácido nucleico guía, y/o donde la secuencia de ácido nucleico de la plantilla de reparación está ubicada dentro de la secuencia de ácido nucleico guía.

La al menos una secuencia de ácido nucleico de la plantilla de reparación y/o al menos una secuencia de ácido nucleico guía de acuerdo con los diversos aspectos y realizaciones de la presente invención comprende una secuencia de nucleótidos seleccionada de una secuencia de nucleótidos natural o no natural, que incluye una secuencia sintética de nucleótidos, que comprende opcionalmente modificaciones de la cadena principal y/o de la base, en donde la secuencia de ácido nucleico guía comprende una secuencia de nucleótidos de a Dn o ARN de cadena sencilla o parcialmente de cadena sencilla, y en donde al menos una secuencia de ácido nucleico de la plantilla de reparación comprende una secuencia de nucleótidos de ADN de cadena sencilla o de cadena doble.

En determinadas realizaciones, al menos una secuencia de ácido nucleico de la plantilla de reparación (RT) del complejo molecular artificial de acuerdo con la presente divulgación comprende al menos una parte terminal, preferiblemente el extremo 3', en donde esta parte final no interactúa con ninguna otro componente del complejo molecular artificial y, por lo tanto, está configurado para hibridarse con al menos una secuencia de complementariedad genómica para mediar en la reparación de la secuencia objetivo de ADN, y/o en donde al menos una secuencia de ácido nucleico de la plantilla de reparación se proporciona como plásmido. Para poder acceder a al menos una secuencia de complementariedad genómica, la RT debe proporcionarse así en una configuración que permita un emparejamiento de bases óptimo con al menos una secuencia de complementariedad genómica. Esta configuración variará en función de la naturaleza de la RT y en función de la forma de proporcionar la RT En ciertas realizaciones, se usa al menos una RT que puede estar unida de forma covalente o no covalente a un RTDD, por ejemplo, un ARNg o un ADNg.

En ciertas realizaciones de la presente divulgación usando una molécula que comprende al menos un tramo de ARN como RTDD, o usando ARN que codifica una proteína de interés, el ARN puede presentarse junto con una molécula o cadena de protección o protectora, cuya molécula protectora se hibridará al menos parcialmente con el ARN que representa la molécula efectora real del complejo molecular artificial para proteger la molécula efectora del ARN de la degradación dentro de la célula.

Las configuraciones adecuadas para un complejo molecular artificial de acuerdo con la presente divulgación se muestran en las Figuras 1 a 4. Los complejos moleculares artificiales que usan una "secuencia de ácido nucleico híbrida" como RTDD y RT de acuerdo con la presente divulgación se muestran en la Fig. 1 A a D y en la Fig. 2 A a C. Dependiendo de la SSN, la plantilla de reparación (RT) puede estar en forma de ADNcs o ADNcd y, en caso de que se use una proteína CRISPR o Argonauta como SSN, puede unirse al menos a un ácido nucleico guía (ARNgu o ARNg o ADNg ) en el extremo 3', el extremo 5' de forma covalente o no covalente o puede estar dentro del ARNg, por ejemplo, formando una estructura secundaria en horquilla de un tamaño y forma definidos. Este diseño permite que tanto el ARNg como la parte de RT puedan cumplir sus funciones sin perturbar la interacción de al menos un ARNg de interés con una nucleasa de CRISPR o Argonauta de interés y, al mismo tiempo, posicionar la RT muy cerca del sitio de una ruptura de ADN inducida por al menos un par CRISPR/ARNg, Argonauta/ADNg.

En ciertas realizaciones que usan nucleasas de CRISPR, el complejo molecular artificial comprenderá una secuencia de ácido nucleico híbrida que comprende o consiste en al menos una secuencia de ácido nucleico de ARN y al menos una de ADN o simplemente una secuencia de ácido nucleico de ARN/ADN híbrida de acuerdo con la presente divulgación, por lo tanto representa una molécula quimérica que comprende ARN y ADN, que comprende dos funcionalidades. En primer lugar, comprende una fracción de ácido nucleico guía (ARNg), que comprende un ácido ribonucleico. Este ARNg comprende dos porciones de secuencias de nucleótidos, siendo necesaria una secuencia de nucleótidos para la interacción con un polipéptido de CRISPR de interés, así como otra secuencia de nucleótidos que comprende un dominio de direccionamiento, en donde el dominio de direccionamiento puede hibridarse mediante emparejamiento de bases con una secuencia objetivo de ADN complementaria de interés adyacente a una secuencia de PAM en la cadena opuesta, representando esta secuencia objetivo de ADN complementaria la primera secuencia objetivo de ADN de acuerdo con la presente divulgación. En segundo lugar, la secuencia de ácido nucleico de ARN/ADN híbrido comprende una fracción de secuencia de ácido nucleico de la plantilla de reparación que puede comprender una edición deseada para introducirla en una secuencia objetivo de ADN de interés. Además, la secuencia de ácido nucleico de la plantilla de reparación puede comprender una secuencia homóloga adicional inmediatamente secuencia arriba y secuencia abajo de la secuencia objetivo de ADN, es decir, los brazos de homología izquierdo y derecho. La longitud y la posición de unión de cada brazo de homología dependen del tamaño del cambio que se introduzca y se pueden ajustar para una eficiencia óptima. Por ejemplo, es probable que una plantilla de reparación con complementariedad específica para la cadena de ADN escindida liberada primero por Cas9 (como se describe en Richardson et al., Nature Biotechnology 2016, doi:10.1038/nbt.3481) puede producir la reparación más eficiente. La plantilla de reparación puede ser una secuencia de nucleótidos de ADN de cadena sencilla o de cadena doble dependiendo de la aplicación específica.

La plantilla de reparación puede contener polimorfismos relativos al ADN genómico para interrumpir la unión de la nucleasa; de lo contrario, la plantilla de reparación se convierte en un objetivo adecuado para la escisión del polipéptido de CRISPR. Por ejemplo, el PAM podría estar mutado de tal manera que ya no esté presente, pero la región codificante del gen no se ve afectada, lo que corresponde a una mutación silenciosa que no cambia la secuencia de aminoácidos codificada. En otra realización, cuando se usa un polipéptido de CRISPR deficiente en nucleasa dentro del complejo molecular artificial como SSN, es posible la presencia de una secuencia de PAM dentro de la secuencia de la plantilla de reparación. En una realización, la secuencia de RTDD/RT comprende al menos una secuencia de ácido nucleico guía y al menos una secuencia de ácido nucleico de la plantilla de reparación, pero el híbrido RTDD/RT también puede comprender otras fracciones unidas a él adecuadas para la edición del genoma como se detalla más adelante. En otra realización, la secuencia híbrida de RTDD/RT consta de al menos una secuencia de ácido nucleico guía y al menos una secuencia de ácido nucleico de la plantilla de reparación.

Se encontró que puede existir un tamaño de RT óptimo dependiendo de la SSN utilizada que proporcione un equilibrio de la eficiencia de la nucleasa con el tamaño del brazo de homología para la eficiencia de la reparación de DSB mediada por HR.

En una realización de la presente divulgación, la secuencia de ácido nucleico guía o ARNg se proporciona como una secuencia de ácido nucleico de ARN que unifica un elemento de ARNtracry ARNcr. En otra realización, por ejemplo, cuando se trabaja con un sistema de CRISPR Tipo V que usa un polipéptido Cpf1 o una variante o un fragmento catalíticamente activo del mismo, el ARNg comprende un elemento de ARNcr. En otra realización más, el ARNg puede proporcionarse como más de una secuencia de ácido nucleico de ARN que imita la situación natural en muchos sistemas de CRISPR en los que el ARNcr y el ARNtracr, si ambos son necesarios, se proporcionan en dos moléculas de ARN separadas. En ciertas realizaciones, esta disposición permite así la posibilidad de tener los dos elementos (ARNtracr y ARNcr) en cadenas de ARN separadas como en la naturaleza. En una realización, se proporciona una molécula de ácido nucleico de ARN separada que proporciona un ARNcr y se proporciona una molécula de ácido nucleico de ARN separada, es decir, se presenta más de un RTDD. O la fracción de ARNcr o la fracción de ARNtracr se pueden asociar con una secuencia de ácido nucleico de la plantilla de reparación (RT). Por ejemplo, se puede preferir proporcionar un híbrido ARNtracr:RT o un ARNcr:RT cuando se escoge la síntesis química ex vivo del ARNtracr:RT o ARNcr:RT debido a la longitud más corta de la molécula respectiva en comparación con un ARNg:RT híbrido, en donde el ARNg consta de una sola molécula de ARN que unifica la función de ARNcr y ARNtracr.

La secuencia de RTDD/RT de acuerdo con la presente divulgación es adecuada para la edición precisa del genoma en cualquier tipo de célula de interés, incluidas las células procariotas y las células eucariotas, incluidas las células fúngicas, animales y vegetales, y para cualquier genoma de interés en una configuración in vitro y representa una herramienta conectada físicamente adecuada para permitir la disponibilidad espaciotemporal simultánea de una plantilla de reparación y SSN durante la edición del genoma.

De acuerdo con todos los aspectos y realizaciones de la presente divulgación, al menos un RTDD y al menos una secuencia de ácido nucleico de la plantilla de reparación están asociados entre sí. El término "asociado con" o "en asociación" de acuerdo con la presente divulgación debe interpretarse en sentido amplio y, por lo tanto, de acuerdo con la presente divulgación implica que un RTDD, por ejemplo, un ARNg o una molécula de biotina, FAM o una digoxigenina, se proporciona en asociación física con una plantilla de reparación de ADN, siendo la asociación de naturaleza covalente o no covalente, aumentando inherentemente la disponibilidad de la plantilla de reparación para la recombinación homóloga. En lugar de la amplificación indiscriminada de la plantilla de reparación, o la provisión de la plantilla de reparación en exceso, pero físicamente desvinculada del RTDD, la secuencia de nucleótidos de la plantilla de reparación se presenta en la DSB junto con la SSN del complejo molecular artificial a una secuencia objetivo de ADN de interés, que a su vez mejora significativamente la previsibilidad y la especificidad de un enfoque de edición del genoma.

En otra realización de acuerdo con la presente divulgación, al menos una secuencia de ácido nucleico de la plantilla de reparación se une a al menos una secuencia de RTDD mediante enlaces o uniones tanto covalentes como no covalentes. De acuerdo con esta realización, el complejo híbrido RTDD y RT se puede proporcionar como una molécula sintetizada in vitro que luego se puede asociar con al menos una SSN de interés, ya sea in vitro, o in vivo en la célula objetivo de interés, o dentro de un ensayo in vitro de interés. La célula puede ser una célula eucariota, incluyendo una célula fúngica, animal o vegetal. La célula también puede ser una célula procariota. Además, la célula puede ser una célula huésped procariota o eucariota que porta, ya sea en un plásmido o integrada en el genoma, una secuencia objetivo heteróloga de otro organismo o virus. En esta realización, la célula funciona como huésped para realizar la modificación del genoma en una secuencia heteróloga proporcionada dentro de dicha célula huésped.

En una realización de acuerdo con los diversos aspectos de la presente divulgación, al menos una secuencia de ácido nucleico de la plantilla de reparación (RT) está unida covalentemente a al menos un RTDD. Una unión covalente o enlace covalente es un enlace químico que implica compartir pares de electrones entre átomos de moléculas o secuencias unidas covalentemente entre sí.

En otra realización de acuerdo con los diversos aspectos de la presente divulgación, al menos una secuencia de ácido nucleico de la plantilla de reparación está unida de forma no covalente a al menos una secuencia de RTDD. Una interacción no covalente se diferencia de un enlace covalente en que no implica compartir electrones, sino que implica variaciones más dispersas de interacciones electromagnéticas entre moléculas/secuencias o dentro de una molécula/secuencia. Las interacciones o uniones no covalentes comprenden interacciones electrostáticas, fuerzas de van der Waals, efectos TT y efectos hidrófobos. De especial importancia en el contexto de las moléculas de ácido nucleico son los enlaces de hidrógeno como interacción electrostática. Un enlace de hidrógeno (enlace H) es un tipo específico de interacción dipolo-dipolo que implica la interacción entre un átomo de hidrógeno parcialmente positivo y un átomo de oxígeno, nitrógeno, azufre o flúor altamente electronegativo, parcialmente negativo, no unido covalentemente a dicho átomo de hidrógeno.

El término "hibridación" como se usa en el presente documento se refiere al emparejamiento de ácidos nucleicos complementarios, es decir, ADN y/o ARN, usando cualquier proceso por el cual una cadena de ácido nucleico se une a una cadena complementaria a través del emparejamiento de bases para formar un complejo hibridado. La hibridación y la fuerza de la hibridación (es decir, la fuerza de la asociación entre los ácidos nucleicos) se ve afectada por factores tales como el grado y la duración de la complementariedad entre los ácidos nucleicos, la rigurosidad de las condiciones involucradas, la Tm del híbrido formado y la relación G:C dentro de los ácidos nucleicos. El término complejo hibridado se refiere a un complejo formado entre dos secuencias de ácido nucleico en virtud de la formación de enlaces de hidrógeno entre bases G y C complementarias y entre bases A y T/U complementarias. Se puede formar un complejo hibridado o una construcción híbrida correspondiente entre dos moléculas de ácido nucleico de ADN, entre dos moléculas de ácido nucleico de ARN o entre una molécula de ácido nucleico de ADN y una de ARN. Para todas las constelaciones, las moléculas de ácido nucleico pueden ser moléculas de ácido nucleico naturales generadas in vitro o in vivo y/o moléculas de ácido nucleico artificiales o sintéticas. La hibridación como se detalló anteriormente, por ejemplo, los pares de bases de Watson-Crick, que pueden formarse entre secuencias de ADN, ARN y ADN/ARN, están dictadas por un patrón de enlace de hidrógeno específico, que por lo tanto representa una forma de unión no covalente de acuerdo con la presente divulgación.

Con respecto a las asociaciones no covalentes de acuerdo con la presente divulgación, al menos un RTDD del complejo molecular artificial de la presente divulgación y al menos una secuencia de la plantilla de reparación de la presente divulgación pueden asociarse entre sí mediante emparejamiento de bases de ARN-ADN.

Otra forma de interacción no covalente es la asociación de al menos una secuencia de la plantilla de reparación con al menos un componente, ya sea RTDD o un RTDD comprendido por la SSN, mediante cargas eléctricas.

Con respecto a una asociación o unión covalente, al menos un RTDD y al menos una secuencia de la plantilla de reparación están conectadas como moléculas contiguas, ya sea producidas in vivo o in vitro. La unión covalente y no covalente también se puede combinar, por ejemplo, proporcionando una secuencia de la plantilla de reparación/RTDD unida covalentemente, que puede comprender además una secuencia de ácido nucleico de la plantilla de reparación adicional unida no covalentemente a una secuencia de la plantilla de reparación/RTDD unida covalentemente. Este enfoque es especialmente adecuado, en caso de que la secuencia de la plantilla de reparación/RTDD unida covalentemente se produzca al menos parcialmente in vivo y una plantilla de reparación adicional, ya sea producida in vivo o in vitro, se agregará al complejo de la plantilla de reparación/RTDD preexistente.

Como también es evidente a partir de Nishimasu et al., citado anteriormente, un ARNg está configurado para interactuar con un polipéptido de CRISPR o una variante o un fragmento catalíticamente activo del mismo de acuerdo con la presente divulgación, si el ARNg comprende al menos una parte que generalmente comprende una configuración heterodúplex, que es reconocida por un polipéptido de CRISPR ya sea de forma dependiente de la secuencia, es decir, a través de la interacción con las bases de un ARN, que comprende A, U, G y C, o de manera independiente de la secuencia, es decir, a través de la interacción del fosfato de la cadena principal de una secuencia de nucleótidos de ARNg con un polipéptido de CRISPR.

De acuerdo con ciertas realizaciones de la presente divulgación, la secuencia objetivo de ADN está ubicada dentro del genoma de una célula, tal como una célula procariota o eucariota, una célula fúngica, animal o vegetal (con realizaciones de la presente invención relacionadas con una célula de la planta), en donde el genoma comprende el genoma nuclear así como otras partes del genoma, incluido el genoma de plástidos.

Una "secuencia objetivo de ADN" define la región genómica, donde se va a realizar una edición dirigida del genoma. Debido al hecho de que el RTDD y la secuencia de ácido nucleico de la plantilla de reparación tienen intrínsecamente diferentes funcionalidades, puede haber más de una región objetivo de ADN, que puede ser diferente para los diferentes componentes del complejo molecular artificial de la presente divulgación. Por lo tanto, una secuencia objetivo de ADN puede definir la región de una región objetivo de ADN de interés, una parte de la secuencia del RTDD, siendo el RTDD un ARNg, es complementaria a, mientras que otra secuencia objetivo de ADN define la región de una región objetivo de ADN de interés, una SSN y/o un dominio de interacción al cual se unirá un dominio. Al menos una parte de la secuencia de ácido nucleico de la plantilla de reparación es complementaria a la que se define como secuencia de complementariedad genómica, representando también dicha secuencia otra secuencia objetivo de ADN. Las regiones objetivo de ADN pueden ser las mismas, o preferiblemente diferentes, pero posiblemente regiones superpuestas, dentro de la secuencia objetivo de ADN de interés.

La relación espacial entre el sitio objetivo de un RTDD y/o SSN y/o un dominio de interacción y el sitio de homología para la secuencia de ácido nucleico de la plantilla de reparación (RT) puede ser variable. Los dos sitios pueden ser idénticos, pueden superponerse total o parcialmente o pueden estar separados por cualquier número de nucleótidos dentro del genoma de interés. La RT puede tener homología con ambas cadenas de ADN genómico, presentado opcionalmente como una construcción de cadena doble, por ejemplo, un plásmido, o cualquier cadena individualmente, independientemente de la cadena a la que se dirige. Se puede configurar una plantilla de reparación eficiente para que tenga una complementariedad específica con la cadena de ADN escindida liberada primero por una SSN, por ejemplo, una Cas9 (como se describe en Richardson et al., Nature Biotechnology. 2016, doi:10.1038/nbt.3481).

Se predice que la interacción entre el RTDD y la RT y, por lo tanto, la estrecha proximidad de la SSN y la RT de acuerdo con el complejo molecular artificial de la presente divulgación superará la eficiencia generalmente baja de la reparación dirigida por homología (HDR)/recombinación homóloga (HR) ya que garantiza la disponibilidad física de la secuencia de nucleótidos de la plantilla de reparación presente de forma estequiométrica en relación con la al menos una SSN in situ en el lugar en donde al menos un polipéptido de SSN introduce una ruptura de cadena genómica dirigida en una secuencia objetivo de ADN.

El término secuencia de ácido nucleico de la plantilla de reparación (RT) como parte del complejo molecular artificial de acuerdo con la presente divulgación implica por lo tanto una secuencia de nucleótidos, que puede ser una secuencia de ADN de cadena sencilla o de cadena doble, que es capaz de proporcionar una plantilla para modificación y/o reparación de una rotura de ADN.

En una realización de acuerdo con la presente divulgación, el complejo molecular artificial es un complejo in vitro ensamblado previamente, en donde la SSN, el RTDD y la RT y, opcionalmente, el componente o parte del dominio de interacción se proporcionan unidos covalentemente entre sí o asociados no covalentemente. En una realización, la secuencia de RTDD/RT se ensambla previamente y la SSN y, opcionalmente, el dominio de interacción se suministra por separado en una célula objetivo, ya sea como ADN transcribible o construcción de ARN traducible o directamente como secuencia de aminoácidos y la secuencia de RTDD/RT y la SSN y, opcionalmente, el dominio de interacción forma un complejo dentro de la célula objetivo. En otra realización, la secuencia de RTDD/RT, así como la SSN y, opcionalmente, el dominio de interacción se ensambla in vitro y el complejo de nucleoproteína que comprende opcionalmente moléculas adicionales, por ejemplo, biotina o FAM, o digoxigenina, se introduce luego en una célula objetivo de interés o en un sistema in vitro que comprende al menos una secuencia de nucleótidos objetivo de ADN de interés que se va a modificar.

La introducción de un complejo molecular artificial funcional ensamblado previamente en una célula objetivo da como resultado una ruptura de cadena doble dirigida y reparación simultánea y modificación específica del sitio debido al hecho de que la actividad de al menos una nucleasa específica del sitio (SSN) es inmediatamente acompañada por la posterior recombinación homóloga en el sitio de la secuencia objetivo de ADN de acuerdo con la presente divulgación con la secuencia de ácido nucleico de la plantilla de reparación de ADN unida al RTDD, interactuando también directamente el RTDD con una SSN. Por lo tanto, los inconvenientes de la escasa disponibilidad de una RT o de eventos de NHEJ inespecíficos (véanse los antecedentes de la invención más arriba) que obstaculizan un evento de edición del genoma altamente específico y controlable pueden reducirse simultáneamente, ya que el complejo molecular artificial puede alcanzar un sitio objetivo en una forma coordinada en una adecuada composición estequiométrica de la plantilla de reparación y nucleasa.

Un beneficio adicional es que el potencial de integración fuera del objetivo de la plantilla de reparación se reduce debido a su asociación física con la proteína, así como al RTDD del complejo, en donde SSN y/o RTDD no pueden integrarse en el genoma por sí mismo.

El término "reparación direccionada dirigida por homología" de acuerdo con la presente divulgación comprende cualquier tipo de alteraciones que puedan introducirse por la secuencia de la plantilla de reparación de acuerdo con la presente solicitud, que puede comprender independientemente inserciones de secuencia, ediciones de al menos una posición de secuencia, eliminaciones o reordenamientos, siendo actualmente las inserciones, eliminaciones o ediciones como estas estrategias permiten la inserción o eliminación dirigida de una secuencia de interés dentro de una secuencia objetivo de ADN, o una modificación específica del sitio de al menos una secuencia.

Un ejemplo de reparación dirigida por homología direccionada como la mediada por un complejo molecular artificial que utiliza una nucleasa de CRISPR como SSN formada ex vivo o in vivo en cooperación con la secuencia de ácido nucleico híbrido de acuerdo con la presente divulgación se puede encontrar en la Fig. 3A a E que ilustra la secuencia cronológica del reconocimiento, la unión, la escisión y la subsiguiente reparación del ADN para un ejemplo de complejo de SSN/ácido nucleico guía (RTDD)/plantilla de reparación (RT) y para una secuencia objetivo de ADN endógeno dada.

En una realización de acuerdo con los diversos aspectos de la presente divulgación, la secuencia de ácido nucleico de la plantilla de reparación y/o al menos una secuencia de RTDD comprenden una secuencia de nucleótidos seleccionada de una secuencia de nucleótidos natural o no natural, que incluye una secuencia de nucleótidos sintética, que comprende opcionalmente modificaciones de la cadena principal y/o de la base, donde la secuencia de ácido nucleico guía comprende una secuencia de nucleótidos de ARN de cadena sencilla o parcialmente de cadena sencilla, y donde la secuencia de ácido nucleico de la plantilla de reparación comprende una secuencia de nucleótidos de ADN de cadena sencilla o de cadena doble.

Un desafío para cualquier enfoque de edición del genoma de CRISPR es el hecho de que el ARNg y el polipéptido de CRISPR funcional como SSN deben transportarse al núcleo o a cualquier otro compartimento que comprenda el ADN genómico, es decir, la secuencia objetivo del ADN, en una forma funcional (no degradada). Dado que el ARN es menos estable que un polipéptido o un ADN de cadena doble y tiene una mayor rotación, especialmente porque las nucleasas pueden degradarlo fácilmente, en algunas realizaciones de acuerdo con el primer aspecto de la presente divulgación, el ARNg como RTDD y/o la secuencia de ácido nucleico de la plantilla de reparación de ADN comprende al menos un nucleótido de origen no natural. Las modificaciones de la cadena principal de acuerdo con la presente divulgación que aumentan la estabilidad del ARNg y/o la secuencia de ácido nucleico de la plantilla de reparación del ADN se seleccionan del grupo que consiste en una modificación de fosforotioato, una modificación de metil fosfonato, una modificación de ácido nucleico bloqueado, una modificación de 2'O-(2-metoxietilo), una modificación de di-fosforotioato y una modificación de ácido nucleico peptídico. En particular, todas dichas modificaciones de la cadena principal todavía permiten la formación de pares de bases complementarias entre dos cadenas de ácido nucleico, pero son más resistentes a la escisión por nucleasas endógenas. Dependiendo de la nucleasa utilizada de acuerdo con la presente invención, podría ser necesario no modificar aquellas posiciones de nucleótidos de un ARNg, que están involucradas en la interacción independiente de la secuencia con el polipéptido de CRISPR. Dicha información se puede derivar de la información estructural disponible para los complejos de nucleasa de CRISPR/ARNg.

En ciertas realizaciones de acuerdo con el primer aspecto de la presente divulgación, se prevé que el RTDD y/o la secuencia de ácido nucleico de la plantilla de reparación RT del ADN y/o el dominio de interacción comprende una modificación de nucleótido y/o de la base, por ejemplo en posiciones seleccionadas, no todas, de la secuencia de nucleótidos. Estas modificaciones se seleccionan del grupo que consiste en la adición de acridina, amina, biotina, azul cascada, colesterol, Cy3, Cy5, Cy5.5, Daboyl, digoxigenina, dinitrofenilo, Edans, 6-FAM, fluoresceína, 3'-glicerilo, HEX, IRD-700, IRD-800, JOE, fosfato de psoraleno, rodamina, ROX, tiol (SH), espaciadores, TAMRA, TET, AMCA-S", SE, BODIPY®, Marina Blue®, Pacific Blue®, Oregon Green®, Rhodamine Green®, Rhodamine Red®, Rhodol Green®y Texas Red®. Por ejemplo, dichas adiciones se incorporan en el extremo 3' o 5' de una secuencia de ácido nucleico utilizada como RT y/o RTDD y/o dominio de interacción como parte del complejo molecular artificial de la presente divulgación. Esta modificación tiene los efectos ventajosos de que la localización celular del RTDD y/o el dominio de interacción y/o la secuencia de ácido nucleico de la plantilla de reparación de ADN dentro de una célula puede visualizarse para estudiar la distribución, concentración y/o disponibilidad de la secuencia respectiva. Además, se puede estudiar la interacción del complejo molecular artificial de la presente divulgación con moléculas endógenas. Los métodos para estudiar dichas interacciones o para la visualización de una secuencia de nucleótidos modificada o etiquetada como se detalló anteriormente están disponibles para los expertos en el campo respectivo.

Para cualquier realización de acuerdo con los diversos aspectos de la presente invención, al menos una nucleasa específica del sitio y/o al menos una secuencia de ácido nucleico de la plantilla de reparación y/o al menos un dominio de interacción y/o al menos un RTDD comprende al menos una secuencia de localización nuclear (NLS), una secuencia de localización de plástidos (PLS), preferiblemente una secuencia de localización de mitocondrias o una secuencia de localización de cloroplastos. Por lo tanto, al menos uno de los componentes del complejo molecular artificial comprende una secuencia para dirigir el complejo al genoma nuclear. En ciertas realizaciones, también el RTDD puede portar al menos una secuencia de localización. Preferiblemente, la SSN y/o el dominio de interacción del complejo molecular artificial comprenderá al menos una secuencia NLS o al menos una PLS, o comprenderá al menos una NLS y al menos una PLS. Al menos una secuencia NLS o PLS transportará todo el complejo molecular artificial al núcleo. Las proteínas etiquetadas con NLS o PLS se pueden generar como moléculas de fusión etiquetadas con NLS o PLS.

Para realizaciones, donde el complejo molecular artificial de acuerdo con la presente divulgación se usa para propósitos in vitro, por ejemplo, para modificar un genoma o parte de un genoma, en un plásmido o cualquier otro vector in vitro, puede que no sea necesaria una secuencia de localización. Las secuencias de localización ayudan a dirigir el complejo molecular artificial a al menos una secuencia objetivo de ADN de interés en el compartimento relevante dentro de una célula objetivo de interés. De acuerdo con ciertas realizaciones de la presente invención, la secuencia de localización puede comprender una secuencia de localización nuclear, una secuencia de localización de plástidos, preferiblemente una secuencia de localización de mitocondrias o una secuencia de localización de cloroplastos. Por lo tanto, al menos una SSN y/o al menos un RTDD y/o al menos un dominio de interacción comprenderán al menos una secuencia de localización correspondiente, preferiblemente una secuencia de localización nuclear (NLS) para dirigir el complejo al genoma nuclear de la célula. En algunas realizaciones, la SSN y/o RT y/o al menos un dominio de interacción y/o el RTDD pueden comprender aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 , o más NLS en o cerca del extremo terminal amino (para péptidos y proteínas), aproximadamente o más de aproximadamente 1,2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del extremo terminal carboxilo (para péptidos y proteínas), o una combinación de estos (p. ej., uno o más NLS en el extremo terminal amino y uno o más NLS en el extremo terminal carboxilo para péptidos y proteínas). Los componentes no basados en aminoácidos del complejo molecular artificial portarán la secuencia de localización, por ejemplo, en el extremo 5' y/o 3', como es el caso de las secuencias de ácido nucleico. Además, también se puede añadir una secuencia de localización, preferiblemente una secuencia de localización sintética, en cualquier posición dentro de una molécula siempre que no altere las interacciones dentro del complejo molecular y/o la capacidad de unión, escisión y reparación de los complejos moleculares artificiales de la presente divulgación. Cuando está presente más de una NLS, cada una puede seleccionarse independientemente de las demás, de modo que una sola NLS puede estar presente en más de una copia y/o en combinación con una o más NLS presentes en una o más copias.

En una realización de la divulgación, al menos una SSN y/o el dominio de interacción comprenderán una secuencia de localización y pueden comprender como máximo 6 ⁿL^s. En algunas realizaciones, una NLS se considera cerca del extremo terminal N o C de un componente de aminoácido del complejo molecular artificial cuando el aminoácido más cercano de la NLS está dentro de aproximadamente 1, 2, 3, 4, 5, 10, 15,20, 25, 30, 40, 50 o más aminoácidos a lo largo de la cadena polipeptídica desde el extremo terminal N o C. Los ejemplos no limitantes de NLS incluyen una secuencia NLS derivada de: la NLS del antígeno T grande del virus SV40, que tiene la secuencia de aminoácidos PKKKRKV (SEQ ID NO: 1); la NLS de nucleoplasmina (p. ej., la NLS bipartita de nucleoplasmina con la secuencia KRPAATKKAGQAKKKK (SEQ ID NO: 2)); la NLS de c-myc que tiene la secuencia de aminoácidos PAAKRVKLD (SEQ ID NO: 3) o RQRRNELKRSP (SEQ ID NO: 4); la NLS de M9 de hRNPA1 que tiene la secuencia NQSSNFGPMKGGN FGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: 5); la secuencia RMRIZFKNKGKDTAELRRRRVEVSVELRKA KKDEQILKRRNV (SEQ ID NO: 6) del dominio 188 de importina alfa; las secuencias VSRKRPRP (SEQ ID NO: 7) y PPKKARED (SEQ ID NO: 8) de la proteína T del mioma; la secuencia PXPKKKPL (SEQ ID NO: 9) de p53 humana, donde la "L" en la posición 8 de la SEQ ID NO: 9 es opcional; la secuencia SALIKKKKKMAP (Se Q ID NO: 10) c-abl IV de ratón; las secuencias DRLRR (SEQ ID NO: 11) y PKQKKRK (SEQ ID NO: 12) del virus de la influenza NS1; la secuencia RKLKKKIKKL del antígeno delta del virus de la hepatitis (SEQ ID NO: 13); la secuencia REKKKFLKRR (SEQ ID NO: 14) de la proteína Mx1 de ratón; la secuencia KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 15) de la polimerasa poli(ADP-ribosa) humana; y la secuencia RKCLQAGMNLEARKTKK (SEQ ID NO: 16) del glucocorticoide de receptores de hormona esteroidea (humana). En algunas realizaciones, la señal de localización puede ser una señal de localización de plástidos, por ejemplo, una señal de localización de plástidos o mitocondrias. Las señales de localización de plástidos adecuadas se seleccionan del grupo que consiste en péptidos de tránsito de cloroplastos o péptidos de direccionamiento mitocondrial. Además, los péptidos derivados de la proteína Tat del VIH, o las secuencias que los codifican, pueden ser adecuados para dirigir una construcción o molécula de interés a una célula y/o compartimento subcelular de interés. Los péptidos Tat adecuados se derivan de YGRKKRRQRRR (SEQ ID NO: 17) o comprenden el motivo GRKKR (SEQ ID NO: 18). En otro ejemplo de realización, una secuencia derivada de la Cox4p mitocondrial de levadura (SEQ ID NO: 30) o una secuencia derivada de la secuencia guía mitocondrial (MLS) de malato deshidrogenasa humana (SEQ ID NO: 31) o derivado de la ácido lipoico sintasa de Arabidopsis (ID de la Ref. Seq. del NCBI: NP 179682.1 designada en el presente documento como SEQ ID NO: 32) puede usarse para localizar el complejo molecular artificial de acuerdo con la presente divulgación en una matriz mitocondrial para modificar el ADN mitocondrial.

En realizaciones particulares, puede ser de interés dirigir el complejo molecular artificial al cloroplasto. En muchos casos, este direccionamiento puede lograrse mediante la presencia de una extensión del extremo terminal N, denominada péptido de tránsito de cloroplastos (CTP) o péptido de tránsito de plástidos. Los transgenes cromosómicos de fuentes bacterianas deben tener una secuencia que codifica una secuencia de CTP fusionada a una secuencia que codifica un polipéptido expresado si el polipéptido expresado se va a compartimentar en el plástido de la planta (p. ej., cloroplasto). En consecuencia, la localización de un polipéptido exógeno en un cloroplasto a menudo se logra mediante la unión operativa de una secuencia de polinucleótidos que codifica una secuencia de CTP a la región 5' de un polinucleótido que codifica el polipéptido exógeno, es decir, al menos una SSN de acuerdo con la presente divulgación. El CTP se elimina en una etapa de procesamiento durante la translocación en el plástido. Sin embargo, la eficiencia del procesamiento puede verse afectada por la secuencia de aminoácidos del CTP y las secuencias cercanas en el extremo terminal NH₂del péptido. Otras opciones para direccionamiento al cloroplasto que se han descrito son la secuencia de señal cab-m7 de maíz (patente de los Estados Unidos n.° 7,022,896, documento WO 97/41228) una secuencia señal de glutatión reductasa de guisante (documento WO 97/41228) y el CTP descrito en el documento US 2009/029861 A1.

Las diversas secuencias de localización de acuerdo con la presente divulgación pueden codificarse en un plásmido o casete de expresión que codifica al menos una secuencia de localización para enlazar operativamente la secuencia de localización a la molécula respectiva, o las secuencias de localización pueden unirse a una proteína, un ácido nucleico u otra biomolécula que forma los complejos moleculares artificiales de la presente divulgación de forma sintética.

En otra realización adicional, al menos una de las señales de exportación nuclear puede usarse además de o en lugar de al menos una secuencia de localización.

En realizaciones, donde el complejo molecular artificial se administra a una célula con la ayuda de al menos un vector de suministro en forma de una secuencia de ácido nucleico, la señal de localización se puede unir covalentemente a al menos una SSN y/o la secuencia que codifica el dominio de interacción de forma covalente como secuencia de ácido nucleico que codifica una señal de localización.

En una realización, al menos una SSN y/o un dominio de interacción polipeptídico puede estar asociado de forma covalente o no covalente con una proteína o un gen informador fluorescente. Este informador puede suministrarse como ADN, como ARNm, como una proteína independiente o como una proteína de fusión unida a al menos una SSN y/o el polipéptido del dominio de interacción.

La molécula de RTDD/RT de acuerdo con la presente divulgación se puede producir de varias formas. Puede hacerse por síntesis química, añadiendo bases de ARN cuando sea apropiado en el proceso de síntesis y bases de ADN cuando sea apropiado en el proceso de síntesis. Alternativamente, RTDD y/o RT pueden sintetizarse independientemente uno del otro y las moléculas pueden entonces asociarse entre sí como se describió anteriormente. Otra opción es utilizar ARN ligasa T4 u otra enzima capaz de ligar ácidos nucleicos a ARN, tal como ARN de cadena sencilla. En el presente documento, los componentes de ARN y ADN se generan de forma independiente mediante cualquier método, se mezclan, se exponen a la enzima de acuerdo con el protocolo del fabricante y se unirán covalentemente mediante ligación, es decir, para generar una unión covalente. Otras estrategias para la unión covalente de la RTDD a la RT incluyen la unión de cada uno de ellos a otros grupos o complejos químicos de unión, tal como un péptido. Este tipo de enfoque es especialmente adecuado cuando la secuencia híbrida de RTDD/RT tiene que detectarse posteriormente dentro de la célula, o cuando debe atribuirse una función adicional a la secuencia de ácido nucleico híbrida. La modificación química de la secuencia de ácido nucleico de RTDD y/o la RT puede ser de gran importancia para estabilizar la secuencia de RTDD/RT y evitar la degradación por enzimas celulares para lograr una alta disponibilidad simultánea de la secuencia de RTDD/RT y al menos una nucleasa específica del sitio en el sitio objetivo de ADN de interés.

En realizaciones de la presente divulgación, donde el RTDD es un ARNg y la SSN es una nucleasa de CRISPR, tal como una nucleasa Cas o Cpf1, puede estar presente más de un RTDD. Se ha descubierto que el uso simultáneo de múltiples ARNg aumentará la activación o represión de genes basada en CRISPR y puede reducir significativamente la aparición de alelos resistentes a los impulsores genéticos. Por lo tanto, los ARNg como los RTDD se pueden presentar como una sola transcripción sin procesar y los ARNg luego se eliminarán del precursor en el núcleo mediante la transcripción de la ARN polimerasa II, obviando simultáneamente la exportación de ARNg al citoplasma (Port y Bullock, Nat. Methods, 2016, vol. 13, n° 10, 852-854). En esas realizaciones, los ARNg se pueden presentar como plásmidos de ARNt-ARNg para que la maquinaria de procesamiento de ARNt endógeno libere múltiples ARNg funcionales.

De acuerdo con ciertas realizaciones de los diversos aspectos de la presente divulgación/invención, al menos una nucleasa específica del sitio, o la secuencia que codifica la misma, y al menos un dominio de interacción, o la secuencia que codifica la misma, y/o al menos un dominio de acoplamiento de la plantilla de reparación, o la secuencia que codifica el mismo, están conectados por al menos un dominio enlazador. Esta secuencia enlazadora puede servir como espaciador molecular para lograr una geometría óptima de la secuencia de RTDD y la secuencia de ácido nucleico de la plantilla de reparación, así como la SSN y, opcionalmente, el componente del dominio de interacción del complejo molecular artificial para que todos los componentes individuales puedan ejercer plenamente su función. La longitud y la composición de las regiones de unión o atadura pueden ser un aspecto de diseño importante, por ejemplo, para ciertos pares de RTDD y RT En una realización, especialmente el extremo 5' del brazo de homología izquierdo de la RT puede comprender una región enlazadora. La atadura o el enlazador pueden tomar una variedad de formas. Comenzando desde el brazo de homología izquierdo o derecho de la RT, permitiendo que esta parte de la RT actúe como una atadura o enlazador flexible para permitir el movimiento de la ^rT hacia el objetivo cromosómico, y como homología para mediar la reacción de HR puede ser realizada por la persona experta con base en la presente divulgación y que tenga conocimiento de los parámetros de diseño habituales para plantillas de reparación como se usa ampliamente en la actualidad para la edición del genoma.

En realizaciones, donde el complejo molecular artificial comprende al menos una SSN así como al menos un dominio de interacción (IA), la SSN y el IA pueden conectarse mediante un enlazador adecuado.

Los parámetros de diseño a considerar incluyen la geometría de la homología de la plantilla de reparación en relación con el sitio de corte de un polipéptido de CRISPR como SSN, la cadena dentro de un sitio objetivo de ADN de interés para el cual la plantilla de reparación es homóloga, el tamaño de la plantilla de reparación, que puede influir, si se introducirá un enlazador y en qué longitud se introducirá un enlazador. Se puede usar una secuencia enlazadora para asociaciones tanto covalentes como no covalentes del ARNg y la plantilla de reparación. Con base en la presente divulgación y con base en la información provista en Nishimasu (citado anteriormente), Tsai et al., (Nature Biotechnology, 32, 569-576, (2014)), o Shechner et al., (Nature Methods, 12(7), 664-670 (2015), doi:10.1038/nmeth.3433), el experto en la materia puede así definir una región enlazadora adecuada para una secuencia de ácido nucleico híbrido para definir una secuencia específica entre el ARNg como RTDD y la RT o entre diferentes ARNg y/o RT, en caso de que se utilicen varios ácidos nucleicos híbridos de modo que ambos el ARNg y la fracción de RT puedan ejercer completamente su función sin restricciones estéricas. Al menos una región enlazadora puede comprender hasta 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 nucleótidos adicionales para separar adecuadamente al menos un ARNg de la RT, o para optimizar el posicionamiento del ARNg y/o la RT. En ciertas realizaciones, la secuencia enlazadora puede comprender hasta 150, 200, 250, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500 o al menos 4700 o 5000 nucleótidos para lograr un mejor posicionamiento del ARNg y /o la RT

Para la asociación no covalente, de acuerdo con la presente divulgación, de cualquier RTDD que comprenda secuencias de ácido nucleico con la RT, un enfoque es proporcionar secuencias parcialmente complementarias en el RTDD y la RT para que las dos moléculas se asocien de forma natural mediante el emparejamiento de bases de ácido nucleico.

Son concebibles otros métodos de asociación no covalente, como el uso de cargas eléctricas de moléculas para provocar una asociación suficiente de la RT con algún componente del complejo de edición molecular artificial. En otra realización, al menos un componente del complejo molecular artificial puede comprender una etiqueta y el compañero de unión, es decir, el RTDD y la SSN, o el RTDD y el dominio de interacción, y/o la parte de RT del mismo, respectivamente, comprenden el compañero de unión correspondiente de la etiqueta para que se logre una interacción no covalente, opcionalmente además del emparejamiento de bases entre RTDD o el dominio de interacción y RT y la asociación entre RTDD y el polipéptido SSN para aumentar la interacción y, por lo tanto, la estabilidad del complejo molecular artificial.

En células humanas, Cas9 se cargó con un ARNg que poseía 28 pb de secuencia adicional en el extremo 3' más una proteína Csy4 asociada de 187 aminoácidos (21.4 kD) que mantuvo al menos un 90 % de actividad en la inducción de DSB en comparación con los controles estándar de ARNg (Tsai et al., Nature Biotech., 32, 2014). Esto sugiere una tolerancia bastante sustancial por parte de Cas9 como SSN para la carga atada al extremo 3' del ARNgu y del potencial de estructura-función adecuado para la molécula de ARNgu extendida. La tolerancia a Cas9 está habilitada en parte por la flexibilidad del extremo 3' libre de la secuencia de ácido nucleico, que en un ARNg estándar termina en una horquilla que se mantiene fuera de la arquitectura de la proteína Cas9 y en una superficie aproximadamente perpendicular a la superficie que sostiene el sitio activo (Nishimasu et al., 2014; Anders et al., 2014). Además, Shechner et al., ("Multiplexable, locus-specific targeting of long RNAs with CRISPR-Display", Nature Methods, 12(7), 664-670 (2015), doi:10.1038/nmeth.3433) muestran que las moléculas largas de ARNcs no codificantes se pueden unir transcripcionalmente a los extremos 5' o 3' del ARNgu, o en un bucle interno del ARNgu sin pérdida de actividad de direccionamiento específica de la secuencia por una proteína dCas9 en el genoma celular humano. Los ARNcs de hasta 4.8 kb fueron acomodados por el complejo de ribonucleoproteína con el mantenimiento de la actividad de direccionamiento específica de la secuencia.

En una realización de acuerdo con los diversos aspectos de la presente divulgación, la secuencia de ácido nucleico de la plantilla de reparación está asociada con el RTDD, por ejemplo, una secuencia de ácido nucleico guía, en el extremo 3' de la secuencia de ácido nucleico guía, y/o la secuencia de ácido nucleico de la plantilla de reparación está asociada con el extremo 5' del RTDD, por ejemplo, una secuencia de ácido nucleico guía, y/o la secuencia de ácido nucleico de la plantilla de reparación está ubicada dentro del RTDD y, por lo tanto, forma una parte funcional separada del RTDD.

Sorprendentemente, los inventores de la presente invención encontraron que un ARNg como RTDD que porta una secuencia de la plantilla de reparación (RT) de ADN ubicada en 3', ya sea una RT de cadena sencilla o de cadena doble, podía interactuar libremente con la secuencia homóloga como se suministra al objetivo por un polipéptido de CRISPR, por ejemplo, Cas9 de un sistema de CRISPR Tipo II, o Cpf1 de un sistema de CRISPR Tipo V u otro polipéptido efector CRISPR. Se hicieron observaciones similares cuando se usaron un ARNg como RTDD que porta una secuencia de la plantilla de reparación de ADN ubicada en 5', ya sea una RT de cadena sencilla o de cadena doble, o ambas, una RT ubicada en 3' y 5'. Localizado en 3' o 5' por lo tanto implica que la RT está unida covalentemente al extremo 3' o 5' de un ARNg, o puede significar que la RT está hibridada, es decir, asociada no covalentemente con una región correspondiente a la secuencia unida a la región 3' y/o 5' del ARNg. Además, la RT podría incorporarse covalentemente en los bucles de tallo de un ARNg, o podría asociarse de forma no covalente con dichos bucles de tallo de ARNg para lograr una construcción de ácido nucleico híbrida funcional, en donde el RTDD y la RT interactúan directamente. Por lo tanto, se encontró que el ADN asociado con un ARNg en varias posiciones del ARNg como se describió anteriormente fue bien tolerado y, por lo tanto, esta nueva forma de complejo híbrido es adecuada para unir dos aspectos clave del principio de edición de genes: (1) precisión de orientación mediada por RTDD/ARNg y (2) reparación eficiente y dirigida al sitio mediada por RT. Además, existe el efecto sinérgico de que ARNg y RT se acercan mucho para aumentar la estabilidad y la disponibilidad de la construcción híbrida junto con un polipéptido de CRISPR como SSN de interés en un sitio objetivo de ADN de interés.

Prácticamente no existen limitaciones en la longitud de esta secuencia de nucleótidos de plantilla de reparación extendida suministrada como parte del complejo molecular artificial de acuerdo con la presente divulgación, en caso de que la RT esté unida al extremo 3' o 5' de un RTDD basado en ácido nucleico, por ejemplo, un ARNg o un ADNg. La longitud de la RT, independientemente del tipo de RTDD, está dictada más bien por la modificación específica que se va a introducir. Las secuencias típicas de Rt pueden tener una longitud de aproximadamente 20 a 8,000 pb o incluso más, por ejemplo, de 20 a 5,000 pb, de 30 a 8,000 pb, de 30 a 5,000 pb, de 40 a 8,000 pb, de 40 a 5,000 pb, de 50 a 8,000 pb, de 50 a 5,000 pb, de 60 a 8,000 pb, de 60 a 5,000 pb, de 70 a 8,000 pb, de 70 a 5,000 pb, de 80 a 8,000 pb, de 80 a 5,000 pb, de 90 a 8,000 pb, de 90 a 5,000 pb, de 100 a 8,000 pb, de 100 a 5,000 pb de ADN de cadena sencilla y/o de cadena doble sin que se observe una pérdida significativa en la frecuencia de corte de al menos una SSN. Como sabe el experto en la materia, la longitud de una plantilla de RT está fuertemente dictada por el tipo de modificación/inserción que se va a efectuar/introducir. En caso de que se pretenda introducir una secuencia de ácido nucleico más grande que codifique una proteína de interés, la longitud de la secuencia de RT tendrá la longitud: longitud de la construcción de ácido nucleico que codifica la proteína de interés más dos brazos de homología suficientemente largos ubicados a la izquierda y derecha de la secuencia. Por lo tanto, en principio no existe un límite superior de 1,500 pb, pero la RT puede tener hasta 5,000 o incluso más pares de bases (pb). Por ejemplo, las inserciones más grandes actualmente introducidas usando un ADN plasmídico como plantilla de reparación y produciendo la plantilla de reparación dentro de un sitio objetivo usan brazos de homología izquierdo y derecho de 800 pb y más, de modo que la longitud total de una plantilla de reparación puede tener varios 1,000 pb. La longitud de los insertos de ácido nucleico debe diseñarse para que no inhiba la nucleasa específica del sitio de interés que puede determinarse en experimentos previos.

Los diferentes componentes del complejo molecular de la presente divulgación, es decir, al menos una SSN, al menos un RTDD y al menos una RT, y opcionalmente al menos un dominio de interacción está asociados de manera funcional.

El término "asociado de forma funcional" implica que los componentes del complejo artificial se ponen en contacto de modo que la SSN y el RTDD puedan interactuar entre sí, por ejemplo mediante una forma de asociación no covalente como se detalló anteriormente. Al menos una secuencia de RTDD que interactúa con al menos una secuencia de RT se ensambla de forma independiente, ya sea antes, después o simultáneamente con el contacto de al menos la secuencia de RTDD con al menos una SSN correspondiente, o una variante o un fragmento catalíticamente activo de la misma de interés. En una realización, todo el complejo, que comprende opcionalmente al menos un dominio de interacción, está asociado in vitro antes de que se introduzca en una célula objetivo que comprenda al menos una región objetivo de ADN de interés para ser editada. En otra realización, al menos una SSN y opcionalmente un dominio de interacción se introducen en al menos una célula objetivo antes o después de al menos una secuencia de RTDD/RT que interactúa. El polipéptido SSN se puede introducir en una célula objetivo transfectando la secuencia polipeptídica o transfectando o transformando al menos una célula objetivo con ARN que codifica al menos un polipéptido SSN o introduciendo una construcción de suministro que codifica al menos un polipéptido SSN que puede transcribirse y traducirse en una célula objetivo. Asimismo, en ciertas realizaciones, la secuencia o secuencias de RTDD y la secuencia o secuencias de ácido nucleico de la plantilla de reparación pueden proporcionarse simultáneamente como construcción proporcionada y ensamblada in vitro. Alternativamente, la secuencia de RTDD y/o la secuencia de ácido nucleico de la plantilla de reparación pueden transfectarse o transformarse en una célula objetivo con la ayuda de un vector de suministro adecuado. En una realización preferida, todo el complejo molecular artificial se ensambla in vitro y luego se introduce en una célula objetivo de interés para permitir el mejor control espacial y estequiométrico de la construcción de edición del genoma. En otra realización preferida, al menos una SSN y opcionalmente un polipéptido de dominio de interacción se introducen en una célula objetivo antes de las secuencias de RTDD/RT y al menos secuencias de RTDD/RT se introducen después en una célula objetivo de interés. El orden secuencial puede ser deseable para ciertos enfoques que utilizan, por ejemplo, un ARNg como RTDD debido a la estabilidad intrínsecamente baja del ARN en comparación con un polipéptido, de modo que el ARNg introducido se unirá y estabilizará inmediatamente por la SSN, es decir, para ciertas realizaciones un polipéptido de CRISPR ya presente en la célula. Sin desear limitarse a la teoría, el ensamblaje ex vivo de una secuencia de ácido nucleico guía y una secuencia de ácido nucleico de la plantilla de reparación también puede mejorar la estabilidad de la construcción en comparación con el ARN guía solo.

Actualmente, existe una variedad de métodos de transformación de plantas para introducir material genético en forma de una construcción genética en una célula de la planta de interés, que comprende medios biológicos y físicos conocidos por los expertos en el campo de la biotecnología vegetal. Un medio biológico común es la transformación con Agrobacterium spp. que se ha utilizado durante décadas para una variedad de diferentes materiales vegetales. La transformación de plantas mediada por vectores virales representa una estrategia adicional para introducir material genético en una célula de interés. Los medios físicos que encuentran aplicación en la biología vegetal son el bombardeo de partículas, también llamado transfección biolística o transferencia de genes mediada por micropartículas, que se refiere a un método de suministro físico para transferir una micropartícula o nanopartícula recubierta que comprende un ácido nucleico o una construcción genética de interés a una célula o tejido objetivo. Los medios de introducción física son adecuados para introducir ácidos nucleicos, es decir, ARN y/o ADN, y proteínas. Asimismo, existen métodos específicos de transformación o transfección para introducir específicamente un ácido nucleico o una construcción de aminoácidos de interés en una célula de la planta, que incluyen electroporación, microinyección, nanopartículas y péptidos de penetración celular (CPP). Además, existen métodos de transfección de base química para introducir construcciones genéticas y/o ácidos nucleicos y/o proteínas, que comprenden entre otros transfección con fosfato de calcio, transfección usando liposomas, por ejemplo, liposomas catiónicos, o transfección con polímeros catiónicos, incluyendo DEAD-dextrano o polietilenimina, o combinaciones de los mismos. Dichos métodos de suministro y vehículos o cargas de suministro difieren inherentemente de las herramientas de suministro que se utilizan para otras células eucariotas, incluidas las células animales y de mamíferos, y cada método de suministro debe ajustarse y optimizarse específicamente para que una construcción de interés para mediar la edición del genoma pueda introducirse en un compartimento específico de una célula objetivo de interés de forma completamente funcional y activa. Las técnicas de suministro anteriores, solas o en combinación, se pueden usar para insertar al menos un complejo molecular artificial, o al menos un subcomponente del mismo, es decir, al menos una SSN, al menos un RTDD, al menos una RT y opcionalmente al menos un IA, o las secuencias que codifican los subcomponentes antes mencionados, de acuerdo con la presente divulgación en una célula objetivo, in vivo o in vitro.

En ciertas realizaciones, los modos de suministro del complejo molecular artificial de la presente divulgación pueden seleccionarse entre suministro mediado por PEG de un complejo SSN-(IA)-RTDD-RT, suministro mediado por PEG de plásmido que codifica SSN-(IA)-RTDD, siendo el RTDD, por ejemplo, un ARNg o ADNg y administración paralela de RT, bombardeo de un complejo SSN-(IA)-RTDD-RT, bombardeo de plásmido que codifica proteína (SSN y opcionalmente IA)-RTDD, por ejemplo, ARNg/ADNg, y suministro paralelo de RT, suministro mediado por péptido de penetración celular (CPP) de un complejo SSN-(iA)-RTDD-RT, lipofección de un complejo SSN-(iA)-r Td D-RT, lipofección de plásmido codificante de proteína (SSN y opcionalmente IA)-RTDD, por ejemplo, ARNg/ADNg, y suministro paralelo de RT, o expresión estable de proteína (s Sn y opcionalmente IA) y suministro transitorio del RTDD o, para ciertos RTDD, un plásmido que codifica el RTDD y suministro paralelo de ADNti.

En ciertas realizaciones, la parte de ARNcr del ARNg comprende un bucle de tallo o una estructura de bucle de tallo optimizada o una estructura secundaria optimizada. En otra realización, el ARNcr maduro comprende un bucle de tallo o una estructura de bucle de tallo optimizada en la secuencia de repetición directa, donde el bucle de tallo o la estructura de bucle de tallo optimizado es importante para la actividad de escisión. En ciertas realizaciones, el ARNcr maduro comprende preferiblemente un solo bucle de tallo. En ciertas realizaciones, la secuencia de repetición directa comprende preferiblemente un solo bucle de tallo. En determinadas realizaciones, la actividad de escisión del complejo de proteína efectora se modifica mediante la introducción de mutaciones que afectan a la estructura del dúplex de ARN de bucle de tallo. En realizaciones preferidas, se pueden introducir mutaciones que mantienen el dúplex de ARN del bucle de tallo, por lo que se mantiene la actividad de escisión del complejo de proteína efectora. En otras realizaciones preferidas, se pueden introducir mutaciones que interrumpen la estructura del dúplex de ARN del bucle de tallo, por lo que la actividad de escisión del complejo de proteína efectora se anula por completo.

El tamaño de al menos una secuencia de ácido nucleico de la plantilla de reparación de acuerdo con la presente divulgación como parte del complejo molecular artificial de acuerdo con la presente divulgación puede variar. Puede estar en el intervalo de aproximadamente 20 pb a aproximadamente 5,000 pb o incluso 8,000 pb dependiendo de la secuencia objetivo de ADN a modificar.

Las plantillas de HOR utilizadas para crear mutaciones o inserciones específicas en una región objetivo de ADN de interés requieren una cierta cantidad de homología en torno a la secuencia objetivo que se modificará. Es mejor si los sitios de inserción de la modificación no están a más de 100 pb de la DSB como lo efectúa una SSN o un compañero de fusión, es decir, un dominio de interacción, en el caso de una SSN deficiente en nucleasa, por ejemplo, un polipéptido de CRISPR, idealmente a menos de 10 pb de distancia si es posible, y la longitud total del brazo de homología es un factor importante a considerar al diseñarlos. Distancias más largas funcionarán, pero la eficiencia probablemente será menor y la introducción de un marcador de selección podría ser necesaria para garantizar que esté presente la modificación deseada que se introducirá en la secuencia objetivo del ADN de interés.

De acuerdo con los diversos aspectos de la presente invención, al menos una secuencia de ácido nucleico de la plantilla de reparación puede ser una molécula de ácido nucleico de ADN de cadena sencilla o de cadena doble. Al menos una secuencia de ácido nucleico de la plantilla de reparación se puede proporcionar en forma de una o más moléculas de ADN de cadena sencilla o de cadena doble lineales. Sin embargo, podría ser adecuado utilizar al menos una secuencia de ácido nucleico de la plantilla de reparación de cadena sencilla o de cadena doble, que se produce ex vivo, cuando se va a ensamblar un complejo molecular ex vivo, que es especialmente adecuado para aumentar la disponibilidad del complejo SSN-RTDD-RT funcional, ya que todos los componentes se pueden introducir simultáneamente en la estequiometría correcta para aumentar la especificidad del enfoque de edición del genoma.

La síntesis de secuencias de ácido nucleico más grandes, ya sea de cadena sencilla o doble, se puede lograr usando métodos comunes de la técnica anterior. Se observa que para ciertas realizaciones, también podrían ser adecuadas las secuencias de ácido nucleico de la plantilla de reparación parciales de cadena sencilla y/o de cadena doble. Es posible cualquier combinación de una secuencia de ácido nucleico de cadena sencilla y/o de cadena doble y cualquier tipo de introducción, tanto simultánea como antes o después de la introducción de los componentes polipeptídicos del complejo molecular artificial. En una realización, se prevé introducir un complejo molecular de acuerdo con el segundo aspecto de la presente divulgación en una célula objetivo, en donde la célula objetivo comprende un vector de plásmido adicional que codifica una plantilla de reparación o una secuencia de la plantilla de reparación adicional, ya que el uso de más de una secuencia de ácido nucleico de la plantilla de reparación es beneficiosa para ciertos enfoques de edición del genoma, en donde el complejo molecular artificial puede luego ensamblarse in vivo después de que se proporcionen los diferentes componentes. En general, la alta disponibilidad física de la secuencia de ácido nucleico de la plantilla de reparación en ese sitio dentro de una célula objetivo, donde se encuentra la región objetivo del ADN, es de gran importancia para permitir un evento de edición del genoma de alta precisión. En ciertas realizaciones, especialmente las plantillas de reparación de ADN de cadena sencilla (cs) son adecuadas para lograr el equilibrio correcto manteniendo el peso molecular lo más bajo posible mientras se proporciona una longitud suficiente para las interacciones de homología para lograr una reparación óptima dirigida por homología.

En una realización de acuerdo con cualquier aspecto de la presente invención, al menos una SSN es un polipéptido de CRISPR y se selecciona independientemente del grupo que consiste en un polipéptido Cas de Streptococcus spp., incluido Streptococcus pyogenes, Streptococcus thermophilus, Staphylococcus aureus, o Neisseria spp., incluyendo Neisseria meningitides, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Roseburia, Parvibaculum, Nitratifractor, Mycoplasma y Campylobacter, Candidatus Micrarchaeum acidiphilum ARMAN-1, Parcubacterias (GenBank: APG80656.1), Sulfolobus spp., incluyendo Sulfolobus islandicus HVE10/4 (GenBank: ADX81770.1) o REY15A (GenBank: ADX84852.1), o en donde el polipéptido de CRISPR se selecciona de un polipéptido Cpf1 de una arquea o una bacteria, incluyendo un polipéptido Cpf1 de Acidaminococcus spp., incluido Acidaminococcus sp. BV3L6, Lachnospiraceae spp., incluyendo la bacteria Lachnospiraceae ND2006, Francisella spp., incluyendo Francisella novicida U112, Eubacterium eligens, Prevotella spp., o Porphyromonas spp., o variantes y/o fragmentos funcionales y/o combinaciones de los mismos, incluyendo nickasas de polipéptido de CRISPR, o un polipéptido de CRISPR que carece de actividad endonucleolítica.

En una realización de acuerdo con la presente invención, las secuencias de RTDD/RT de acuerdo con la presente divulgación se pueden usar con una nickasa SSN, por ejemplo, una nickasa Cas9, mutante para minimizar las mutaciones fuera del objetivo, donde se usan ARN guía emparejados, cada uno de los cuales es específico para un mutante de nickasa derivado de Cas9.

En algunas realizaciones, al menos una SSN y opcionalmente al menos un dominio de interacción se proporciona como un polipéptido expresado, traducido o sintetizado in vitro. En algunas realizaciones, se usa un vector de suministro que codifica al menos un polipéptido de CRISPR, en donde el vector de suministro puede comprender adicionalmente secuencias reguladoras o señales de localización. Un polipéptido SSN que está mutado con respecto a una enzima de tipo silvestre correspondiente, de modo que la enzima SSN mutada carece de la capacidad de escindir una o ambas cadenas de un polinucleótido objetivo que contiene una secuencia objetivo también comprendida por diversas realizaciones de acuerdo con la presente divulgación. Por ejemplo, una sustitución de aspartato por alanina (D10A) en el dominio catalítico RuvC I de Cas9 de S. pyogenes que convierte Cas9 de una endonucleasa que escinde ambas cadenas de una región objetivo de ADN de interés en una nickasa que escinde una cadena sencilla. Otros ejemplos de mutaciones que convierten a un polipéptido Cas9 en una nickasa incluyen, sin limitación, H840A, N854A y N863A. Como ejemplo adicional, se pueden mutar dos o más dominios catalíticos de Cas9 (RuvC I, RuvC II y RuvC III o el dominio HNH) para producir una Cas9 mutada que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, una mutación D10A se combina con una o más de las mutaciones H840A, N854A o N863A para producir una enzima Cas9 que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, se considera que una enzima SSN carece sustancialmente de toda actividad de escisión de ADN cuando la actividad de escisión de ADN de la enzima mutada es de no más del 25 %, 10 %, 5 %, 1 %, 0.1 %, 0.01 % o menos. de la actividad de escisión del ADN de la forma no mutada de la enzima; un ejemplo puede ser cuando la actividad de escisión del ADN de la forma mutada es nula o insignificante en comparación con la forma de tipo silvestre no mutada.

Donde la enzima no es Cas9 de S. pyogenes, se pueden realizar mutaciones en cualquiera o en todos los residuos correspondientes a las posiciones l0 , 762, 840, 854, 863 y/o 986 de SpCas9 (que puede determinarse, por ejemplo, mediante herramientas estándar de comparación de secuencias). En particular, se prefieren cualquiera o todas las siguientes mutaciones en Cas9 de S. pyogenes: D10A, E762A, H840A, N854A, N863a y/o D986A; así como también se prevé una sustitución conservadora de cualquiera de los aminoácidos de sustitución de acuerdo con la presente divulgación. Las sustituciones iguales o conservadoras de estas mutaciones en las posiciones correspondientes en otras Cas9 también son posibles para ciertas realizaciones, particularmente D10 y H840 en Cas9 de S. pyogenes. Sin embargo, en otras Cas9s, los residuos correspondientes a D10 y H840 de Cas9 de S. pyogenes también son posibles. Los "ortólogos" de proteínas CRISPR dadas también pueden usarse en la práctica de la invención. Los ortólogos son genes en diferentes especies que evolucionaron a partir de un gen ancestral común por especiación. Normalmente, los ortólogos conservan la misma función en el curso de la evolución. Lo más preferiblemente, la enzima Cas9 como SSN es de, o se deriva de, Cas9 de S. pyogenes, o Cas9 de S. aureus, o Cas9 de tipo silvestre de S. thermophilus, cuya secuencia de proteína se proporciona en la base de datos SwissProt con el número de acceso G3ECR1. Del mismo modo, Cas9 de S. pyogenes o Cas9 de S. aureus está incluida en SwissProt con el número de acceso Q99ZW2.

En una realización de la presente divulgación, el ARN guía como secuencia de RTDD de acuerdo con la presente divulgación está diseñado para tener una actividad óptima, es decir, propiedades de reconocimiento, hacia una enzima o polipéptido SSN seleccionado de una longitud específica, por lo que la enzima SSN se puede truncar a un fragmento catalíticamente activo de la SSN de tipo silvestre haciéndolo más pequeño en longitud que la enzima de tipo silvestre correspondiente al truncar las moléculas de ácido nucleico que codifican la enzima SSN que puede transcribirse o traducirse in vitro o in vivo, o proporcionando un polipéptido SSN sintetizado. También es posible generar enzimas SSN quiméricas, donde diferentes partes de la enzima se intercambian entre diferentes ortólogos para llegar a enzimas quiméricas que tienen una especificidad adaptada.

Una "variante" o "fragmento funcional" de acuerdo con la presente divulgación comprende cualquier SSN y/o dominio de interacción y/o proteína de RTDD o una versión truncada de la misma derivada de la SSN de tipo silvestre y/o dominio de interacción y/o proteína de RTDD, es decir, que tiene un grado de homología de secuencia con una enzima de tipo silvestre, pero que ha sido mutada (modificada) de alguna manera como se describe en este documento. Por ejemplo, la actividad enzimática de la nucleasa derivada de Cas9 genera roturas de cadena doble en las secuencias del sitio objetivo que se hibridan con 20 nucleótidos de la secuencia guía y que tienen ejemplos de secuencias de motivos adyacentes al protoespaciador (PAM) que incluyen NGG/NRG o un PAM que puede ser determinado como se describe en el presente documento siguiendo los 20 nucleótidos de la secuencia objetivo. Esta función enzimática se puede variar generando variantes de SSN que tengan actividad de nickasa o variante muerta de nucleasa. Además, una SSN y/o dominio de interacción y/o variante de polipéptido de RTDD de acuerdo con la presente divulgación puede optimizarse por codones para adaptar la SSN y/o el dominio de interacción y/o el polipéptido de RTDD al uso de codones de una célula objetivo, tal como una célula eucariota, una célula animal o vegetal.

En realizaciones preferidas de acuerdo con la presente invención, los componentes del complejo molecular artificial, particularmente los componentes SSN o IA, o sus fragmentos catalíticamente activos que aún ejercen la función catalítica del polipéptido de tipo silvestre, y/o los componentes adicionales pueden ser de codón optimizado, y/o el polipéptido SSN y/o el dominio de interacción y/o el RTDD y/o la RT pueden unirse a una secuencia etiqueta, para identificar la ubicación de una secuencia objetivo y/o el complejo molecular artificial. La etiqueta se puede seleccionar del grupo que consiste en una etiqueta de polihistidina (His), una etiqueta de glutatión-S-transferasa (GST), una etiqueta de tiorredoxina, una etiqueta FLAG, una etiqueta que tiene propiedades fluorescentes, por ejemplo, seleccionada de etiqueta (E)GFP (proteína fluorescente verde (mejorada)), una etiqueta DsRed, una etiqueta mCherry, una etiqueta (t)dtomato, una etiqueta mNeonGreen y similares o, una estreptavidina o etiqueta de estreptavidina, una etiqueta de proteína de unión a maltosa (MBP), un péptido de tránsito que permite el direccionamiento a un compartimento subcelular, incluidas las mitocondrias o el núcleo, una etiqueta instantánea y/o una etiqueta de secreción que permite la secreción de una secuencia de aminoácidos unida a la misma, un aminoácido no natural que normalmente no se encuentra en la naturaleza, o una combinación de las etiquetas antes mencionadas. Un componente de proteína del complejo molecular artificial, por ejemplo, la SSN y/o el dominio de interacción, puede comprender cualquier secuencia de proteína adicional y, opcionalmente, una secuencia enlazadora entre dos dominios cualesquiera. Los ejemplos de dominios de proteínas que pueden fusionarse con cualquier componente de al menos un complejo molecular artificial incluyen, sin limitación, etiquetas de epítopos, secuencias de genes informadores y dominios de proteínas que tienen una o más de las siguientes actividades: actividad de metilasa, actividad de desmetilasa, actividad de activación de la transcripción, actividad de represión de la transcripción, actividad del factor de liberación de transcripción, actividad de modificación de histonas, actividad de escisión de ARN y actividad de unión de ácido nucleico. Los ejemplos no limitantes de etiquetas de epítopos incluyen etiquetas de histidina (His), etiquetas V5, etiquetas FLAG, etiquetas de hemaglutinina (HA) de influenza, etiquetas Myc, etiquetas VSV-G y etiquetas de tiorredoxina (Trx). Los ejemplos de genes informadores incluyen, pero sin limitarse a, glutatión-S-transferasa (GST), peroxidasa de rábano picante (HRP), cloranfenicol acetiltransferasa (CAT), beta-galactosidasa, beta-glucuronidasa, luciferasa, proteína fluorescente verde (GFP), HcRed , DsRed, proteína fluorescente cian (CFP), proteína fluorescente amarilla (YFP) y proteínas autofluorescentes, incluida la proteína fluorescente azul (BFP). Una enzima CRISPR se puede fusionar con una secuencia genética que codifica una proteína o un fragmento de una proteína que se une a moléculas de ADN o se une a otras moléculas celulares, incluidas, pero sin limitarse a, la proteína de unión a maltosa (MBP), la etiqueta S, fusiones del dominio de unión al ADN de Lex A (DBD), fusiones del dominio de unión al ADN de GAL4 y fusiones de la proteína BP16 del virus del herpes simple (HSV).

En una realización, al menos un componente del complejo molecular artificial puede tener un funcionamiento modificado como ADN nickasa, y/o el polipéptido SSN, o su fragmento catalíticamente activo, puede estar presente en forma de una molécula de fusión con otra fracción funcional, preferiblemente una fracción polipeptídica funcional que tiene una función enzimática, preferiblemente una fracción funcional que tiene una función de modelado de la cromatina y/o que estimula la recombinación homóloga y/o modifica la transcripción. Cuando se analiza al menos una célula modificada dentro de un tejido de un organismo multicelular, se prefieren dichas etiquetas y proteínas marcadoras, especialmente etiquetas de proteínas fluorescentes, que tienen una fluorescencia brillante para que puedan determinarse incluso en capas más profundas de tejidos complejos. Las proteínas fluorescentes adecuadas están disponibles comercialmente y el experto en la materia puede seleccionarlas fácilmente para el propósito específico.

De acuerdo con las diversas realizaciones de la presente invención, la SSN y/o el dominio de interacción y/o el o los polipéptidos de RTDD y/o la secuencia o secuencias de RTDD y/o RT comprenden al menos una secuencia de localización nuclear, y/o una secuencia de localización de plástidos, por ejemplo, una secuencia de localización de mitocondrias o una secuencia de localización de cloroplastos, para el direccionamiento eficiente del polipéptido SSN a un compartimento celular que comprende una secuencia de ADN genómico de interés que se va a modificar. Los requisitos de secuencia para tales secuencias de localización son conocidos por los expertos en el campo de la biología molecular. Para no obstaculizar la función del polipéptido SSN o de la secuencia de nucleótidos de RT, la secuencia de localización se fusiona, es decir, se une covalentemente, a la parte del extremo terminal No el extremo terminal C, o correspondientemente al extremo 5' o 3' de la molécula respectiva.

En una realización, al menos un polipéptido SSN y opcionalmente al menos un dominio de interacción, si representa una secuencia polipeptídica, se proporciona como secuencia polipeptídica producida ex vivo, ya sea utilizando tecnologías recombinantes para la producción de proteínas o mediante la síntesis de la secuencia de aminoácidos correspondiente. En otra realización, el polipéptido SSN y opcionalmente al menos un dominio de interacción se presenta como una secuencia de ARN, que puede traducirse a la secuencia de aminoácidos correspondiente tras la introducción de una célula objetivo de interés. En otra realización más, el polipéptido SSN y, opcionalmente, al menos un polipéptido del dominio de interacción se inserta como una construcción de ADN, configurada para una expresión estable o para una expresión transitoria en una célula de interés, de modo que al menos un polipéptido SSN y, opcionalmente, al menos un polipéptido de dominio de interacción se transcribe y traduce luego en una célula objetivo de interés de forma constitutiva o inducible. Las construcciones de ADN adecuadas y los métodos asociados para introducir al menos un polipéptido SSN y, opcionalmente, al menos un polipéptido del dominio de interacción de acuerdo con la presente divulgación en una célula objetivo son conocidos por el experto en la materia, mientras que las formas específicas de introducir al menos un polipéptido SSN y opcionalmente al menos un polipéptido de dominio de interacción de acuerdo con ciertas realizaciones de la presente divulgación adaptado específicamente para la aplicación en células vegetales se detallan adicionalmente a continuación.

El complejo molecular artificial, o las partes del mismo, es decir, al menos un polipéptido SSN, al menos un RTDD y al menos una RT y opcionalmente al menos un dominio de interacción tiene que introducirse en una célula objetivo de interés utilizando una construcción de suministro adecuada. Naturalmente, el tipo de construcción de suministro puede variar, dependiendo de si el complejo molecular está completamente ensamblado in vitro y luego se introducen en una célula objetivo, o si los diferentes componentes del complejo molecular se introducen por separado en una célula y el complejo se ensambla luego mediante interacciones no covalentes dentro de una célula objetivo de interés. La introducción generalmente se lleva a cabo mediante el uso de una construcción de suministro adecuada.

El término "construcción de suministro" o "vector (de suministro)", como se usa en el presente documento de acuerdo con varias realizaciones de los diferentes aspectos de la presente invención, se refiere a cualquier medio y/o método biológico, químico, no químico o basado en partículas usado como un cargamento para transportar una secuencia de nucleótidos y/o aminoácidos de interés a una célula eucariota objetivo. Las construcciones de suministro adecuadas comprenden medios biológicos para administrar secuencias de nucleótidos en una célula objetivo, incluidos vectores virales, Agrobacterium spp., péptidos de penetración celular (CPP) o construcciones de suministro de productos químicos, incluidas nanopartículas, vesículas lipídicas o poliméricas, fosfato de calcio o combinaciones de los mismos. Las vesículas lipídicas o poliméricas se pueden seleccionar, por ejemplo, de lípidos, liposomas, sistemas de encapsulación de lípidos, nanopartículas, por ejemplo, nanopartículas de sílice mesoporosas, formulaciones de partículas lipídicas de ácido nucleico pequeño, polímeros, por ejemplo, polímeros catiónicos como DEAE-dextrano o polietilenimina y polimerosomas. En una realización, el polímero se selecciona del grupo que consiste en polímeros lineales, polímeros ramificados, dendrímeros (compuestos orgánicos altamente ramificados) y polisacáridos. En otra realización, el sistema de encapsulación de lípidos comprende uno o más de un fosfolípido, colesterol, polietilenglicol (PEG)-lípido y un compuesto lipófilo que suministra la partícula al tejido objetivo. En una realización adicional, la construcción de suministro puede ser una nanopartícula de sílice mesoporosa.

Los métodos de introducción física como se usan en el presente documento y que son adecuados para proporcionar al menos un complejo molecular o al menos una secuencia híbrida de ácido nucleico de ARN/ADN de acuerdo con la presente divulgación se refieren a electroporación, microinyección, bombardeo de partículas, sonoporación, magnetofección o impalefección usando nanoestructuras alargadas y conjuntos de tales nanoestructuras, tales como nanofibras de carbono o nanoalambres de silicio que se han funcionalizado con ADN plasmídico, y métodos químicos y pueden depender del uso de micro o nanopartículas o productos químicos, incluido el polietilenglicol (PEG).

Por ejemplo, para una realización, donde los componentes del complejo molecular artificial están asociados ex vivo, el vector de suministro puede ser un vector basado en lípidos o polimérico. Los vectores basados en lípidos o poliméricos se pueden seleccionar, por ejemplo, de lípidos, liposomas, sistemas de encapsulación de lípidos, micropartículas, filamentos, nanopartículas, partículas pequeñas de ácido nucleico-lípido, polímeros y polimerosomas. En algunas realizaciones, el polímero se puede seleccionar del grupo que consiste en polímeros lineales, polímeros ramificados, dendrímeros y polisacáridos. En otra realización, el sistema de encapsulación de lípidos comprende uno o más de un fosfolípido, colesterol, polietilenglicol (PEG)-lípido y un compuesto lipófilo que suministra la partícula en una célula objetivo.

Para células de mamíferos, la modificación ex vivo de células inmunes para diversos fines terapéuticos ha ganado mucho interés durante la última década para combatir varias enfermedades tumorales mediante la transferencia adoptiva de linfocitos específicamente modificados, tales como las células T Especialmente los linfocitos de células T CD8+ son objetivos interesantes a este respecto. Se describió que las respuestas inmunitarias derivadas de células T individuales sin modificar, células T de memoria centrales primarias individuales y secundarias individuales alcanzaron un tamaño y una diversidad fenotípica similares, estuvieron sujetas a una variación estocástica comparable y, en última instancia, podrían reconstituir la inmunocompetencia contra una infección que de otro modo sería letal con una bacteria patógena medido por mapeo in vivo del destino de las células T CD8+ y sus descendientes a lo largo de tres generaciones de transferencia adoptiva de una sola célula en serie y reexpansión impulsada por la infección (Graef et al., Immunity, 41, 116-126, 2014). Después del nuevo desarrollo de células T tímicas a partir de células hematopoyéticas pueden mantenerse células T específicas de antígeno completamente maduras durante largos periodos de tiempo en un individuo, en donde el antígeno puede ser un antígeno extraño, por ejemplo, un antígeno expresado en un virus o una célula cancerosa. La modificación dirigida de dichas células T efectoras, o sus precursores, representa por lo tanto una estrategia importante para proporcionar células T adecuadas para la inmunoterapia. Las células T sin modificar se diferencian a través de una etapa llamada células T de memoria de células madre, que dan lugar a células T de memoria centrales y células T de memoria efectoras y, finalmente, células T efectoras, donde las células T efectoras representan células diferenciadas terminalmente que, en última instancia, pueden reconocer y destruir una célula objetivo. La memoria efectora y las células T efectoras son los subconjuntos de células T que tienen la capacidad de trasladarse a los tejidos periféricos. Actualmente se sugiere otro subconjunto, las células T de memoria residentes en tejidos, que ya no circulan más (véase, por ejemplo, Farber et al., Nature Reviews Immunology, 14, 24-35, 2014).

Además, la inmunoterapia de los cánceres ha proporcionado algunos de los primeros casos clínicos espectaculares que muestran que la transferencia adoptiva de células T que expresan receptores reactivos tumorales recombinantes puede curar tumores malignos resistentes al tratamiento (Brentjens et al., 2013; Grupp et al., 2013; Porter et al., 2011) y que el uso de células T modificadas en terapias de transferencia adoptiva se ha mostrado prometedora en el tratamiento de cánceres, particularmente cánceres hematológicos. Cada vez más, las células T modificadas genéticamente de un subconjunto definido y una composición fenotípica se utilizan para aumentar el éxito de la inmunoterapia contra el cáncer (véase, Riddell et al., Cancer J., 20(2), 141-144, 2014). El uso de células T modificadas con receptor de antígeno quimérico como terapia para neoplasias malignas hematológicas y también para tumores sólidos se está generalizando cada vez más. Con este fin, las células T se modifican para expresar receptores de antígenos quiméricos dirigidos a tumores (CAR) (véase, por ejemplo, Anurathapan et al., Molecular Therapy, 22, 623 633, 2014). También los llamados CAR de segunda generación, por ejemplo, CAR dirigidos a CD19 que incorporan dominios de señalización CD2B o 4-1 BB, para redirigir y reprogramar las células T para aumentar su eficacia antitumoral son cada vez más importantes (véase, por ejemplo, Sjoukje et al., Nature Reviews Drug Discovery, 14, 499-509, 2015).

Por lo tanto, las secuencias de ácido nucleico de ARN/ADN híbrido de acuerdo con la presente divulgación representan una herramienta importante para modificar una o más células de mamíferos in vivo o ex vivo, por ejemplo para el tratamiento de una enfermedad. Por ejemplo, una célula de linfocito, tal como una célula T o una célula asesina natural (NK) de cualquier etapa de desarrollo para alterar un gen expresado por una célula T o una célula NK para influir en la proliferación, supervivencia y/o función de una célula T o una célula NK con alta precisión para evitar efectos fuera del objetivo, que podrían ser perjudiciales para una aplicación terapéutica de la célula o población celular modificada.

En determinadas realizaciones, el complejo molecular artificial de acuerdo con la presente divulgación es adecuado para su uso en un método de tratamiento de una enfermedad, en donde la enfermedad se caracteriza por al menos una mutación genómica y el complejo molecular artificial está configurado para seleccionar y reparar al menos una mutación genómica. Por lo tanto, se proporciona un método para tratar una enfermedad utilizando el complejo molecular artificial de acuerdo con cualquiera de las reivindicaciones anteriores, en donde la enfermedad se caracteriza por al menos una mutación genómica y el complejo molecular artificial está configurado para seleccionar y reparar al menos una mutación genómica. El método terapéutico de tratamiento puede comprender la edición de genes o genomas, o la terapia génica.

Las células adecuadas, particularmente para enfoques terapéuticos, o para modificar un genoma viral, incluyen células y/o líneas celulares eucariotas (por ejemplo, animales) y procariotas. Los ejemplos no limitantes de tales células o líneas celulares generadas a partir de tales células incluyen COS, CHO (p. ej., Ch O-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK₂93 (p. ej., HEK₂93-F, HEK₂93-H, HEK₂93-T) y células perC6, así como células de insectos tales como Spodoptera fugiperda (Sf), o células fúngicas tales como Saccharomyces, Pichia y Schizosaccharomyces. En ciertas realizaciones, la línea celular es una línea celular CHO, MDCK o HEK₂93. Las células adecuadas también incluyen células madre tales como, a modo de ejemplo, células madre embrionarias no humanas, células madre pluripotentes inducidas, células madre hematopoyéticas, células madre neuronales y células madre mesenquimatosas.

En un aspecto, se divulga un método para tratar a un sujeto que lo necesita, que comprende inducir la edición de genes transformando/transfectando al sujeto con los componentes del complejo molecular artificial como se discute en el presente documento o cualquiera de los vectores discutidos en el presente documento y administrando una fuente de energía inductora al sujeto. La divulgación comprende los usos de dicho polinucleótido o vector en la fabricación de un medicamento, por ejemplo, dicho medicamento para tratar a un sujeto o para dicho método para tratar un sujeto. La divulgación comprende el polinucleótido como se discute en el presente documento o cualquiera de los vectores discutidos en el presente documento para su uso en un método para tratar a un sujeto que lo necesite que comprende la inducción de la edición génica, en donde el método comprende además administrar una fuente de energía inductora al sujeto. En un aspecto, en el método también se proporciona una plantilla de reparación, por ejemplo suministrada por un vector que comprende dicha plantilla de reparación.

En una realización de la presente divulgación, también se contemplan vectores lentivirales mínimos de no primates basados en el virus de la anemia infecciosa equina (EIAV), especialmente para la terapia génica usando los complejos moleculares artificiales de la presente divulgación (véase, por ejemplo, Balagaan, J Gene Med 2006; 8: 275-285). En otra realización, también se contempla RetinoStat®, un vector de terapia génica lentiviral basado en el virus de la anemia infecciosa equina que expresa las proteínas angiostáticas endostatina y angiostatina que se suministra a través de una inyección subretiniana para el tratamiento de la membrana forma una degeneración macular relacionada con la edad (véase, por ejemplo, Binley et al., HUMAN GENE THERAPY 23:980-991 (septiembre de 2012)) y este vector puede modificarse para el sistema SSN-RTDD-RT de la presente divulgación. En la actualidad, se han divulgado vectores lentivirales como en el tratamiento de la enfermedad de Parkinson, véase, por ejemplo, la solicitud de patente de los Estados Unidos n.° 2012/0295960 A1 y la patente de los Estados Unidos n.° 7,303,910 B2. También se han descrito vectores lentivirales para el tratamiento de enfermedades oculares, véase, por ejemplo, las solicitudes de patente de los Estados Unidos n.° 2006/0281180, 2009/0007284, 2011/0117189, 2009/0017543, 2007/0054961, y 2010/0317109. También se han descrito vectores lentivirales para la administración al cerebro, véase, por ejemplo, las solicitudes de patente de los Estados Unidos n.° 2011/0293571, 2011/0293571, 2004/0013648, 2007/0025970, 2009/0111106 y la patente de los Estados Unidos n.° 7,259,015.

En otra realización de la presente divulgación, el complejo molecular artificial o los componentes del mismo pueden administrarse en liposomas, tal como una partícula lipídica estable de ácido nucleico (SNALP) (véase, por ejemplo, Morrissey et al., Nature Biotechnology, vol. 23, n.° 8, agosto 2005). Se contemplan inyecciones intravenosas diarias de aproximadamente 1, 3 o 5 mg/kg/día de una Cas específica de CRISPR dirigida en una SNALP. El tratamiento diario puede durar unos tres días y luego semanalmente durante unas cinco semanas. En otra realización, también se contempla una SNALP encapsulada específica que puede administrarse mediante inyección intravenosa a una dosis de aproximadamente 1 o 2.5 mg/kg (véase, por ejemplo, Zimmermann et al., Nature Letters, vol. 441,4 de mayo de 2006). La formulación de SNALP puede contener los lípidos 3-N-[(w-metoxipoli(etilenglicol) 2000)carbamoil]-1,2-dimiristiloxi-propilamina (PEG-C-DMA), 1,2-dilinoleiloxi-N,N-dimetil-3-aminopropano (DLinDMA), 1,2-diestearoil-snglicero-3-fosfocolina (DSPC) y colesterol, en una relación porcentual molar de 2:40:10:48 (véase, por ejemplo, Zimmermann et al., Nature Letters, vol. 441, 2006). En otra realización, se ha demostrado que las partículas estables de lípidos de ácido nucleico (SNALP) son moléculas de suministro eficaces para tumores hepáticos derivados de HepG2 altamente vascularizados, pero no en tumores hepáticos derivados de HCT-116 poco vascularizados (véase, por ejemplo, Li, Gene Therapy (2012) 19, 775-780). Los liposomas de SNALP se pueden preparar formulando D-Lin-DMA y PEG-C-DMA con diestearoilfosfatidilcolina (DSPC), colesterol y ARNip usando una proporción de lípidos/ARNip de 25:1 y una proporción molar de 48/40/10/2 de colesterol/D-Lin-DMA/DSPC/PEG-C-DMA. Los liposomas de SNALP resultantes tienen un tamaño de aproximadamente 80-100 nm.

En otra realización más de la presente divulgación, una SNALP puede comprender colesterol sintético (Sigma-Aldrich, St Louis, MO, EE. UU.), dipalmitoilfosfatidilcolina (Avanti Polar Lipids, Alabaster, AL, EE. UU.), 3-N-[(w-metoxi polietilenglicol)₂000)carbamoil]-1,2-dimirestiloxipropilamina y 1,2-dilinoleiloxi-3-N,N-dimetilaminopropano catiónico (véase, por ejemplo, Geisbert et al., Lancet 2010; 375: 1896-905). Puede contemplarse una dosificación de aproximadamente 2 mg/kg de SSN/RTDD/RT total por dosis administrada como, por ejemplo, una infusión intravenosa en bolo.

De manera similar, los complejos moleculares artificiales de acuerdo con la presente divulgación pueden representar una herramienta útil para la modificación de material genético en células de ganado u otros animales. Por ejemplo, la corrección de enfermedades genéticas o la edición de características favorables tales como carne, leche, por ejemplo, leche con un contenido reducido de lactosa, o producción de óvulos en ganado o aves.

Por lo tanto, en una realización, se divulga un método para generar una población de células inmunitarias de un animal que comprende introducir una construcción de acuerdo con la presente divulgación en al menos una célula inmunitaria de interés, in vivo o ex vivo, para tratar una enfermedad, tal como una enfermedad autoinmune, por ejemplo, diabetes de tipo I o artritis reumatoide, o una enfermedad proliferativa, tal como un cáncer, por ejemplo, glioma, melanoma, neuroblastoma, cáncer de colon, pulmón, mama y próstata, cánceres resistentes a múltiples fármacos así como cánceres relacionados con el gen p53 mutado.

Los tejidos preferidos de la mayoría de las especies de plantas que forman objetivos para la edición del genoma son los embriones inmaduros, los callos embriogénicos, los meristemos de plantas intactas, el polen, el tubo del polen o los óvulos, las células en suspensión u otros tipos de células con potencial regenerativo. Para algunas plantas, los tejidos preferidos pueden ser protoplastos u hojas. Cualquier célula que pueda tratarse y luego regenerarse en una planta completa puede considerarse un tejido o célula preferido. Los protocolos para la preparación de tejidos, la regeneración y el suministro de ADN son diferentes de acuerdo con la especie, el tipo de tejido, el método de suministro y otros factores. Un método de suministro común es el bombardeo de partículas de células con partículas de oro o tungsteno recubiertas de ADN o proteínas. Otros métodos de suministro son la transformación mediada por polietilenglicol (PEG), electroporación, infección viral, inyección directa en las células y transformación mediada por Agrobacterium. En algunas plantas, el suministro se puede realizar en los óvulos fertilizados cortando el estilo poco después de la fertilización y aplicando un líquido con los reactivos de edición en el tubo del polen cortado. Para células animales, tales como células de mamíferos, la electroporación, es decir, una tecnología de transfección basada en la creación momentánea de pequeños poros en las membranas celulares mediante la aplicación de un pulso eléctrico, podría representar un enfoque adecuado para introducir al menos un complejo molecular de acuerdo con la presente divulgación. Varios protocolos específicos de tipos de células para el éxito de la transfección directa con una multitud de tipos de células diferentes, incluidas células primarias de mamíferos, células madre y líneas celulares difíciles de transfectar, están disponibles para el experto en la materia, que son adecuados como herramientas de suministro para al menos un complejo molecular de acuerdo con la presente divulgación. Es importante tener en cuenta que la combinación de dos o más métodos o agentes adecuados para la administración puede proporcionar resultados superiores de acuerdo con el tipo de célula cuyo genoma se deba editar y, por lo tanto, se incluya dentro del alcance de la presente invención.

En una realización, se pueden usar proteínas sobrealimentadas para suministrar el complejo molecular artificial, o componentes del mismo, de acuerdo con la presente divulgación. Las proteínas sobrealimentadas son una clase de proteínas de origen natural o modificadas genéticamente con una carga teórica neta inusualmente altamente positiva o negativa y pueden emplearse en el suministro de un complejo o complejos moleculares artificiales o componente o componentes de los mismos o molécula o moléculas de ácido nucleico que los codifican. Tanto las proteínas con carga supernegativa como superpositiva exhiben una notable capacidad para resistir la agregación inducida térmica o químicamente. Las proteínas con carga superpositiva también pueden penetrar en las células de los mamíferos. La asociación de la carga con estas proteínas, tal como el ADN plasmídico, el ARN u otras proteínas, puede permitir el suministro funcional de estas macromoléculas a las células de los mamíferos tanto in vitro como in vivo. El laboratorio de David Liu informó sobre la creación y caracterización de proteínas sobrealimentadas en 2007 (Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112).

El suministro no viral de ARN y ADN plasmídico es de particular interés para transferir el complejo molecular artificial a células de mamíferos y es valiosa tanto para aplicaciones terapéuticas como de investigación. Akinc et al., 2010, Nat. Biotech. 26, 561-569). La proteína GFP 36 purificada (u otra proteína cargada superpositivamente, por ejemplo, GFP 48) se mezcla con ARN en los medios libres de suero apropiados y se deja formar complejos antes de la adición a las células. La inclusión de suero en esta etapa inhibe la formación de complejos de proteína-ARN sobrealimentados y reduce la eficacia del tratamiento. Se ha encontrado que el siguiente protocolo es efectivo para una variedad de líneas celulares (McNaughton et al., 2009, Proc. Natl. Acad. Sci. EE. UU. 106, 6111-6116) (Sin embargo, se deben realizar experimentos previos que varían la dosis de proteína y ARN para optimizar el procedimiento para líneas celulares específicas): (1) Un día antes del tratamiento, placa 1 * 105 células (p. ej., HEK₂93, el número depende del tipo de célula) por pocillo en una placa de 48 pocillos. (2) El día del tratamiento, diluya la proteína GFP 36 purificada en medios sin suero hasta una concentración final de 200 nM. Añadir ARN hasta una concentración final de 50 nM. Agitar con vórtice para mezclar e incubar a temperatura ambiente durante 10 min. (3) Durante la incubación, aspirar el medio de las células y lavar una vez con PBS. (4) Después de la incubación de GFP 36 y ARN, agregar los complejos proteína-ARN a las células. (5) Incubar las células con complejos a 37 °C durante 4 h. (6) Después de la incubación, aspirar los medios y lavar tres veces con 20 U/mL de heparina PBS. Incubar las células con medios que contengan suero durante 48 h más o más dependiendo del ensayo de actividad. (7) Analizar las células mediante inmunotransferencia, qPCR, ensayo fenotípico u otro método adecuado.

Otro método de suministro preferido para el complejo molecular artificial es ensamblar in vitro el ácido nucleico híbrido de RTDD-RT y luego cargar este híbrido en un polipéptido SSN in vitro producido y opcionalmente purificado antes de aplicarlo a las células objetivo de interés. Sin embargo, otros métodos de suministro útiles podrían ser la administración del polipéptido SSN y, opcionalmente, un dominio de interacción, por ejemplo, una estreptavidina monomérica, un Fvcs con una especificidad determinada, un dominio de unión al ADN o un dominio de nucleasa adicional como ARNm o construcción de ADN genético, que comprende opcionalmente elementos reguladores adicionales, en al menos una célula objetivo para la transcripción y/o expresión in vivo, junto con la aplicación del ácido nucleico híbrido simultáneamente, antes o especialmente después de la administración del polipéptido SSN. En el caso de una asociación no covalente del RTDD con el componente RT, estas moléculas también pueden administrarse por separado; en caso de que el RTDD sea un ARNg, el ARNg se puede suministrar como ARN o como un casete de expresión de ADN que se puede transcribir in vivo. En los casos en los que al menos un polipéptido SSN o al menos un ARNg se suministre como un casete de expresión, puede ser preferible expresarlos a partir de un replicón viral de ARN o ADN o un vector viral, en particular, cuando la célula objetivo es una célula de la planta.

En una realización preferida, al menos un complejo molecular artificial está asociado ex vivo, los diferentes componentes del complejo, es decir, al menos SSN que comprende opcionalmente al menos un dominio de interacción, al menos un RTDD y al menos un ácido nucleico plantilla de reparación de RT se sintetizan, ya sea químicamente o de forma recombinante, ex vivo/in vitro y luego se purifican los diferentes componentes, preferiblemente antes del ensamblaje. Se puede realizar un paso de purificación adicional después del ensamblaje de al menos un complejo molecular artificial de acuerdo con la presente divulgación. Los métodos para purificar ácidos nucleicos, incluidos ADN y ARN, o polipéptidos, o complejos de ribonucleoproteínas y ribonucleoproteínas están fácilmente disponibles para el experto en la materia. La provisión de un complejo molecular altamente puro y estequiométrico, que opcionalmente puede ser analizado in vitro, permite la provisión de una herramienta precisa de edición del genoma con alta eficiencia.

Para las realizaciones de la presente divulgación que se basan en moléculas no basadas en ácidos nucleicos o aminoácidos como RTDD o dominios de interacción, por ejemplo, biotina (vitamina H) o un derivado de la misma, fluoresceína o digoxigenina o cualquier otro compañero de unión afín para una interacción del dominio de interacción de SSN-RTDD, o RTDD, o interacción de dominio de interacción de SSN, es posible que la RT se sintetice ex vivo y luego la RT se une químicamente a la molécula respectiva.

En una realización adicional de acuerdo con los diversos aspectos de acuerdo con la presente invención, se puede usar una secuencia de ácido nucleico de la plantilla de reparación convencional, ya sea en forma de plásmido o en forma de un oligonucleótido de ácido nucleico, además de RTDD/RT para aumentar aún más la eficiencia del evento de edición dirigido al genoma. Por lo general, el factor decisivo si se aplica un plásmido u otra plantilla de reparación de ADN de cadena doble o si se usa un oligonucleótido de cadena sencilla como plantilla de reparación depende del tamaño de la modificación que se pretende introducir. El experto en la materia puede definir fácilmente una plantilla de reparación convencional adicional que se puede usar además de la construcción de ácido nucleico híbrido de acuerdo con la presente divulgación. Esas plantillas de reparación convencionales pueden introducirse en al menos una célula objetivo de interés mediante un vector de suministro, por ejemplo, un vector geminiviral, en caso de que la célula objetivo sea una célula de la planta, o mediante transfección directa o introducción como también se detalla en el presente documento para la introducción de la secuencia de RTDD/RT de acuerdo con la presente divulgación.

En un aspecto, se describen kits que contienen uno cualquiera o más de los elementos divulgados en el presente documento. En algunas realizaciones de la presente divulgación, el kit comprende un sistema de vector como se enseña en este documento e instrucciones para usar el kit. Los elementos se pueden proporcionar individualmente o en combinaciones, y se pueden proporcionar en cualquier recipiente adecuado, tal como un vial, una botella o un tubo. Los kits pueden incluir ARNg y una cadena protectora no unida para estabilizar el ARNg. Los kits pueden incluir el ARNg como RTDD que interactúa directamente con una RT de interés y, opcionalmente, con una cadena protectora adicional unida al menos parcialmente a la secuencia guía. Por lo tanto, los kits pueden incluir el ARNg en forma de una secuencia de nucleótidos parcialmente de cadena doble. En algunas realizaciones, el kit incluye instrucciones en uno o más idiomas, por ejemplo, en más de un idioma. Las instrucciones pueden ser específicas para las aplicaciones y los métodos descritos en este documento.

En un aspecto adicional de acuerdo con la presente divulgación, se divulga por lo tanto un kit que comprende al menos un componente o todos los componentes de al menos un complejo molecular artificial de la presente divulgación, en donde al menos un complejo molecular puede proporcionarse como un complejo ensamblado previamente, o en donde al menos un complejo molecular puede proporcionarse en forma de sus constituyentes separados, que comprenden al menos un polipéptido SSN, o una secuencia expresable que codifica el mismo, al menos una secuencia de RTDD y al menos una secuencia de ácido nucleico de la plantilla de reparación. El suministro separado de los diferentes constituyentes del complejo molecular, por ejemplo en forma de polvo seco o liofilizado para secuencias de ácido nucleico, garantiza una mayor estabilidad de las secuencias de ácido nucleico, en particular de la construcción RTDD/RT, en particular si las secuencias de ARN son mucho menos estables que los polipéptidos que se proporcionan en el kit. Al menos una proteína SSN y, opcionalmente, al menos un dominio de interacción que interactúa con la misma o está conectado a la misma puede administrarse dentro de un tampón de almacenamiento adecuado, por ejemplo, que comprende NaCl 300 mM, Tris-HCl 10 mM, EDTA 0.1 mM, OTT 1 mM, glicerol al 50 %, pH 7.4 a 25 °C para un polipéptido Cas9. El kit puede comprender además un tampón de reacción adecuado que incluye iones adecuados, por ejemplo, Mg2+ para una enzima Cas9, necesarios para la actividad de un polipéptido de CRISPR respectivo.

En algunas realizaciones de la presente divulgación, un kit comprende uno o más reactivos para usar en un proceso que utiliza uno o más de los elementos descritos en el presente documento. Los reactivos pueden proporcionarse en cualquier recipiente adecuado. Por ejemplo, un kit puede proporcionar uno o más tampones de reacción o almacenamiento. Los reactivos pueden proporcionarse en una forma que sea utilizable en un ensayo particular, o en una forma que requiera la adición de uno o más componentes antes de su uso (p. ej., en forma concentrada o liofilizada). Un tampón puede ser cualquier tampón, incluyendo, pero sin limitarse a, un tampón de carbonato de sodio, un tampón de bicarbonato de sodio, un tampón de borato, un tampón Tris, un tampón MOPS, un tampón HEPES y combinaciones de los mismos. En algunas realizaciones, el tampón es alcalino. En algunas realizaciones, el tampón tiene un pH de aproximadamente 7 a aproximadamente 10. En algunas realizaciones, el kit comprende uno o más oligonucleótidos correspondientes a una secuencia guía para la inserción en un vector para enlazar operativamente la secuencia guía y un elemento regulador. En algunas realizaciones, el kit comprende un polinucleótido de la plantilla de recombinación homóloga. En algunas realizaciones, el kit comprende uno o más de los vectores y/o uno o más de los polinucleótidos descritos en el presente documento. El kit puede permitir ventajosamente proporcionar todos los elementos de los sistemas de la divulgación.

Alternativamente, el kit puede comprender los componentes de SSN como ARNm liofilizado o como proteína liofilizada, respectivamente. En otra realización de acuerdo con este aspecto, el kit puede comprender un componente adicional que proporciona un vehículo o sistema de suministro adecuado además de un componente que comprende el o los componentes de SSN como complejo molecular. En una realización adicional de acuerdo con este aspecto, al menos un polipéptido SSN y al menos una secuencia de RTDD/RT se presentan como al menos dos componentes, siendo compatibles entre sí más de una SSN y/o RTDD/RT Al menos un polipéptido SSN puede presentarse como vector para ser transformado o transfectado en una célula de interés, mientras que al menos una secuencia de RTDD/RT puede presentarse como componente separado. Por lo tanto, un kit de acuerdo con la presente divulgación puede ser adecuado para el uso simultáneo o posterior de los diferentes componentes en caso de que esté presente más de un componente. Opcionalmente, un kit de acuerdo con este aspecto puede comprender instrucciones de uso, particularmente instrucciones de uso específicas para una célula objetivo a editar. En otra realización de acuerdo con este aspecto de la presente divulgación, el kit se desarrolla específicamente para proporcionar un kit de desarrollo de características para una planta específica de interés que incluye herramientas específicas para lograr la modificación de características deseada. De acuerdo con esta realización, el kit comprende una plantilla de reparación específica, que está configurada para transferir el rasgo de interés o para tratar una enfermedad de interés, o para modificar una secuencia objetivo de ADN de interés en un locus objetivo de ADN de interés en una célula tal como una célula de mamífero o una célula de la planta. Además, el kit comprende una enzima SSN adecuada, o dos nickasas SSN, asociadas como un complejo con al menos un RTDD, en donde el RTDD comprende al menos una primera parte de secuencia que interactúa directamente con al menos una SSN una segunda parte de secuencia configurada para interactuar directamente con al menos una secuencia de ácido nucleico de la plantilla de reparación (RT), y en donde al menos un RTDD está configurado para asociarse o poder asociarse con una plantilla de reparación que porta el rasgo específico de interés.

Un kit de acuerdo con una realización de la presente divulgación es tanto una célula de la planta así como un rasgo específico, y el uso de dicho kit permite el rápido direccionamiento y modificación de un locus de ADN genómico de interés para lograr el desarrollo de rasgos. En una realización, el RTDD es un ARNg, en donde los componentes del ARNg ya están diseñados para interactuar con motivos PAM y una enzima de CRISPR de interés y la plantilla de reparación proporcionada presenta la secuencia que se insertará o modificará de manera conveniente.

En un aspecto de acuerdo con la presente divulgación, se proporciona así una planta, una célula de la planta, un material de la planta o un derivado, o una progenie del mismo que comprende o esta editado por al menos un complejo molecular artificial de acuerdo con la presente divulgación (realizaciones de la invención relacionadas con una planta, célula de la planta o material de la planta que comprende un complejo de la presente divulgación). En un aspecto adicional de acuerdo con la presente divulgación, se proporciona una planta, una célula de la planta, un material de la planta o un derivado, o una progenie de los mismos, que se ha modificado con al menos un complejo molecular artificial.

En otro aspecto adicional de acuerdo con la presente divulgación, se proporciona un método para modificar al menos una secuencia objetivo de ADN, que comprende las siguientes etapas: (i) proporcionar al menos una célula y/o un genoma procariota, eucariota o viral (las realizaciones de la presente invención están relacionadas con al menos una célula y/o genoma vegetal) que comprende al menos una secuencia de complementariedad genómica y al menos una secuencia objetivo de ADN en una región genómica de interés; (ii) proporcionar al menos un complejo molecular artificial como se define en el presente documento; (iii) poner en contacto al menos un complejo molecular artificial con al menos una secuencia objetivo de ADN en condiciones adecuadas para conseguir (a) la interacción de al menos una nucleasa específica del sitio con al menos una secuencia objetivo de ADN; y (b) emparejamiento de bases complementarias de al menos una secuencia de ácido nucleico de la plantilla de reparación con al menos una secuencia de complementariedad genómica para lograr el reconocimiento de al menos una secuencia de complementariedad y la inducción de al menos una rotura de ADN por al menos una nucleasa específica del sitio, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación dirige la reparación dirigida por homología en el sitio de al menos una secuencia objetivo de ADN; y (iv) obtener al menos una célula y/o genoma procariota, eucariota o viral que comprende una modificación en al menos una secuencia objetivo de ADN; donde, en realizaciones de la presente invención, al menos un dominio de acoplamiento de la plantilla de reparación, o la secuencia de ácido nucleico que codifica el mismo, se selecciona de una proteína VirD2 de Agrobacterium.

Debido al hecho de que el complejo molecular artificial se puede utilizar dentro de cualquier tipo de célula de interés, es posible diseñar un par SSN/RTDd /RT para la modificación de cualquier región genómica, incluida la región episomal o epigenética de un organismo de interés, que comprende secuencias objetivo de ADN procariota, eucariota o viral o secuencias epigenéticas de interés. Para realizaciones que modifican el genoma de un virus, es adecuado transferir el genoma viral, o la parte relevante del mismo, a un vector de interés y propagar y modificar el genoma viral dentro de una célula huésped adecuada (por ejemplo, una célula procariota o eucariota) que porta el vector que comprende el genoma viral, o la parte relevante del mismo.

Una célula "procariota", como se usa en el presente documento, se refiere a un organismo unicelular que carece de un núcleo unido a una membrana (carión), mitocondrias o cualquier otro orgánulo unido a una membrana y comprende arqueas y bacterias.

Un genoma viral puede derivarse de cualquier virus que comprenda un genoma codificado por ARN o ADN.

En una realización de la presente divulgación, al menos una secuencia de ácido nucleico de la plantilla de reparación y/o al menos un dominio de acoplamiento de la plantilla de reparación del complejo molecular artificial se proporcionan a al menos una célula procariota o eucariota (con realizaciones de la invención en relación con al menos una célula de la planta) independientemente de que al menos una nucleasa específica del sitio de al menos un complejo molecular y al menos un complejo molecular artificial se ensamble, o se ensamble parcialmente, dentro de al menos una célula o genoma procariota, eucariota, o viral.

En una realización, al menos una secuencia de RTDD/RT del complejo molecular artificial se proporciona a al menos una célula procariota o eucariota independientemente de al menos un polipéptido SSN de al menos un complejo molecular y al menos un complejo molecular artificial se ensambla dentro, o parcialmente ensamblado, de al menos una célula procariota o eucariota (con realizaciones de la invención relacionadas con al menos una célula de la planta).

Al menos un complejo molecular artificial, como se detalló anteriormente, se puede proporcionar como un complejo ensamblado in vitro que luego se introduce en al menos una célula objetivo de interés. Alternativamente, algunos o todos los al menos un polipéptido SSN y/o al menos una secuencia de RTDD y/o al menos una secuencia de ácido nucleico de la plantilla de reparación pueden insertarse como una construcción genética de ARN o de ADN y pueden producirse in vivo para que tenga lugar el ensamblaje final de al menos un complejo molecular in vivo. En una realización preferida, al menos un complejo molecular está asociado ex vivo y al menos un complejo molecular que comprende al menos un polipéptido SSN, al menos una secuencia de ácido nucleico guía y al menos una secuencia de ácido nucleico de la plantilla de reparación se proporciona simultáneamente a al menos una célula mediante un vector de suministro adecuado que permite la introducción funcional de al menos un complejo molecular en al menos una célula objetivo que comprende al menos una secuencia objetivo de ADN de interés.

En otra realización preferida, al menos una SSN y opcionalmente al menos un dominio de interacción se proporciona como proteína de fusión en un plásmido que se producirá dentro de una célula que comprende una secuencia objetivo de ADN que se modificará. Los demás componentes del complejo molecular artificial pueden entonces ser producidos ex vivo. Por ejemplo, se puede usar un sistema de vector inducible para producir al menos una SSN y, opcionalmente, al menos un dominio de interacción. Tan pronto como se alcance un nivel de expresión suficiente, el complejo RTDD/RT se puede introducir en una célula objetivo y se puede ensamblar el complejo molecular artificial de acuerdo con la presente divulgación in situ.

En otra realización, al menos un complejo molecular artificial completo es un complejo molecular artificial ensamblado ex vivo.

Las "condiciones adecuadas" o "condiciones de reacción adecuadas" como se hace referencia en el presente documento en el contexto de los métodos de acuerdo con la presente divulgación se refieren a condiciones que permiten tanto el crecimiento como el desarrollo de una célula u organismo, incluidas las células procariotas o eucariotas, que son transformadas o fabricadas y las condiciones necesarias para lograr la integración estable o la introducción transitoria de una construcción genética de interés en al menos una célula u organismo de interés. Las condiciones para promover el crecimiento y/o la transformación de procariotas o bacterias son conocidas por el experto en la materia (véase también: Green y Sambrook, Molecular Cloning, A Laboratory Manual, 2012, Cold Spring Harbor Laboratory Press). Las condiciones para promover el crecimiento de células animales y/o para introducir material genético en células animales, particularmente de mamíferos, están disponibles para el experto en la materia para una variedad de líneas celulares diferentes (véase Green y Sambrook citado anteriormente^. Las condiciones para promover el crecimiento y desarrollo de plantas o células vegetales, incluyendo entre otros la temperatura, la luz, el agua, el oxígeno, los nutrientes minerales y el soporte del suelo, que pueden variar para diferentes especies de plantas y pueden determinarse fácilmente por el experto en la materia de la divulgación proporcionada en el presente documento. Las condiciones adecuadas adicionales para lograr la integración estable o la introducción transitoria de al menos un complejo molecular de interés depende del método de transformación seleccionado para la introducción de al menos un complejo molecular de interés, la etapa de desarrollo del material de la planta o célula de la planta a transformar y al menos un complejo molecular de interés a introducir. Dichas condiciones adecuadas pueden ser definidas por el experto a la luz de la presente divulgación que define las condiciones adecuadas para los métodos en combinación con ejemplos de complejos moleculares y vectores de suministro adecuados y técnicas de suministro como se divulga y reivindica en el presente documento.

En una realización de acuerdo con el método anterior de la presente divulgación, al menos una célula eucariota es una célula de la planta, preferiblemente una célula de la planta de una planta seleccionada del grupo que consiste en Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea spp., que incluye Zea mays, Setaria italica, Oryza minuta, Oryza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Secale cereale, Triticale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta spp., incluyendo Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Nicotiana benthamiana, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Marus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine nexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oleracea, Brassica rapa, Raphanus sativus, Brassica juncacea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Gossypium sp., Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, Helianthus annuus, Helianthus tuberosus and Allium tuberosum o cualquier variedad o subespecie perteneciente a una de las plantas antes mencionadas.

Con respecto a las células vegetales como objetivos, por ejemplo, una variedad de métodos de transformación y/o transfección están disponibles para los expertos en el campo. Para protoplastos de maíz, por ejemplo, se divulga un método adecuado en Sheen, J. 2002 ("A transient expression assay using maize mesophyll protoplasts"). Para protoplastos de Arabidopsis, un protocolo adecuado está disponible en: doi.org/10.1038/ngrot.2007.199 o se puede recuperar en http://www.nature.com/nprot/journal/v2/nHfull/nprot.2007.199.html. Para tabaco y otros protoplastos de dicotiledóneas, se encuentra disponible un protocolo adecuado en www.plantphysiol.org/cgi/doi/10.1104/ pp.112.205179. El experto en la materia que tenga conocimiento de la presente divulgación y esté al tanto de los protocolos citados puede definir un método adecuado para introducir un complejo molecular de acuerdo con la presente divulgación en un protoplasto vegetal derivado de una planta monocotiledónea o dicotiledónea.

Los protoplastos son muy útiles para probar tecnologías y reactivos de edición de genes, pero para la regeneración de plantas editadas con genes no siempre son el tipo de célula preferido, ya que muy pocas especies de plantas se regeneran eficientemente a partir de protoplastos. En estos casos, los tejidos preferidos para la mayoría de las especies de plantas son los embriones inmaduros, los callos embriogénicos, los embriones fertilizados, los meristemos de plantas intactas, el polen, el tubo del polen o los óvulos, las células embriogénicas en suspensión u otros tipos de células con potencial regenerativo. Un método común de suministro físico es el bombardeo de células con partículas de oro o tungsteno recubiertas de ADN o proteínas, mientras que un método común asistido biológicamente utiliza Agrobacterium o un vector viral (modificado) como se divulga en el presente documento.

La o las "células meristemáticas" a las que se hace referencia de acuerdo con la presente divulgación pertenecen a un tipo de tejido dentro de una planta que también se denomina meristemo o cambium o tejido formativo. Al igual que las células madre de los organismos animales, las células meristemáticas de las plantas que representan células indiferenciadas tienen la capacidad intrínseca de desarrollarse y diferenciarse en tipos de células especializadas, de acuerdo con la predisposición genética y otros factores ambientales y de desarrollo. En los organismos vegetales, los meristemos no solo están presentes durante el desarrollo del embrión, sino que se pueden encontrar durante todo el ciclo de vida de una planta, de modo que una modificación genética específica de células o tejidos meristemáticos de acuerdo con la presente divulgación no se limita a embriones de plantas o plántulas, sino que también puede llevarse a cabo en plántulas más grandes y plantas más maduras, por ejemplo, cuando se dirige a los meristemos que forman la base para los órganos reproductivos de la planta, por ejemplo, la borla o espiga de maíz.

De acuerdo con una realización de acuerdo con los diversos aspectos de acuerdo con la presente divulgación, una célula meristemática puede ser una célula de la planta madura o inmadura de un embrión de planta o plántula de una planta que comprende al menos una célula meristemática o tejido meristemático.

Para ciertos enfoques de edición del genoma, podría ser deseable una integración estable del complejo molecular que codifica el o los casetes de expresión, donde un organismo transgénico que porta una construcción deseada de interés, o una parte de la misma, puede heredar una construcción insertada de manera estable a la progenie de un célula de la planta de interés inicialmente transformada o transfectada. Dicha integración estable puede tener lugar en cualquier región genómica de un organismo, tal como un organismo eucariota, incluyendo el genoma nuclear así como el genoma extranuclear, incluyendo el genoma de plástidos.

Una introducción transitoria podría ser deseable, en caso de que se desee un cierto efecto mediante la introducción de un complejo molecular de interés, o una parte del mismo, pero la construcción por sí misma no debe ser heredado a una descendencia de la célula inicialmente. Por razones regulatorias, tal enfoque podría ser especialmente adecuado para ciertas aplicaciones, particularmente con células vegetales, tejidos, órganos o material como estructura que comprende la secuencia objetivo de ADN a modificar.

El término "integración dirigida" o "integración funcional", como se usa en el presente documento, se refiere a la integración de una construcción genética de interés en al menos una célula, que permite la transcripción y/o traducción y/o la actividad catalítica y/o la actividad de unión incluyendo la unión de una molécula de ácido nucleico a otra molécula de ácido nucleico, incluyendo ADN o ARN, o la unión de una proteína a una estructura objetivo dentro de al menos una célula. Cuando sea pertinente, la integración funcional tiene lugar en un determinado compartimento celular de al menos una célula, incluyendo el núcleo, el citosol, la mitocondria, el cloroplasto, la vacuola, la membrana, la pared celular y similares. En consecuencia, el término "integración funcional" -en contraste con el término "integración estable" detallado anteriormente- implica que el complejo molecular de interés se introduce en al menos una célula por cualquier medio de transformación, transfección o transducción por medios biológicos, incluida la transformación por Agrobacterium, o por medios físicos, incluido el bombardeo de partículas, así como la etapa posterior, en donde el complejo molecular ejerce su efecto dentro o sobre al menos una célula en la que se introdujo. Según la naturaleza de la construcción genética a introducir, dicho efecto naturalmente puede variar e incluir, solo o en combinación, entre otros, la transcripción de un ADN codificado por la construcción genética a un ácido ribonucleico, la traducción de un ARN a una secuencia de aminoácidos, la actividad de una molécula de ARN dentro de una célula, que comprende la actividad de un ARN guía, o un miARN o un ARNip para su uso en la interferencia de ARN y/o una actividad de unión, incluida la unión de una molécula de ácido nucleico a otra molécula de ácido nucleico, incluido el ADN o el ARN, o la unión de una proteína a una estructura objetivo dentro de al menos una célula, o incluida la integración de una secuencia suministrada a través de un vector o una construcción genética, ya sea de forma transitoria o estable. Dicho efecto también puede comprender la actividad catalítica de una secuencia de aminoácidos que representa una enzima o una parte catalíticamente activa de la misma dentro de al menos una célula y similares. Dicho efecto logrado tras la integración funcional del complejo molecular de acuerdo con la presente divulgación puede depender de la presencia de secuencias reguladoras o secuencias de localización que están comprendidas por la construcción genética de interés como es conocido por el experto en la materia.

Como se detalló anteriormente, los métodos de acuerdo con la presente divulgación dirigidos a células pluripotentes o multipotentes proporcionan la ventaja de que tanto la transformación como el desarrollo adicional de al menos una célula transformada, particularmente una célula meristemática, pueden tener lugar in planta obviando la necesidad de engorrosas etapas de cultivo in vitro para la regeneración de una planta o material de la planta a partir de la misma. Sin embargo, en determinadas realizaciones, podría ser adecuado explantar o diseccionar una célula, tejido, órgano o material de la planta para su posterior cultivo, cribado o ensayo, de acuerdo con las necesidades específicas. Varios métodos para el cultivo in vitro de una célula de la planta, tejido, órgano o material están disponibles para el experto en la materia.

Por lo tanto, podría ser deseable una integración estable, donde una planta transgénica que porta una construcción de interés deseada, o una parte de la misma, se inserta de manera estable y la construcción insertada o parte de la misma se hereda a la progenie de una célula de la planta de interés inicialmente transformada. Dicha integración estable puede tener lugar en cualquier región genómica de la planta, tanto en el genoma nuclear como en el genoma extranuclear, incluido el genoma de plástidos de una célula de la planta. Además, los complejos moleculares artificiales de acuerdo con la presente divulgación pueden usarse para crear una modificación epigenética. En otro aspecto, se divulga un método de evaluación funcional y cribado de genes. El complejo molecular artificial de la presente divulgación se puede usar, por lo tanto, para administrar con precisión dominios funcionales, para activar o reprimir genes o para alterar el estado epigenético alterando con precisión el sitio de metilación en un locus específico de interés. Un método de la divulgación puede usarse para crear una planta, un animal o una célula que puede usarse para modelar y/o estudiar condiciones genéticas o epigenéticas de interés, tal como un modelo de mutaciones de interés o un modelo de enfermedad. Como se usa en el presente documento, "enfermedad" se refiere a una enfermedad, trastorno o indicación en un sujeto. Por ejemplo, un método de la divulgación puede usarse para crear un animal o una célula que comprende una modificación en una o más secuencias de ácido nucleico asociadas con una enfermedad, o una planta, animal o célula en la que se alteran la expresión de una o más secuencias de ácido nucleico asociadas a una enfermedad. Tal secuencia de ácido nucleico puede codificar una secuencia de proteína asociada a una enfermedad o puede ser una secuencia de control asociada a una enfermedad. Por consiguiente, se entiende que en las realizaciones de la divulgación, una planta, sujeto, paciente, organismo o célula puede ser un sujeto, paciente, organismo o célula no humano. Por lo tanto, la divulgación proporciona una planta, un animal o una célula, producidos por los presentes métodos, o una progenie de los mismos. La progenie puede ser un clon de la planta o el animal producido, o puede ser el resultado de la reproducción sexual al cruzarse con otros individuos de la misma especie para introgresar otros rasgos deseables en su descendencia. La célula se puede proporcionar in vivo o ex vivo en los casos de organismos multicelulares, particularmente animales o plantas. En el caso de que la célula se cultive, se puede establecer una línea celular si se cumplen las condiciones de cultivo apropiadas y si la célula se adapta adecuadamente para este propósito (por ejemplo, una célula madre). También se prevén líneas celulares bacterianas producidas por la divulgación. Por lo tanto, también se prevén líneas celulares.

Una introducción transitoria podría ser deseable, en caso de que se desee un cierto efecto, por ejemplo, un efecto silenciador, una manipulación dirigida, que comprenda una introducción o una eliminación, mediante la introducción de una construcción genética de interés, o una parte de la misma, pero la construcción por sí misma no debería heredarse a una progenie de la célula inicialmente transformada.

En otra realización más del aspecto anterior de acuerdo con la presente invención, la introducción de al menos un complejo molecular de interés, o partes del mismo que incluyen el ARNg y/o la RT, se lleva a cabo usando un medio seleccionado del grupo que consiste en un dispositivo adecuado para el bombardeo de partículas, incluida una pistola de genes, incluida una pistola manual de genes (p. ej., Helios® Gene Gun System, BIO-RAD) o una pistola estacionaria de genes, transformación, incluida la transformación usando Agrobacterium spp. o usando un vector viral, microinyección, electroporación, tecnología de filamentos, incluida la tecnología de filamentos de carburo de silicio, y química, por ejemplo, usando fosfato de calcio, dendrímeros, liposomas o polímeros catiónicos, y no química, por ejemplo, usando electroporación, sonoporación, transfección óptica usando un láser, fusión de protoplastos, impalefección, administración hidrodinámica de genes de ADN mediante la inyección de una construcción de suministro en un órgano, tal como el hígado, de un animal, tal como un animal roedor, transfección o una combinación de los mismos.

En ciertas realizaciones, al menos una célula eucariota es una célula de la planta meristemática, y la célula de la planta, después de la introducción del complejo molecular artificial de acuerdo con la presente divulgación, se cultiva adicionalmente en condiciones adecuadas hasta que se alcanza la etapa de desarrollo de madurez de la inflorescencia para obtener una planta o material de la planta que comprende una modificación de interés mediada por al menos un complejo molecular de acuerdo con la presente divulgación. Varios protocolos están, por ejemplo, disponibles para el experto en la materia para producir polen germinable y viable a partir de espigas de maíz cultivadas in vitro, por ejemplo en Pareddy DR et al. (1992) Maturation of maize pollen in vitro. Plant Cell Rep 11 (10): 535-539. doi:10.1007/BF00236273, Stapleton AE et al., (1992) Immature maize spikelets develop and produce pollen in culture. Plant Cell Rep 11 (5-6):248-252 o Pareddy DR et al. (1989) Production of normal, germinable and viable pollen from in vitro-cultured maize tassels. Theor Appl Genet 77 (4): 521-526. Esos protocolos están entre otros basados en la escisión de la borla, la esterilización de la superficie y el cultivo en un medio con kinetina para promover el crecimiento y la maduración de la borla. Después de que se forman las espiguillas, se puede realizar una cosecha continua de anteras. Después de la extrusión, las anteras serán desecadas hasta que salga el polen. Alternativamente, se pueden diseccionar las anteras y arrojar el polen en un medio líquido que posteriormente se utiliza para polinizar las mazorcas.

"Madurez de la inflorescencia", como se usa en el presente documento, se refiere al estado, cuando la inflorescencia inmadura de una planta que comprende al menos una célula meristemática ha alcanzado una etapa de desarrollo, cuando una inflorescencia madura, es decir, una inflorescencia estaminada (masculina) o una inflorescencia pistilada (femenina), se logra y así se presenta un gameto del polen (masculino) o del óvulo (femenino) o de ambos. Dicha etapa de la fase reproductiva de una planta es especialmente importante, ya que el material de la planta obtenido puede utilizarse directamente para la polinización de otra planta o para la fertilización con el polen de otra planta.

En una realización adicional de acuerdo con el método anterior de la presente divulgación, la modificación de al menos una secuencia objetivo de ADN es un enfoque de edición del genoma seleccionado del grupo que consiste en mejora del rendimiento, tolerancia al estrés abiótico, incluido el estrés por sequía, estrés osmótico, estrés por calor, estrés por frío, estrés oxidativo, estrés por metales pesados, estrés por sal o anegamiento, tolerancia al estrés biótico, incluida la tolerancia a los insectos, tolerancia a las bacterias, tolerancia a los virus, tolerancia a los hongos o tolerancia a los nematodos, resistencia a los herbicidas, incluido el glifosato, glufosinato, inhibidores de acetolactato sintasa (ALS) y Dicamba, resistencia al hospedaje, tiempo de floración, resistencia al desmoronamiento, color de la semilla, composición del endospermo, contenido nutricional, modificación de marcadores fenotípicos o modificación metabólica, incluida la edición del genoma para permitir un enfoque de farmacología molecular en al menos una célula de la planta. Los marcadores fenotípicos pueden ser objetivos preferidos para los enfoques de coedición, por ejemplo, para monitorear la eficiencia de la edición.

En otra realización de la presente divulgación, el desarrollo de rasgos se efectúa para una célula procariota o un genoma viral, por ejemplo, para proporcionar a una célula procariota una vía metabólica modificada adecuadamente para producir un producto de interés, o para proporcionar un genoma viral atenuado.

En otra realización de acuerdo con el método anterior de la presente divulgación, la modificación de al menos una secuencia objetivo de ADN es un enfoque de edición del genoma, para modificación ex vivo de una célula inmune en al menos una célula eucariota, o una célula de mamífero, o un leucocito de mamífero, para obtener una célula modificada adecuada para tratar una enfermedad viral o para inmunoterapia, especialmente inmunoterapia contra el cáncer.

En una realización, el método anterior de acuerdo con la presente divulgación es un método para modificar una célula eucariota, con realizaciones de la invención relacionadas con al menos una célula de la planta, de una manera específica para proporcionar una planta modificada genéticamente, preferiblemente no transgénica, en donde el método puede entre otros ser un método para el desarrollo de rasgos. Por ejemplo, se puede introducir una sustitución altamente específica del sitio de 1,2, 3 o más nucleótidos en la secuencia codificante de un gen vegetal para producir sustituciones de uno o más aminoácidos que conferirán tolerancia a al menos un herbicida tal como glifosato, glufosinato, Dicamba o un herbicida inhibidor de la acetolactato sintasa (ALS). Además, en otra realización, las sustituciones de uno o más aminoácidos en la secuencia codificante de un gen de una planta de repetición rica en leucina del sitio de unión de nucleótidos (NBS-LRR) que alterará el espectro de reconocimiento de patógenos de la proteína para optimizar la resistencia a enfermedades de la planta. En otra realización más, una secuencia potenciadora pequeña o un sitio de unión del factor de transcripción se puede modificar en un promotor endógeno de un gen vegetal o se puede introducir en el promotor de un gen vegetal para alterar el perfil de expresión o la fuerza del gen vegetal regulado por el promotor. El perfil de expresión se puede alterar a través de varias modificaciones, introducciones o eliminaciones en otras regiones, tal como intrones, regiones 3' no traducidas, secuencias potenciadoras en cis o trans. En otra realización adicional, el genoma de una célula de la planta, preferiblemente una célula de la planta meristemática, puede modificarse de manera que la planta resultante de la célula meristemática modificada pueda producir una sustancia química o compuesto de interés agronómico o farmacéutico, por ejemplo insulina o análogos de insulina, anticuerpos, una proteína con una función enzimática de interés, o cualquier otro compuesto farmacéuticamente relevante adecuado como medicamento, como suplemento dietético o como producto para el cuidado de la salud.

En otro aspecto, la edición de rasgos de acuerdo con los métodos de la presente divulgación proporciona un método de edición de rasgos para lograr el tratamiento de una enfermedad y/o afección y/o prevenir la infección/infestación de insectos en una planta que comprende modificar material genético cromosómico o extracromosómico de dicha planta mediante el uso de cualquiera de los métodos anteriores. Los ejemplos no limitantes de las enfermedades y/o afecciones que se pueden tratar con los métodos inventados incluyen la pudrición del tallo por antracnosis, la pudrición de la mazorca por Aspergillus, la pudrición común de la mazorca de maíz, la pudrición de la mazorca de maíz, la roya común del maíz, la pudrición de la mazorca por Diploidía, el rayado de la hoja por Diploidía, la pudrición del tallo por Diploidía , mildiú velloso, mancha ocular, pudrición de la mazorca por Fusarium, pudrición del tallo por Fusarium, pudrición de la mazorca por Gibberella, pudrición del tallo por Gibberella, marchitamiento de Goss y tizón de la hoja, mancha gris de la hoja, tizón de la cabeza, tizón de la hoja del maíz del norte, mancha marrón por Physoderma, Pythium, tizón de la hoja del sur, Herrumbre del Sur y Marchitez y Tizón Bacteriano de Stewart, y combinaciones de los mismos.

Ejemplos no limitantes de los insectos que causan, directa o indirectamente, enfermedades y/o afecciones que se pueden tratar con los métodos inventados incluyen gusano cogollero, escarabajo asiático de jardín, gusano cortador negro, chinche apestoso marrón marmolado, chinche apestoso marrón, barrenador común del tallo, picudos del maíz, gusano cogollero, áfido de la hoja del maíz, gusano de la raíz del maíz, gusano de la raíz del maíz que se alimenta de seda, barrenador europeo del maíz, gusano cogollero, colaspis de la uva, barrenador del lúpulo, escarabajo japonés, exploración del gusano cogollero, escarabajo del maíz, gusano del maíz, escarabajo de la hoja del maíz del sur, barrenador del maíz del sudoeste, araña roja, escarabajo de la caña de azúcar, gusano cortador de frijol occidental, larva blanca y gusanos de alambre, y combinaciones de los mismos. Los métodos inventados también son adecuados para prevenir infecciones y/o infestaciones de una planta por cualquiera de dichos insectos.

Ejemplos no limitativos de características que pueden introducirse mediante este método son la resistencia o tolerancia a plagas de insectos, tales como gusanos de la raíz, barrenadores del tallo, gusanos cortadores, escarabajos, pulgones, chicharritas, gorgojos, ácaros y chinches. Estos podrían realizarse mediante la modificación de genes de plantas, por ejemplo, para aumentar la resistencia inherente de una planta a las plagas de insectos o para reducir su atractivo para dichas plagas. Otros rasgos pueden ser la resistencia o tolerancia a nematodos, patógenos bacterianos, fúngicos o virales o sus vectores. Otros rasgos más podrían ser un uso de nutrientes más eficiente, como un mayor uso de nitrógeno, mejoras o introducciones de eficiencia en la fijación de nitrógeno, una mayor eficiencia fotosintética, como la conversión de plantas C3 a C4. Sin embargo, otros rasgos podrían ser una mayor tolerancia a los factores estresantes abióticos, como la temperatura, el suministro de agua, la salinidad, el pH, la tolerancia a los extremos en la exposición a la luz solar, la eficiencia en el uso del nitrógeno, la eficiencia en el uso del fósforo, la eficiencia en el uso del agua y el rendimiento de cultivos o biomasa. Los rasgos adicionales pueden ser características relacionadas con el sabor, la apariencia, los perfiles de nutrientes o vitaminas de las porciones comestibles o alimentables de la planta, o pueden estar relacionados con la longevidad de almacenamiento o la calidad de estas porciones. Finalmente, los rasgos se pueden relacionar con cualidades agronómicas como la resistencia al hospedaje, aplastamiento, el tiempo de floración, la maduración, la emergencia, la cosecha, la estructura de la planta, el vigor, el tamaño, el rendimiento y otras características. Para conseguir la modificación de rasgos anterior, el método de acuerdo con la presente divulgación comprende modificar material genético cromosómico o extracromosómico de una planta o célula de la planta mediante el uso de cualquiera de los métodos anteriores.

En una realización de acuerdo con el método anterior de acuerdo con la presente divulgación, la célula objetivo es una célula procariota y la modificación comprende al menos una modificación de una región genómica objetivo de interés de al menos una célula procariota, en donde la modificación es adecuada para modular o aumentar la resistencia de la bacteria frente al estrés biótico o abiótico, incluida la resistencia frente a los antibióticos, o en donde la modificación es adecuada para mejorar la resistencia a los fagos de al menos una célula procariota. En otra realización, la modificación comprende insertar un gen de interés en un sitio objetivo de ADN de al menos una célula procariota de interés, por ejemplo, para insertar una secuencia que codifica una proteína marcadora fluorescente u otro marcador seleccionable en al menos un sitio objetivo de ADN de interés. En otra realización, la modificación comprende la eliminación, es decir, la eliminación de al menos un sitio objetivo de ADN de interés en al menos una célula procariota. Como las células procariotas no se diferenciarán más, pero pueden heredar directamente al menos una modificación introducida de interés para su progenie y como las células procariotas suelen tener un tiempo de generación muy corto en comparación con las células eucariotas, una modificación introducida por al menos un RTDD/RT en forma de al menos un complejo molecular artificial de acuerdo con la presente divulgación se puede lograr rápidamente y la población resultante de células modificadas se puede obtener y analizar en un período de tiempo muy corto.

En ciertas realizaciones de la presente divulgación, el método anterior de acuerdo con la presente divulgación puede comprender además la siguiente etapa: (v) identificar y/o seleccionar al menos una célula procariota o eucariota (con realizaciones de la invención relacionadas con al menos una célula de la planta y/o genoma) que comprende la modificación en al menos una secuencia objetivo de ADN, o identificar una modificación a un genoma viral tal como se propaga en una célula procariota o eucariota.

Los métodos para analizar o identificar una modificación de acuerdo con la presente divulgación como se efectúa en el genoma de al menos una célula procariota o eucariota o un genoma viral son conocidos por los expertos en la técnica y comprenden, pero no se limitan a, la reacción en cadena de la polimerasa (PCR), incluyendo entre otros PCR cuantitativa en tiempo real, PCR multiplex, RT-PCR, PCR anidada, PCR analítica y similares, microscopía, incluida microscopía de campo claro y oscuro, tinción de dispersión, contraste de fase, fluorescencia, confocal, contraste de interferencia diferencial, deconvolución, microscopía electrónica, microscopía UV, microscopía IR, microscopía de sonda de barrido, el análisis del metabolito de una célula, el análisis de un espectro de resistencia alterado de una célula modificada, análisis de ARN, análisis de proteoma, ensayos funcionales para determinar una integración funcional, por ejemplo, de un gen marcador o un transgén de interés, o de una eliminación, análisis de Southern, secuenciación, incluida la secuenciación profunda y combinaciones de los mismos. A continuación, las células que comprenden la modificación deseada pueden seleccionarse para un cultivo adicional o cualquier otra etapa de fabricación posterior.

En otro aspecto de acuerdo con la presente invención, se proporciona un método para fabricar una planta o célula de la planta que comprende las siguientes etapas: (i) realizar un método para modificar al menos una secuencia objetivo de ADN en una célula eucariota como se detalló anteriormente, en donde al menos una célula eucariota es una célula de la planta; (ii) obtener al menos una planta o una progenie de la misma a partir de al menos una célula de la planta de la etapa (i); (iii) opcionalmente: determinar la modificación en al menos una secuencia objetivo de ADN en al menos una célula de al menos una planta o una progenie de la misma.

Células, tejidos, órganos y materiales de la planta adecuados para realizar este aspecto se detallaron anteriormente. El término "fabricación" de acuerdo con la presente divulgación debe interpretarse en sentido amplio y comprende cualquier forma de manipulación genética realizada en el material genético de una planta o célula de la planta. Puede tener lugar la provisión de al menos un complejo molecular artificial que comprende al menos una secuencia de RTDD/RT que comprende al menos un dominio de acoplamiento de la plantilla de reparación y al menos un ácido nucleico de la plantilla de reparación y al menos un polipéptido SSN, que comprende opcionalmente un dominio de interacción, de manera que permita la acción transitoria o la integración estable, o una combinación de las mismas, de los diferentes componentes como se detalló anteriormente. Preferiblemente, al menos un complejo molecular artificial, o los diferentes componentes del mismo, se proporcionan de manera transitoria para que no tenga lugar la integración de ninguno de esos componentes efectores como tales, incluida una secuencia que codifica un ARN de ácido nucleico guía, una secuencia que codifica una ADN de ácido nucleico de la plantilla de reparación y una secuencia que codifica un polipéptido de CRISPR en el genoma de la célula objetivo de interés.

En una realización de acuerdo con el método de fabricación anterior de acuerdo con la presente invención, al menos una planta o célula de la planta se selecciona de una planta monocotiledónea o dicotiledónea, preferiblemente, donde la planta se selecciona del grupo que consiste en Zea spp., incluido Zea mays, Nicotiana benthamiana, o Beta spp, incluido Beta vulgaris, o Secale ssp., incluido Secale cereal, o Triticum ssp., incluido Triticum aestivum.

Como se detalla a lo largo de la presente divulgación, los métodos de acuerdo con la presente divulgación son adecuados y pueden adaptarse a células objetivo que pertenecen a todos los reinos de la vida, como esencia del uso de una construcción de RTDD/RT que se asocia de manera funcional en combinación con una nucleasa adecuada específica del sitio que interactúa con el RTDD es independiente de la especie y la célula, siempre que exista un mecanismo de recombinación homóloga para la reparación del ADN en la célula, pero dictada por la interacción covalente o no covalente de al menos el ARNg y al menos una RT Lo que debe determinarse individualmente para cada célula objetivo y cada objetivo es (i) la nucleasa específica del sitio o su fragmento catalíticamente activo y si el uso de un dominio de interacción, por ejemplo, como proteína de fusión, podría ser adecuado; (ii) un par de dominios de interacción de RTDD-SSN o RTDD-interacción adecuados que permitan una interacción directa de dichos componentes mediante el reconocimiento de compañeros de unión afines; y (iii) una RT adecuada y su conexión con el RTDD, donde el diseño de la RT es relevante para introducir una reparación personalizada en una secuencia objetivo de ADN de interés escindida por al menos una SSN del complejo molecular artificial y opcionalmente (para nucleasas de CRISPR) (iv) un ARNg y el polipéptido de CRISPR, que tienen que ser compatibles como se detalló anteriormente; (v) una coincidencia del ARNg de interés con un sitio PAM dentro de la región objetivo de ADN de interés; y (vi) la secuencia objetivo de ADN y la modificación objetivo a introducir. Para cualquier genoma secuenciado disponible públicamente, el diseño de secuencias de ácido nucleico adecuadas se puede elaborar por lo tanto in silico basado en la presente divulgación.

En otro aspecto más de acuerdo con la presente divulgación se proporciona el uso de al menos una secuencia de RTDD/RT de acuerdo con la presente divulgación, o el uso de un complejo molecular artificial de acuerdo con la presente divulgación para la edición del genoma en una célula procariota o eucariota. En una realización de este aspecto, el uso es para una célula eucariota, tal como una célula u organismo fúngico, animal o vegetal, o un organismo viral como se propaga en una célula procariota o eucariota. Las realizaciones de la invención se refieren al uso de un complejo molecular artificial de acuerdo con la presente divulgación para la modificación del genoma en una célula de la planta o un organismo.

De acuerdo con los diversos aspectos y realizaciones de acuerdo con la presente divulgación, una célula eucariota o un método o uso para modificar células eucariotas, incluidas las células madre, no incluye explícitamente ningún proceso de clonación de seres humanos, un proceso para modificar la identidad genética de línea germinal de los seres humanos o el uso de embriones humanos, o un método que requiera la destrucción de embriones humanos para obtener células de los mismos. Específicamente, las células de la línea germinal humana o los embriones humanos se excluyen específicamente como células u organismos objetivo para ser modificados con los complejos moleculares artificiales o mediante los métodos de acuerdo con la presente divulgación. La presente invención se describe adicionalmente con referencia a los siguientes ejemplos no limitantes.

Ejemplos

La presente invención se ilustra adicionalmente mediante los siguientes ejemplos.

Ejemplo 1: Secuencia de ácido nucleico híbrido como par de RTDD/RT adecuado para combinarse con un polipéptido Cas o Cpf1 o Argonauta

En un experimento, el ARNgu o el ADNgu con cola se hibridan a través del emparejamiento de bases complementarias y la ligadura de ARN-ADN o ADN-ADN con una plantilla de reparación de cadena sencilla. Para la asociación covalente, los oligonucleótidos de ADN sintetizados se ligan covalentemente al extremo 3' de los oligonucleótidos de ARN/ADN utilizando el protocolo del fabricante de la ligasa de ARNcs. Para la asociación no covalente, los oligonucleótidos de ARN/ADN y ADN con secuencia parcialmente complementaria se mezclan y se les permite formar complejos mediante el emparejamiento de bases de Watson-Crick. La hibridación exitosa se puede determinar en ensayos de cambio de gel. El tratamiento de alícuotas del ácido nucleico híbrido con enzimas RNasa y DNasa antes de los ensayos de cambio de gel indica que parte del ácido nucleico híbrido está compuesto de ARN y parte de ADN para aquellos experimentos que usan ARNgu. El híbrido de ácido nucleico luego se compleja con la proteína Cas9 recombinante u otra nucleasa derivada de CRISPR o Argonauta. La complejación exitosa se puede verificar tratando con proteinasa K, RNasa, DNasa y un tratamiento simulado, y observando los patrones de cambio de gel relativos. Los polipéptidos Cas recombinantes se produjeron y posteriormente se purificaron a través de una entidad comercial externa o por capacidad interna. Las diferentes arquitecturas de secuencias de ácido nucleico híbrido entre una secuencia de ácido nucleico guía como RTDD y una secuencia de ácido nucleico de la plantilla de reparación (RT) probada se muestran en las Figuras 1 y 2.

Ejemplo 2: Corte in vitro de un objetivo de ADN por un complejo de proteína Cas9 con un ácido nucleico híbrido de ARN-ADN

En un experimento, se probó la funcionalidad de la proteína Cas como una endonucleasa específica del sitio cuando se usó con la tecnología híbrida de ácido nucleico descrita. Un plásmido linealizado que contenía al menos un sitio objetivo para el ARNgu se mezcló con un complejo Cas9-ARNgu-RT como se describe en la presente divulgación. Después de la incubación en condiciones adecuadas para la actividad de la nucleasa, incluido el pH, la temperatura y los cofactores correctos, que son conocidos por los expertos en diversas nucleasas CRISPR y variantes de las mismas, el plásmido objetivo de ADN se corrió en un gel de agarosa y se observó el tamaño de las bandas indicando el corte en el sitio objetivo esperado. La escisión in vitro del ADN objetivo indicó que la RT asociada con el ARNgu como "carga" no interfirió con la función normal del complejo de Cas9 como una endonucleasa específica del sitio.

Ejemplo 3: Edición in vivo por proteína Cas9 complejada con un ácido nucleico híbrido de ARN-ADN

Para demostrar que un gen objetivo se puede editar in vivo mediante un complejo suministrado que comprende la proteína Cas9 y un ácido nucleico híbrido de ARN-ADN, se reparó un gen tdTomato no funcional contenido dentro de un plásmido transformado mediante el intercambio de un solo nucleótido para restaurar la señal fluorescente del gen tdTomato. Para determinar el uso óptimo para la edición mediante la provisión de una plantilla de reparación de ADNcs con complementariedad con la cadena objetivo o la cadena no objetivo, se compararon los complejos que portaban plantillas de reparación de cualquiera de las cadenas.

El complejo de ácido nucleico híbrido de ARN/ADN-polipéptido Cas obtenido en el Ejemplo 1 se usó para reparar un plásmido episomal objetivo, que codifica un gen tdTomato con una sola mutación puntual de A por T que crea una señal de parada temprana en la posición del codón 51. Este plásmido se introdujo en un sistema de protoplastos de maíz junto con el complejo de edición que comprende la proteína Cas9 y un ácido nucleico híbrido de ^aRN-ADN a través del suministro mediado por PEG o electroporación. Una plantilla de reparación de cadena sencilla se enlaza luego al ARNgu a través del emparejamiento de bases complementarias. La plantilla de reparación es complementaria a la región de 80 pares de bases secuencia abajo y -40 pares de bases secuencia arriba del sitio de corte. Luego, la edición exitosa da como resultado que algunas células muestren un fenotipo de fluorescencia de tdTomato debido a la reparación del gen tdTomato en al menos un plásmido contenido en ellas. La eficacia relativa de la edición con las diferentes plantillas de reparación puede evaluarse fácilmente midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 4: Edición in vivo por proteína Cas9 complejada con una RT unida al componente de ARN por unión covalente o asociada por emparejamiento de bases complementarias

Para demostrar la edición con moléculas de ácido nucleico híbrido fabricadas de diversas maneras, se usaron las condiciones óptimas identificadas en el Ejemplo 3 para evaluar la reparación del mismo plásmido episomal objetivo con enlace covalente de ácidos nucleicos híbridos o emparejamiento de bases no covalente de la plantilla de reparación con el ARNgu.

En caso de que se use un marcador, particularmente un marcador fluorescente, la edición exitosa dará como resultado que algunas células muestren un fenotipo de fluorescencia debido a la reparación del gen que codifica la fluorescencia, tal como un gen tdTomato, en al menos un plásmido contenido en ellas. A continuación, se puede evaluar la eficacia relativa de la edición con las diferentes plantillas de reparación midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 5: Edición in vivo por la proteína Cas9 complejada con un híbrido de ácido nucleico formado al unir la RT al extremo 5' o 3' del ARNgu

En un ejemplo, el método descrito en el Ejemplo 3 puede usarse para identificar una preferencia por la plantilla de reparación hibridada o enlazada al extremo 5' o 3' del ARNgu. La covalencia de enlace preferible determinada en el Ejemplo 4 se puede emplear en el presente documento. Con base en los resultados presentados en Tsai et al. ("Dimeric CRISPR RNA-guided Fokl nucleases for highly specific genome editing", Nature Biotechnology, 32, 569-576 (2014), doi:10.1038/nbt.2908) y además, Shechner et al. ("Multiplexable, locus-specific targeting of long RNAs with cRlSPR-Display", Nature Methods, 12(7), 664-670 (2015), doi:10.1038/nmeth.3433), se espera que sea preferible una fusión en 3'.

La edición exitosa da como resultado que algunas células muestren un fenotipo de fluorescencia, tal como un fenotipo de tdTomato, debido a la reparación del gen tdTomato en al menos un plásmido contenido en ellas. A continuación, se puede evaluar la eficacia relativa de la edición con las diferentes plantillas de reparación midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 6: Determinación de la longitud óptima del enlazador entre el ARNgu y la plantilla de reparación para la edición in vivo por proteína Cas9 complejada con un ácido nucleico híbrido

En un ejemplo, se usó una longitud creciente del enlazador en incrementos de 50 pares de bases hasta una longitud de 500 pares de bases entre el ARNgu y la plantilla de reparación para identificar las condiciones óptimas para la recombinación homóloga para reparar el objetivo descrito en el Ejemplo 3. El empleo de un conjunto de longitudes de enlazador ayudará a determinar la flexibilidad necesaria que se necesita dentro del híbrido para superar la geometría de la cadena objetivo de la proteína. Esto es particularmente necesario cuando se trabaja con diferentes nucleasas de CRISPR y, por lo tanto, ARNg específicos y plantillas de reparación individuales (RT) para coordinar la interacción del complejo molecular y garantizar que el complejo de CRISPR también en presencia de la RT pueda ejercer su efecto. Las condiciones del Ejemplo 3 se usaron junto con los parámetros optimizados determinados en los Ejemplos 3 a 5. El enlazador era ADN con complementariedad con la secuencia cercana al gen objetivo.

La edición exitosa dará como resultado que algunas células muestren un fenotipo de fluorescencia de tdTomato, en caso de que se use un marcador de tdTomato, debido a la reparación del gen tdTomato en al menos un plásmido contenido en ellas. La eficacia relativa de la edición con las diferentes longitudes del enlazador se puede evaluar midiendo la abundancia de células fluorescentes resultantes de cada tratamiento. Asimismo, se puede usar cualquier otro marcador seleccionable de interés, incluido cualquier marcador fluorescente adecuado para un tipo de célula de interés, marcadores de antibióticos, secuencias de etiqueta, secuencias reguladoras y similares.

Ejemplo 7: Determinar la configuración óptima de la plantilla de reparación para edición in vivo por proteína Cas9 complejada con un ácido nucleico híbrido

Para demostrar la edición con plantillas de reparación de cadena sencilla y cadena doble, se uso el ensayo in vivo descrito en el Ejemplo 3 para una comparación relativa de las dos configuraciones. Se espera que las plantillas de reparación de cadena sencillas sean mejores de acuerdo con el peso molecular más bajo y las tasas de edición más altas publicadas con oligos de ADNcs cortos que con oligos de ADNcd cortos. Sin embargo, puede ser necesario usar una plantilla de reparación de cadena doble en los casos en que sea necesario editar o insertar secuencias grandes. Las condiciones óptimas de los Ejemplos 4 y 6 pueden usarse en este ejemplo.

Un evento de edición exitoso da como resultado que algunas células muestren un fenotipo de fluorescencia, tal como un fenotipo de tdTomato, debido a la reparación del gen tdTomato en al menos un plásmido contenido en ellas. A continuación, se puede evaluar la eficacia relativa de la edición con las diferentes plantillas de reparación midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 8: Edición in vivo de un objetivo cromosómico por la proteína Cas9 complejada con un ácido nucleico híbrido de ARN-ADN

En un ejemplo, el método optimizado por los Ejemplos 3 a 7 puede usarse para realizar ediciones en un gen objetivo cromosómico. En el presente documento, se usó una planta de maíz transgénica con una inserción estable del casete de tdTomato del codón de terminación temprana para demostrar la utilidad de la invención para un objetivo cromosómico. La edición exitosa dio como resultado que algunas células mostraran un fenotipo de fluorescencia de tdTomato debido a la reparación del gen tdTomato integrado en el ADN genómico. La eficiencia de la edición se evaluó midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 9: Inserción in vivo de un casete de gen en un objetivo cromosómico por la proteína Cas9 complejada con un ácido nucleico híbrido de ARN-ADN

Para demostrar la utilidad de la invención para la inserción de un gen de longitud completa en un objetivo cromosómico, se integraron un gen informador fluorescente tdTomato y un terminador en el gen hmg13 del maíz, lo que resultó en una señal fluorescente de tdTomato debido a la expresión impulsada por el promotor endógeno para hmg13. Los resultados podrían demostrar que se pueden realizar insertos largos utilizando el método inventado y ayudarán a optimizar las condiciones para dicha inserción.

La edición exitosa da como resultado que algunas células muestren un fenotipo de fluorescencia de tdTomato debido a la inserción del gen tdTomato en el objetivo hmg13 y se pudo confirmar la posterior expresión de la proteína tdTomato. A continuación, se puede evaluar la eficiencia de edición correspondiente para cada tipo de célula analizada midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 10: Uso de un péptido de penetración celular para suministrar a las células vegetales la proteína Cas9 complejada con un ácido nucleico híbrido de ARN-ADN

El sistema óptimo identificado en los Ejemplos 8 o 9 se utilizó en este ejemplo para probar la eficacia de la transformación basada en PEG frente a la transformación con un péptido de penetración celular (CPP). Publicaciones y solicitudes anteriores sugieren que el uso de los CPP para el suministro permitirá la introducción en células con una pared celular de la proteína Cas9 complejada con un ácido nucleico híbrido de ARN-ADN. Por lo tanto, los CPP se usaron dentro de una proteína de fusión Cas o se unieron a Cas a través de un enlace disulfuro formado entre una cisteína del extremo terminal N en la proteína Cas y una cisteína del extremo terminal N en el CPP. Los CPP libres también se pueden usar para ayudar a la importación del complejo de ácido nucleico de Cas a través de la unión transitoria en la cadena de ácido nucleico. Los CPP iniciales pueden incluir el péptido TAT del VIH (véase, por ejemplo, las SEQ ID NOs: 17 y 18), o una secuencia derivada de la misma y/o una secuencia de (Arg)g. La eficacia se puede probar usando el método optimizado de los Ejemplos 3-9 a través de la expresión exitosa de tdTomato en un sistema de protoplastos.

Ejemplo 11: Otras nucleasas de CRISPR

Como se detalló anteriormente, las secuencias de ácido nucleico híbridas de acuerdo con la presente divulgación son adecuadas para una variedad de nucleasas de CRISPR de diferentes sistemas de CRISPR. Para cualquier nucleasa efectora, por ejemplo, Cas9 o Cpf1, las condiciones y longitudes óptimas del ARNg y la RT deberán evaluarse como se detalla en los Ejemplos 1 a 10 anteriores para lograr resultados óptimos para un evento de edición del genoma de interés para cada tipo de célula de interés. Además, los primeros experimentos con nickasas Cas9 se realizaron de la misma manera que se detalló anteriormente utilizando más de un ARNg y una o dos RT individuales asociadas con al menos uno de los ARNg. Los primeros resultados demuestran que este parece ser un enfoque prometedor para la edición precisa del genoma también en células eucariotas.

Ejemplo 12: Construcciones de células animales

El método divulgado puede usarse en células eucariotas siempre que sean capaces de recombinación homóloga. En un primer ejemplo, se han modificado células T o precursores de células T murinas in vitro para modularlas para que sean adecuadas para la inmunoterapia contra el cáncer. Podría demostrarse que las construcciones de ácido nucleico híbrido de acuerdo con la presente divulgación, cuando se optimizan específicamente (optimización de codones) y se diseñan (PAM, sitios objetivo) para un sistema animal, se pueden usar para la edición genómica de alta precisión en un tipo de célula animal eucariota de interés. La modificación de un gen expresado que regula la proliferación o función de la célula T usando el método descrito en esta divulgación puede usarse por lo tanto para terapia, particularmente en un mamífero, y más particularmente para tratar una enfermedad o trastorno en un sujeto mediante la modificación de un tipo de célula de interés con las construcciones de acuerdo con la presente divulgación.

Ejemplo 13: Transformación/transfección de tejido de borla inmaduro expuesto

Como se ha detallado anteriormente, se ha descrito una variedad de medios físicos/mecánicos así como biológicos para transformar células vegetales, tejidos, órganos o plantas completas o partes de las mismas para introducir material genético en una planta o estructura objetivo de la planta. Estos métodos también son adecuados para introducir al menos una secuencia de ácido nucleico híbrido de ARN/ADN y/o al menos un ARNg y/o al menos una plantilla de reparación y/o al menos un polipéptido de CRISPR de acuerdo con la presente divulgación. Después de haber expuesto y así obtenido una célula meristemática, por ejemplo un tejido de borla de una planta de maíz macho, se pueden aplicar los siguientes métodos para transformar este tejido:

En cuanto a los medios biológicos, los tejidos vegetales o las células de los mismos pueden transformarse con Agrobacterium, incluida la transformación mediada por Agrobacterium tumefaciens o Agrobacterium rhizogenes. Este tipo de transformación es bien conocida por el experto en la materia (véase, por ejemplo, Jones, H.D. et al., "Review of methodologies and a protocol for the Agrobacterium-mediated transformaron of wheat", plant methods, 2005; o Frame, B.R. et al., "Agrobacterium tumefaciens-mediated transformation of maize embryos using a standard binary vector system", Plant, 2002). Con este fin, un cultivo de agrobacterium que comprende una construcción de interés se cultiva, por ejemplo, durante la noche a 28 °C en medio fluido de caldo de Luria que contiene un antibiótico adecuado, MES 10 mM y ACE 200 mM. Al día siguiente, el cultivo de toda la noche se centrifuga a 4,400 rpm durante 15 min y se desecha el sobrenadante. A continuación, el precipitado se centrifuga de nuevo durante 15 min a 4,400 rpm durante 2 min y se desecha el sobrenadante restante. El precipitado se resuspende (5 ml de H₂O, MES 10 mM, MgCl 10 mM2 ACE 20 |^j M). La densidad óptica a 600 nm se ajusta a 1.5. La suspensión posiblemente diluida se puede utilizar posteriormente.

Otra posibilidad para transformar células o tejidos meristemáticos de una planta por medios biológicos es el uso de vectores virales. Los vectores virales tienen la ventaja de que pueden introducirse como ADN o como ARN y en una estructura objetivo vegetal de interés. Además, los vectores virales o virus de plantas tienen la capacidad de propagarse a diferentes células y tejidos.

Para los fines de la presente invención, las partículas de virus, transcripciones in vitro de virus o Agrobacteria que portan un virus que codifica el ADN-T pueden introducirse en una estructura objetivo de la planta de interés mediante filtración (con vacío y sin vacío). Se pueden llevar a cabo experimentos alternativos utilizando savia vegetal. Para ello, tanto el tabaco como las espinacas pueden infectarse con el virus de interés para posteriormente aislar dicho virus de interés de la savia vegetal para infectar otra estructura objetivo de la planta, especialmente células meristemáticas o tejidos de diferentes plantas con la savia vegetal que contiene el virus.

A pesar de los medios biológicos de interés para transformar las estructuras de borla, se pueden utilizar otros medios físicos/mecánicos para la transformación además del bombardeo de partículas.

Un método adecuado es la microinyección. La microinyección se puede utilizar para cualquier tipo de estructura meristemática probada, preferentemente utilizando un microscopio con un micromanipulador. Debido al tamaño de ciertas estructuras meristemáticas como la borla o los meristemos de mazorca, la microinyección se puede realizar bajo el control del microscopio o, en caso de que las estructuras objetivo sean lo suficientemente grandes, sin la ayuda del microscopio. La inyección puede llevarse a cabo utilizando una variedad de métodos para introducir una variedad de moléculas objetivo diferentes en una estructura objetivo vegetal de interés que incluye ADN plasmático de cadena doble, ADN lineal de cadena doble, ARN y proteínas, así como partículas de virus en solución líquida. Estas diferentes moléculas se pueden aplicar con la ayuda de microagujas o nanoagujas que ayudan a inyectar las moléculas objetivo en la célula meristemática o estructura de interés. Las moléculas objetivo se recubren primero sobre la aguja que luego se inserta en la célula meristemática o estructura de interés.

Otro medio adecuado es el bombardeo de partículas, p. ej., utilizando un sistema de suministro de partículas, siendo divulgado este método adicionalmente más arriba.

Otro desarrollo de esta tecnología es el uso de una combinación de filamentos de carburo de silicio (SiC) (p. ej., filamentos de carburo de silicio Silar®) y microinyección. Con este fin, se precipitan sobre filamentos de carburo de silicio ADN de cadena doble (opcionalmente plásmido), ADN lineal de cadena doble, ARN, proteína o un complejo de ribonúcleo molecular de acuerdo con la presente divulgación, o partículas de virus que se van a inyectar a través de una aguja de microinyección en la estructura meristemática o célula de interés. Esta técnica tiene la ventaja de que no solo es posible transfectar una sola célula, sino que existe la posibilidad de penetrar en diferentes células en paralelo debido a la propagación de los filamentos. Además, las células se destruyen menos, ya que la aguja no tiene que penetrar en la célula y los filamentos son bastante pequeños.

Ejemplo 14: Medios para detectar una modificación.

Cualquier modificación transitoria o estable que se introduzca en al menos una secuencia objetivo de ADN de acuerdo con la presente divulgación puede detectarse utilizando un medio de detección de fluorescencia, en caso de que se utilice un informador de fluorescencia. Dado que los tejidos de la borla, como las anteras y el polen seco, tienen una fuerte autofluorescencia, se deben utilizar otros medios para estas células y tejidos. Por lo tanto, la detección puede lograrse y confirmarse mediante métodos moleculares adicionales, tales como PCR, que incluye PCR de enriquecimiento, digestión de PCR, una combinación de PCR de enriquecimiento con digestión de PCR, cuantitativa o secuenciación, o RT-PCR, incluida la secuenciación profunda o de próxima generación o análisis de transferencia Southern o Northern. Los niveles de proteína pueden analizarse mediante transferencia Western y similares. En caso de que se haya introducido un rasgo fenotípicamente detectable en al menos una célula de interés, también es posible realizar un ensayo para detectar si dicho rasgo, por ejemplo, una resistencia, una fluorescencia, un fenotipo mutante morfológico o cualquier otro rasgo, está presente o ausente en al menos una célula modificada o una progenie o derivado de la misma. Los métodos de detección anteriores son conocidos por los expertos.

Como es habitual, la configuración para analizar un evento de integración estable en diferentes plantas objetivo y células de las mismas se puede realizar de la siguiente manera: en primer lugar, el ADN y/o el ARN se extraen de diferentes materiales, incluidos, por ejemplo, tejido de borla, antera o polen/células transformadas con diferentes construcciones que codifican una proteína fluorescente, por ejemplo, una proteína fluorescente roja. En resumen, las muestras se pueden analizar mediante PCR cuantitativa (qPCR). De las muestras anteriores, varias muestras mostrarán una señal fluorescente (roja) clara, es decir, muy intensa, que es indicativa de un evento positivo y que luego se puede seleccionar. A partir de esas muestras, se generará ADNc, incluidos los controles sin transcriptasa inversa, para excluir que los resultados posteriores no estén asociados con ADN no digerido. De las muestras con señal de ADN positiva utilizadas para la medición de la transcripción, varias muestras podrían mostrar una transcripción clara y otras una transcripción potencial (en el límite de lo que podría medirse claramente).

Ejemplo 15: Proteína de fusión de Cas9 y Fvcs

En un experimento, se puede expresar una proteína de fusión de la nucleasa Cas9 como SSN y un anticuerpo de cadena sencilla contra la fluoresceína como dominio de interacción in vitro o in vivo y se expone a un oligonucleótido marcado con FAM para que actúe como plantilla de reparación. La RT se sintetizó y se unió covalentemente a FAM como dominio de acoplamiento de la plantilla de reparación. La eficacia de la edición se midió mediante una señal fluorescente que indicaba la reparación o mediciones basadas en secuencias de la frecuencia de reparación, como se detalló anteriormente. El par de dominios de interacción de SSN de una Cas9 y un Fvcs con una afinidad específica por un ligando seleccionado, por ejemplo, FAM, se puede producir y purificar por separado y luego se puede entrecruzar o conectar, o la SSN y el dominio de interacción (IA) se puede producir como molécula de fusión. Dependiendo del ensayo, la molécula de SSN-IA puede transfectarse en una célula o agregarse a un ensayo como proteína, o la construcción puede introducirse en una célula objetivo en un vector (inducible o activo de manera constitutiva) para ser transcrita y traducida in vivo. Además, la secuencia que codifica la SSN-IA se puede introducir en una célula objetivo que comprende una secuencia objetivo de ADN de interés para modificarla como construcción de ARN para traducirla in vivo. Se muestran ejemplos de moléculas de fusión de SSN-IA de acuerdo con la presente divulgación que combinan la funcionalidad de una SSN derivada de CRISPR con la afinidad de unión extremadamente alta de una proteína especializada a su compañera afín con la SEQ ID NO: 44 (construcción de fusión Cas/mSA) y la SEQ ID NO: 45 (construcción de fusión Cas/Fvcs(FAM)). La Figura 4 A a C ilustra esquemáticamente un enfoque de modificación del genoma usando fusiones de una SSN y una estreptavidina monomérica o un Fvcs como IA. En particular, el uso de estreptavidina monomérica o Fvcs o cualquier otro IA o RTDD no está restringido al uso de una nucleasa de CRISPR o Argonauta.

Ejemplo 16: Unión de ácido nucleico por una proteína de fusión Cas9 unida a Fvcs

Para demostrar la capacidad de la proteína de fusión del Ejemplo 15 para unirse a una plantilla de reparación de cadena sencilla o de cadena doble, se repetirá el ensayo de unión descrito con un oligonucleótido marcado con fluoresceína (FAM). Los oligonucleótidos marcados con FAM se pueden obtener comercialmente. Una interacción exitosa puede probarse mediante la migración conjunta de proteína, ADN y el tinte fluorescente y el aumento de peso molecular correspondiente. La funcionalidad de la parte de la nucleasa de la proteína de fusión se probará utilizando un ensayo de escisión in vitro de un ARN guía específico y un plásmido linealizado que alberga el objetivo correspondiente. Después de la incubación en condiciones adecuadas para la actividad de la nucleasa, incluido el pH, la temperatura y los cofactores correctos, que son conocidos por los expertos en diversas nucleasas de CRISPR y variantes de las mismas, el plásmido objetivo de ADN se corrió en un gel de agarosa y se observó el tamaño de las bandas indicando el corte en el sitio objetivo esperado. La escisión in vitro del ADN objetivo indicó que la RT asociada con la nucleasa no interfirió con la función normal del complejo de Cas9 como una endonucleasa específica del sitio.

Ejemplo 17: Proteína de fusión de Cas9 y mSA2

En un experimento, una proteína de fusión de la nucleasa Cas9 y una etiqueta de estreptavidina modificada (basada en la SEQ ID NO: 34) se expresó y se expuso a un oligonucleótido marcado con biotina que actuaba como plantilla de reparación, actuando la biotina como RTDD y representando el oligonucleótido una RT La eficacia de la edición se midió mediante una señal fluorescente que indicaba la reparación o mediciones basadas en secuencias de la frecuencia de reparación.

Ejemplo 18: Unión de ácido nucleico por una proteína de fusión Cas9 unida a mSA2

Para demostrar la capacidad de la proteína de fusión del Ejemplo 17 para unirse a una plantilla de reparación de cadena sencilla o de cadena doble, se repitió el ensayo de unión descrito con un oligonucleótido marcado con biotina. Los oligonucleótidos marcados con biotina pueden obtenerse comercialmente o generarse usando desoxinucleotidil transferasa terminal. Una interacción exitosa puede probarse mediante la migración conjunta de proteína y ADN y el correspondiente aumento de peso molecular. La funcionalidad de la parte de la nucleasa de la proteína de fusión se probará utilizando un ensayo de escisión in vitro de un ARN guía específico y un plásmido linealizado que alberga el objetivo correspondiente. Después de la incubación en condiciones adecuadas para la actividad de la nucleasa, incluido el pH, la temperatura y los cofactores correctos, que son conocidos por los expertos en diversas nucleasas de CRISPR y sus variantes, el plásmido objetivo de ADN se corrió en un gel de agarosa y se observó el tamaño de las bandas indicando el corte en el sitio objetivo esperado. La escisión in vitro del ADN objetivo indicó que la RT asociada con la nucleasa no interfirió con la función normal del complejo de Cas9 como una endonucleasa específica del sitio.

Ejemplo 19: Edición in vivo de un objetivo episomal por la proteína de fusión Cas9 complejada con un ácido nucleico de la plantilla de reparación marcado con biotina o FAM para restaurar la funcionalidad del gen

Para demostrar que un gen objetivo se puede editar in vivo mediante un complejo suministrado que comprende proteína Cas9 y un ácido nucleico marcado con FAM o biotina, se reparó un gen tdTomato no funcional contenido dentro de un plásmido transformado mediante el intercambio de un solo nucleótido para restaurar la señal fluorescente del gen tdTomato. Para determinar el uso óptimo para la edición mediante la provisión de una plantilla de reparación de ADNcs con complementariedad con la cadena objetivo o la cadena no objetivo, se comparan los complejos que portan plantillas de reparación de cualquiera de las cadenas.

La proteína de fusión complejada con ácido nucleico del Ejemplo 16 o 18 respectivamente se usó para reparar un plásmido episomal objetivo, que codifica un gen tdTomato con una sola mutación puntual de A por T que crea una señal de parada temprana en la posición 51 del codón. Este plásmido se introdujo en un sistema de protoplastos de maíz junto con el complejo de edición que comprende la proteína de fusión Cas9-ScFV o Cas9-mSA2 y un ácido nucleico marcado con biotina o FAM a través del suministro mediado por PEG. Luego, la edición exitosa da como resultado que algunas células muestren un fenotipo de fluorescencia de tdTomato debido a la reparación del gen tdTomato en al menos un plásmido contenido en ellas. La eficacia relativa de la edición con las diferentes plantillas de reparación puede evaluarse fácilmente midiendo la abundancia de células fluorescentes resultantes de cada tratamiento.

Ejemplo 20: Edición in vivo de un objetivo cromosómico por la proteína de fusión Cas9 complejada con un ácido nucleico de la plantilla de reparación marcado con FAM o biotina para integrar la secuencia de ADN en un locus específico

Para demostrar que un gen objetivo se puede editar in vivo mediante un complejo administrado que comprende la proteína Cas9 y un ácido nucleico marcado con FAM o biotina, se integrará una secuencia conocida de ADN en un sitio específico dentro del ADN genómico.

La proteína de fusión de Cas9 y un fragmento variable de cadena sencilla con afinidad por la fluoresceína (Ejemplo 16) o la proteína de fusión de Cas9 y la estreptavidina modificada (Ejemplo 18) se expresaron y expusieron a ADN de plantilla de reparación marcada y se usaron para integrar una secuencia de ADN conocida en un locus genómico. La edición exitosa se analizará mediante reparación de la indicación de la señal fluorescente o ensayos moleculares en el sitio objetivo.

Ejemplo 21: Unión de ácido nucleico por una proteína de fusión Argonauta unida a Fvcs

Para demostrar la capacidad de unir un ácido nucleico de la plantilla de reparación a una nucleasa que no es CRISPR, se realizó un ensayo de unión que mostró el aumento de peso en un estudio de migración conjunta utilizando un oligo de ácido nucleico de reparación marcado con FAM y una proteína de fusión de una nucleasa Argonauta. (véase la SEQ ID NO: 46) y un fragmento variable de cadena sencilla con afinidad por FAM (véanse las SEQ ID NOs: 43 y 45). Del mismo modo, una SSN Argonauta podría enlazarse a una estreptavidina monomérica (véanse las SEQ ID NOs: 42 y 44) como complejo de unión para una RT La funcionalidad de la parte de la nucleasa de la proteína de fusión se probó utilizando un ensayo de escisión in vitro de un ácido nucleico guía específico y un plásmido linealizado que alberga al objetivo correspondiente. Después de la incubación en condiciones adecuadas para la actividad de la nucleasa, incluido el pH, la temperatura y los cofactores correctos y similares, que son conocidos por los expertos en diversas nucleasas que no son CRISPR y variantes de las mismas, el plásmido objetivo de ADN se corrió en un gel de agarosa y se observaron los tamaños de banda que indican el corte en el sitio objetivo esperado. La escisión in vitro del ADN objetivo indicó que la RT asociada con la nucleasa no interfirió con la función normal del complejo Argonauta como una endonucleasa específica del sitio.

Ejemplo 22: Edición in vivo de un objetivo cromosómico por una proteína de fusión Argonauta complejada con un ácido nucleico de la plantilla de reparación marcado con FAM para integrar la secuencia de ADN en un locus específico

Para demostrar que un gen objetivo se puede editar in vivo mediante un complejo suministrado que comprende la proteína Argonauta nucleasa no CRISPR y un ácido nucleico marcado con FAM o biotina, se integrará una secuencia de ADN específica y conocida en un sitio específico dentro del ADN genómico.

La proteína de fusión de la nucleasa Argonauta y un fragmento variable de cadena sencilla con afinidad por la fluoresceína (véase el Ejemplo 21) se expresó y expuso al ADN marcado de la plantilla de reparación y se usó para integrar una secuencia de ADN conocida en un locus genómico. La edición exitosa se analizará mediante reparación de indicación de señal fluorescente o ensayos moleculares en el sitio objetivo.

Ejemplo 23: Proteína de fusión de nucleasa de CRISPR (como Cas9 o Cpf1) y un RTDD1

Para demostrar que la estrategia de unión está funcionando, se fusionó una nucleasa de CRISPR purificada como Cas9 o Cpf1 con un RTDD1, en este caso está conectada a un fragmento variable de cadena sencilla (SEQ ID NO: 54) y expresado en bacterias E. coli. Se corrió en un gel de SDS de gradiente continuo desnaturalizante (4-10%) y muestra la cantidad y la pureza de la proteína. La proteína se tiñó en este gel. El panel derecho de la Fig. 5 muestra la unión. Este es un gel de acrilamida no desnaturalizante al 4% (PAGE Blue Native) y en el presente documento el ADN se tiñe con GelRed. La plantilla de reparación marcada con FAM (RTDD2-) se incubó en el tampón de nucleasa sin o con la nucleasa-RTDD1 que se muestra en el panel izquierdo de la Figura 5. Si la proteína estaba presente, la unión se produjo como se observa por la detección de ADN en un nivel de peso molecular más alto (flecha en la Figura 5).

Ejemplo 24: Detección de eventos de HDR

Para demostrar que la secuenciación de próxima generación, más específicamente la secuenciación profunda de amplicón, es capaz de detectar el evento de HDR en el sitio objetivo, la nucleasa codificada (en este caso era una nucleasa de CRISPR) fusionada con la variante de estreptavidina se transformó en un plásmido junto con la plantilla de reparación. La plantilla de reparación tenía una etiqueta de biotina en 5' y se suministró como un oligonucleótido de cadena sencilla. Veinticuatro horas después de la transformación, se recogieron los protoplastos y se extrajo el ADN. El sitio objetivo se amplificó utilizando un conjunto de cebadores que se diseñaron para que no se superpusieran con los brazos de homología de la plantilla de reparación. Línea 4 de la Figura 6 muestra el evento de ^hD^rcorrecto. El evento reemplaza la secuencia AAGGTGCTCGGCCCCGAGCTC (SEQ ID NO: 52; que codifica la secuencia de aminoácidos de KVLGPEL) con AAGTGGTCCAGCGCCGCGACCTAGCTC (SEQ ID NO: 53; que codifica la secuencia de aminoácidos de KWSSAAT-L). La SEQ ID NO: 51 es la plantilla de reparación completa que demuestra que los brazos de homología no se extienden más allá del amplicón, lo que significa que es poco probable que se produzcan artefactos de PCR con la plantilla de reparación restante.

Ejemplo 25: La unión de la plantilla de reparación mejora la eficiencia de HDR

Para este experimento, los componentes del Ejemplo 24 se transformaron en protoplastos de hoja de maíz. En el caso de la unión, la nucleasa (en este caso era una nucleasa de CRISPR) se fusionó con una secuencia de estreptavidina nativa. En cualquier caso, la nucleasa se suministró en forma de plásmido. El ADN de la plantilla de reparación se suministró como oligonucleótido con una etiqueta de biotina en 5'. Veinticuatro horas después de la transformación, se recogieron los protoplastos y se extrajo el ADN. El sitio objetivo se amplificó utilizando un conjunto de cebadores que se diseñaron para que no se superpusieran con los brazos de homología de la plantilla de reparación. La secuenciación profunda de amplicón (véase el Ejemplo 24) y el análisis computacional posterior permiten la cuantificación de eventos de INDEL y de HDR en el sitio objetivo. La frecuencia de HDR se normalizó a la frecuencia de INDEL como una medida de la ocurrencia de ruptura de cadena doble. La frecuencia de HDR promedio aumentó del 0.92 % (±0.06 %) sin unión al 1.26 % (± 0.06 %) cuando la plantilla de reparación se une a la nucleasa (Figura 7).

Claims

REIVINDICACIONES

1. Un método para modificar al menos una secuencia objetivo de ADN, que comprende las siguientes etapas:

(i) proporcionar al menos una célula de la planta y/o genoma que comprende al menos una secuencia de complementariedad genómica y al menos una secuencia objetivo de ADN en una región genómica de interés;

(ii) proporcionar al menos un complejo molecular artificial que comprende

(A) al menos una nucleasa específica del sitio (SSN) o un fragmento catalíticamente activo de la misma, o una secuencia de ácido nucleico que la codifica, y que interactúa directamente con ella

(B) al menos un dominio de acoplamiento de la plantilla de reparación (RTDD) o una secuencia de ácido nucleico que lo codifica, en donde el dominio de acoplamiento de la plantilla de reparación está configurado para interactuar directamente de forma covalente con al menos una secuencia de ácido nucleico de la plantilla de reparación (RT); (C) que comprende opcionalmente al menos un dominio de interacción (IA), o una secuencia de ácido nucleico que codifica el mismo, en donde al menos un dominio de interacción interactúa directamente con al menos una nucleasa específica del sitio o el fragmento catalíticamente activo de la misma, y en donde al menos un dominio de interacción está configurado para proporcionar al menos una de las funcionalidades seleccionadas del grupo que consiste en

(I) interacción con al menos un dominio de acoplamiento de la plantilla de reparación; y/o

(II) interacción con al menos una secuencia de ácido nucleico de la plantilla de reparación; y/o

(III) interacción específica de secuencia con ADN genómico;

en donde el al menos una secuencia de ácido nucleico de la plantilla de reparación comprende al menos una parte que es complementaria a al menos una secuencia de complementariedad genómica, y en donde al menos una secuencia de ácido nucleico de la plantilla de reparación está configurada para mediar en la reparación de una secuencia objetivo de ADN y en donde la secuencia de ácido nucleico de la plantilla de reparación comprende una secuencia de nucleótidos de ADN de cadena sencilla; y

en donde el al menos un dominio de acoplamiento de la plantilla de reparación, o la secuencia de ácido nucleico que codifica el mismo, se selecciona de una proteína VirD2 de Agrobacterium;

(iii) poner en contacto al menos un complejo molecular artificial con al menos una secuencia objetivo de ADN en condiciones adecuadas para lograr

(a) interacción de al menos una nucleasa específica del sitio con al menos una secuencia objetivo de ADN; y (b) emparejamiento de bases complementarias de al menos una secuencia de ácido nucleico de la plantilla de reparación con al menos una secuencia de complementariedad genómica para lograr el reconocimiento de al menos una secuencia de complementariedad y la inducción de al menos una ruptura de ADN por parte de al menos una nucleasa específica del sitio, en donde el al menos una secuencia de ácido nucleico de la plantilla de reparación dirige la reparación dirigida por homología en el sitio de al menos una secuencia objetivo de ADN; y

(iv) obtener al menos una célula y/o genoma vegetal que comprende una modificación en al menos una secuencia objetivo de ADN.

2. El método de acuerdo con la reivindicación 1, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación y al menos un dominio de acoplamiento de la plantilla de reparación del complejo molecular artificial se proporcionan a al menos una célula de la planta independientemente de al menos una nucleasa específica del sitio de al menos un complejo molecular artificial y

al menos un complejo molecular artificial está ensamblado, o parcialmente ensamblado, dentro de al menos una célula de la planta.

3. El método de acuerdo con la reivindicación 1, en donde al menos un complejo molecular artificial es un complejo molecular artificial ensamblado ex vivo.

4. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en donde al menos una célula de la planta se selecciona de una planta del grupo que consiste en Hordeum vulgare, Hordeum bulbusom, Sorghum bicolor, Saccharum officinarium, Zea spp., incluyendo Zea mays, Setaria italica, Oryza minuta, Oryza sativa, Oryza australiensis, Oryza alta, Triticum aestivum, Triticum durum, Secale cereale, Triticale, Malus domestica, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiatus, Beta spp., incluyendo Beta vulgaris, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Nicotiana sylvestris, Nicotiana tomentosiformis, Nicotiana tabacum, Nicotiana benthamiana, Solanum lycopersicum, Solanum tuberosum, Coffea canephora, Vitis vinifera, Erythrante guttata, Genlisea aurea, Cucumis sativus, Marus notabilis, Arabidopsis arenosa, Arabidopsis lyrata, Arabidopsis thaliana, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine nexuosa, Lepidium virginicum, Capsella bursa pastoris, Olmarabidopsis pumila, Arabis hirsute, Brassica napus, Brassica oleracea, Brassica rapa, Raphanus sativus, Brassica juncacea, Brassica nigra, Eruca vesicaria subsp. sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa, Medicago truncatula, Cicer yamashitae, Cicer bijugum, Cicer arietinum, Cicer reticulatum, Cicer judaicum, Cajanus cajanifolius, Cajanus scarabaeoides, Phaseolus vulgaris, Glycine max, Gossypium sp., Astragalus sinicus, Lotus japonicas, Torenia fournieri, Allium cepa, Allium fistulosum, Allium sativum, Helianthus annuus, Helianthus tuberosus y Allium tuberosum o cualquier variedad o subespecie perteneciente a una de las plantas antes mencionadas.

5. El método de acuerdo con la reivindicación 1, en donde la modificación de al menos una secuencia objetivo de ADN provoca una edición de características seleccionada del grupo que consiste en mejora del rendimiento, tolerancia al estrés abiótico, incluido el estrés por sequía, estrés osmótico, estrés por calor, estrés por frío, estrés oxidativo, estrés por metales pesados, estrés por sal o anegamiento, tolerancia al estrés biótico, incluida la tolerancia a los insectos, tolerancia a las bacterias, tolerancia a los virus, tolerancia a los hongos o tolerancia a los nematodos, resistencia a los herbicidas, incluidos el glifosato, el glufosinato, los inhibidores de ALS y Dicamba, resistencia al aplastamiento, tiempo de floración, resistencia al desgrane, color de la semilla, composición del endospermo, contenido nutricional o modificación metabólica.

6. El método de acuerdo con la reivindicación 1, que comprende además la siguiente etapa:

(v) identificar y/o seleccionar al menos una célula y/o genoma vegetal que comprende la modificación en al menos una secuencia objetivo de ADN.

7. El método de una cualquiera de las reivindicaciones 1 a 6, en donde la nucleasa específica del sitio, o la secuencia de ácido nucleico que la codifica, se selecciona de al menos una nucleasa de CRISPR, incluidas las nucleasas Cas o Cpf1, una TALEN, una ZFN, una meganucleasa, una endonucleasa de restricción, incluyendo Fokl o una variante de la misma, o dos endonucleasas de corte específicas de sitio, o una variante o un fragmento catalíticamente activo de las mismas.

8. El método de una cualquiera de las reivindicaciones 1 a 7, en donde al menos una nucleasa específica del sitio y/o al menos un dominio de interacción comprende al menos una secuencia de localización nuclear, una secuencia de localización de plástidos, preferiblemente una secuencia de localización de mitocondrias o una secuencia de localización de cloroplastos.

9. El método de una cualquiera de las reivindicaciones 1 a 8, en donde al menos una secuencia de ácido nucleico de la plantilla de reparación comprende al menos una parte terminal, preferiblemente el extremo 3', en donde esta parte terminal no interactúa con ningún otro componente del complejo molecular artificial y por lo tanto está configurado para hibridarse con al menos una secuencia de complementariedad genómica para mediar en la reparación de la secuencia objetivo de ADN, y/o en donde al menos una secuencia de ácido nucleico de la plantilla de reparación se proporciona como plásmido.

10. El método de una cualquiera de las reivindicaciones anteriores, en donde al menos una nucleasa específica del sitio, o la secuencia que la codifica, y al menos un dominio de interacción, o la secuencia que lo codifica, y/o al menos un dominio de acoplamiento a la plantilla de reparación, o la secuencia que lo codifica, están conectados por al menos un dominio enlazador.

11. Un método para fabricar una planta o célula de la planta que comprende las siguientes etapas:

(i) realizar un método de acuerdo con la reivindicación 1;

(ii) obtener al menos una planta de al menos una célula de la planta de la etapa (i);

(iii) opcionalmente: determinar la modificación en al menos una secuencia objetivo de ADN en al menos una célula de al menos una planta.

12. Una planta, célula de la planta o material de la planta que comprende al menos un complejo molecular artificial como se define en la reivindicación 1.

13. Uso de al menos un complejo molecular artificial como se define en la reivindicación 1 para la modificación del genoma en una célula de la planta u organismo para la reparación dirigida por homología en el sitio de al menos una secuencia objetivo de ADN en una región genómica de interés de al menos una célula de la planta.