WO2020111984A2 - Средство разрезания днк на основе cas9 белка из defluviimonas sр. - Google Patents

Средство разрезания днк на основе cas9 белка из defluviimonas sр. Download PDF

Info

Publication number
WO2020111984A2
WO2020111984A2 PCT/RU2019/050230 RU2019050230W WO2020111984A2 WO 2020111984 A2 WO2020111984 A2 WO 2020111984A2 RU 2019050230 W RU2019050230 W RU 2019050230W WO 2020111984 A2 WO2020111984 A2 WO 2020111984A2
Authority
WO
WIPO (PCT)
Prior art keywords
dna
sequence
protein
rna
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/RU2019/050230
Other languages
English (en)
French (fr)
Other versions
WO2020111984A3 (ru
Inventor
Константин Викторович СЕВЕРИНОВ
Сергей Анатольевич ШМАКОВ
Дарья Николаевна АРТАМОНОВА
Игнатий Игоревич ГОРЯНИН
Ольга Сергеевна МУШАРОВА
Юлия Валерьевна ПИСКУНОВА
Яна Витальевна ФЁДОРОВА
Татьяна Игоревна ЗЮБКО
Михаил Алексеевич ХОДОРКОВСКИЙ
Георгий Евгеньевич ПОБЕГАЛОВ
Анатолий Николаевич АРСЕНИЕВ
Полина Анатольевна СЕЛЬКОВА
Александра Андреевна ВАСИЛЬЕВА
Татьяна Олеговна АРТАМОНОВА
Марина Викторовна АБРАМОВА
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Skolkovo Institute of Science and Technology
Original Assignee
Skolkovo Institute of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to KR1020217019951A priority Critical patent/KR20210118817A/ko
Priority to AU2019388217A priority patent/AU2019388217B2/en
Priority to CN201980090347.0A priority patent/CN113614247B/zh
Priority to EP19891145.5A priority patent/EP3889270A4/en
Priority to PE2021000761A priority patent/PE20212083A1/es
Priority to US17/296,629 priority patent/US20220017896A1/en
Priority to MA53578A priority patent/MA53578B1/fr
Priority to JP2021529804A priority patent/JP7698579B2/ja
Priority to BR112021010186-1A priority patent/BR112021010186A2/pt
Priority to EA202191505A priority patent/EA202191505A1/ru
Priority to CA3121089A priority patent/CA3121089A1/en
Priority to MX2021006118A priority patent/MX2021006118A/es
Application filed by Skolkovo Institute of Science and Technology filed Critical Skolkovo Institute of Science and Technology
Publication of WO2020111984A2 publication Critical patent/WO2020111984A2/ru
Publication of WO2020111984A3 publication Critical patent/WO2020111984A3/ru
Priority to PH12021551202A priority patent/PH12021551202A1/en
Priority to CONC2021/0006937A priority patent/CO2021006937A2/es
Priority to ZA2021/03582A priority patent/ZA202103582B/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]

Definitions

  • the invention relates to biotechnology, in particular, to new Cas enzymes, the nucleases of CRISPR-Cas systems, used for cutting DNA and editing the genome of various organisms.
  • This technology can be used in the future for gene therapy of hereditary human diseases, as well as for editing the genome of other organisms.
  • the following methods are currently used: artificial nuclease systems containing zinc finger domains, TALEN systems, and bacterial CRISPR-Cas systems.
  • the first two methods require the laborious optimization of the nuclease amino acid sequence to recognize a specific DNA sequence.
  • the structures recognizing the target DNA are not proteins, but short RNA guides.
  • Cutting a specific target DNA does not require the synthesis of a nuclease or its de novo gene, but is achieved through the use of RNA guides complementary to the target sequence.
  • the technique allows for simultaneous DNA cutting in several regions using guiding RNAs of different sequences. This approach is also used to simultaneously change several genes in eukaryotic organisms.
  • CRISPR-Cas systems are prokaryotic immune systems capable of introducing breaks into the genetic material of viruses highly specifically (Mojica FJ M. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements // Journal of molecular evolution. - 2005 . - T. 60. - Ns. 2. - C. 174-182).
  • Acronym CRISPR-Cas stands for “Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et al. Identification of genes that are associated with DNA repeats in prokaryotes // Molecular microbiology. - 2002. - T. 43. - Ns. 6. - C.
  • CRISPR-Cas systems consist of CRISPR cassettes and genes encoding various Cas proteins (Jansen R. et al., Molecular microbiology. - 2002. - T. 43. - Na. 6. - P. 1565-1575).
  • CRISPR cassettes consist of spacer sequences, each of which has a unique nucleotide sequence, and repeating palindromic repeats (Jansen R. et al., Molecular microbiology. - 2002. - T. 43. - Ns. 8. - P.
  • CRISPR-Cas systems represented by a single effector protein, are divided into six different types (from I to VI) depending on the Cas proteins that make up the systems.
  • the CRISPR-Cas9 system of type II is distinguished by the simplicity of the composition and mechanism of operation: for its functioning, the formation of an effector complex consisting of only one Cas9 protein and two short RNAs: crRNA (crRNA) and tracer RNA (tracrRNA) is necessary.
  • crRNA crRNA
  • tracerRNA tracer RNA
  • Tracer RNA mates complementary to the cRRNA region derived from the CRISPR repeat, forming the secondary structure necessary for binding of the RNA guides to the Cas effector.
  • the Cas9 effector protein is an RNA-dependent DNA endonuclease with two nucpease domains (HNH and RuvC) that breaks the complementary strands of the target DNA, thereby forming a double-stranded DNA break (Deltcheva E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III // ' Nature. - 201 1. - T. 471. - Ns. 7340. - C. 602).
  • CRISPR-Cas nucleases are known that are capable of specifically and specifically introducing double-stranded DNA breaks.
  • One of the main characteristics limiting the use of CRISPR-Cas systems is a PAM sequence that flans a target DNA from the 3'-end, the presence of which is necessary for the proper recognition of Cas9 DNA by nuclease.
  • Different CRISPR-Cas proteins have different PAM sequences that limit the ability of nucleases to be used on any DNA site.
  • the use of CRISPR-Cas proteins with various new PAM sequences is necessary to ensure the possibility of changing any DNA region, both in vitro and in the genome of living organisms. Changing eukaryotic genomes also requires the use of small nucleases to ensure the delivery of CRISPR-Cas systems to cells via AAV viruses.
  • the present invention is the creation of new tools for changing the sequence of genomic DNA of unicellular or multicellular organisms based on CRISPR-Cas9 systems.
  • Current systems are of limited use due to the specific PAM sequence that must be present at the 3'-end of the DNA site undergoing modification.
  • the search for new Cas9 enzymes with other PAM sequences will expand the arsenal of available tools for the formation of double-strand breaks in the necessary, strictly defined places in the DNA molecules of different organisms.
  • the authors characterized previously predicted for Defluviimonas sp. 20V17 CRISPR nuclease II type DfCas9, which can be used to introduce targeted changes in the genome of this as well as other organisms.
  • the essential features that distinguish the present invention are: (a) a short, different from other known sequence of RAM; (b) the relatively small size of the characterized protein DfCas9 - 1079 amino acid residues (a.o.).
  • This problem is solved by using a protein containing the amino acid sequence of SEQ ID NO: 1, or containing an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and differs from SEQ ID NO: 1 only in non-conservative amino acid residues to form a double-strand break in the DNA molecule,
  • this application is characterized in that the formation of a double-strand break in the DNA molecule occurs at a temperature of from 35 ° C to 37 ° C and in the presence of Mn 2+ ions .
  • this use is characterized in that the concentration of Mn 2+ ions is more than 5 mM.
  • This problem is also solved by creating a method for the formation of double-strand break in the genomic DNA sequence of a unicellular or multicellular organism, directly adjacent to the sequence 5'-NN (G / A) NA (C / T) N-3 ', including the introduction of at least one the cell of this organism is an effective amount of: a) a protein containing the amino acid sequence of SEQ ID NO: 1, or a nucleic acid encoding a protein containing the amino acid sequence of SEQ ID NO: 1, and b) an RNA guide containing the duplex sequence with the nucleotide sequence of the site the genomic DNA of an organism directly adjacent to the nucleotide sequence of 5'-NN (G / A) NA (C / T) N-3 'and interacting with the specified protein after the formation of a duplex, or a DNA sequence encoding the specified RNA guide; wherein the interaction of the indicated protein with the RNA guide and the 5'-NN (G / A) NA (C / T) N-3 'n
  • RNA guide A mixture of cRRNA (crRNA) and tracer RNA (tracrRNA) capable of complexing with the target DNA and DfCas9 protein can be used as the RNA guide.
  • RNA can be used as a guide.
  • hybrid RNA constructed on the basis of cRRNA and tracer RNA. Methods for constructing a hybrid RNA guide are known to those skilled in the art (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep; 31 (9): 827-32).
  • Hybri PD et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep; 31 (9): 827-32).
  • One embodiment of the construction of a hybrid RNA is disclosed in the Examples below.
  • the invention can be used both for cutting the target DNA in vitro, and for modifying the genome of any living organism. Modification of the genome can be carried out in a direct way - by cutting the genome in the corresponding site, as well as by inserting an exogenous DNA sequence due to homologous repair.
  • any portion of double-stranded or single-stranded DNA from the genome of an organism other than the organism used during introduction can be used, while this section (or a mixture of sections) is intended for integration into the double-stranded gap in the target DNA formed by the action of DfCas9 nuclease.
  • a double-stranded DNA region from the body’s genome used when introducing DfCas9 protein, but modified by mutations (nucleotide substitution), as well as insertions or deletions of one or more nucleotides, can be used as an exogenous DNA sequence.
  • the technical result of the present invention is to increase the versatility of the available CRISPR-Cas9 systems, allowing the use of Cas9 nuclease to cut genomic or plasmid DNA in more specific sites and specific conditions.
  • FIG. 1 Scheme of CRISPR loci in Defluviimonas sp.
  • FIG. 2 Development of a DNA cutting system limited
  • FIG. 3 Scheme of interaction of the RNA guide with the site of the target
  • FIG. 4. The dependence of the efficiency of the reaction of cutting DNA from
  • FIG. 5 Verification of protein activity in cutting various DNA
  • FIG. 6 In vitro reactions of DNA cutting of the human gene fragment grin2b.
  • FIG. 7 The effect of ion concentration on reaction efficiency
  • FIG. 8 Selection of the sgRNA sequence.
  • FIG. 9 Alignment of the initial parts of the sequences of Cas9 proteins from organisms Staphylococcus aureus (SaCas9), Campylobacter jejuni (CjCas9) and DfCas9. Non-conservative areas underlined
  • the term “percent homology of two sequences” is equivalent to the term “percent identity of two sequences”.
  • the identity of the sequences is determined based on the reference sequence. Algorithms for sequence analysis are known in the art, such as BLAST described in Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990).
  • BLAST described in Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990).
  • a comparison of nucleotide and amino acid sequences made using the Blast software package provided by the National Center for Biotechnology Information (http: //www.ncbi.nlm.nih) can be used to determine the level of identity and similarity between nucleotide sequences and amino acid sequences.
  • the percentage of identity of two sequences is determined by the number of positions of identical amino acids in these two sequences, taking into account the number of spaces and the length of each space that must be entered for optimal comparison of the two sequences by alignment. Percent identity is the number of identical amino acids in these positions, taking into account sequence alignment, divided by the total number of positions and multiplied by 100.
  • double-stranded break immediately prior to the PAM nucleotide sequence means that a double-strand break in the target DNA sequence will be produced at a distance of 0 to 25 nucleotides in front of the PAM nucleotide sequence.
  • Exogenous DNA sequence By an exogenous DNA sequence introduced simultaneously with an RNA guide, one should understand a DNA sequence prepared specifically for the specific modification of double-stranded target DNA at the site of the break determined by the specificity of the RNA guide. Such a modification may, for example, be the insertion or deletion of certain nucleotides at the site of breakage of the target DNA.
  • Exogenous DNA can serve as a portion of DNA from another organism, or a portion of DNA from the same organism as the target DNA.
  • a protein containing a specific amino acid sequence is meant a protein having an amino acid sequence made up of a specified amino acid sequence and possibly other sequences connected by peptide bonds to the specified amino acid sequence.
  • An example of other sequences may be a nuclear localization signal (NLS) sequence, or other sequences providing enhanced functionality for a specified amino acid sequence.
  • NLS nuclear localization signal
  • Exogenous DNA sequence By an exogenous DNA sequence introduced simultaneously with an RNA guide, one should understand a DNA sequence prepared specifically for the specific modification of double-stranded target DNA at the site of the break determined by the specificity of the RNA guide. Such a modification may, for example, be the insertion or deletion of certain nucleotides at the site of breakage of the target DNA.
  • Exogenous DNA can serve as a piece of DNA from another organism, or a piece of DNA from the same organism as the target DNA.
  • an effective amount of protein and RNA introduced into a cell should be understood to mean such an amount of protein and RNA that, when it enters the specified cell, it will be able to form a functional complex, that is, a complex that will specifically bind to the target DNA and produce a double-stranded break in it at the place determined guide RNA and PAM sequence on DNA.
  • the effectiveness of this process can be assessed by analyzing the target DNA isolated from the indicated cell using standard methods known to those skilled in the art.
  • RNA and RNA to the cell can be carried out in various ways.
  • a protein can be delivered in the form of a DNA plasmid that encodes a gene for this protein, as an mRNA for translation of this protein in the cytoplasm of a cell, or as a ribonucleoprotein complex comprising this protein and RNA-guiding. Delivery can be carried out by various methods known to those skilled in the art.
  • the nucleic acid encoding the components of the system can be introduced into the cell directly or indirectly: by transfection or transformation of cells by methods known to those skilled in the art, by using a recombinant virus, by manipulating the cell, such as microinjection of DNA, etc.
  • a ribonucleic complex consisting of nuclease and directing RNA and exogenous DNA (if necessary) can be accomplished by transfecting the complexes into the cell or by mechanically introducing the complex into the cell, for example, microinjection.
  • a nucleic acid molecule encoding a protein that must be introduced into a cell can be integrated into the chromosome or can be extrachromosomally replicating DNA.
  • a protein having a sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 in a eukaryotic cell this protein must be in the nucleus of this cell. Therefore, in some embodiments of the invention, a protein having a sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and which is further modified at one or both ends by adding one or more nuclear localization signals.
  • a nuclear localization signal from the SV40 virus can be used.
  • a nuclear localization signal can be separated from the main protein sequence by a spacer sequence, for example as described in Shen B, et al.
  • the present invention encompasses the use of a protein from the body of Defluviimonas sp. 20V17, homologous to the previously characterized Cas9 proteins, for introducing double-stranded breaks in DNA molecules in strictly defined positions.
  • CRISPR nucleases to introduce targeted changes in the genome has several advantages. First, the specificity of the action of the system is determined by the cRRNA sequence, which allows one type of nuclease to be used for all target loci. Secondly, the technique allows you to deliver several directing RNAs complementary to different target genes into the cell at once, which allows for a one-time change of several genes at once.
  • PAM is a strictly defined sequence of several nucleotides located in type II systems close to or several nucleotides from the 3'-end of the protospacer on a non-target chain. In the absence of PAM, hydrolysis of bonds in DNA with the formation of double-strand break does not occur. The need for the presence of the PAM sequence on the target increases the specificity of recognition, but at the same time imposes a limitation on the choice of target DNA regions into which a gap must be introduced.
  • RNA sequencing of E. coli DH5alpha bacteria carrying the created DfCas9_pacyc184 construct was performed. Sequencing showed that the CRSIPR cassette of the system is actively transcribed, as well as tracer RNA (Fig. 1). Sequence analysis of crRNA and tracrRNA suggested a possible formation of secondary structures recognized by DfCas9 nuclease.
  • the authors determined the PAM sequence of the DfCas9 protein using bacterial PAM screening.
  • E. coli DH5alpha cells carrying the DfCas9_pacyc184 plasmid were transformed with a library of plasmids containing the 5’- spacer sequence
  • RNA sequencing of the RNA guide sequence allowed the synthesis of crRNA and tracrRNA molecules in vitro. The synthesis was carried out using the NEB HiScribe T7 RNA synthesis kit.
  • RNA guides of the following sequence were used to cut the DNA of targets bounded from the 3 ’end of the NN (G / A) NA (C / T) N sequence: tracrRNA - 5’-
  • the first 20 nucleotides that make up the crRNA sequence are complementary to the corresponding sequence on the target DNA and provide its specific recognition by DfCas9 nuclease. If it is necessary to cut another target DNA, this 20-letter spacer sequence is changed (Fig. 3).
  • the nuclease domains of Cas9 proteins require the presence of divalent ions for their activity.
  • in vitro reactions to cut target DNA were carried out in the presence of salts of magnesium, manganese, calcium, and zinc.
  • the target DNA cutting reaction was carried out under the following conditions:
  • the total reaction volume was 20 ⁇ l, reaction time 30 minutes, incubation temperature 37 ° C.
  • the reaction products were applied to a 1.5% agarose gel and subjected to electrophoresis.
  • the DNA fragment split into two parts, one of which (about 325 bp in length) formed a band clearly visible on the gel (Fig. 4).
  • the results of the experiments showed that the DfCas9 protein requires manganese ions rather than magnesium for its work, which is an unusual property for the cas9 nucleases characterized to date.
  • Example 1 Testing the activity of the protein DfCas9 in cutting various DNA targets.
  • sequences were selected that were flanked at the 3 'end by DNA sections corresponding to the PAM of the 5'-NN (G / A) NA (C / T) N-3' sequence. Of the six selected sequences, only two were effectively cut with DfCas9 protein: DNA fragments of the corresponding size cut by the effector complex were visible on the gel (Fig. 6).
  • the selectivity in cutting different targets may be due to the differing efficiency of DfCas9 recognition of various secondary DNA structures, or other reasons.
  • the selectivity of DfCas9 in cutting various targets can increase the specificity of this protein when it cuts the genomes of eukaryotic cells.
  • DfCas9 in combination with RNA guides is a new tool for cutting double-stranded DNA, limited by the sequence 5'-NN (G / A) NA (C / T) N-3 'with a characteristic operating temperature range from 35 ° C to 37 ° WITH.
  • Example 2 The effect of the concentration of Mn2 + ions on the functionality of the nuclease.
  • FIG. 7 shows that an increase in the concentration of MnCl2 from 5 mM to 10 mM leads to more efficient cutting of the target DNA, while a further increase in the concentration of divalent ions does not affect the efficiency of the reaction.
  • the presence of manganese ions in a concentration of 10 mM or more is necessary.
  • Example 3 The use of a hybrid guide RNA for cutting DNA target.
  • sgRNA is a form of guide RNA, which is a fused together tracrRNA (tracer RNA) and crRNA.
  • tracrRNA tracer RNA
  • crRNA a fused together tracrRNA (tracer RNA) and crRNA.
  • tracrRNA tracer RNA
  • three variants of this sequence were designed, which differ in the length of tracrRNA - crRNA duplex.
  • RNA was synthesized in vitro and experiments were performed on them to cut the DNA target (Fig. 8 - shows the reaction of cutting DfCas9 DNA using various sgRNA variants).
  • the matched sgRNA3 was as effective as the native tracrRNA and crRNA sequences: cutting more than 50% of the target DNA.
  • This sgRNA variant can be used to cut any other target DNA by changing the sequence that directly mates with the target DNA.
  • RNA sequences were used as hybrid RNAs:
  • the reaction was carried out under the following conditions: DNA concentration of the sequence containing PAM (AAAACG) - 20 nM, protein concentration - 400 nM, RNA concentration - 2 ⁇ M; incubation time 30 minutes, incubation temperature 37 ° C.
  • This hybrid RNA variant can be used to cut any other target DNA when changing the sequence that directly mates with the target DNA.
  • Example 4 Proteins Cas9 from closely related organisms related to Defluviimonas sp.
  • DfCas9 protein is significantly different in amino acid sequence from other Cas9 proteins studied to date.
  • a protein containing an amino acid sequence that is at least 95% identical to the amino acid sequence of SEQ ID NO: 1 and has differences compared to SEQ ID NO: 1 only in non-conservative amino acid residues for the formation of double-stranded break in a DNA molecule located immediately before the nucleotide sequence of 5'-NN (G / A) NA (C / T) N-3 'in the indicated DNA molecule.
  • Homologous proteins can be obtained by mutagenesis (for example, site-directed or PCR-mediated mutagenesis) of the corresponding nucleic acid molecules, followed by testing the encoded modified Cas9 protein to maintain its functions in accordance with the functional assays described here.
  • Example 5 The DfCas9 system described in the present invention in combination with RNA directors can be used to change the sequence of the genomic DNA of a multicellular organism, including a eukaryotic one.
  • various approaches known to those skilled in the art can be applied.
  • methods for delivering CRISPR-Cas9 systems to cells of organisms are disclosed in sources (Liu C et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28; 266: 17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov; 25 (1): 1234-1257), and in the sources disclosed within these sources.
  • DfCas9 nuclease For efficient expression of DfCas9 nuclease in eukaryotic cells, it will be desirable to optimize the codons for the amino acid sequence of the DfCas9 protein by methods known to those skilled in the art (e.g., IDT codon optimization tool).
  • DfCas9 nuclease For the effective functioning of DfCas9 nuclease in eukaryotic cells, it is necessary to import this protein into the nucleus of the eukaryotic cell.
  • a nuclear localization signal from the SV40 virus T-antigen (Lanford et al., Cell, 1986, 46: 575-582) connected to the DfCas9 sequence using the spacer sequence described in Shen B, et al. "Generation of gene-modified mice via Cas9 / RNA-mediated gene targeting", Cell Res. 2013 May; 23 (5): 720-3 or without.
  • the complete amino acid sequence of the nuclease transported into the nucleus of a eukaryotic cell will be the following sequence: MAPKKKRKVGIHGVPAA-DfCas9-KRPAATKKAGQAKKKK (hereinafter DfCas9 NLS).
  • DfCas9 NLS MAPKKKRKVGIHGVPAA-DfCas9-KRPAATKKAGQAKKKK
  • DfCas9 NLS MAPKKKRKVGIHGVPAA-DfCas9-KRPAATKKAGQAKKKK
  • Delivery in the form of a gene is carried out by creating a plasmid carrying the DfCas9 NLS gene under the regulation of the promoter (for example, the CMV promoter) and a sequence encoding RNA guides under the regulation of the U6 promoter.
  • the DNA sequences used are DNA sequences flanked by 3'-NN (G / A) NA (C / T) -5 ', for
  • cRRNA expression cassette is as follows:
  • the sequence of the U6 promoter is highlighted in bold, followed by the sequence encoding tracer RNA.
  • Plasmid DNA is purified and transfected into HEK293 human cells using Lipofectamine 2000 reagent (Thermo Fisher Scientific). Cells are incubated for 72 hours, after which genomic DNA is isolated from them using genomic DNA purification columns (Thermo Fisher Scientific). The target DNA site is analyzed by sequencing on the lllumina platform to determine the number of insertions-deletions in DNA occurring in the target site due to the directed double-strand break and its subsequent repair.
  • primers are used that flank the putative cleavage site, for example, for the above grin2b gene sites: 5'-GACT AT AGCAAT AGCAC-3 '
  • samples are prepared using the Ultra II DNA Library Prep Kit for lllumina (NEB) reagent protocol to prepare samples for high throughput sequencing. This is followed by sequencing on the lllumina 300cycles platform, direct reading. Sequencing results are analyzed by bioinformatics methods. An insertion or deletion of several nucleotides in the target DNA sequence is taken as a cut detection.
  • NEB Ultra II DNA Library Prep Kit for lllumina
  • RNA guides Delivery in the form of a ribonucleic complex is carried out by incubation of the recombinant form of DfCas9 NLS with RNA guides in CutSmart buffer (NEB).
  • Recombinant protein is obtained from bacterial producer cells by purification using affinity chromatography (NiNTA, Qiagen) by size separation (Superdex 200).
  • the protein is mixed with RNA in a ratio of 1: 2: 2 (DfCas9 NLS: crRNA
  • tracrRNA incubated for 10 minutes at room temperature, then the mixture was transfected into cells.
  • DfCas9 nuclease from the deep-sea bacterium Defluviimonas sp. 20V17 has several advantages over the previously characterized Cas9 proteins.
  • DfCas9 has a relatively simple, three-letter, different from other known PAM Cas nuclease, necessary for the functioning of the system.
  • Most of the currently known Cas nucleases capable of introducing double-stranded DNA breaks have multi-letter complex PAM motifs that limit the choice of sequences suitable for cutting.
  • Cas nucleases studied that recognize short PAM only DfCas9 can recognize sequences limited to 5’-NN (G / A) NA (C / T) N-3 ’nucleotides.
  • DfCas9 The second advantage of DfCas9 is the relatively small size of the protein (1079 a.o.). Today it is one of the few studied small-sized proteins that have a simple PAM sequence and are active at 37 ° C. An unusual property of DfCas9 is the presence of ions Manganese for successfully cutting target DNA targets. This property can be used to regulate the operation of the Cas9 complex.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

Настоящее изобретение описывает новую бактериальную нуклеазу системы CRISPR-Cas9 из бактерии Defluviimonas sp. 20V17, а также ее применение для образования строго специфичных двунитевых разрывов в молекуле ДНК. Данная нуклеаза обладает необычными свойствами и может быть использована в качестве инструмента для внесения изменений в строго определенных местах в последовательности геномной ДНК одноклеточных или многоклеточных организмов. Таким образом, достигается повышение универсальности доступных систем CRISPR-Cas9, что позволит использовать нуклеазы Cas9 из различных организмов для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и при различных условиях.

Description

СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ CAS9 БЕЛКА ИЗ
DEFLUVIIMONAS SP.
Область техники
Изобретение относится к биотехнологии, а именно, к новым ферментам Cas нуклеазам систем CRISPR-Cas, применяемым для разрезания ДНК и редактирования генома различных организмов. Данная технология может применяться в будущем для генной терапии наследственных заболеваний человека, а также для редактирования генома других организмов.
Уровень техники
Изменение последовательности ДНК - одна из актуальных задач биотехнологии на сегодняшний день. Редактирование и изменение геномов эукариотических и прокариотических организмов, а также манипуляции с ДНК in vitro, требуют направленного внесения двунитевых разрывов в последовательности ДНК.
Для решения этой задачи в настоящее время используют следующие методики: искусственные нуклеазные системы, содержащей домены типа «цинковые пальцы», TALEN-системы и бактериальные CRISPR-Cas системы. Первые два метода требуют трудозатратой оптимизации аминокислотной последовательности нуклеазы для узнавания конкретной последовательности ДНК. В отличие от них в случае CRISPR-Cas систем структурами, узнающими ДНК мишень, являются не белки, а короткие направляющие РНК. Разрезание конкретной ДНК мишени не требует синтеза нуклеазы или ее гена de novo, а обеспечивается за счет использования направляющих РНК, комплементарных целевой последовательности. Это делает CRISPR Cas системы удобными и эффективными инструментами разрезания различных ДНК- последовательностей. Методика позволяет осуществлять единовременное разрезание ДНК в нескольких участках при использовании направляющих РНК разной последовательностей. Такой подход используется в том числе для одновременного изменения нескольких генов в эукариотических организмах.
По своей природе CRISPR-Cas системы являются иммунными системами прокариот, способными высоко специфично вносить разрывы в генетический материал вирусов (Mojica F. J. М. et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements //Journal of molecular evolution. - 2005. - T. 60. - Ns. 2. - C. 174-182). Аббревиатура CRISPR-Cas расшифровывается как“Clustered Regularly Interspaced Short Palindromic Repeats and CRISPR associated genes” (Jansen R. et al. Identification of genes that are associated with DNA repeats in prokaryotes //Molecular microbiology. - 2002. - T. 43. - Ns. 6. - C. 1585-1575), что переводе с английского обозначает “короткие палиндромные повторы, регулярно расположенные группами, и ассоциированные с ними гены”. Все CRISPR-Cas системы состоят из CRISPR кассет и генов, кодирующих различные Cas белки (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43. - Na. 6. - С. 1565-1575). CRISPR кассеты состоят из последовательностей-спейсеров, каждый из которых имеет уникальную нуклеотидную последовательность, и повторяющихся палиндромных повторов (Jansen R. et al. , Molecular microbiology. - 2002. - T. 43. - Ns. 8. - С. 1565-1575). В результате транскрипции CRISPR кассет и их последующего процессинга образуются направляющие крРНК, которые вместе с Cas белками формируют эффекторный комплекс (Brouns S. J. J. et al. Small CRISPR RNAs guide antiviral defense in prokaryotes //Science. - 2008. - T. 321 . - Ns. 5891 . - C. 980-964). За счет комплементарного спаривания крРНК с целевым участком ДНК, именуемым протоспейсером, Cas-нуклеаза узнает ДНК-мишень и высоко специфично вносит в нее разрыв.
CRISPR-Cas системы, представленными одиночным белком-эффектором, разделяют на шесть различных типов (от I до VI) в зависимости от Cas белков, входящих в состав систем. Система CRISPR-Cas9 II типа отличается простотой состава и механизма работы: для ее функционирования необходимо формирование эффекторного комплекса, состоящего лишь из одного белка Cas9 и двух коротких РНК: крРНК (crRNA) и трейсерной РНК (tracrRNA). Трейсерная РНК комплементарно спаривается с участком крРНК, происходящим из CRISPR повтора, образуя вторичную структуру, необходимую для связывания направляющих РНК с Cas эффектором. Эффекторный белок Cas9 является РНК- зависимой ДНК эндонуклеазой с двумя нукпеазными доменами (HNH и RuvC), вносящими разрывы в комплементарные нити целевой ДНК, таким образом образуя двунитевой разрыв ДНК (Deltcheva Е. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III //'Nature. - 201 1 . - T. 471 . - Ns. 7340. - C. 602).
На сегодняшний день известно несколько CRISPR-Cas нуклеаз, способных направлено и специфично вносить двунитевые разрывы в ДНК. Одной из основных характеристик, ограничивающих применение CRISPR-Cas систем является РАМ последовательность, фланирующая ДНК-мишень с З'-конца, наличие которой необходимо для правильного узнавания ДНК Cas9 нуклеазой. Различные CRISPR-Cas белки имеют разные РАМ последовательности, которые ограничивают возможности применения нуклеаз на любых участках ДНК. Использование CRISPR-Cas белков с новыми разнообразными РАМ последовательностями необходимо для обеспечения возможности изменения любого участка ДНК, как in vitro, так и в геноме живых организмов. Изменение эукариотических геномов также требует использования нуклеаз малого размера для обеспечения доставки CRISPR-Cas систем в клетки посредством AAV вирусов.
Несмотря на известность ряда способов разрезания ДНК и изменения последовательности геномной ДНК, на сегодняшний день сохраняется потребность в новых эффективных инструментах для модификации ДНК в различных организмах и в строго определенных местах последовательности ДНК. Данное изобретение обладает рядом свойств, необходимых для решения этой задачи.
Сущность изобретения
Задачей настоящего изобретения является создание новых инструментов для изменения последовательности геномной ДНК одноклеточных или многоклеточных организмов на основе систем CRISPR-Cas9. Существующие в настоящее время системы имеют ограниченное применение из-за специфичной последовательности РАМ, которая должна присутствовать на З'-конце участка ДНК, подвергающегося модификации. Поиск новых ферментов Cas9 с другими РАМ последовательностями позволит расширить арсенал имеющихся средств для образования двунитевого разрыва в необходимых, строго определенных местах в молекулах ДНК разных организмов. Для решения этой задачи авторами была охарактеризована ранее предсказанная для Defluviimonas sp. 20V17 CRISPR нуклеаза II типа DfCas9, которая может быть применена для внесения направленных изменений в геном как этого, так и других организмов. Существенными признаками, отличающими настоящее изобретение, являются: (а) короткая, отличающаяся от других известных последовательность РАМ; (б) относительно малый размер охарактеризованного белка DfCas9 - 1079 аминокислотных остатков (а. о.).
Указанная задача решается путем применения белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК,
расположенного непосредственно перед нуклеотидной последовательностью 5’-NN(G/A)NA(C/T)N-3’ в указанной молекуле ДНК. В некоторых вариантах изобретения данное применение характеризуется тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 °С до 37 °С и в присутствии ионов Мп2+. В предпочтительных вариантах изобретения данное применение характеризуется тем, что концентрация ионов Мп2+ составляет более 5 мМ.
Указанная задача также решается путем создания способа образования двунитевого разрыва в последовательности геномной ДНК одноклеточного или многоклеточного организма, непосредственно примыкающей к последовательности 5’-NN(G/A)NA(C/T)N-3’, включающего введение в по меньшей мере одну клетку этого организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1 , и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’-NN(G/A)NA(C/T)N-3’, и взаимодействующей с указанным белком после образования дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК; при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NN(G/A)NA(C/T)N-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NN(G/A)NA(C/T)N-3’ . В некоторых вариантах изобретения данный способ характеризуется тем, что дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.
В качестве направляющей РНК может быть использована смесь из крРНК (crRNA) и трейсерной РНК (tracrRNA), способных образовать комплекс с участком целевой ДНК и белком DfCas9. В предпочтительных вариантах изобретения в качестве направляющей РНК может быть использована гибридная РНК, сконструированная на основе крРНК и трейсерной РНК. Методы конструирования гибридной направляющей РНК известны специалистам (Hsu PD, et al., DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol. 2013 Sep;31 (9):827-32). Один из вариантов конструирования гибридной РНК раскрыт в Примерах ниже.
Изобретение может быть использовано как для разрезания целевой ДНК in vitro, так и для модификации генома какого-либо живого организма. Модификация генома может проводиться прямым способом - разрезанием генома в соответствующем сайте, а также вставкой экзогенной последовательности ДНК за счет гомологичной репарации.
В качестве экзогенной последовательности ДНК может быть использован любой участок двунитевой или однонитевой ДНК из генома организма, отличного от организма, используемого при введении (или смесь таких участков между собой и с другими фрагментами ДНК), при этом этот участок (или смесь участков) предназначен для интеграции в место двуцепочечного разрыва в целевой ДНК, образованного под действием нуклеазы DfCas9. В некоторых вариантах изобретения в качестве экзогенной последовательности ДНК может быть использован участок двуцепочечной ДНК из генома организма, используемого при введении белка DfCas9, но при этом измененный мутациями (заменой нуклеотидов), а также вставками или делециями одного или нескольких нуклеотидов.
Техническим результатом настоящего изобретения является повышение универсальности доступных систем CRISPR-Cas9, позволяющее использовать нуклеазу Cas9 для разрезания геномной или плазмидной ДНК в большем количестве специфических сайтов и специфических условий.
Краткое описание рисунков
Фиг. 1 . Схема CRISPR локусов в Defluviimonas sp.
Фиг. 2. Разработка системы порезки ДНК, ограниченной
NN(G/A)NA(C/T)N последовательностью.
Фиг. 3. Схема взаимодействия направляющей РНК с участком целевой
ДНК.
Фиг. 4. Зависимость эффективности реакции разрезания ДНК от
присутствия ионов. Фиг. 5. Проверка активности белка в разрезании различных ДНК
мишеней.
Фиг. 6. Реакции in vitro разрезания ДНК фрагмента гена человека grin2b.
Фиг. 7. Влияние концентрации ионов на эффективность реакции
разрезания ДНК.
Фиг. 8. Подбор последовательности sgRNA.
Фиг. 9. Выравнивание начальных частей последовательностей белков Cas9 из организмов Staphylococcus aureus (SaCas9), Campylobacter jejuni (CjCas9) и DfCas9. Подчеркнуты снизу неконсервативные участки
последовательностей.
Подробное раскрытие изобретения
В описании данного изобретения термины «включает» и «включающий» интерпретируются как означающие «включает, помимо всего прочего». Указанные термины не предназначены для того, чтобы их истолковывали как «состоит только из». Если не определено отдельно, технические и научные термины в данной заявке имеют стандартные значения, общепринятые в научной и технической литературе.
Используемый здесь термин «процент гомологии двух последовательностей» эквивалентен термину «процент идентичности двух последовательностей». Идентичность последовательностей определяется на основании референсной последовательности. Алгоритмы для анализа последовательности известны в данной области, такие как BLAST, описанный в Altschul et al., J. Mol. Biol., 215, pp. 403-10 (1990). Для целей настоящего изобретения для определения уровня идентичности и сходства между нуклеотидными последовательностями и аминокислотными последовательностями может быть использовано сравнение нуклеотидных и аминокислотных последовательностей, производимое с помощью пакета программ Blast, предоставляемого National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/blast) с использованием содержащего разрывы выравнивания со стандартными параметрами. Процент идентичности двух последовательностей определяется числом положений идентичных аминокислот в этих двух последовательностях с учетом числа пробелов и длины каждого пробела, которые необходимо ввести для оптимального сопоставления двух последовательностей путем выравнивания. Процент идентичности равен числу идентичных аминокислот в данных положениях с учетом выравнивания последовательностей, разделенному на общее число положений и умноженному на 100.
Термин "специфически гибрид изуется" относится к ассоциации между двумя одноцепочечными молекулами нуклеиновых кислот или в достаточной степени комплементарными последовательностями, что разрешает такую гибридизацию в предопределенных условиях, обычно использующихся в данной области.
Фраза "двунитевой разрыв, расположенный непосредственно перед нуклеотидной последовательностью РАМ" означает, что двунитевой разрыв в целевой последовательности ДНК будет произведен на расстоянии от 0 до 25 нуклеотидов перед нуклеотидной последовательностью РАМ.
Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.
Под белком, содержащим определенную аминокислотную последовательность следует понимать белок, имеющий аминокислотную последовательность, составленную из указанной аминокислотной последовательности и, возможно, других последовательностей, соединённых пептидными связями с указанной аминокислотной последовательностью. Примером других последовательностей может служить последовательность сигнала ядерной локализации (NLS), или другие последовательности, обеспечивающие повышенную функциональность для указанной аминокислотной последовательности.
Под экзогенной последовательностью ДНК, вводимой одновременно с направляющей РНК, следует понимать последовательность ДНК, подготовленную специально для специфической модификации двуцепочечной целевой ДНК в месте разрыва, определяемого специфичностью направляющей РНК. Подобной модификацией может быть, например, вставка или делеция определенных нуклеотидов в месте разрыва целевой ДНК. Экзогенной ДНК может служить как участок ДНК из другого организма, так и участок ДНК из того же организма, что и целевая ДНК.
Под эффективным количеством вводимых в клетку белка и РНК следует понимать такое количество белка и РНК, которое при попадании в указанную клетку будет способно образовать функциональный комплекс, то есть комплекс, который будет специфически связываться с целевой ДНК и производить в ней двунитевой разрыв в месте, определяемом направляющей РНК и РАМ последовательностью на ДНК. Эффективность этого процесса может быть оценена при помощи анализа целевой ДНК, выделенной из указанной клетки с помощью стандартных методов, известных специалистам.
Доставка белка и РНК в клетку может быть осуществлена различными способами. Например, белок может быть доставлен в виде ДНК-плазмиды, которая кодирует ген этого белка, как мРНК для трансляции этого белка в цитоплазме клетки, или как рибонуклеопротеидный комплекс, включающий этот белок и направляющую РНК. Доставка может быть осуществлена различными методами, известными специалистам.
Нуклеиновая кислота, кодирующая компоненты системы, может быть введена в клетку, непосредственно или опосредованно: за счет трансфекции или трансформации клеток известными специалистам способами, за счет использования рекомбинатного вируса, за счет манипуляций с клеткой, таких как микроинъекция ДНК и т.п.
Доставка рибонуклеинового комплекса, состоящего из нуклеазы и направляющих РНК и экзогенной ДНК (при необходимости) может осуществляться путем трансфекции комплексов в клетку или за счет механического введения комплекса внутрь клетки, например, микроинъекции.
Молекула нуклеиновой кислоты, кодирующая белок, который необходимо ввести в клетку, может быть интегрирована в хромосому или может представлять собой внехромосомно реплицирующуюся ДНК. В некоторых вариантах для обеспечения эффективной экспрессии гена белка с вводимой в клетку ДНК необходимо изменить последовательность этой ДНК в соответствии с типом клетки в целях оптимизации кодонов при экспрессии, обусловленное неравномерностью частот встречаемости синонимичных кодонов в кодирующих областях генома различных организмов. Оптимизация кодонов необходима для увеличения экспрессии в клетках животных, растений, грибов или микроорганизмов. Для функционирования белка, имеющего последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 , в эукариотической клетке необходимо, чтобы этот белок оказался в ядре этой клетки. Поэтому, в некоторых вариантах изобретения, для образования двунитевых разрывов в целевой ДНК используют белок, имеющий последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 , и который дополнительно модифицирован с одного или с обоих концов добавлением одного или нескольких сигналов ядерной локализации. Например, может быть использован сигнал ядерной локализации из вируса SV40. Для эффективной доставки в ядро сигнал ядерной локализации может быть отделен от основной последовательности белка спейсерной последовательностью, например, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", Cell Res. 2013 May;23(5):720-3. Также, в других вариантах осуществления, может быть использован другой сигнал ядерной локализации, или альтернативный метод доставки указанного белка в ядро клетки.
Настоящее изобретение охватывает применение белка из организма Defluviimonas sp. 20V17, гомологичного ранее охарактеризованным белкам Cas9, для внесения двуцепочечных разрывов в молекулы ДНК в строго определенных положениях. Использование CRISPR нуклеаз для внесения направленных изменений в геном имеет ряд преимуществ. Во-первых, специфичность действия системы определяется последовательностью крРНК, что позволяет использовать один тип нуклеазы для всех локусов-мишеней. Во-вторых, методика позволяет доставить в клетку сразу несколько направляющих РНК, комплементарных разным генам-мишеням, что позволяет осуществлять единовременное изменение сразу нескольких генов.
Для биохимической характеризации белка Cas9 из бактерии Defluviimonas sp. 20V17 локус CRISPR, кодирующий основные компоненты системы (гены белков DfCas9, cas1 , cas2, а также CRISPR кассету и направляющие РНК), был клонирован в малокопийный бактериальный вектор pACYC184. Эффекторному рибонуклеиновому комплексу, состоящему из Cas9 и дуплекса крРНК (crRNA) и тракрРНК (tracrRNA), для распознавания и последующего гидролиза ДНК помимо комплементарного соответствия спейсера крРНК и протоспейсера необходимо присутствие РАМ (от англ.“РАМ” - protospacer adjusted motif) на ДНК мишени (Mojica F. J. M. et al. Short motif sequences determine the targets of the prokaryotic CRISPR defence system //Microbiology. - 2009. - T. 155. - Na. 3. - C. 733-740). PAM представляет собой строго определенную последовательность из нескольких нуклеотидов, расположенных в системах типа II вплотную либо в нескольких нуклеотидах от З’-конца протоспейсера на нецелевой цепи. При отсутствии РАМ гидролиза связей в ДНК с образованием двунитевого разрыва не происходит. Необходимость присутствия РАМ последовательности на мишени повышает специфичность узнавания, но в то же время накладывает ограничение в выборе целевых участков ДНК, в которые необходимо внести разрыв.
Для определения последовательностей направляющей РНК системы CRISPR-Cas9 было проведено РНК-секвенирование бактерий E.coli DH5alpha, несущих созданную конструкцию DfCas9_pacyc184. Секвенирование показало, что CRSIPR кассета системы активно транскрибируется, как и трейсерная РНК (Фиг. 1 ). Анализ последовательности crRNA и tracrRNA позволил предположить возможное формирование ими вторичных структур, распознаваемых DfCas9 нуклеазой.
Далее авторами было произведено определение РАМ последовательности белка DfCas9 при помощи бактериального РАМ скрининга. Для определения РАМ последовательности белка DfCas9 клетки E.coli DH5alpha, несущие плазмиду DfCas9_pacyc184, были трансформированы библиотекой плазмид, содержащих последовательность спейсера 5’-
Т AG АССТТ CGGG AT CAT GT CG AT CAT GAT С-3’ CRISPR кассеты DfCas9 системы, фланкированной рандомизированной семибуквенной последовательностью с 5’ или 3’ конца. Плазмиды, несущие последовательность, соответствующую последовательности РАМ системы DfCas9, подвергались деградации под действием функционирующей CRISPR-Cas системы, в то время как остальные плазмиды библиотеки эффективно трансформировались в клетки, придавая им устойчивость к антибиотику ампициллину. После трансформации и инкубации клеток на чашках с антибиотиком колонии смывались с поверхности агара и из них экстрагировали ДНК с помощью набора Qiagen Plasmid Purification Midi. Из выделенного пула плазмид амплифицировали при помощи ПЦР участки, включающие рандомизированную РАМ последовательность, которые затем подвергали высокоэффективному секвенированию на платформе lllumina. Полученные прочтения анализировали: сравнивали эффективность трансформации плазмид с уникальными РАМ, входящими в библиотеку, в клетки, несущие DfCas9_pacyc184 или в контрольные клетки, несущие пустой вектор расус184. Полученные результаты анализировали методами биоинформатики. В результате удалось выявить РАМ системы DfCas9 - трехбуквенную последовательность 5’-NN(G/A)NA(C/T)N-3’ (Фиг. 2).
Для разработки системы порезки ДНК in vivo и in vitro необходимо получить все компоненты, входящие в состав эффекторного DfCas9 комплекса: направляющие РНК и DfCas9 нуклеазу. Определение РНК-секвенированием последовательности направляющих РНК позволило синтезировать in vitro молекулы crRNA и tracrRNA. Синтез осуществлялся с помощью набора NEB HiScribe Т7 RNA synthesis.
Для разрезания ДНК мишеней, ограниченных с 3’ конца NN(G/A)NA(C/T)N последовательностью использовали направляющие РНК следующей последовательности: tracrRNA - 5’-
UCCUAGCAGAAGAAGCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCACAC CAUUGGGGCAGGCUGCGGCCUGCCCCAUCUGUUU - 3' и crRNA - 5’- uaucuccuuucauugagcacGUCCGGGCUUGGCCACGCCGCUUC - 3'.
Первые 20 нуклеотидов, входящих в состав последовательности crRNA, комплементарно спариваются с соответствующей последовательностью на ДНК мишени и обеспечивают ее специфическое узнавание DfCas9 нуклеазой. В случае необходимости разрезания другой ДНК мишени, эта 20-буквенная спейсерная последовательность изменяется (Фиг. 3).
Для получения рекомбинантного белка DfCas9 его ген был закпонирован в плазмиду рЕТ21 а. Клетки E.coli Rosetta были трансформированы полученной плазмидой DfCas9_pET21 a. Клетки, несущие плазмиду, наращивали до оптической плотности OD6oo=0.6, далее проводилась индукция экспрессии гена DfCas9 при помощи добавления IPTG до концентрации 1 тМ. Клетки инкубировали в течение 4 часов при 25 °С, после чего проводили их лизис. Очистку рекомбинантного белка проводили двумя этапами: с помощью аффинной хроматографии (Ni-NTA) и разделением белков по размерам на колонке Superdex 200. Полученный белок концентрировали с помощью фильтров Amicon с размером пор 30 «Да. После этого белок замораживали на минус 80 °С и использовали для проведения in vitro реакций.
В качестве ДНК мишени использовали двунитевой фрагмент ДНК длиной 378 пар нуклеотидов (п.н.), несущий последовательность протоспейсера на расстоянии около 30 п.н. с 3’ конца, ограниченную соответствующей РАМ последовательностью, определенной в экспериментах на бактериях: NN(G/A)NA(C/T)N.
Последовательность ДНК-мишени: 5’- cccggggtaccacggagagatggtggaaatcatctttctcgtgggcatccttgatggccacctcgtcggaagtgccca cgaggatgacagcaatgccaatgctgggggggctcttctgagaacgagctctgctgcctgacacggccaggacggc caacaccaaccagaacttgggagaacagcactccgctctgggcttcatcttcaactcgtcgactccctgcaaacaca aagaaagagcatgttaaaataggatctacatcacgtaacctgtcttagaagaggctagatactgcaattcaaggacct tatctcctttcattgag cacAAAAACG aactccatctaccag cctactctcttatctctg gtatt -3’ .
Нуклеазные домены Cas9 белков для своей активности требуют присутствия дивалентных ионов. В связи с этим проведение in vitro реакций по разрезанию ДНК-мишени проводили в присутствии солей магния, марганца, кальция и цинка. In vitro реакцию порезки ДНК-мишени проводили в следующих условиях:
1х буфер Tris-HCI, pH = 7.9 (при 25 °С)
400 нМ DfCas9
20 нМ ДНК-мишень
2 мкМ crRNA
2 мкМ tracrRNA
1 мМ соли соответствующего иона
Общий объем реакции был 20 мкл, продолжительность реакции 30 минут, температура инкубации 37 °С.
Продукты реакции наносили на 1.5% агарозный гель и подвергали электрофорезу. В случае успешной порезки мишени ДНК фрагмент распадался на две части, одна из которых (длиной около 325 н.п.) образовывала хорошо различимую на геле полосу (Фиг. 4). Результаты проведенных экспериментов показали, что белок DfCas9 требует для своей работы ионы марганца, а не магния, что является необычным свойством для охарактеризованных на сегодняшний день Cas9 нуклеаз.
Для подтверждения значимости различных РАМ последовательности DfCas9 были проведены эксперименты по разрезанию in vitro ДНК мишеней, аналогичным использованным ранее, но содержащим точечные (однонуклеотидные) мутации в РАМ последовательности 5’- AAAAACG -3’ (Фиг. 5). Результаты эксперимента подтвердили, что фермент DfCas9 способен вносить двунитевые разрывы в ДНК последовательности, ограниченные РАМ последовательностью NN(G/A)NA(C/T)N с 3’ конца. Замены в 3, 5 и 6 позициях РАМ критичны для эффекторного комплекса DfCas9 и препятствуют эффективному разрезанию целевой ДНК.
Кроме того, были проведены эксперименты по поиску оптимальной температуры работы DfCas9: она оказалась равной 35-37°С, что открывает перед DfCas9 перспективы использования в клетках человека.
Нижеследующие примеры осуществления способа приведены в целях раскрытия характеристик настоящего изобретения и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения.
Пример 1. Тестирование активности белка DfCas9 в разрезании различных ДНК мишеней.
Для того, чтобы проверить способность DfCas9 узнавать различные последовательности ДНК, фланкированные мотивом 5’-NN(G/A)NA(C/T)N-3’, были проведены эксперименты по разрезанию in vitro ДНК-мишеней из последовательности гена grin2b человека (см. таблицу 1 ).
Таблица 1. ДНК-мишени, выделенные из гена grin2b человека.
Figure imgf000015_0001
Реакции in vitro разрезания ДНК проводили в условиях, аналогичных предыдущим экспериментам. Для каждой из целевых последовательностей была синтезирована направляющая crRNA. В качестве ДНК-мишени использовали фрагмент гена человека grin2b размером около 760 н.п: 5- ttgtctctgcctgtagctgccaatgactatagcaatagcaccttttattgccttgttcaaggatttctgaggcttttgaaagtttc attttctctcattctgcagagcaaataccagagataagagagtaggctggtagatggagttgggtttggtgctcaatgaa aggagataaggtccttgaattgcagtatctagcctcttctaagacaggttacgtgatgtagatcctattttaacatgctctttc tttgtgtttgcagggagtcgacgagttgaagatgaagcccagagcggagtgctgttctcccaagttctggttggtgttggc cgtcctggccgtgtcaggcagcagagctcgttctcagaagagcccccccagcattggcattgctgtcatcctcgtgggc acttccgacgaggtggccatcaaggatgcccacgagaaagatgatttccaccatctctccgtggtaccccggg - 3’. В качестве ДНК мишеней были выбраны последовательности, фланкированные с 3’ конца участками ДНК, соответствующими РАМ последовательности 5’-NN(G/A)NA(C/T)N-3’. Из шести выбранных последовательностей только две были эффективно разрезаны белком DfCas9: порезанные эффекторным комплексом ДНК-фрагменты соответствующего размера видны на геле (Фиг. 6). Избирательность в разрезании различных мишеней может объясняться отличающейся эффективностью узнавания DfCas9 различных вторичных структур ДНК, или другими причинами. Избирательность DfCas9 в разрезании различных мишеней может повысить специфичность этого белка при разрезании им геномов эукариотических клеток.
Таким образом, DfCas9 в комплексе с направляющими РНК является новым инструментом для разрезания двунитевой ДНК, ограниченной последовательностью 5’-NN(G/A)NA(C/T)N-3’ с характерным температурным диапазоном работы от 35 °С до 37 °С.
Пример 2. Влияние концентрации ионов Мп2+ на функциональность нуклеазы.
Для проверки влияния ионов Мп2+ на нуклеазную активность DfCas9 были проведены in vitro эксперименты разрезания двунитевого ДНК фрагмента, содержащего целевую ДНК последовательность, ограниченную РАМ последовательностью АААААС, согласующуюся с консенсусом 3’- NN(G/A)NA(C/T) -5’. Для проведения реакции использовали буфер 1х CutSmart buffer (NEB), концентрацию целевой ДНК - 20 нМ и концентрацию trRNA/crRNA - 2 мкМ.
В качестве ДНК-мишени использовали 5’- aataccagagataagagagtaggctggtagatggagttCGTTTTTgtgctcaatgaaaggagataaggtccttg aattgcagtatctagcctcttctaagacaggttacgtgatgtagatcctattttaacatgctctttctttgtgtttgcagggagtc gacgagttgaagatgaagcccagagcggagtgctgttctcccaagttctggttggtgttggccgtcctggccgtgtcag gcagcagagctcgttctcagaagagcccccccagcattggcattgctgtcatcctcgtgggcacttccgacgaggtgg ccatcaaggatgcccacgagaaagatgatttccaccatctctccgtggtaccccggg -3’.
В реакции использовали tracrRNA: 5’-
UCCUAGCAGAAGAAGCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCACAC CAUUGGGGCAGGCUGCGGCCUGCCCCAUCUGUUU-3' и crRNA: 5’- uaucuccuuucauugagcacGUCCGGGCUUGGCCACGCCGCUUC-3'.
На Фиг. 7 показано, что увеличение концентрации MnCl2 с 5 мМ до 10 мМ приводит к более эффективному разрезанию ДНК-мишени, в то время как дальнейшее увеличение концентрации дивалентных ионов не сказывается на эффективности протекания реакции. Таким образом, для эффективной работы DfCas9 необходимо присутствие ионов марганца в концентрации равной 10 или более мМ.
Пример 3. Использование гибридной направляющей РНК для разрезания ДНК мишени.
sgRNA - форма направляющих РНК, которая представляет собой слитые воедино tracrRNA (трейсерная РНК) и crRNA. Для подбора оптимальной sgRNA были сконструированы три варианта этой последовательности, отличающиеся длиной tracrRNA - crRNA дуплекса. РНК синтезировали in vitro и проводили с ними эксперименты по разрезанию ДНК -мишени (Фиг. 8 - показаны реакции разрезания DfCas9 ДНК с использованием различных вариантов sgRNA).
Подобранная sgRNA3 оказалась так же эффективна, как и нативные последовательности tracrRNA и crRNA: порезка более 50% ДНК-мишени.
Этот вариант sgRNA может быть использован для разрезания любой другой целевой ДНК при изменении последовательности, непосредственно спаривающейся с ДНК -мишенью.
В качестве гибридных РНК были использованы следующие РНК последовательности:
1 -sgRNA1 24DR:
UAUCUCCUUUCAUUGAGCACGUCCGGGCUUGGCCACGCCGCUUCGAAAGAA
GCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCACACCAUUGGGGCAGGC
UGCGGCCUGCCCCAUCUGUUU
2 - sgRNA2 18DR
UAUCUCCUUUCAUUGAGCACGUCCGGGCUUGGCCACGCGAAAGCGUG
GUCUUUCCCGCGAUAAGGUUAAAACCACACCAUUGGGGCAGGCUGCGGCCUG
CCCCAUCUGUUU
3 - sgRNA3 30DR
UAUCUCCUUUCAUUGAGCACGUCCGGGCUUGGCCACGCCGCUUCUUC
UGCGAAAGCAGAAGAAGCGGCGUGGUCUUUCCCGCGAUAAGGUUAAAACCAC
ACCAUUGGGGCAGGCUGCGGCCUGCCCCAUCUGUUU
4 - контроль (без РНК)
5 - положительный контроль (порезка мишени с помощью crRNA+trRNA)
Жирным шрифтом обозначена 20-нукпеотидная последовательность, обеспечивающая спаривание с ДНК -мишенью (вариабельная часть sgRNA). В эксперименте делали контрольную пробу без РНК, а также положительный контроль - порезка мишени с помощью crRNA+trRNA.
Реакцию проводили в следующих условиях: концентрация ДНК последовательности, содержащей РАМ (AAAACG) - 20 нМ, концентрация белка - 400 нМ, концентрация РНК - 2 мкМ; время инкубирования 30 минут, температура инкубирования 37 °С.
Данный вариант гибридной РНК может быть использован для разрезания любой другой целевой ДНК при изменении последовательности, непосредственно спаривающейся с ДНК -мишенью.
Пример 4. Белки Cas9 из близкородственных организмов, относящихся к Defluviimonas sp.
На сегодняшний день в Defluviimonas не охарактеризовано ни одного фермента системы CRISPR-Cas9. Сравнимые по размерам белки Cas9 из Staphylococcus aureus идентичен DfCas9 на 21 %, Cas9 из Campylobacter jejuni на 28% (степень идентичности была рассчитана по программе BLASTp, default parameters).
Таким образом, белок DfCas9 существенно отличается по аминокислотной последовательности от других Cas9 белков, изученных на сегодняшний день.
Специалисту в области генетической инженерии очевидно, что полученный и охарактеризованный Заявителем вариант последовательности белка DfCas9 может быть изменен без изменения функции самого белка (например, направленным мутагенезом аминокислотных остатков, напрямую не влияющих на функциональную активность (Sambrook et al. , Molecular Cloning: A Laboratory Manual, (1989), CSH Press, pp. 15.3-15.108)). В частности, специалисту известно, что могут быть изменены неконсервативные аминокислотные остатки, не затрагивающие остатки, определяющие функциональность белка (определяющие его функцию или структуру). Примерами таких изменений могут служить замены неконсервативных аминокислотных остатков на гомологичные. Некоторые из участков, содержащих неконсервативные аминокислотные остатки, приведены на Фиг. 9. В некоторых вариантах осуществления изобретения возможно использование белка, содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’- NN(G/A)NA(C/T)N-3’ в указанной молекуле ДНК. Гомологичные белки могут быть получены путем мутагенеза (например, сайт-направленного или ПЦР- опосредуемого мутагенеза) соответствующих молекул нуклеиновых кислот с последующим тестированием кодируемого модифицированного белка Cas9 на сохранение его функций в соответствии с описанными здесь функциональными анализами.
Пример 5. Описанная в настоящем изобретении система DfCas9 в комплексе с направляющими РНК может быть использована для изменения последовательности геномной ДНК многоклеточного организма, в том числе эукариотического. Для введения система DfCas9 в комплексе с направляющими РНК в клетки этого организма (во все клетки или в часть клеток) могут быть применены различные подходы, известные специалистам. Например, методы доставки CRISPR-Cas9 систем в клетки организмов раскрыты в источниках (Liu С et al., Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications. J Control Release. 2017 Nov 28;266:17-26; Lino CA et al., Delivering CRISPR: a review of the challenges and approaches. Drug Deliv. 2018 Nov;25(1 ):1234-1257), и в источниках, раскрытых внутри этих источников.
Для эффективной экспрессии нуклеазы DfCas9 в эукариотических клетках будет желательно провести оптимизацию кодонов для аминокислотной последовательности белка DfCas9 методами, известными специалистам (например, IDT codon optimization tool).
Для эффективной работы нуклеазы DfCas9 в эукариотических клетках необходимо обеспечить импорт этого белка внутрь ядра эукариотической клетки. Для этого можно использовать сигнал ядерной локализации из Т-антигена вируса SV40 (Lanford et al., Cell, 1986, 46: 575-582), соединённый с последовательностью DfCas9 с помощью спейсерной последовательности, описанной в Shen В, et al. "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", Cell Res. 2013 May;23(5):720-3 или без нее. Таким образом, полная аминокислотная последовательность нуклеазы транспортируемой внутрь ядра эукариотической клетки будет представлять собой следующую последовательность: MAPKKKRKVGIHGVPAA-DfCas9- KRPAATKKAGQAKKKK (далее DfCas9 NLS). Для доставки белка с приведенной выше аминокислотной последовательностью, могут быть использованы по меньшей мере два подхода. Доставка в виде гена осуществляется путем создания плазмиды, несущей ген DfCas9 NLS под регуляцией промотора (например, CMV промотора) и последовательности, кодирующей направляющие РНК под регуляцией U6 промотора. В качестве ДНК- мишеней используются ДНК последовательности фланкированные 3’- NN(G/A)NA(C/T)-5’, например, последовательности гена grin2b человека:
5’ -ttg cagtatctag cctcttc-3’
Таким образом, кассета для экспрессии крРНК выглядит следующим образом:
Gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatt tgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagtttt aaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgt ggaaaggacgaaacaccgttgcagtatctagcctcttcGTCCGGGCTTGGCCACGCCGCTTCTT CTG CTAG G AT ttttt
Жирным шрифтом выделена последовательность U6 промотора, далее последовательность, необходимая для узнавания целевой ДНК, а последовательность прямого повтора выделена заглавными буквами.
Кассета для экспрессии трейсерной РНК выглядит следующим образом: Gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatt tgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagtttt aaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgt ggaaaggacgaaacaccgTCCT AGCAG AAG AAGCGGCGTGGT CTTT CCCGCG AT AA G GTT AA AACC AC ACC ATT G G G G C AG G CTG CG G CCT G CCCC AT CT GTTTtttt
Жирным шрифтом выделена последовательность U6 промотора, далее последовательность, кодирующая трейсерную РНК.
Плазмидную ДНК очищают и трансфицируют в клетки человека НЕК293 с помощью реагента Lipofectamine 2000 (Thermo Fisher Scientific). Клетки инкубируют в течение 72 часов, после чего из них выделяется геномная ДНК с помощью колонок для очистки геномной ДНК (Thermo Fisher Scientific). Целевой ДНК сайт анализируется с помощью секвенирования на платформе lllumina с целью определения числа вставок-делеций в ДНК, происходящих в целевом сайте по причине направленного двунитевого разрыва и последующей его репарации.
Для амплификации целевых фрагментов используют праймеры, фланкирующие предположительное место внесения разрыва, например для указанных выше сайтов гена grin2b: 5’-GACT AT AGCAAT AGCAC-3’
5TCAACTCGTCGACTCCCTG-3’
После амплификации пробы готовятся по протоколу реагента Ultra II DNA Library Prep Kit for lllumina (NEB) для подготовки образцов к высокопроизводительному секвенированию. Затем проводится секвенирование на платформе lllumina 300cycles, прямое прочтение. Результаты секвенирования анализируются биоинформатическими методами. В качестве детекции разрезания принимается вставка или делеция нескольких нуклеотидов в целевой последовательности ДНК.
Доставка в виде рибонуклеинового комплекса осуществляется путем инкубации рекомбинантной формы DfCas9 NLS с направляющими РНК в CutSmart буфере (NEB). Рекомбинантный белок получают из бактериальных клеток-продуцентов, очищая его с помощью аффинной хроматографии (NiNTA, Qiagen) разделением по размеру (Superdex 200).
Белок смешивают с РНК в соотношении 1 :2:2 (DfCas9 NLS : crRNA
:tracrRNA), инкубируют в течение 10 минут на комнатной температуре, затем смесь трансфицируют в клетки.
Далее проводится анализ экстрагированной из них ДНК на предмет вставок-делеций в целевом ДНК сайте (как описано выше).
Охарактеризованная в настоящем изобретении DfCas9 нуклеаза из глубоководной бактерии Defluviimonas sp. 20V17 имеет ряд преимуществ относительно ранее охарактеризованных Cas9 белков. Например, DfCas9 обладает относительно простым, трехбуквенным, отличным от других известных РАМ Cas нуклеаз, необходимый для функционирования системы. Большинство известных на сегодняшний день Cas нуклеаз, способных вносить двунитевые разрывы в ДНК, имеют многобуквенные сложные РАМ мотивы, ограничивающие выбор последовательностей, пригодных для разрезания. Среди изученных Cas нуклеаз, распознающих короткие РАМ, только DfCas9 может распознавать последовательности, ограниченные 5’-NN(G/A)NA(C/T)N-3’ нуклеотидами.
Второе преимущество DfCas9 - относительно малый размер белка (1079 а. о.). На сегодняшний день это один из немногих изученных малоразмерных белков, обладающих простой РАМ последовательностью и активных при 37 °С. Необычным свойством DfCas9 является необходимость присутствия ионов марганца для успешного разрезания целевых ДНК-мишеней. Это свойство может быть использовано для регуляции работы Cas9 комплекса.
Несмотря на то, что изобретение описано со ссылкой на раскрываемые варианты воплощения, для специалистов в данной области должно быть очевидно, что конкретные подробно описанные случаи приведены лишь в целях иллюстрирования настоящего изобретения, и их не следует рассматривать как каким-либо образом ограничивающие объем изобретения. Должно быть, понятно, что возможно осуществление различных модификаций без отступления от сути настоящего изобретения.

Claims

ФОРМУЛА ИЗОБРЕТЕНИЯ
1 . Применение белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или содержащего аминокислотную последовательность, которая по меньшей мере на 95% идентична аминокислотной последовательности SEQ ID NO: 1 и имеет отличия по сравнению с SEQ ID NO: 1 только в неконсервативных аминокислотных остатках, для образования двунитевого разрыва в молекуле ДНК, расположенного непосредственно перед нуклеотидной последовательностью 5’-NN(G/A)NA(C/T)N-3’ в указанной молекуле ДНК.
2. Применение по п. 1 , характеризующееся тем, что образование двунитевого разрыва в молекуле ДНК происходит при температуре от 35 °С до 37 °С и в присутствии ионов Мп2+.
3. Применение белка по п. 1 , где белок содержит аминокислотную последовательность SEQ ID NO: 1 .
4. Способ образования двунитевого разрыва в последовательности геномной ДНК одноклеточного или многоклеточного организма, непосредственно примыкающей к последовательности 5’-NN(G/A)NA(C/T)N-3’, включающий введение в по меньшей мере одну клетку этого организма эффективного количества: а) белка, содержащего аминокислотную последовательность SEQ ID NO: 1 , или нуклеиновой кислоты, кодирующей белок, содержащий аминокислотную последовательность SEQ ID NO: 1 , и б) направляющей РНК, содержащей последовательность, образующую дуплекс с нуклеотидной последовательностью участка геномной ДНК организма, непосредственно примыкающей к нуклеотидной последовательности 5’- NN(G/A)NA(C/T)N-3’, и взаимодействующей с указанным белком после образования дуплекса, или последовательности ДНК, кодирующей указанную направляющую РНК;
при этом взаимодействие указанного белка с направляющей РНК и нуклеотидной последовательностью 5’-NN(G/A)NA(C/T)N-3’ приводит к образованию двунитевого разрыва в последовательности геномной ДНК, непосредственно примыкающей к последовательности 5’-NN(G/A)NA(C/T)N-3’ .
5. Способ по п. 4, дополнительно включающий введение экзогенной последовательности ДНК одновременно с направляющей РНК.
PCT/RU2019/050230 2018-11-26 2019-11-26 Средство разрезания днк на основе cas9 белка из defluviimonas sр. Ceased WO2020111984A2 (ru)

Priority Applications (15)

Application Number Priority Date Filing Date Title
AU2019388217A AU2019388217B2 (en) 2018-11-26 2019-11-26 DNA-cutting agent
CN201980090347.0A CN113614247B (zh) 2018-11-26 2019-11-26 Dna切割剂
EP19891145.5A EP3889270A4 (en) 2018-11-26 2019-11-26 DNA CUTTING AGENT
PE2021000761A PE20212083A1 (es) 2018-11-26 2019-11-26 Agente de corte de adn
US17/296,629 US20220017896A1 (en) 2018-11-26 2019-11-26 Dna cutting means based on cas9 protein from defluviimonas sp.
MA53578A MA53578B1 (fr) 2018-11-26 2019-11-26 Dispositif pour découper l'adn à base de la protéine cas9 à partir de defluviimonas sp.
JP2021529804A JP7698579B2 (ja) 2018-11-26 2019-11-26 デフルビーモナス属(Defluviimonas)種由来のCas9タンパク質に基づくDNAカット手段
EA202191505A EA202191505A1 (ru) 2018-11-26 2019-11-26 Средство разрезания днк
BR112021010186-1A BR112021010186A2 (pt) 2018-11-26 2019-11-26 Agente de corte de dna, métodos associados e seus usos
KR1020217019951A KR20210118817A (ko) 2018-11-26 2019-11-26 Dna 절단 물질
MX2021006118A MX2021006118A (es) 2018-11-26 2019-11-26 Agente de corte de adn.
CA3121089A CA3121089A1 (en) 2018-11-26 2019-11-26 Dna cutting means based on cas9 protein from defluviimonas sp
PH12021551202A PH12021551202A1 (en) 2018-11-26 2021-05-25 Dna-cutting agent
CONC2021/0006937A CO2021006937A2 (es) 2018-11-26 2021-05-26 Agente de corte de adn
ZA2021/03582A ZA202103582B (en) 2018-11-26 2021-05-26 Dna-cutting agent

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
RU2018141534A RU2712492C1 (ru) 2018-11-26 2018-11-26 Средство разрезания днк на основе cas9 белка из defluviimonas sp.
RU2018141534 2018-11-26

Publications (2)

Publication Number Publication Date
WO2020111984A2 true WO2020111984A2 (ru) 2020-06-04
WO2020111984A3 WO2020111984A3 (ru) 2020-07-23

Family

ID=69625403

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2019/050230 Ceased WO2020111984A2 (ru) 2018-11-26 2019-11-26 Средство разрезания днк на основе cas9 белка из defluviimonas sр.

Country Status (18)

Country Link
US (1) US20220017896A1 (ru)
EP (1) EP3889270A4 (ru)
JP (1) JP7698579B2 (ru)
KR (1) KR20210118817A (ru)
CN (1) CN113614247B (ru)
AU (1) AU2019388217B2 (ru)
BR (1) BR112021010186A2 (ru)
CA (1) CA3121089A1 (ru)
CL (1) CL2021001381A1 (ru)
CO (1) CO2021006937A2 (ru)
EA (1) EA202191505A1 (ru)
MA (1) MA53578B1 (ru)
MX (1) MX2021006118A (ru)
PE (1) PE20212083A1 (ru)
PH (1) PH12021551202A1 (ru)
RU (1) RU2712492C1 (ru)
WO (1) WO2020111984A2 (ru)
ZA (1) ZA202103582B (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022536353A (ja) * 2019-06-11 2022-08-15 ジョイント・ストック・カンパニー “バイオキャド” 細菌、肺パスツレラ菌(Pasteurella pneumotropica)由来のCas9タンパク質に基づくDNAカット剤
US12201699B2 (en) 2014-10-10 2025-01-21 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
US12338436B2 (en) 2018-06-29 2025-06-24 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014014105B1 (pt) * 2011-12-16 2023-10-10 Targetgene Biotechnologies Ltd Método para modificar um sítio-alvo predeterminado no interior de um ácido nucleico genômico ou organelar alvo em uma célula hospedeira eucariótica por um complexo núcleoproteína
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
AU2014281028B2 (en) * 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
EP3294877A1 (en) * 2015-05-15 2018-03-21 Pioneer Hi-Bred International, Inc. Rapid characterization of cas endonuclease systems, pam sequences and guide rna elements
US11352647B2 (en) * 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
CN112020554B (zh) * 2018-02-23 2024-10-22 先锋国际良种公司 新颖cas9直系同源物

Non-Patent Citations (15)

* Cited by examiner, † Cited by third party
Title
ALTSCHUL ET AL., J. MOL. BIOL., vol. 215, 1990, pages 403 - 10
BROUNS S. J. J. ET AL.: "Small CRISPR RNAs guide antiviral defense in prokaryotes", SCIENCE, vol. 321, 2008, pages 960 - 964, XP055401088, DOI: 10.1126/science.1159689
DELTCHEVA E ET AL.: "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III", NATURE, vol. 471, 2011, pages 602, XP055619637, DOI: 10.1038/nature09886
HSU PD ET AL.: "DNA targeting specificity of RNA-guided Cas9 nucleases", NAT BIOTECHNOL, vol. 31, no. 9, September 2013 (2013-09-01), pages 827 - 32, XP055219426, DOI: 10.1038/nbt.2647
JANSEN R ET AL., MOLECULAR MICROBIOLOGY, vol. 43, 2002, pages 1565 - 1575
JANSEN R. ET AL.: "Identification of genes that are associated with DNA repeats in prokaryotes", MOLECULAR MICROBIOLOGY, vol. 43, 2002, pages 1565 - 1575, XP002424877, DOI: 10.1046/j.1365-2958.2002.02839.x
LANFORD ET AL., CELL, vol. 46, 1986, pages 575 - 582
LINO CA ET AL.: "Delivering CRISPR: a review of the challenges and approaches", DRUG DELIV, vol. 25, no. 1, November 2018 (2018-11-01), pages 1234 - 1257, XP055573342, DOI: 10.1080/10717544.2018.1474964
LIU C ET AL.: "Delivery strategies of the CRISPR-Cas9 gene-editing system for therapeutic applications", J CONTROL RELEASE, vol. 266, 28 November 2017 (2017-11-28), pages 17 - 26, XP085292687, DOI: 10.1016/j.jconrel.2017.09.012
MOJICA F. J. M. ET AL.: "Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements", JOURNAL OF MOLECULAR EVOLUTION, vol. 60, 2005, pages 174 - 182, XP019363173, DOI: 10.1007/s00239-004-0046-3
MOJICA F. J. M. ET AL.: "Short motif sequences determine the targets of the prokaryotic CRISPR defence system", MICROBIOLOGY, vol. 155, 2009, pages 733 - 740, XP055118633, DOI: 10.1099/mic.0.023960-0
SAMBROOK ET AL.: "Molecular Cloning: A Laboratory Manual", 1989, CSH PRESS, pages: 3 - 108
See also references of EP3889270A4
SHEN B ET AL.: "Generation of gene-modified mice via Cas9/RNA- mediated gene targeting", CELL RES, vol. 23, no. 5, May 2013 (2013-05-01), pages 720 - 3, XP055141533, DOI: 10.1038/cr.2013.46
SHEN B ET AL.: "Generation of gene-modified mice via Cas9/RNA-mediated gene targeting", CELL RES, vol. 23, no. 5, May 2013 (2013-05-01), pages 720 - 3, XP055141533, DOI: 10.1038/cr.2013.46

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12201699B2 (en) 2014-10-10 2025-01-21 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair
US12338436B2 (en) 2018-06-29 2025-06-24 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto
JP2022536353A (ja) * 2019-06-11 2022-08-15 ジョイント・ストック・カンパニー “バイオキャド” 細菌、肺パスツレラ菌(Pasteurella pneumotropica)由来のCas9タンパク質に基づくDNAカット剤
JP7621281B2 (ja) 2019-06-11 2025-01-24 ジョイント・ストック・カンパニー “バイオキャド” 細菌、肺パスツレラ菌(Pasteurella pneumotropica)由来のCas9タンパク質に基づくDNAカット剤

Also Published As

Publication number Publication date
EP3889270A2 (en) 2021-10-06
MX2021006118A (es) 2021-07-07
PH12021551202A1 (en) 2021-10-25
PE20212083A1 (es) 2021-11-04
CN113614247A (zh) 2021-11-05
CL2021001381A1 (es) 2022-01-07
JP7698579B2 (ja) 2025-06-25
EA202191505A1 (ru) 2021-09-14
CN113614247B (zh) 2025-01-17
RU2712492C1 (ru) 2020-01-29
JP2022509826A (ja) 2022-01-24
CA3121089A1 (en) 2020-06-04
AU2019388217A1 (en) 2021-07-08
US20220017896A1 (en) 2022-01-20
MA53578B1 (fr) 2022-10-31
CO2021006937A2 (es) 2021-09-20
EP3889270A4 (en) 2022-08-24
MA53578A1 (fr) 2022-02-28
KR20210118817A (ko) 2021-10-01
ZA202103582B (en) 2022-07-27
WO2020111984A3 (ru) 2020-07-23
AU2019388217B2 (en) 2025-03-27
BR112021010186A2 (pt) 2021-09-28

Similar Documents

Publication Publication Date Title
WO2020111984A2 (ru) Средство разрезания днк на основе cas9 белка из defluviimonas sр.
JP7698578B2 (ja) バイオテクノロジー的に重要な細菌、クロストリジウム・セルロリティクム(Clostridium cellulolyticum)由来のCas9タンパク質に基づく、DNAカット手段
RU2788197C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Streptococcus uberis NCTC3858
RU2778156C1 (ru) Средство разрезания ДНК на основе Cas9 белка из бактерии Capnocytophaga ochracea
RU2791447C1 (ru) Средство разрезания ДНК на основе ScCas12a белка из бактерии Sedimentisphaera cyanobacteriorum
RU2722933C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии demequina sediminicola
RU2722934C1 (ru) Средство разрезания днк на основе cas9 белка из бактерии pasteurella pneumotropica
EA041933B1 (ru) Средство разрезания днк
JP7708752B2 (ja) 細菌パスツレラ・ニューモトロピカ(Рasteurella pneumotropica)由来Cas9タンパク質の使用
OA20197A (en) DNA-cutting agent.
HK40063723A (en) Dna-cutting agent
EA041935B1 (ru) СРЕДСТВО РАЗРЕЗАНИЯ ДНК НА ОСНОВЕ Cas9 БЕЛКА ИЗ БАКТЕРИИ Pasteurella Pneumotropica
EA042517B1 (ru) Средство разрезания днк
OA20443A (en) DNA-cutting agent based on CAS9 protein from the bacterium pasteurella pneumotropica
EA044419B1 (ru) Применение cas9 белка из бактерии pasteurella pneumotropica
HK40063723B (zh) Dna切割剂
OA20812A (en) Use of CAS9 protein from the bacterium pasteurella pneumotropica.
OA20196A (en) DNA-cutting agent.
HK40066134A (zh) Dna切割剂

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 3121089

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 2021529804

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: NC2021/0006937

Country of ref document: CO

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: LK/P/1/21792

Country of ref document: LK

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112021010186

Country of ref document: BR

WWE Wipo information: entry into national phase

Ref document number: DZP2021000338

Country of ref document: DZ

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19891145

Country of ref document: EP

Kind code of ref document: A2

ENP Entry into the national phase

Ref document number: 2019891145

Country of ref document: EP

Effective date: 20210628

ENP Entry into the national phase

Ref document number: 2019388217

Country of ref document: AU

Date of ref document: 20191126

Kind code of ref document: A

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112021010186

Country of ref document: BR

Free format text: COM BASE NA PORTARIA 405 DE 21/12/2020, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA POIS O CONTEUDO APRESENTADO NA PETICAO NO 870210047577 DE 26/05/2021 NAO ESTA EM LINGUA VERNACULA (TITULO FALTANDO LETRAS)

WWP Wipo information: published in national office

Ref document number: NC2021/0006937

Country of ref document: CO

ENP Entry into the national phase

Ref document number: 112021010186

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20210526

WWG Wipo information: grant in national office

Ref document number: 201980090347.0

Country of ref document: CN