WO2024124567A1 - 纳米孔测序方法和试剂盒 - Google Patents

纳米孔测序方法和试剂盒 Download PDF

Info

Publication number
WO2024124567A1
WO2024124567A1 PCT/CN2022/139739 CN2022139739W WO2024124567A1 WO 2024124567 A1 WO2024124567 A1 WO 2024124567A1 CN 2022139739 W CN2022139739 W CN 2022139739W WO 2024124567 A1 WO2024124567 A1 WO 2024124567A1
Authority
WO
WIPO (PCT)
Prior art keywords
chain
polymerase
primer
strand
nanopore
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/CN2022/139739
Other languages
English (en)
French (fr)
Inventor
陈俊毅
曾涛
季州翔
黎宇翔
董宇亮
章文蔚
徐讯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN202280102552.6A priority Critical patent/CN120359304A/zh
Priority to EP22968271.1A priority patent/EP4636094A1/en
Priority to PCT/CN2022/139739 priority patent/WO2024124567A1/zh
Publication of WO2024124567A1 publication Critical patent/WO2024124567A1/zh
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores

Definitions

  • the target polynucleotide double-stranded chain further comprises: the 3' end of the first chain and the 5' end of the second chain are connected, so that the target polynucleotide double-stranded chain has a hairpin structure at the end.
  • the method further includes 5) after extending to the hairpin structure, the polymerase continues to extend using the first chain as a template, so that the first chain exits the nanopore on the membrane in the direction opposite to the electric field, detecting the change in the electrical signal generated when the first chain exits the nanopore, and re-determining the sequence information of the first chain of the target polynucleotide double chain.
  • the polymerase having strand displacement activity is a polymerase having salt tolerance.
  • an inhibitory segment that inhibits polymerase chain displacement polymerization activity is linked to the 3' end of the guide sequence.
  • a voltage is applied to both sides of the membrane to form an electric field force.
  • the voltage is above 10 mV, preferably a voltage of 50 mV-250 mV.
  • the present invention provides a kit comprising:
  • the artificially modified nucleotide is LNA, PNA, BNA or any combination thereof.
  • the artificially modified nucleotides are LNAs, and the number of the artificially modified nucleotides is 2-10, preferably 4-8.
  • the 5' end of the primer is connected to a hydrophobic molecule, preferably selected from any one or more of the following: lipids, fatty acids, sterols, carbon nanotubes, polypeptides, proteins and/or amino acids, such as cholesterol, palmitate or tocopherol.
  • the buffer system for performing the polymerization reaction contains NTP, dNTP, ddNTP or any combination thereof.
  • the buffer system for the polymerization reaction contains additives or auxiliary reagents commonly used to enhance polymerase extension reactions, such as dimethyl sulfoxide (DMSO), glycerol, formamide, bovine serum albumin (BSA), ammonium sulfate ((NH4)2SO4), polyethylene glycol (PEG), gelatin, non-ionic detergents (such as Tween 20, Trtion X-100), N,N,N-trimethylglycine (betaine), single-stranded nucleic acid binding protein or any combination thereof.
  • DMSO dimethyl sulfoxide
  • BSA bovine serum albumin
  • NH4SO4 ammonium sulfate
  • PEG polyethylene glycol
  • gelatin non-ionic detergents (such as Tween 20, Trtion X-100), N,N,N-trimethylglycine (betaine), single-stranded nucleic acid binding protein or any combination thereof.
  • the present invention provides use of the kit of the second aspect of the present invention in high-throughput sequencing, wherein the high-throughput sequencing is preferably nanopore sequencing.
  • FIG2 shows a schematic diagram of a nanopore sequencing method according to another embodiment of the present invention.
  • FIG3 shows a schematic diagram of a nanopore sequencing method according to yet another embodiment of the present invention.
  • FIG. 9 shows an electrophoresis gel image of the sequencing library in Example 3.
  • FIG. 10 shows a schematic diagram of the sequencing complex of Example 4.
  • FIG. 11 shows a current signal diagram of a typical target polynucleotide to be detected in nanopore sequencing in Example 4.
  • FIG1 shows an exemplary process of the nanopore sequencing method of the present invention.
  • a Y-shaped double-stranded sequencing adapter (a structure encircled by a hexagon in the figure) is formed by annealing the top chain and the bottom chain, and the Y-shaped double-stranded sequencing adapter is connected to one end of the double-stranded target polynucleotide to construct a sequencing library.
  • the constructed sequencing library can be stored for a long time with reference to the method of conventional double-stranded polynucleotides.
  • the constructed sequencing library consists of an A chain and a B chain, wherein the B chain is a sequencing chain and the A chain is a complementary chain of the sequencing chain.
  • the entire sequencing process is as follows: (1) The sequencing library (A chain and B chain), primer (C chain), and polymerase with chain displacement activity (represented by an ellipse in the figure) are mixed and incubated; the C chain binds to the 3' end of the A chain, and the polymerase with chain displacement activity binds to the target polynucleotide to form a sequencing complex. (2) The polymerase with chain displacement activity uses the A chain as a template and the C chain as a primer, and uses the necessary components in the sequencing buffer, such as the pH buffer system, dNTP, Mg 2+ , etc., to initiate the chain displacement polymerization reaction.
  • the sequencing library A chain and B chain
  • primer C chain
  • polymerase with chain displacement activity represented by an ellipse in the figure
  • the inhibitory segment 1 can be a GC-rich motif with stronger binding force, artificially modified nucleotides (such as LNA, PNA, BNA) or other inhibitory molecules. Both the guide sequence 1 and the inhibitory segment 1 are on the A chain. Similarly, the 3' end of the B chain can be complementary to the primer C' chain, and the 5' end is the guide sequence 2.
  • the inhibitory segment 2 is connected to the 3' end of the guide sequence 2 (indicated by a bold black line in the figure), and the inhibitory segment 2 can inhibit the strand displacement polymerization activity of the polymerase.
  • the specific form of the inhibitory segment 2 is not limited, as long as it can inhibit the strand displacement polymerization activity of the polymerase.
  • a polymerase with strand displacement activity uses strand B as a template and strand C’ as a primer, and uses necessary components in the sequencing buffer, such as a pH buffer system, dNTP, Mg2+, etc., to initiate a strand displacement polymerization reaction, using strand B as a template, displacing strand A, and extending strand C’ until the strand displacement polymerization activity of the polymerase is inhibited by the inhibitory segment 1.
  • the sequencing buffer such as a pH buffer system, dNTP, Mg2+, etc.
  • the polymerase with strand displacement activity uses strand A as a template, displaces strand B, and extends strand C at a stable rate.
  • the B chain is displaced at a relatively stable speed and passes through the nanopore at a relatively stable speed, achieving stable sequencing.
  • the C chain extends to the end of the A chain to form a new nucleic acid duplex, and the displaced B chain passes through the nanopore until it encounters the polymerase at the other end.
  • the polymerase uses the necessary components in the sequencing buffer, such as the pH buffer system, dNTP, Mg2+, etc., to initiate the polymerization reaction, using the B chain as a template to extend the C’ chain.
  • the B chain As the C’ chain extends, the B chain is pulled out of the nanopore at a relatively stable speed against the direction of the electric field force (indicated by an upward arrow in the figure). (7) The C’ chain extends to the 5’ end of the B chain to form a new nucleic acid duplex, and the B chain is also completely pulled out of the nanopore. The entire process sequenced the same B chain twice.
  • the constructed sequencing library consists of A chain and B chain, wherein the B chain is the sequencing chain and the A chain is the complementary chain of the sequencing chain.
  • the 3' end of the A chain is complementary to the primer C chain;
  • the 5' end of the B chain is a guide sequence (represented by a black dotted line in the figure), and the inhibitory segment (represented by a bold black line segment in the figure) is connected to the 3' end of the guide sequence.
  • the inhibitory segment can inhibit the chain displacement polymerization activity of the polymerase.
  • the specific form of the inhibitory segment is not limited, as long as it can inhibit the chain displacement polymerization activity of the polymerase.
  • the inhibitory segment can be a GC-rich motif with stronger binding force, an artificially modified nucleotide (such as LNA, PNA, BNA), or other inhibitory molecules.
  • the guide sequence and the inhibitory segment are both on the B chain.
  • the entire sequencing process is as follows: (1) The sequencing library (A chain and B chain), primer (C chain), and polymerase with chain displacement activity (represented by an ellipse in the figure) are mixed and incubated; the C chain binds to the 3' end of the A chain, and the polymerase with chain displacement activity binds to the target polynucleotide, thereby forming a complex to be sequenced.
  • the polymerase with chain displacement activity uses the A chain as a template and the C chain as a primer, and uses the necessary components in the sequencing buffer, such as the pH buffer system, dNTP, Mg2+, etc. to initiate the chain displacement polymerization reaction.
  • the B chain is displaced, and the C chain is extended until the chain displacement polymerization activity of the polymerase is inhibited by the inhibitory segment. Since the 5' end of the C chain is connected to a hydrophobic molecule such as cholesterol (indicated by a circle in the figure), the sequencing complex is bound to the membrane material near the nanopore under the action of hydrophobic molecules such as cholesterol (in the figure, the membrane is represented by a square, and the middle channel represents the nanopore).
  • the guide sequence at the 5' end of the sequencing chain B chain is captured by the nanopore under the action of the electric field force and passes through the nanopore (indicated by a downward arrow in the figure).
  • the inhibition segment passes through the nanopore.
  • the polymerase with chain displacement activity uses the A chain as a template, displaces the B chain, and extends the C chain at a stable speed.
  • the B chain is displaced at a relatively stable speed and passes through the nanopore at a relatively stable speed to achieve stable sequencing.
  • the C chain extends to the end of the A chain, the hairpin structure is opened, and the polymerase uses the original hairpin structure sequence and the B chain as a template to continue to extend the C chain.
  • the B chain As the C chain extends, the B chain is pulled out of the nanopore at a relatively stable speed against the direction of the electric field force (indicated by an upward arrow in the figure). (6)
  • the C strand extends to the end of the B strand to form a new nucleic acid duplex, and the B strand is completely pulled out of the nanopore. The entire process sequences the same B strand twice.
  • the polymerase with chain displacement activity can be selected from DNA polymerase or RNA polymerase, such as Bst DNA polymerase, SD DNA polymerase, phi29 DNA polymerase, Bsu Large Fragment DNA polymerase, Klenow Fragment DNA polymerase, T3 RNA polymerase, T7 RNA polymerase, SP6 RNA polymerase, E. coli RNA polymerase or any combination thereof; or the polymerase is a polymerase without chain displacement activity that is modified to have chain displacement activity, such as T4 DNA polymerase, T7 DNA polymerase, DNA polymerase I or any combination thereof.
  • DNA polymerase or RNA polymerase such as Bst DNA polymerase, SD DNA polymerase, phi29 DNA polymerase, Bsu Large Fragment DNA polymerase, Klenow Fragment DNA polymerase, T3 RNA polymerase, T7 RNA polymerase, SP6 RNA polymerase, E. coli RNA polymerase or any combination thereof; or
  • Example 1 Screening for a salt-tolerant polymerase with strand displacement activity.
  • FIG. 4 shows an experimental schematic diagram of Example 1.
  • Polynucleotides SEQ.1 (A chain) and SEQ.2 (B chain) anneal to a Y-shaped nucleic acid duplex structure, named Y-0LNA;
  • SEQ.3 (C chain) is 15 nt in length, with CY3 fluorescent modification (star symbol) at the 5' end, and complementary pairing with the 3' end of SEQ.2 (B chain); polymerase (ellipse symbol) binds to the nucleic acid complex.
  • FIG. 13 shows the specific structure of iSpC3.
  • the polymerase uses the B chain as a template and extends the C chain; if the polymerase is inactive, the C chain cannot be extended and remains 15 nt; if the polymerase has no chain displacement polymerization activity, the A chain cannot be displaced and can only extend the C chain to 21 nt; if the polymerase has chain displacement polymerization activity, the A chain can be completely displaced and the C chain can be extended to 48 nt; the length of the C chain is detected by electrophoresis.
  • SEQ.1 is used as A chain and annealed with SEQ.2 as B chain.
  • the polynucleotide and annealing product were subjected to 15% TBE non-denaturing polyacrylamide gel electrophoresis at 200V for 1h.
  • the electrophoresis results are shown in Figure 5.
  • Lane 1 is the annealing product of SEQ.1+SEQ.2 (Y-0LNA), the arrow indicates the Y-shaped nucleic acid duplex
  • lane 5 is SEQ.1
  • lane 9 is SEQ.2
  • lane 10 is a DNA molecular weight standard (Thermo Scientific, SM1313).
  • the above results show that SEQ.1 and SEQ.2 can form a Y-shaped nucleic acid duplex that meets the expectations.
  • the polymerase reaction system is shown in Table 2.
  • Lane 1 is SEQ.3 with CY3 fluorescence modification at the 5' end, which serves as a negative control (NC); lanes 2-3 are polymerase BST+, lanes 4-5 are polymerase SD+, lanes 6-7 are polymerase Klenow Fragment, lanes 8-9 are polymerase Bsu Large Fragment, and lanes 10-11 are polymerase phi29, which are chain displacement polymerization products under 0.15M KCl and 0.30M KCl conditions.
  • the electrophoresis position of the C chain extended to 48nt is marked with C-48nt, and the electrophoresis position of the C chain not extended is marked with C.
  • Example 2 Detection of the inhibition of polymerase chain displacement polymerization activity by modified nucleotide LNA in the non-template strand.
  • FIG. 4 shows the experimental schematic diagram of Example 2.
  • Polynucleotides SEQ.4, SEQ.5, and SEQ.6 contain 2 LNAs, 4 LNAs, and 8 LNAs (indicated by bold black segments), respectively, as A chains, and anneal with SEQ.2 (B chain) to form Y-shaped nucleic acid duplex structures, respectively named Y-2LNA, Y-4LNA, and Y-8LNA;
  • SEQ.3 (C chain) is 15 nt in length, with CY3 fluorescent modification at the 5' end (indicated by a star symbol), and is complementary to the 3' end of SEQ.2 (B chain); a polymerase with strand displacement activity (indicated by an ellipse symbol) binds to the nucleic acid complex.
  • the polymerase uses the B chain as a template to extend the C chain; if the polymerase is inactive, the C chain cannot be extended and remains at 15 nt; if the 2 LNAs, 4 LNAs, or 8 LNAs contained in SEQ.4, or SEQ.5, or SEQ.6 can inhibit the chain displacement polymerization activity of the polymerase, the A chain cannot be displaced and the C chain can only be extended to 21 nt; if the 2 LNAs, 4 LNAs, or 8 LNAs contained in SEQ.4, or SEQ.5, or SEQ.6 cannot inhibit the chain displacement polymerization activity of the polymerase, the A chain can be completely displaced and the C chain is extended to 48 nt; the length of the C chain is detected by electrophoresis.
  • SEQ.1, SEQ.4, SEQ.5, and SEQ.6 were annealed with SEQ.2 to form Y-shaped nucleic acid duplexes, and the annealing products were named Y-0LNA, Y-2LNA, Y-4LNA, and Y-8LNA, respectively; Y-0LNA was used as a control group without LNA.
  • the annealing process was incubated at 95°C for 5 minutes, cooled to 25°C at a rate of 0.1°C/s, and incubated for 30 minutes.
  • the annealing reaction system is shown in Table 3.
  • Lanes 1-4 are the annealing products of SEQ.1+SEQ.2 (Y-0LNA), SEQ.4+SEQ.2 (Y-2LNA), SEQ.5+SEQ.2 (Y-4LNA), and SEQ.6+SEQ.2 (Y-8LNA), respectively. Arrows indicate Y-shaped nucleic acid duplexes. Lanes 5-9 are SEQ.1, SEQ.4, SEQ.5, SEQ.6, and SEQ.2, respectively.
  • Lane 10 is a DNA molecular weight standard (Thermo Scientific, SM1313). The above results show that SEQ.1 and SEQ.2, SEQ.4 and SEQ.2, SEQ.5 and SEQ.2, and SEQ.6 and SEQ.2 can all form Y-shaped nucleic acid duplexes that meet expectations.
  • the annealing product Y-0LNA (as a control group without LNA) of SEQ.1 and SEQ.2 (A chain + B chain), or the annealing product Y-2LNA of SEQ.4 and SEQ.2 (A chain + B chain), or the annealing product Y-4LNA of SEQ.5 and SEQ.2 (A chain + B chain), or the annealing product Y-8LNA of SEQ.6 and SEQ.2 (A chain + B chain), SEQ.3 (C chain) with CY3 fluorescent modification at the 5' end, and a polymerase with strand displacement activity were mixed with a reaction buffer containing a high concentration of salt ions and incubated at 30°C for 1 hour.
  • the polymerases with strand displacement activity tested were: BST+ (ArcticZymes Technologies, 71502-201); Klenow Fragment (NEB, M0212S); Bsu Large Fragment (NEB, M0330S).
  • the polymerase reaction system is shown in Table 4.
  • Lanes 1-4 are polymerase BST+, lanes 6-9 are polymerase Bsu Large Fragment, and lanes 11-14 are polymerase Klenow Fragment, which are chain displacement polymerization products under 0.30M KCl conditions; lanes 5, 10, and 15 are SEQ.3 with CY3 fluorescence modification at the 5' end, as a negative control (NC).
  • NC negative control
  • FIG8 shows a schematic diagram of sequencing library construction in Example 3.
  • the top chain (SEQ.7, SEQ.8, SEQ.9) consists of three parts: A, B, and C.
  • A is a guide sequence, which consists of 30 iSpC3 (indicated by black dashed lines in the figure);
  • B is a segment (inhibitory segment) that can inhibit polymerase chain displacement polymerization activity, which is 2, 4, and 8 LNA modified nucleic acids (indicated by bold black segments in the figure);
  • C is a DNA that is complementary to the bottom chain, and has a protruding T at the 3' end.
  • the 5' end of the bottom chain (SEQ.10) is modified with a phosphate group and consists of two parts, D and E.
  • D is a sequence that is complementary to the top chain B and C
  • E is a sequence that is complementary to the primer (SEQ.11).
  • FIG12 shows the specific structure of iSp18. The top chain and the bottom chain are annealed to a Y-type double-stranded sequencing adapter in a ratio of 1:1.
  • Each adapter is labeled as follows: the annealing adapter of SEQ.7 and SEQ.10 is labeled as Adaptor-2LNA, the annealing adapter of SEQ.8 and SEQ.10 is labeled as Adaptor-4LNA, and the annealing adapter of SEQ.9 and SEQ.10 is labeled as Adaptor-8LNA.
  • the target polynucleotide to be tested pUC57 plasmid enzyme-digested linearized double-stranded DNA
  • the Y-shaped double-stranded sequencing adapter after end repair and A addition, and the library to be sequenced is obtained after magnetic bead purification.
  • SEQ.7, SEQ.8, and SEQ.9 were annealed with SEQ.10 to form Y-shaped double-stranded sequencing adapters, and the obtained annealing products were named Adaptor-2LNA, Adaptor-4LNA, and Adaptor-8LNA, respectively.
  • the annealing process was incubated at 95°C for 5 minutes, cooled to 25°C at a rate of 0.1°C/s, and continued to incubate for 30 minutes.
  • the annealing reaction system is shown in Table 5.
  • the Y-shaped double-stranded sequencing adapter and the DNA to be tested are connected to form a sequencing library.
  • pUC57 plasmid SEQ.12 was digested with restriction endonucleases EcoR I-HF (NEB, R3101) and Hind III-HF (NEB, R3104) according to the manufacturer's instructions. The reaction conditions were incubated at 37°C for 60 minutes. The digestion reaction system is shown in Table 6.
  • Lane 1 is the target polynucleotide to be tested before connection, that is, the linearized double-stranded DNA of pUC57 plasmid digestion
  • lanes 2-4 are the products of connection and purification of sequencing adapters containing 2, 4, and 8 LNA modified nucleic acids and the target polynucleotide to be tested, respectively, marked as pUC57+Adaptor-2LNA, pUC57+Adaptor-4LNA, and pUC57+Adaptor-8LNA.
  • the connected sequencing library is marked with "pUC57+Adaptor” to indicate the electrophoresis position
  • the target polynucleotide that has not been connected to the adapter is marked with "pUC57” to indicate the electrophoresis position.
  • the results shown in Figure 9 show that the three groups of sequencing libraries pUC57+Adaptor-2LNA, pUC57+Adaptor-4LNA, and pUC57+Adaptor-8LNA were successfully constructed.
  • Example 4 Perform nanopore sequencing.
  • the sequencing library pUC57+Adaptor-4LNA was incubated with primers (SEQ.11), polymerase BST+ with strand displacement activity and reaction buffer at 30°C for 1 hour to form a sequencing complex as shown in Figure 10.
  • the sequencing library marked as A is complementary to the primer marked as B, wherein the 5' end of the primer has a cholesterol modification (marked as C), and is incubated with a polymerase with strand displacement activity (marked as D) to form a sequencing complex.
  • the sequencing complex incubation system is shown in Table 9.
  • FIG 11. The sequencing signal of the pUC57+Adaptor-4LNA sequencing library was captured, and a clear sequencing signal current amplitude change diagram was obtained.
  • (a) is a diagram of the current signal change after the nanopore captures the sequencing library.
  • (b) is an enlarged diagram of the signal in the box in (a).
  • the second group of tests was conducted with the same experimental steps except that the sequencing buffer used was different.
  • the sequencing buffer and sequencing results are shown in Table 10.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Food Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Nanotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种纳米孔测序方法和试剂盒。所述方法包括:1)提供测序文库,包括靶多核苷酸双链,靶多核苷酸双链包括第一链和第二链,第一链的5'端与第二链的3'端包括非配对的第一单链区,分别含有引导序列和第二引物配对区;2)将第一引物与测序文库进行孵育以形成测序复合物,所述第一引物具有3'自由端,且通过5'端附着在嵌有纳米孔的膜上;3)使具有链置换活性的聚合酶以第二链为模板、延伸第一引物,在电场力作用下,引导序列被膜上的纳米孔捕获且穿过纳米孔,随着延伸进行,第一链被置换出,并穿过纳米孔;4)检测延伸过程中第一链穿过纳米孔时产生的电信号变化,确定靶多核苷酸双链的第一链的序列信息。

Description

纳米孔测序方法和试剂盒 技术领域
本发明属于生物技术领域,具体而言,本发明提供了一种纳米孔测序方法和试剂盒。
背景技术
纳米孔测序技术是一种单分子水平检测技术,具有测序速度快、测序读长长、直接测序、通量高、成本低、体积小和便携带等优势。在纳米孔测序过程中,单个纳米孔镶嵌在绝缘防渗膜上,形成一个稳定的离子电流通道,在电压的作用下单链核酸分子穿过纳米孔,从而使通过纳米孔的离子电流减小。由于单链核酸分子上不同碱基的分子结构与体积大小不同,使得通过纳米孔的电流展现出对应于碱基序列的差异。利用算法解析电流变化信号,便可对穿孔的单链核酸序列实时读取。但是不加控制的单链核酸在穿过纳米孔时,由于速度过快,使得产生的电信号难以解析。同时,在正常测序过程中,双链核酸需要先转换为单链核酸才能通过纳米孔,进而完成测序。
因此现有技术中开发了不同的策略,以相对稳定的速度控制待测靶双链核酸转换为单链核酸,进而使单链核酸以相对稳定的速度穿过纳米孔,完成测序。
专利公开文本CN105209634A和CN106460061A公开了如下的测序技术路线。(1)使用Y型测序接头复合物,其中接头的顶链由“引导序列+解旋酶结合位点+限位序列(spacer)+与底链互补的序列”组成,接头的底链由“与顶链互补的序列+与拘束序列(tether)互补的序列”组成,顶链和底链退火为测序接头,解旋酶结合于接头中顶链的“解旋酶结合位点”,并停滞在限位序列处;(2)把待测核酸与Y型测序接头复合物进行连接,获得测序文库;(3)把测序文库、拘束序列(tether)和测序缓冲液加入到嵌有纳米孔的测序流体槽(flow cell)中,拘束序列将测序文库结合在镶嵌纳米孔蛋白的高分子膜上;(4)在测序文库未被纳米孔捕获时,由于限位序列的存在,解旋酶无法解旋核酸双链,当测序文库被纳米孔捕获时,在电场力作用下,解旋酶移动并穿过限位序列,以相对稳定的速度进行核酸双链的解旋,实现测序。此项技术路线的缺点是:(1)所采用的Y型测序接头复合物是解旋酶-核酸复合物,接头复合物构建流程复杂、产率低;(2)采用Y型测序接头复合物构建的测序文库,需要同时保持解旋酶的生化活性及核酸的完整性,保存条件严苛,难以长期保存,须尽快进行测序。
美国授权专利US10480027B2公开了如下的测序技术路线。(1)提供 一种聚合酶-核酸复合物,其包含链置换聚合酶和环状核酸模板,并提供核酸合成所需的组分,由此聚合产生新合成链。(2)随着时间的推移,新合成链通过纳米孔,通过测量电流变化确定新生链的序列。专利公开文本CN113366120A也公开了类似的技术路线。这类技术路线的缺点是:在DNA合成的新生链被纳米孔捕获前,新生链的合成是一直进行的、不受控制地持续合成,新生链易形成复杂的二级结构,难以被纳米孔捕获,完成测序。
因此,本领域中需要改进纳米孔测序技术。
发明内容
本发明的目标在于至少部分地解决或改进纳米孔测序技术中如下的一项或多项问题:测序接头复合物构建流程复杂、产率低、保存条件严苛、难以长期保存;使用聚合酶合成的新生链在通过纳米孔前容易形成二级结构;测序系统复杂度高。
因此,在第一方面,本发明提出了一种纳米孔测序方法,所述方法包括:
1)提供测序文库,所述测序文库包括靶多核苷酸双链,所述靶多核苷酸双链包括第一链和第二链,所述第一链的5’端与所述第二链的3’端包括非配对的第一单链区,在所述第一链的第一单链区5’端含有引导序列,在所述第二链的第一单链区3’端含有第二引物配对区;
2)将第一引物与所述测序文库进行孵育以形成测序复合物,其中,所述第一引物与所述第二引物配对区通过碱基互补配对原则进行结合,所述第一引物具有3’自由端,且所述复合物通过所述第一引物的5’端附着在嵌有纳米孔的膜上;
3)使具有链置换活性的聚合酶以第二链为模板、延伸所述第一引物,在电场力作用下,所述引导序列被膜上的纳米孔捕获且穿过纳米孔,随着延伸的进行,所述第一链被置换出,并穿过纳米孔;
4)检测延伸过程中所述第一链穿过纳米孔时产生的电信号变化,确定所述靶多核苷酸双链的第一链的序列信息。
在一个优选的实施方案中,在1)中,所述第一链的3’端与所述第二链的5’端序列完全互补配对形成配对区。
在一个优选的实施方案中,在1)中,所述靶多核苷酸双链进一步包括:所述第一链的3’端与所述第二链的5’端包括非配对的第二单链区,在所述第一链的第二单链区3’端包括第一引物配对区。
在一个优选的实施方案中,在2)中,将第一引物、第二引物与所述测序文库进行孵育以形成测序复合物,其中,所述第一引物与所述第二引物配对区通过碱基互补配对原则进行结合,所述第二引物与所述第一引物配对区通过碱基互补配对原则进行结合,且所述复合物通过所述第一引物 和/或所述第二引物的5’端固定在嵌有纳米孔的膜上。
在一个优选的实施方案中,所述方法进一步包括:5)聚合酶以所述第一链为模板延伸所述第二引物,使得所述第一链以逆电场方向退出膜上的纳米孔,检测所述第一链退出纳米孔时产生的电信号变化,再次确定所述靶多核苷酸双链的第一链的序列信息。
在一个优选的实施方案中,所述第二链的5’端含有引导序列。
在一个优选的实施方案中,在1)中,所述靶多核苷酸双链进一步包括:所述第一链的3’末端和所述第二链的5’末端相连接,使得所述靶多核苷酸双链在该末端具有发夹结构。
在一个优选的实施方案中,所述方法进一步包括5)延伸至所述发卡结构后,聚合酶以所述第一链为模板继续进行延伸,使得所述第一链以逆电场方向退出膜上的纳米孔,检测所述第一链退出纳米孔时产生的电信号变化,再次确定所述靶多核苷酸双链的第一链的序列信息。
在某些实施方案中,所述具有链置换活性的聚合酶为具有耐盐性的聚合酶。
在某些实施方案中,具有链置换活性的聚合酶是DNA聚合酶或RNA聚合酶,如Bst DNA聚合酶、SD DNA聚合酶、phi29DNA聚合酶、Bsu Large Fragment DNA聚合酶、Klenow Fragment DNA聚合酶、T3RNA聚合酶、T7RNA聚合酶、SP6RNA聚合酶、E.coli RNA聚合酶或其任意组合;或者所述聚合酶是无链置换活性聚合酶经过改造后具有链置换活性的聚合酶,如T4DNA聚合酶、T7DNA聚合酶、DNA聚合酶I或其任意组合。
在一个实施方案中,通过在多核苷酸双链上连接Y型接头制备靶多核苷酸双链,所述Y型接头包括引导序列和引物配对区,在与多核苷酸双链连接后使得获得的靶多核苷酸第一链的5’端含有引导序列,第二链的3’端包括第二引物配对区。
在一个实施方案中,所述引物为核酸单链,优选长度小于80个核苷酸,例如小于70、60或50个核苷酸。
在一个实施方案中,所述引物的5’端连接有疏水性分子,优选为选自以下任意一种或多种:脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质和/或氨基酸,如胆固醇、棕榈酸酯或生育酚。
在一个实施方案中,所述引导序列包含多核苷酸或多个iSpC3。优选地,所述多核苷酸为同聚多核苷酸。
在一个实施方案中,所述引导序列长度可以是10-50个核苷酸或iSpC3,例如20、30或40个核苷酸或iSpC3。
在某些实施方案中,所述纳米孔是跨膜蛋白孔或固态孔。
在某些实施方案中,所述跨膜蛋白孔选自溶血素、MspA、MspB、MspC、MspD、FraC、ClyA、PA63、CsgG、CsgD、XcpQ、SP1、phi29连接器蛋白(phi29connector)、InvG、GspD或其任意组合。
在某些实施方案中,所述纳米孔还连接有另外的多肽,所述另外的多肽选自标签、酶切位点、信号肽或导肽、可检测的标记或其任意组合。
在某些实施方案中,所述膜是两亲性膜(例如磷脂双分子层)、高分子聚合物膜(例如两嵌段共聚物di-block、三嵌段共聚物tri-block)或其任意组合。
在某些实施方案中,所述引导序列的3’端连接有抑制聚合酶链置换聚合活性的抑制区段。
在某些实施方案中,所述抑制区段是GC富含基序、人工修饰核苷酸、其他抑制分子或其任意组合。
在某些实施方案中,所述人工修饰核苷酸是LNA、PNA、BNA或其任意组合。
在某些实施方案中,所述人工修饰核苷酸是LNA,其个数为2-10个,优选4-8个。
在某些实施方案中,所述方法在如下的缓冲液或测序缓冲液中进行:磷酸二氢根-磷酸氢根缓冲体系、碳酸-碳酸氢钠缓冲体系、Tris-HCl缓冲体系、HEPES缓冲体系、MOPS缓冲体系或其任意组合。
在某些实施方案中,所述反应缓冲液或测序缓冲液含有NTP、dNTP、ddNTP或其任意组合。
在某些实施方案中,所述反应缓冲液或测序缓冲液含有K+、Na+或其任意组合。
在某些实施方案中,所述反应缓冲液或测序缓冲液含有Mg2+、Mo2+、Cu2+、Fe2+、Zn2+、Ca2+、Pb2+、Cd2+或其任意组合。
在某些实施方案中,所述反应缓冲液或测序缓冲液含有增强聚合酶延伸反应常用的添加剂或辅助试剂,如二甲基亚砜(DMSO)、甘油、甲酰胺、牛血清白蛋白(BSA)、硫酸铵((NH4)2SO4)、聚乙二醇(PEG)、明胶、非离子型去污剂(如Tween 20,Trtion X-100)、N,N,N-三甲基甘氨酸(甜菜碱)、单链核酸结合蛋白或其任意组合。
在某些实施方案中,对膜两侧施加电压以形成电场力。在某些实施方案中,所述电压是10mV以上,优选50mV-250mV的电压。
在第二方面,本发明提供了一种试剂盒,包括:
用于与核苷酸双链连接的Y型接头,所述Y型接头两条链上分别包括引导序列和引物配对区,在与核苷酸双链连接后使得获得的靶多核苷酸第一链的5’端含有引导序列,第二链的3’端包括引物配对区;
纳米孔;
膜;
引物,所述引物与所述引物配对区互补,所述引物的5’端具有固定部件,用于附着在膜上;
具有链置换活性的聚合酶;
进行聚合反应的缓冲体系。
在某些实施方案中,所述纳米孔嵌入所述膜中。
在某些实施方案中,所述引导序列的3’端连接有抑制聚合酶链置换聚合活性的抑制区段。
在某些实施方案中,所述抑制区段为GC富含基序或人工修饰核苷酸。
在某些实施方案中,所述人工修饰核苷酸是LNA、PNA、BNA或其任意组合。
在某些实施方案中,所述人工修饰核苷酸是LNA,其个数为2-10个,优选4-8个。
在某些实施方案中,所述引物为核酸单链,优选长度小于80个核苷酸,例如小于70、60或50个核苷酸。
在某些实施方案中,所述引物5’端连接有疏水性分子,优选为选自以下任意一种或多种:脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质和/或氨基酸,如胆固醇、棕榈酸酯或生育酚。
在某些实施方案中,所述引导序列包含多核苷酸或iSpC3。
在某些实施方案中,所述引导序列长度可以是10-50,例如20、30或40个核苷酸或iSpC3。
在某些实施方案中,所述具有链置换活性的聚合酶为DNA聚合酶或RNA聚合酶。
在某些实施方案中,所述具有链置换活性的聚合酶为耐盐聚合酶。
在某些实施方案中,所述聚合酶为无链置换活性聚合酶经过改造后具有链置换活性的聚合酶。
在某些实施方案中,所述具有链置换活性的聚合酶为DNA聚合酶或RNA聚合酶,例如Bst DNA聚合酶、SD DNA聚合酶、phi29DNA聚合酶、Bsu Large Fragment DNA聚合酶、Klenow Fragment DNA聚合酶、T3RNA聚合酶、T7RNA聚合酶、SP6RNA聚合酶、E.coli RNA聚合酶或其任意组合;或者所述聚合酶是无链置换活性聚合酶经过改造后具有链置换活性的聚合酶,例如T4DNA聚合酶、T7DNA聚合酶、DNA聚合酶I或其任意组合。
在某些实施方案中,所述纳米孔是跨膜蛋白孔或固态孔。
在某些实施方案中,所述跨膜蛋白孔选自溶血素、MspA、MspB、MspC、MspD、FraC、ClyA、PA63、CsgG、CsgD、XcpQ、SP1、Phi29连接器蛋白、InvG、GspD或其任意组合。
在某些实施方案中,所述纳米孔还连接有另外的多肽,所述另外的多肽选自标签、酶切位点、信号肽或导肽、可检测的标记或其任意组合。
在某些实施方案中,所述膜是两亲性膜、高分子聚合物膜或其任意组合。
在某些实施方案中,所述膜是磷脂双分子层、两嵌段共聚物或三嵌段 共聚物。
在某些实施方案中,所述进行聚合反应的缓冲体系是磷酸二氢根-磷酸氢根缓冲体系、碳酸-碳酸氢钠缓冲体系、Tris-HCl缓冲体系、HEPES缓冲体系、MOPS缓冲体系或其任意组合。
在某些实施方案中,所述进行聚合反应的缓冲体系含有NTP、dNTP、ddNTP或其任意组合。
在某些实施方案中,所述进行聚合反应的缓冲体系含有增强聚合酶延伸反应常用的添加剂或辅助试剂,如二甲基亚砜(DMSO)、甘油、甲酰胺、牛血清白蛋白(BSA)、硫酸铵((NH4)2SO4)、聚乙二醇(PEG)、明胶、非离子型去污剂(如Tween 20,Trtion X-100)、N,N,N-三甲基甘氨酸(甜菜碱)、单链核酸结合蛋白或其任意组合。
在第三方面,本发明提供了本发明第二方面的试剂盒在高通量测序中的应用,所述高通量测序优选为纳米孔测序。
本发明的优点在于如下的一项或多项:本发明的测序文库和测序接头构成简单、测序文库构建流程简便,并且测序文库可以长期保存。本发明方法由具有链置换活性的聚合酶以相对稳定的速度打开双链、合成新生链,因此测序链的穿孔速度相对稳定。本发明方法在测序文库被纳米孔捕获之后,才会持续进行DNA合成、产生新生链。因此,可以避免“在测序文库被纳米孔捕获之前,由于新生链的持续合成,产生复杂的二级结构,进而导致不能正常测序”的问题。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一个实施方案的纳米孔测序方法示意图。
图2示出了根据本发明另一个实施方案的纳米孔测序方法示意图。
图3示出了根据本发明再一个实施方案的纳米孔测序方法示意图。
图4示出了实施例1和实施例2的实验示意图,(a)多聚核苷酸A链和B链退火为Y型核酸双链体结构,(b)A链含有2个LNA、4个LNA、8个LNA(加粗黑色线段表示)。
图5示出了实施例1和实施例2的Y型核酸双链体退火产物电泳图。泳道1-4分别为SEQ.1+SEQ.2(Y-0LNA)、SEQ.4+SEQ.2(Y-2LNA)、SEQ.5+SEQ.2(Y-4LNA)、SEQ.6+SEQ.2(Y-8LNA)的退火产物,箭头标示Y型核酸双链体;泳道5-9分别为SEQ.1、SEQ.4、SEQ.5、SEQ.6、SEQ.2;泳道10为DNA分子量标准。
图6示出了实施例1筛选具有链置换活性且耐盐的聚合酶。
图7示出了实施例2检测非模板链中修饰核苷酸抑制聚合酶链置换聚合活性。Y-0LNA的非模板链中含0个LNA,Y-2LNA的非模板链中含2个LNA,Y-4LNA的非模板链中含4个LNA,Y-8LNA的非模板链中含8个LNA。
图8示出了实施例3测序文库构建示意图,(a)测序接头示意图,(b)测序文库示意图。
图9示出了实施例3测序文库电泳胶图。
图10示出了实施例4测序复合物示意图。
图11示出了实施例4纳米孔测序典型的待测靶多核苷酸的电流信号图。
图12示出了实施例中使用的iSp18的具体结构。
图13示出了实施例中使用的iSpC3的具体结构。
具体实施方式
为了使本发明的上述以及其他特征和优点更加清楚,下面结合附图进一步描述本发明。应当理解,本文给出的具体实施例是出于向本领域技术人员解释的目的,仅是示例性的,而非限制性的。对于本领域的普通技术人员而言,可以根据具体情况理解术语在本发明中的具体含义,除非另有明确的限定。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
图1展示了本发明的纳米孔测序方法的一个示例性过程。Y型双链测序接头(在图中为六边形圈出的结构)由顶链和底链退火形成,Y型双链测序接头与靶多核苷酸双链的一端连接,进而构建为测序文库。构建完成的测序文库可以参照常规双链多核苷酸的方法长期保存。构建完成的测序文库由A链和B链组成,其中B链为测序链,A链为测序链的互补链。A链3’末端能够与引物C链互补配对;B链5’末端为引导序列(在图中以黑色虚线表示,参照专利公开文本CN 103733063A),与引导序列3’端相连接的是抑制区段(在图中以加粗黑色线段表示),抑制区段能够抑制聚合酶的链置换聚合活性。抑制区段的具体形式不受限制,只要能够抑制聚合酶的链置换聚合活性的分子均可以。例如,抑制区段可以是具有更强结合力的GC富含基序、人工修饰核苷酸(如LNA、PNA、BNA)或其他抑制分子等。引导序列与抑制区段均在B链上。整个测序过程如下:(1)将测序文库(A链和B链)、引物(C链),以及具有链置换活性的聚合酶(在图中以椭圆表示)混匀孵育;C链结合于A链3’末端,具有链置换活性的聚合酶结合于靶多核苷酸上,进而形成测序复合物。(2)具有链置换活性的聚合酶以A链为模板、C链为引物,利用测序缓冲液中的必要组分,如pH缓冲体系、dNTP、Mg 2+等,启动链置换的聚合反应。以A链为 模板、置换B链、并延伸C链,直至聚合酶的链置换聚合活性被抑制区段所抑制。由于C链5’末端连接胆固醇等疏水性分子(在图中以圆形表示),因此,测序复合物在胆固醇等疏水性分子作用下结合在纳米孔附近的膜材料上(在图中以方块表示膜,中间通道表示纳米孔,参照专利公开文本CN103733063A)。引物5’端还可以连接其他疏水性分子,例如脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质和/或氨基酸,如棕榈酸酯、生育酚。引物也可以含有多种天然或非天然修饰核苷酸。施加测序电压后,在电场力作用下,测序链B链5’末端的引导序列被纳米孔捕获,穿过纳米孔(在图中以向下箭头表示)。(3)在电场力作用下,抑制区段穿过纳米孔。具有链置换活性的聚合酶以稳定的速度,以A链为模板、置换B链、并延伸C链。(4)B链以相对稳定的速度被置换出,并以相对稳定的速度穿过纳米孔,实现稳定测序。(5)C链延伸至A链末端,形成新的双链体,被置换出的B链则完全穿过纳米孔,完成测序。
图2展示了本发明的纳米孔测序方法的另一个示例性流程。Y型双链测序接头由顶链和底链退火形成,Y型双链测序接头1与靶多核苷酸双链的一端连接,Y型双链测序接头2与靶多核苷酸双链的另一端连接,进而构建为测序文库。Y接头1与Y接头2的具体序列不受限制,它们也可以相同,也可以不同。构建完成的测序文库可以参照常规双链多核苷酸的方法长期保存。测序文库由A链和B链组成,其中B链为测序链,A链为测序链的互补链。A链的3’末端能够与引物C链互补配对,5’末端为引导序列1(在图中以黑色虚线表示),与引导序列1的3’端相连接的是抑制区段1(在图中以加粗黑色线段表示),抑制区段1能够抑制聚合酶的链置换聚合活性。抑制区段1的具体形式不受限制,只要能够抑制聚合酶的链置换聚合活性的分子均可以。例如,抑制区段1可以是具有更强结合力的GC富含基序、人工修饰核苷酸(如LNA、PNA、BNA)或其他抑制分子等。引导序列1与抑制区段1均在A链上。同样的,B链的3’末端能够与引物C’链互补配对,5’末端为引导序列2,与引导序列2的3’端相连接的是抑制区段2(在图中以加粗黑色线段表示),抑制区段2能够抑制聚合酶的链置换聚合活性。抑制区段2的具体形式不受限制,只要能够抑制聚合酶的链置换聚合活性的分子均可以。例如,抑制区段2可以是具有更强结合力的GC富含基序、人工修饰核苷酸(如LNA、PNA、BNA),或其他抑制分子等。引导序列2与抑制区段2均在B链上。整个测序过程如下:(1)将测序文库(A链和B链)与引物(C链和C’链),以及具有链置换活性的聚合酶(在图中以椭圆表示)混匀孵育;C链与A链3’端互补配对,C’链与B链3’端互补配对;具有链置换活性的聚合酶结合于靶多核苷酸上,进而形成测序复合物。(2)在靶多核苷酸双链的一端,具有链置换活性的聚合酶,以A链为模板、C链为引物,利用测序缓冲液中的必要组分,如pH缓冲体系、dNTP、Mg2+等,启动链置换聚合反应, 以A链为模板、置换B链、并延伸C链,直至聚合酶的链置换聚合活性被抑制区段2所抑制。同样的,在靶多核苷酸双链的另一端,具有链置换活性的聚合酶,以B链为模板、C’链为引物,利用测序缓冲液中的必要组分,如pH缓冲体系、dNTP、Mg2+等,启动链置换聚合反应,以B链为模板、置换A链、并延伸C’链,直至聚合酶的链置换聚合活性被抑制区段1所抑制。由于C链和C’链5’末端连接胆固醇等疏水性分子(在图中以圆形表示),因此,测序复合物在胆固醇等疏水性分子作用下结合在纳米孔附近的膜材料上(在图中以方块表示膜,中间通道表示纳米孔)。施加测序电压后,在电场力作用下,测序链B链5’末端的引导序列2被纳米孔捕获,穿过纳米孔(在图中以向下箭头表示)。(3)在电场力作用下,B链的抑制区段2穿过纳米孔。具有链置换活性的聚合酶以稳定的速度,以A链为模板、置换B链、并延伸C链。(4)B链以相对稳定的速度被置换出,并以相对稳定的速度穿过纳米孔,实现稳定测序。(5)C链延伸至A链末端,形成新的核酸双链体,而被置换出的B链穿过纳米孔直至遇到另一端的聚合酶,聚合酶利用测序缓冲液中的必要组分,如pH缓冲体系、dNTP、Mg2+等,启动聚合反应,以B链为模板、延伸C’链。(6)随着C’链的延伸,逆电场力方向,B链以相对稳定的速度从纳米孔中拔出(在图中以向上箭头表示)。(7)C’链延伸至B链5’末端,形成新的核酸双链体,B链也被完全从纳米孔中拔出。整个过程对同一条B链进行了两次测序。
图3展示了本发明的纳米孔测序方法的再一个示例性流程。Y型双链测序接头由顶链和底链退火形成,发卡型接头由一条单链退火形成,靶多核苷酸双链一端连接Y型双链测序接头,另一端为发卡结构,例如通过连接发卡型接头形成发卡结构,进而构建为测序文库。构建完成的测序文库可以参照常规双链多核苷酸的方法长期保存。构建完成的测序文库由A链和B链组成,其中B链为测序链,A链为测序链的互补链。A链3’末端与引物C链互补配对;B链5’末端为引导序列(在图中以黑色虚线表示),与引导序列3’端相连接的是抑制区段(在图中以加粗黑色线段表示),抑制区段能够抑制聚合酶的链置换聚合活性。抑制区段的具体形式不受限制,只要能够抑制聚合酶的链置换聚合活性的分子均可以。例如,抑制区段可以是具有更强结合力的GC富含基序、人工修饰核苷酸(如LNA、PNA、BNA),或其他抑制分子等。引导序列与抑制区段均在B链上。整个测序过程如下:(1)将测序文库(A链和B链)、引物(C链),以及具有链置换活性的聚合酶(在图中以椭圆表示)混匀孵育;C链结合于A链3’末端,具有链置换活性的聚合酶结合于靶多核苷酸上,进而形成待测序复合物。(2)具有链置换活性的聚合酶以A链为模板、C链为引物,利用测序缓冲液中的必要组分,如pH缓冲体系、dNTP、Mg2+等,启动链置换聚合反应。以A链为模板、置换B链、并延伸C链,直至聚合酶的链 置换聚合活性被抑制区段所抑制。由于C链5’末端连接胆固醇等疏水性分子(在图中以圆形表示),因此,测序复合物在胆固醇等疏水性分子作用下结合在纳米孔附近的膜材料上(在图中以方块表示膜,中间通道表示纳米孔),施加测序电压后,在电场力作用下,测序链B链5’末端的引导序列被纳米孔捕获,穿过纳米孔(在图中以向下箭头表示)。(3)在电场力作用下,抑制区段穿过纳米孔。具有链置换活性的聚合酶以稳定的速度,以A链为模板、置换B链、并延伸C链。(4)B链以相对稳定的速度被置换出,并以相对稳定的速度穿过纳米孔,实现稳定测序。(5)C链延伸至A链末端,发卡结构被打开,聚合酶以原发夹结构序列和B链为模板、继续延伸C链。随着C链延伸,逆电场力方向,B链以相对稳定的速度从纳米孔中拔出(在图中以向上箭头表示)。(6)C链延伸至B链末端,形成新的核酸双链体,B链也被完全从纳米孔中拔出。整个过程对同一条B链进行了两次测序。
在本发明中,所述具有链置换活性的聚合酶可以选自DNA聚合酶或RNA聚合酶,例如Bst DNA聚合酶、SD DNA聚合酶、phi29 DNA聚合酶、Bsu Large Fragment DNA聚合酶、Klenow Fragment DNA聚合酶、T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶、E.coli RNA聚合酶或其任意组合;或者所述聚合酶是无链置换活性聚合酶经过改造后具有链置换活性的聚合酶,例如T4 DNA聚合酶、T7 DNA聚合酶、DNA聚合酶I或其任意组合。
实施例一:筛选具有链置换活性的耐盐聚合酶。
在图4中的(a)示出了实施例1的实验示意图。多聚核苷酸SEQ.1(A链)和SEQ.2(B链)退火为Y型核酸双链体结构,命名为Y-0LNA;SEQ.3(C链)长度为15nt,5’末端带有CY3荧光修饰(星形符号表示),且与SEQ.2(B链)的3’末端互补配对;聚合酶(椭圆符号表示)结合核酸复合物。图13示出了其中iSpC3的具体结构。在反应缓冲液中,聚合酶以B链为模板、延伸C链;如果聚合酶没有活性,则C链不能延伸,仍为15nt;如果聚合酶没有链置换聚合活性,则A链不能被置换,只能延伸C链到21nt;如果聚合酶具有链置换聚合活性,则A链可以被完全置换,延伸C链到48nt;通过电泳检测C链长度。
1、Y型核酸双链体退火。
1)按照生产商说明将SEQ.1、SEQ.2、SEQ.3分别用TE缓冲液(pH=8)溶解成终浓度100μM的母液。
2)将SEQ.1和SEQ.2退火为Y型核酸双链体,命名为Y-0LNA。退火流程为95℃孵育5分钟,0.1℃/s的降温速度降至25℃,继续孵育30分钟。退火反应体系见表1。
表1 Y型核酸双链体退火反应体系
Figure PCTCN2022139739-appb-000001
Figure PCTCN2022139739-appb-000002
3)多聚核苷酸SEQ.1作为A链,与作为B链的SEQ.2退火。多聚核苷酸和退火产物进行15%TBE非变性聚丙烯酰胺凝胶电泳,200V电泳1h。电泳结果如图5所示,泳道1为SEQ.1+SEQ.2(Y-0LNA)退火产物,箭头标示Y型核酸双链体,泳道5为SEQ.1,泳道9为SEQ.2,泳道10为DNA分子量标准(Thermo Scientific,SM1313)。上述结果表明:SEQ.1与SEQ.2能够形成符合预期的Y型核酸双链体。
2、筛选具有链置换活性的耐盐聚合酶。
1)如图4中的(a)所示,将SEQ.1与SEQ.2(A链+B链)的退火产物Y-0LNA,5’末端带有CY3荧光修饰SEQ.3(C链),具有链置换活性的聚合酶,含有高浓度盐离子的反应缓冲液混合,30℃条件下孵育1小时。测试的具有链置换活性的聚合酶分别为:BST+(ArcticZymes Technologies,71502-201);SD+(ArcticZymes Technologies,71501-201);Klenow Fragment(NEB,M0212S);Bsu Large Fragment(NEB,M0330S);phi29(NEB,M0269S)。反应缓冲液分别为:反应缓冲液1(终浓度:0.15M KCl,50mM Tris-HCl,10mM MgCl2,1mM dNTP,pH=7.90);反应缓冲液2(终浓度:0.30M KCl,50mM Tris-HCl,10mM MgCl2,1mM dNTP,pH=8.10)。聚合酶反应体系见表2。
表2聚合酶反应体系
Figure PCTCN2022139739-appb-000003
2)取10μL反应产物与10μL 2×上样缓冲液(Invitrogen,AM8546G)混匀,95℃处理10分钟。样品进行20%TBU变性聚丙烯酰胺凝胶电泳,200V电泳1h,电泳结束后检测CY3荧光。电泳结果如图6所示,泳道1为5’末端带有CY3荧光修饰SEQ.3,作为阴性对照(NC);泳道2-3为聚合酶BST+、泳道4-5为聚合酶SD+、泳道6-7为聚合酶Klenow Fragment、泳道8-9为聚合酶Bsu Large Fragment、泳道10-11为聚合酶phi29,在0.15M KCl和0.30M KCl条件下的链置换聚合反应产物。C链延伸到48nt用C-48nt标示电泳位置,C链未延伸用C标示电泳位置。
3)图6所示结果表明:聚合酶BST+、聚合酶SD+、聚合酶Klenow Fragment、聚合酶Bsu Large Fragment在0.15M KCl和0.30M KCl的高盐条件下均有链置换聚合活性;聚合酶phi29在0.15M KCl的高盐条件下有链置换聚合活性,而在0.30M KCl的高盐条件下几乎没有链置换聚合活性。
实施例二:检测非模板链中修饰核苷酸LNA抑制聚合酶链置换聚合活性。
在图4中的(b)示出了实施例2的实验示意图。多聚核苷酸SEQ.4、SEQ.5、SEQ.6分别含有2个LNA、4个LNA、8个LNA(加粗黑色线段表示),作为A链,分别和SEQ.2(B链)退火为Y型核酸双链体结构,分别命名为Y-2LNA、Y-4LNA、Y-8LNA;SEQ.3(C链)长度为15nt,5’末端带有CY3荧光修饰(星形符号表示),且与SEQ.2(B链)的3’末端互补配对;具有链置换活性的聚合酶(椭圆符号表示)结合核酸复合物。在反应缓冲液中,聚合酶以B链为模板、延伸C链;如果聚合酶没有活性,则C链不能延伸,仍为15nt;如果SEQ.4、或SEQ.5、或SEQ.6中含有的2个LNA、或4个LNA、或8个LNA能够抑制聚合酶的链置换聚合活性,则A链不能被置换,只能延伸C链到21nt;如果SEQ.4、或SEQ.5、或SEQ.6中含有的2个LNA、或4个LNA、或8个LNA不能抑制聚合酶的链置换聚合活性,则A链可以被完全置换,延伸C链到48nt;通过电泳检测C链长度。
1、Y型核酸双链体退火。
1)按照生产商说明将SEQ.1、SEQ.2、SEQ.3、SEQ.4、SEQ.5、SEQ.6分别用TE缓冲液(pH=8)溶解成终浓度100μM的母液。
2)将SEQ.1、SEQ.4、SEQ.5、SEQ.6均单独与SEQ.2退火为Y型核酸双链体,退火产物分别命名为Y-0LNA、Y-2LNA、Y-4LNA、Y-8LNA;Y-0LNA作为不含LNA的对照组。退火流程为95℃孵育5分钟,0.1℃/s的降温速度降至25℃,继续孵育30分钟。退火反应体系见表3。
表3 Y型核酸双链体退火反应体系
Figure PCTCN2022139739-appb-000004
3)多聚核苷酸和退火产物进行15%TBE非变性聚丙烯酰胺凝胶电泳,200V电泳1h。电泳结果如图5所示,泳道1-4分别为SEQ.1+SEQ.2(Y-0LNA)、SEQ.4+SEQ.2(Y-2LNA)、SEQ.5+SEQ.2(Y-4LNA)、SEQ.6+SEQ.2(Y-8LNA)的退火产物,箭头标示Y型核酸双链体,泳道5-9分别为SEQ.1、SEQ.4、SEQ.5、SEQ.6、SEQ.2,泳道10为DNA分子量标准(Thermo Scientific,SM1313)。上述结果表明:SEQ.1与SEQ.2、 SEQ.4与SEQ.2、SEQ.5与SEQ.2、SEQ.6与SEQ.2均能形成符合预期的Y型核酸双链体。
2、检测非模板链中修饰核苷酸LNA抑制聚合酶链置换聚合活性。
1)如图4中的(b)所示,把SEQ.1与SEQ.2(A链+B链)的退火产物Y-0LNA(作为不含LNA的对照组)、或SEQ.4与SEQ.2(A链+B链)的退火产物Y-2LNA、或SEQ.5与SEQ.2(A链+B链)的退火产物Y-4LNA、或SEQ.6与SEQ.2(A链+B链)的退火产物Y-8LNA,5’末端带有CY3荧光修饰SEQ.3(C链),具有链置换活性的聚合酶,含有高浓度盐离子的反应缓冲液混合,30℃条件下孵育1小时。测试的具有链置换活性的聚合酶分别为:BST+(ArcticZymes Technologies,71502-201);Klenow Fragment(NEB,M0212S);Bsu Large Fragment(NEB,M0330S)。反应缓冲液分别为:反应缓冲液2(终浓度:0.30M KCl,50mM Tris-HCl,10mM MgCl2,1mM dNTP,pH=8.10)。聚合酶反应体系见表4。
表4聚合酶反应体系
Figure PCTCN2022139739-appb-000005
2)取10μL反应产物与10μL 2×上样缓冲液(Invitrogen,AM8546G)混匀,95℃处理10分钟。样品进行20%TBU变性聚丙烯酰胺凝胶电泳,200V电泳1h,电泳结束后检测CY3荧光。电泳结果如图7所示,泳道1-4为聚合酶BST+、泳道6-9为聚合酶Bsu Large Fragment、泳道11-14为聚合酶Klenow Fragment,在0.30M KCl条件下的链置换聚合反应产物;泳道5、10、15为5’末端带有CY3荧光修饰SEQ.3,作为阴性对照(NC)。C链延伸到48nt用C-48nt标示电泳位置,C链延伸到21nt用C-21nt标示电泳位置,C链未延伸用C标示电泳位置。
图7所示结果表明:在0.30M KCl的高盐条件下,非模板链中4个或8个LNA能够很好地抑制聚合酶BST+、聚合酶Klenow Fragment、聚合酶Bsu Large Fragment的链置换聚合活性;非模板链中2个LNA能够部分抑制聚合酶BST+、聚合酶Klenow Fragment、聚合酶Bsu Large Fragment的链置换聚合活性。
实施例三:构建测序文库。
图8示出了实施例3测序文库构建示意图。(a)测序接头示意图。顶链(SEQ.7、SEQ.8、SEQ.9)由A、B、C三部分组成,A为引导序列,由 30个iSpC3组成(在图中以黑色虚线表示);B为能够抑制聚合酶链置换聚合活性的区段(抑制区段),分别为2个、4个、8个LNA修饰核酸(在图中以加粗黑色线段表示);C为与底链互补配对的DNA,且3’端有突出的T。底链(SEQ.10)的5’端有磷酸基团修饰,由D、E两部分组成,D为与顶链B和C互补配对的序列,E为与引物(SEQ.11)互补配对的序列。图12示出了其中iSp18的具体结构。顶链和底链按照1:1的比例退火为Y型双链测序接头。各接头标记如下:SEQ.7与SEQ.10退火接头标记为Adaptor-2LNA,SEQ.8与SEQ.10退火接头标记为Adaptor-4LNA,SEQ.9与SEQ.10退火接头标记为Adaptor-8LNA。(b)测序文库示意图。待测靶多核苷酸(pUC57质粒酶切线性化双链DNA)经过末端修复和加A后与Y型双链测序接头连接,经过磁珠纯化后得到待测序文库。
1、Y型双链测序接头退火。
1)按照生产商说明将SEQ.7、SEQ.8、SEQ.9、SEQ.10分别用TE缓冲液(pH=8)溶解成终浓度100μM的母液。
2)如图8所示,将SEQ.7、SEQ.8、SEQ.9均单独与SEQ.10退火为Y型双链测序接头,获得的退火产物分别命名为Adaptor-2LNA、Adaptor-4LNA、Adaptor-8LNA。退火流程为95℃孵育5分钟,0.1℃/s的降温速度降至25℃,继续孵育30分钟。退火反应体系见表5。
表5 Y型双链测序接头退火反应体系
Figure PCTCN2022139739-appb-000006
2、Y型双链测序接头和待测DNA连接为测序文库。
1)按照生产商说明用限制性内切酶EcoR I-HF(NEB,R3101)和Hind III-HF(NEB,R3104)将pUC57质粒(SEQ.12)进行酶切,反应条件为37℃孵育60分钟。酶切反应体系见表6。
表6酶切反应体系
Figure PCTCN2022139739-appb-000007
2)按照生产商说明用AMPure XP beads(Beckman Coulter,A63882)进行酶切产物的纯化,并使用Qubit dsDNA HS试剂盒(Thermofisher, Q32854)测定产物浓度。
3)按照生产商说明用NEBNext FFPE DNA Repair Mix(NEB,M6630)和NEBNext Ultra II End repair/dA-tailing Module(NEB,E7546)对酶切纯化产物进行末端修复和加A。反应条件为20℃孵育5分钟,65℃孵育5分钟。末端修复和加A反应体系见表7。
表7末端修复和加A反应体系
Figure PCTCN2022139739-appb-000008
4)按照生产商说明用AMPure XP beads(Beckman Coulter,A63882)对末端修复和加A产物进行纯化,并使用Qubit dsDNA HS试剂盒(Thermofisher,Q32854)测定产物浓度。
5)按照生产商说明用NEBNext Quick Ligation Module(NEB,E6056)对纯化产物进行接头连接反应,反应条件为25℃孵育10分钟。连接反应体系见表8。
表8连接反应体系
Figure PCTCN2022139739-appb-000009
6)按照生产商说明用AMPure XP beads(Beckman Coulter,A63882)对连接接头后的产物进行纯化,并使用Qubit dsDNA HS试剂盒(Thermofisher,Q32854)测定产物浓度。得到如图8所示的测序文库。
7)测序文库进行6%TBE非变性聚丙烯酰胺凝胶电泳,200V电泳2h。电泳结果如图9所示,泳道1为连接前的待测靶多核苷酸,即pUC57质粒酶切线性化双链DNA,泳道2-4分别为含2个、4个、8个LNA修饰核酸的测序接头与待测靶多核苷酸连接并纯化后的产物,标记为pUC57+Adaptor-2LNA、pUC57+Adaptor-4LNA、pUC57+Adaptor-8LNA。连接好的测序文库用“pUC57+Adaptor”标示电泳位置,未进行接头连接 的测靶多核苷酸用“pUC57”标示电泳位置。图9所示结果表明:3组测序文库pUC57+Adaptor-2LNA、pUC57+Adaptor-4LNA、pUC57+Adaptor-8LNA均构建成功。
实施例四:进行纳米孔测序。
1)把测序文库pUC57+Adaptor-4LNA与引物(SEQ.11)、具有链置换活性的聚合酶BST+和反应缓冲液,30℃条件下孵育1小时,形成如图10所示的测序复合物。在图10中,标记为A的测序文库与标记为B的引物互补配对,其中引物的5’末端有一个胆固醇修饰(标记为C),同时与具有链置换活性的聚合酶(标记为D)孵育结合,形成测序复合物。反应缓冲液终浓度为37.5mM KCl,12.5mM Tris-HCl,2.5mM MgCl2,pH=8.10。测序复合物孵育体系见表9。
表9测序复合物孵育反应体系
Figure PCTCN2022139739-appb-000010
2)按照文献(Ji Z,Guo P.Channel from bacterial virus T7 DNA packaging motor for the differentiation of peptides composed of a mixture of acidic and basic amino acids.Biomaterials.2019May 21;214:119222)所披露的方法搭建基于膜片钳和信号放大器的单通道纳米孔检测系统,完成单个孔蛋白嵌孔,把孵育后的测序复合物加入到该单通道体系中,100mV条件下观测并获得电流信号的变化,测序缓冲液为0.30M KCl,50mM Tris-HCl,10mM MgCl2,0.5mM dNTP,pH=8.10,标记为第一组。
测序结果如图11所示,pUC57+Adaptor-4LNA测序文库有测序信号被捕获,获得清晰的测序信号电流振幅变化图。在图11中,(a)为纳米孔捕获到测序文库后电流信号变化图。(b)为(a)中方框内信号的放大图。
3)除使用的测序缓冲液不同外,完全相同的实验操作步骤进行第二组测试。第二组使用的测序缓冲液为0.30M KCl,50mM Tris-HCl,10mM MgCl2,pH=8.10,不含有dNTP,则没有捕获到测序信号。测序缓冲液与测序结果见表10。
表10测序缓冲液与测序结果
Figure PCTCN2022139739-appb-000011
表10所示结果表明:在测序缓冲液中存在dNTP的条件下,可以使用具有链置换活性的聚合酶BST+和pUC57+Adaptor-4LNA测序文库进行测序。证明了本发明的测序方案是可行的。
序列表
SEQ.1:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGGTTGTTTCTGTTGGTGCTGATATTGC 3’(X=iSpC3)
SEQ.2:
5’GCAATATCAGCACCAACAGAAACAACCTCGGGTCGTAAGAATTCTATT 3’
SEQ.3:
5’CY3-AATAGAATTCTTACG 3’
SEQ.4:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX(LNA_G)(LNA_G)TTGTTTCTGTTGGTGCTGATATTGC 3’(X=iSpC3)
SEQ.5:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX(LNA_G)(LNA_G)(LNA_T)(LNA_T)GTTTCTGTTGGTGCTGATATTGC 3’(X=iSpC3)
SEQ.6:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX(LNA_G)(LNA_G)(LNA_T)(LNA_T)(LNA_G)(LNA_T)(LNA_T)(LNA_T)CTGTTGGTGCTGATATTGC 3’(X=iSpC3)
SEQ.7:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX(LNA_G)(LNA_G)TTGTTTCTGTTGGTGCTGATATTGCT 3’(X=iSpC3)
SEQ.8:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX(LNA_G)(LNA_G)(LNA_T)(LNA_T)GTTTCTGTTGGTGCTGATATTGCT 3’(X=iSpC3)
SEQ.9:
5’XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX(LNA_G)(LNA_G)(LNA_T)(LNA_T)(LNA_G)(LNA_T)(LNA_T)(LNA_T)CTGTTGGTGCTGATATTGCT 3’(X=iSpC3)
SEQ.10:
5’Phosphorylation-GCAATATCAGCACCAACAGAAACAACCTTTGAGGCGAGCGGTCAA 3’
SEQ.11:
5’Cholesterol-YTTGACCGCTCGC 3’(Y=iSp18)
SEQ.12:
5’TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTCGAGCTCGGTACCTCGCGAATGCATCTAGATATCGGATCCCGGGCCCGTCGACTGCAGAGGCCTGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGG GTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC 3’
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (46)

  1. 一种纳米孔测序方法,所述方法包括:
    1)提供测序文库,所述测序文库包括靶多核苷酸双链,所述靶多核苷酸双链包括第一链和第二链,所述第一链的5’端与所述第二链的3’端包括非配对的第一单链区,在所述第一链的第一单链区5’端含有引导序列,在所述第二链的第一单链区3’端含有第二引物配对区;
    2)将第一引物与所述测序文库进行孵育以形成测序复合物,其中,所述第一引物与所述第二引物配对区通过碱基互补配对原则进行结合,所述第一引物具有3’自由端,且所述复合物通过所述第一引物的5’端附着在嵌有纳米孔的膜上;
    3)使具有链置换活性的聚合酶以第二链为模板、延伸所述第一引物,在电场力作用下,所述引导序列被膜上的纳米孔捕获且穿过纳米孔,随着延伸进行,所述第一链被置换出,并穿过纳米孔;
    4)检测延伸过程中所述第一链穿过纳米孔时产生的电信号变化,确定所述靶多核苷酸双链的第一链的序列信息。
  2. 根据权利要求1所述的方法,在1)中,所述第一链的3’端与所述第二链的5’端序列完全互补配对形成配对区。
  3. 根据权利要求1所述的方法,在1)中,所述靶多核苷酸双链进一步包括:所述第一链的3’端与所述第二链的5’端包括非配对的第二单链区,在所述第一链的第二单链区3’端包括第一引物配对区。
  4. 根据权利要求3所述的方法,所述方法进一步包括:
    在2)中,将第一引物、第二引物与所述测序文库进行孵育以形成测序复合物,其中,所述第一引物与所述第二引物配对区通过碱基互补配对原则进行结合,所述第二引物与所述第一引物配对区通过碱基互补配对原则进行结合,且所述复合物通过所述第一引物和/或所述第二引物的5’端固定在嵌有纳米孔的膜上。
  5. 根据权利要求4所述的方法,所述方法进一步包括:
    5)聚合酶以所述第一链为模板延伸所述第二引物,使得所述第一链以逆电场方向退出膜上的纳米孔,检测所述第一链退出纳米孔时产生的电信号变化,再次确定所述靶多核苷酸双链的第一链的序列信息。
  6. 根据权利要求4或5所述的方法,所述第二链的5’端含有引导序列。
  7. 根据权利要求1所述的方法,在1)中,所述靶多核苷酸双链进一步包括:所述第一链的3’末端和所述第二链的5’末端相连接,使得所述靶多核苷酸双链在该末端具有发夹结构。
  8. 根据权利要求7所述的方法,所述方法进一步包括:
    5)延伸至所述发卡结构后,聚合酶以所述第一链为模板继续进行延伸,使得所述第一链以逆电场方向退出膜上的纳米孔,检测所述第一链退 出纳米孔时产生的电信号变化,再次确定所述靶多核苷酸双链的第一链的序列信息。
  9. 根据权利要求1-8任一项所述的方法,通过在多核苷酸双链上连接Y型接头制备靶多核苷酸双链,所述Y型接头两条链上分别包括引导序列和引物配对区,在与多核苷酸双链连接后使得获得的靶多核苷酸第一链的5’端含有引导序列,第二链的3’端包括第二引物配对区。
  10. 根据权利要求1-8任一项所述的方法,所述引物的长度小于80、70、60或50个核苷酸。
  11. 根据权利要求1-8任一项所述的方法,所述引物的5’端连接有疏水性分子。
  12. 根据权利要求11所述的方法,所述疏水性分子选自以下任意一种或多种:脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质和/或氨基酸。
  13. 根据权利要求1-8任一项所述的方法,所述引导序列包含多核苷酸或多个iSpC3。
  14. 根据权利要求1-8任一项所述的方法,所述引导序列长度是10-50个核苷酸或iSpC3。
  15. 根据权利要求1-8任一项所述的方法,所述引导序列的3’端连接有抑制聚合酶链置换聚合活性的抑制区段。
  16. 根据权利要求15所述的方法,所述抑制区段为GC富含基序或人工修饰核苷酸。
  17. 根据权利要求16所述的方法,所述人工修饰核苷酸是LNA、PNA、BNA或其任意组合。
  18. 根据权利要求17所述的方法,所述人工修饰核苷酸是LNA,其个数为2-10个,优选4-8个。
  19. 根据权利要求1-8任一项所述的方法,所述具有链置换活性的聚合酶为DNA聚合酶或RNA聚合酶。
  20. 根据权利要求19所述的方法,所述具有链置换活性的聚合酶为耐盐的DNA聚合酶或RNA聚合酶。
  21. 根据权利要求19或20所述的方法,所述具有链置换活性的聚合酶为:Bst DNA聚合酶、SD DNA聚合酶、phi29 DNA聚合酶、Bsu Large Fragment DNA聚合酶、Klenow Fragment DNA聚合酶、T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶、E.coli RNA聚合酶或其任意组合。
  22. 根据权利要求19或20所述的方法,所述聚合酶为无链置换活性聚合酶经过改造后具有链置换活性的聚合酶。
  23. 根据权利要求22所述的方法,所述聚合酶为经过改造后具有链置换活性的T4 DNA聚合酶、T7 DNA聚合酶、DNA聚合酶I或其任意组合。
  24. 根据权利要求1-8任一项所述的方法,所述纳米孔是跨膜蛋白孔 或固态孔。
  25. 根据权利要求24所述的方法,所述跨膜蛋白孔选自溶血素、MspA、MspB、MspC、MspD、FraC、ClyA、PA63、CsgG、CsgD、XcpQ、SP1、phi29连接器蛋白、InvG、GspD或其任意组合。
  26. 根据权利要求1-8任一项所述的方法,所述纳米孔还连接有另外的多肽,所述另外的多肽选自标签、酶切位点、信号肽或导肽、可检测的标记或其任意组合。
  27. 根据权利要求1-8任一项所述的方法,所述膜是两亲性膜、高分子聚合物膜或其任意组合。
  28. 根据权利要求27所述的方法,所述膜是磷脂双分子层、两嵌段共聚物或三嵌段共聚物。
  29. 根据权利要求1-8任一项所述的方法,所述方法在如下的缓冲液或测序缓冲液中进行:磷酸二氢根-磷酸氢根缓冲体系、碳酸-碳酸氢钠缓冲体系、Tris-HCl缓冲体系、HEPES缓冲体系、MOPS缓冲体系或其任意组合。
  30. 根据权利要求29所述的方法,所述反应缓冲液或测序缓冲液含有增强聚合酶延伸反应的添加剂或辅助试剂。
  31. 根据权利要求30所述的方法,所述添加剂或辅助试剂选自二甲基亚砜、甘油、甲酰胺、牛血清白蛋白、硫酸铵、聚乙二醇、明胶、非离子型去污剂、N,N,N-三甲基甘氨酸、单链核酸结合蛋白或其任意组合。
  32. 一种试剂盒,所述试剂盒包括:
    用于与核苷酸双链连接的Y型接头,所述Y型接头两条链上分别包括引导序列和引物配对区,在与核苷酸双链连接后使得获得的靶多核苷酸第一链的5’端含有引导序列,第二链的3’端包括引物配对区;
    纳米孔;
    膜;
    引物,所述引物与所述引物配对区互补,所述引物的5’端具有固定部件,用于附着在膜上;
    具有链置换活性的聚合酶;
    进行聚合反应的缓冲体系。
  33. 根据权利要求32所述的试剂盒,所述纳米孔嵌入所述膜中。
  34. 根据权利要求32或33所述的试剂盒,所述引导序列的3’端连接有抑制聚合酶链置换聚合活性的抑制区段,且所述抑制区段为GC富含基序或人工修饰核苷酸。
  35. 根据权利要求34的试剂盒,所述人工修饰核苷酸是LNA、PNA、BNA或其任意组合;优选为2-10个LNA,更优选为4-8个LNA。
  36. 根据权利要求32或33所述的试剂盒,所述引物的长度小于80、70、60或50个核苷酸,且所述引物的5’端连接有疏水性分子,所述疏水 性分子选自以下任意一种或多种:脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质和/或氨基酸。
  37. 根据权利要求32或33所述的试剂盒,所述引导序列包含多核苷酸或多个iSpC3,且长度是10-50个核苷酸或iSpC3。
  38. 根据权利要求32或33所述的试剂盒,所述聚合酶为Bst DNA聚合酶、SD DNA聚合酶、phi29 DNA聚合酶、Bsu Large Fragment DNA聚合酶、Klenow Fragment DNA聚合酶、T3 RNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶、E.coli RNA聚合酶或其任意组合,或所述聚合酶为经改造后具有链置换活性的T4 DNA聚合酶、T7 DNA聚合酶、DNA聚合酶I或其任意组合。
  39. 根据权利要求32或33所述的试剂盒,所述纳米孔是跨膜蛋白孔或固态孔。
  40. 根据权利要求39所述的试剂盒,所述跨膜蛋白孔选自溶血素、MspA、MspB、MspC、MspD、FraC、ClyA、PA63、CsgG、CsgD、XcpQ、SP1、phi29连接器蛋白、InvG、GspD或其任意组合。
  41. 根据权利要求32或33所述的试剂盒,所述膜是两亲性膜、高分子聚合物膜或其任意组合。
  42. 根据权利要求41所述的试剂盒,所述膜是磷脂双分子层、两嵌段共聚物或三嵌段共聚物。
  43. 根据权利要求32或33所述的试剂盒,所述进行聚合反应的缓冲体系是磷酸二氢根-磷酸氢根缓冲体系、碳酸-碳酸氢钠缓冲体系、Tris-HCl缓冲体系、HEPES缓冲体系、MOPS缓冲体系或其任意组合。
  44. 根据权利要求32或33所述所述的试剂盒,所述进行聚合反应的缓冲体系含有增强聚合酶延伸反应的添加剂或辅助试剂,且所述添加剂或辅助试剂选自二甲基亚砜、甘油、甲酰胺、牛血清白蛋白、硫酸铵、聚乙二醇、明胶、非离子型去污剂、N,N,N-三甲基甘氨酸、单链核酸结合蛋白或其任意组合。
  45. 根据权利要求32-44任一项所述的试剂盒在高通量测序中的应用。
  46. 根据权利要求45所述的应用,所述高通量测序为纳米孔测序。
PCT/CN2022/139739 2022-12-16 2022-12-16 纳米孔测序方法和试剂盒 Ceased WO2024124567A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202280102552.6A CN120359304A (zh) 2022-12-16 2022-12-16 纳米孔测序方法和试剂盒
EP22968271.1A EP4636094A1 (en) 2022-12-16 2022-12-16 Nanopore sequencing method and kit
PCT/CN2022/139739 WO2024124567A1 (zh) 2022-12-16 2022-12-16 纳米孔测序方法和试剂盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/139739 WO2024124567A1 (zh) 2022-12-16 2022-12-16 纳米孔测序方法和试剂盒

Publications (1)

Publication Number Publication Date
WO2024124567A1 true WO2024124567A1 (zh) 2024-06-20

Family

ID=91484172

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/139739 Ceased WO2024124567A1 (zh) 2022-12-16 2022-12-16 纳米孔测序方法和试剂盒

Country Status (3)

Country Link
EP (1) EP4636094A1 (zh)
CN (1) CN120359304A (zh)
WO (1) WO2024124567A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2026017141A1 (zh) * 2024-07-19 2026-01-22 北京齐碳科技有限公司 表征目标生物分子的方法
WO2026050948A1 (zh) * 2024-09-04 2026-03-12 深圳华大生命科学研究院 核酸文库的构建方法及应用

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103733063A (zh) 2011-05-27 2014-04-16 牛津纳米孔技术有限公司 偶联方法
CN103827320A (zh) * 2011-07-25 2014-05-28 牛津纳米孔技术有限公司 使用跨膜孔进行双链多核苷酸测序的发夹环方法
CN104039979A (zh) * 2011-10-21 2014-09-10 牛津纳米孔技术公司 使用孔和Hel308解旋酶表征目标多核苷酸的酶方法
CN105209634A (zh) 2013-03-08 2015-12-30 牛津纳米孔技术公司 酶停滞方法
CN106460061A (zh) 2014-04-04 2017-02-22 牛津纳米孔技术公司 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
CN108138227A (zh) * 2015-04-28 2018-06-08 亿明达股份有限公司 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差
CN109266537A (zh) * 2018-09-14 2019-01-25 首度生物科技(苏州)有限公司 使用单分子多次通过纳米孔达到精密测序的基因测序仪
US10480027B2 (en) 2012-06-08 2019-11-19 Pacific Biosciences Of California, Inc. Nanopore sequencing methods
US20190352709A1 (en) * 2016-12-01 2019-11-21 Oxford Nanopore Technologies Limited Methods and systems for characterizing analytes using nanopores
CN113366120A (zh) 2018-12-07 2021-09-07 深圳华大生命科学研究院 纳米孔测序方法
US20210363577A1 (en) * 2018-06-06 2021-11-25 Oxford Nanopore Technologies Limited Method
WO2022243692A1 (en) * 2021-05-19 2022-11-24 Oxford Nanopore Technologies Plc Methods for complement strand sequencing

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103733063A (zh) 2011-05-27 2014-04-16 牛津纳米孔技术有限公司 偶联方法
CN103827320A (zh) * 2011-07-25 2014-05-28 牛津纳米孔技术有限公司 使用跨膜孔进行双链多核苷酸测序的发夹环方法
CN104039979A (zh) * 2011-10-21 2014-09-10 牛津纳米孔技术公司 使用孔和Hel308解旋酶表征目标多核苷酸的酶方法
US10480027B2 (en) 2012-06-08 2019-11-19 Pacific Biosciences Of California, Inc. Nanopore sequencing methods
CN105209634A (zh) 2013-03-08 2015-12-30 牛津纳米孔技术公司 酶停滞方法
CN106460061A (zh) 2014-04-04 2017-02-22 牛津纳米孔技术公司 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
CN108138227A (zh) * 2015-04-28 2018-06-08 亿明达股份有限公司 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差
US20190352709A1 (en) * 2016-12-01 2019-11-21 Oxford Nanopore Technologies Limited Methods and systems for characterizing analytes using nanopores
US20210363577A1 (en) * 2018-06-06 2021-11-25 Oxford Nanopore Technologies Limited Method
CN109266537A (zh) * 2018-09-14 2019-01-25 首度生物科技(苏州)有限公司 使用单分子多次通过纳米孔达到精密测序的基因测序仪
CN113366120A (zh) 2018-12-07 2021-09-07 深圳华大生命科学研究院 纳米孔测序方法
WO2022243692A1 (en) * 2021-05-19 2022-11-24 Oxford Nanopore Technologies Plc Methods for complement strand sequencing

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JI ZGUO P: "Channel from bacterial virus T7 DNA packaging motor for the differentiation of peptides composed of a mixture of acidic and basic amino acids", BIOMATERIALS, vol. 214, 21 May 2019 (2019-05-21), pages 119222
See also references of EP4636094A1
WANG, YUNHAO ET AL.: "Nanopore sequencing technology, bioinformatics and applications", NATURE BIOTECHNOLOGY, vol. 39, 8 November 2021 (2021-11-08), pages 1348 - 1365, XP037616214, DOI: 10.1038/s41587-021-01108-x *
ZHANG, HAOBO ET AL.: "Research Progress on Nanopore Sequencing Technology in Disease Detection", CHINA ANIMAL HEALTH INSPECTION, CN, vol. 38, no. 6, 31 December 2021 (2021-12-31), CN, pages 82 - 89, XP009555397, ISSN: 1005-944X *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2026017141A1 (zh) * 2024-07-19 2026-01-22 北京齐碳科技有限公司 表征目标生物分子的方法
WO2026050948A1 (zh) * 2024-09-04 2026-03-12 深圳华大生命科学研究院 核酸文库的构建方法及应用

Also Published As

Publication number Publication date
CN120359304A (zh) 2025-07-22
EP4636094A1 (en) 2025-10-22

Similar Documents

Publication Publication Date Title
US20240352507A1 (en) Method for increasing throughput of single molecule sequencing by concatenating short dna fragments
TWI837127B (zh) 用於準確及具成本效益之定序、單倍體分類及組裝的基於單管珠之dna共條碼編輯
CN106232834B (zh) 样品制备方法
JP6749243B2 (ja) 1つまたは複数のポリヌクレオチド結合タンパク質を標的ポリヌクレオチドに付着させる方法
CN103060924B (zh) 微量核酸样本的文库制备方法及其应用
US20210189460A1 (en) Sequential paired-end sequencing
CN115516109A (zh) 条码化核酸用于检测和测序的方法
WO2024124567A1 (zh) 纳米孔测序方法和试剂盒
CN106414773A (zh) 利用分子孔表征目标分子的方法
CA2922244C (en) Chromosome conformation capture method including selection and enrichment steps
WO2020113581A1 (zh) 纳米孔测序方法
CN118207308A (zh) 纳米孔测序方法和试剂盒
EP4159872B1 (en) Labeling of dna
US20220403368A1 (en) Methods and systems for preparing a nucleic acid construct for single molecule characterisation
US20250154581A1 (en) Single molecule nanopore sequencing method
CN112805393A (zh) 一种解旋酶及其应用
WO2025031382A1 (zh) 一种rna直接测序的建库方法
WO2024138572A1 (zh) 测序接头、测序接头复合物、靶核酸序列多次纳米孔测序的方法
WO2020094457A1 (en) Liquid sample workflow for nanopore sequencing
WO2024109455A1 (zh) 一种rna-dna嵌合接头及其应用
CN116732136A (zh) 文库制备方法和测序方法
WO2024138573A1 (zh) 测序接头、测序接头复合物、靶核酸序列多次扩增的方法及纳米孔测序的方法
CN118272509A (zh) 基于组合索引的单细胞dna-蛋白互作测序试剂盒和方法
WO2024131530A1 (zh) 测序文库的制备方法
US20210040540A1 (en) Parallel liquid-phase hybrid capture method for simultaneously capturing sense and antisense double strands of genomic target region

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22968271

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 202280102552.6

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2022968271

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022968271

Country of ref document: EP

Effective date: 20250716

WWP Wipo information: published in national office

Ref document number: 202280102552.6

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2022968271

Country of ref document: EP