WO2022213253A1

WO2022213253A1 - 经修饰的Prp43解旋酶及其用途

Info

Publication number: WO2022213253A1
Application number: PCT/CN2021/085609
Authority: WO
Inventors: 张周刚; 李文; 王艳双; 王慕旸
Original assignee: Chengdu Qitan Technology Ltd
Current assignee: Chengdu Qitan Technology Ltd
Priority date: 2021-04-06
Filing date: 2021-04-06
Publication date: 2022-10-13
Anticipated expiration: 2023-10-06
Also published as: CN115777019A; US20240368568A1; EP4299746A4; EP4299746A1

Abstract

一种经修饰的Prp43解旋酶及其用途。由于突变的引入和/或辅助蛋白的引入而增强了Prp43解旋酶的ATP水解活性或解旋活性，能长时间保持与目标多核苷酸的结合，从而允许酶以测序要求的合适速率、持续稳定地控制多核苷酸的移动速度，可以用于纳米孔测序。

Description

经修饰的Prp43解旋酶及其用途

技术领城

本申请涉及核酸测序技术。

背景技术

纳米孔测序技术是第三代核酸测序技术，它是通过记录DNA/RNA链穿过纳米孔时不同碱基产生的不同电信号来获得DNA/RNA序列信息。纳米孔测序技术所面临的挑战之一是DNA/RNA分子通过纳米孔的速度往往太快、超过仪器的分辨率，因此难以获得反映序列信息的准确的电信号。因此，如何控制或减缓DNA/RNA分子通过纳米孔的速度对于提高纳米孔测序技术的准确率是至关重要的。

目前，新兴的一种表征多核苷酸的方法包括跨膜孔、解旋酶与多核苷酸的接触及相互作用，从而解旋酶控制目标多核苷酸穿过纳米孔的运动，以增加多核苷酸在纳米孔处的停留时间。

例如，专利WO2013057495A3和US20150191709A1公开了一种新的表征目标多核苷酸的方法，所述的方法使用孔和Hel308解旋酶或能结合目标多核苷酸内部核苷酸的分子马达。该发明所述的解旋酶或分子马达可以有效控制目标多核苷酸穿过所述孔的运动。另外，专利US20150065354A1和US9617591B2公开了一种使用XPD解旋酶表征目标多核苷酸的方法，所述方法利用孔和XPD解旋酶。该发明所述的XPD解旋酶可以控制目标多核苷酸穿过所述孔的运动。此外，专利US 2016O257942A1和US20180179500 A1则披露了T4噬菌体来源Dda解旋酶及其某些同源蛋白经过修饰后可以应用于多核苷酸过孔测序。

自然界中，解旋酶可分为六大超家族(Superfamily,SF),其中SF1和SF2超家族解旋酶以单体形式发挥移位和解旋功能，SF3-SF6家族则以多聚体形式发挥作用。纳米孔测序应用中，单体形式作用的解旋酶应用更简便、表现均一性也会更强。SF1和SF2超家族的解旋酶根据蛋白序列同源性、结构域排列、底物结合形式和特异性、解旋的极性(5’-3’方向和3’-5’方向)以及解旋或移位机制等特性分类为不同的家族，SF1超家族包含UvrD/Rep家族解旋酶、类Upf1家族解旋酶和类Pif1家族解旋酶，SF2超家族包含Rad3/XPD家族解旋酶、类Ski2家族解旋酶、DEAH/RHA家族解旋酶、NS3/NPH-II家族解旋酶、DEAD盒(DEAD-Box)家族解旋酶、类RIG-I家族解旋酶、类RecQ家族解旋酶、类RecG家族解旋酶、Swi/Snf家族解旋酶和T1R家族解旋酶。RecD和T4噬菌体来源的Dda解旋酶同属于SF1超家族的类Pif1家族，底物倾向于单链DNA，以5’-3’方向进行移位和解旋，常见的同属于该家族的解旋酶还包括Pif1解旋酶、TrwC解旋酶等；Methanococcoides burtonii菌株来源的Hel308解旋酶(如US20150191709A1中所披露)属于SF2超家族的类ski2家族解旋酶，能同时以单链DNA或RNA为底物，以3’-5’方向极性移位或解旋双链核酸，常见的同属于该家族的解旋酶还包括ski2解旋酶、Brr2解旋酶、Mtr4解旋酶等；XPD解旋酶则属于SF2超家族的Rad3/XPD家族解旋酶，特异性结合单链DNA，以5’-3’极性方向移位或解旋双链核酸，常见的同属于该家族的酶还包括Rad3解旋酶等。

虽然现有技术中公开了多种可用于纳米孔测序技术的解旋酶，但是每种解旋酶各有其优缺点和各自的适用环境，这些解旋酶仍然难以满足科学研究和医疗技术等对于核酸测序技术在多方面提出的更苛刻的要求，因此仍然存在对于可以用于核酸纳米孔测序技术的新型解旋酶的需要，以便改善纳米孔测序技术的适用性、准确性和灵敏度等。

发明内容

发明人发现Prp43解旋酶，尤其是经修饰的Prp43解旋酶可以控制多核苷酸分子移动穿过纳米孔，从而可以用于纳米孔测序技术。

因此，本申请的第一方面涉及一种经修饰的Prp43解旋酶，包括RecA1结构域、RecA2结构域和Ratchet结构域，相对于对应的野生型Prp43解旋酶或其片段而言所述经修饰的Prp43解旋酶包括在选自RecA1结构域、 RecA2结构域、Ratchet结构域的至少一个结构域中引入的1、2、3、4、5、6、7、8、9、10、11个或更多个半胱氨酸的插入或置换，和/或1、2、3、4、5、6、7、8、9、10、11个或更多个非天然氨基酸的插入或置换。

本申请的第二方面涉及一种蛋白构建体，其包括本申请第一方面所述的经修饰的Prp43解旋酶，以及在所述Prp43解旋酶的C端或N端融合的辅助激活蛋白Paf1的G-Path结构域或含有G-Path结构域的Paf1片段。

本申请的第三方面涉及一种编码本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体的核酸。

本申请的第四方面涉及一种包含本申请的第三方面所述核酸的表达载体。

本申请的第五方面涉及本申请第三方面所述的核酸或包含本申请的第四方面所述表达载体的宿主细胞。

本申请的第六方面涉及一种制备本申请的第二方面所述的蛋白构建体的方法，包括：提供SEQ ID NO:1的多肽或其变体和SEQ ID NO:26的多肽或其变体，在SEQ ID NO:1的多肽或其变体中引入至少一个半胱氨酸残基和/或至少一个非天然氨基酸，然后在所得多肽的C端或N端融合SEQ ID NO:26的多肽或其变体，形成所述蛋白构建体。

本申请的第七方面涉及一种制备本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体的方法，包括：包括培养本申请第五方面所述的宿主细胞，并进行诱导表达，然后纯化所得表达产物。

本申请的第八方面涉及一种控制多核苷酸分子移动的方法，包括将所述多核苷酸分子与本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体接触。

本申请的第九方面涉及一种表征目标多核苷酸的方法，所述的方法包括：

(a)将目标多核苷酸与本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体接触，使得所述Prp43解旋酶或蛋白构建体控制所述目标多核苷酸移动穿过一纳米孔；(b)获取目标多核苷酸中的核苷酸与所述纳米孔相互作用时的一个或多个特征，从而表征所述目标多核苷酸。

本申请的第十方面涉及本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体在表征目标多核苷酸或控制目标多核苷酸穿过孔的移动中的用途。

本申请的第十一方面涉及一种用于表征目标多核苷酸的分析装置，所述的分析装置包含一个或多个纳米孔、一个或多个本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体、以及一个或多个容器。

本申请的第十二方面涉及一种形成表征目标多核苷酸的传感器的方法，包括提供纳米孔，和在所述纳米孔和本申请第一方面所述的经修饰的Prp43解旋酶或本申请第二方面所述的蛋白构建体之间形成复合物。

本申请提供了一种可用于核酸纳米孔测序的新型Prp43解旋酶突变体或其构建体，由于突变的引入和/或辅助蛋白的引入而增强了其ATP水解活性或解旋活性，并且/或者能长时间保持与目标多核苷酸的结合，从而允许持续稳定地控制多核苷酸的移动速度。因此，本申请的Prp43解旋酶突变体或其构建体可以在测序要求的合适速率下持续地控制目标多核苷酸穿过孔的移动，进而改善纳米孔测序的通量和准确率。

具体实施方式

定义

为了更清楚地解释本发明的实施方式，本文中使用了一些科学术语和专有名词。除非在本文中进行了明确定义，所有这些术语和名词应当被理解为具有本领域技术人员所通常理解的含义。为了更清楚起见，对于本文中使用的某些术语进行了以下定义。

术语“多肽”是指包含通过肽键连接的氨基酸残基并含有多于五个氨基酸残基的分子。多肽通常可以包含20个或更多个氨基酸，优选地包含50个或更多个氨基酸，或者包含100个或更多个氨基酸。在本文中，术语“蛋白质”、“蛋白”与术语“多肽”被认为具有相同的含义；因此，术语“蛋白质”、“蛋白”和“多肽”可互换使用。可任选地修饰(例如，糖基化、磷酸化、酰化、法尼基化、异戊烯基化、磺化等)多肽以增加其官能性或活性。在某些条件下、在特定底物存在下表现出活性的多肽可称为“酶”。应当理解，由于遗传密码的简并性，可以产生编码给定多肽的多种核苷酸序列。

本文所述的“核酸”是脱氧核糖核酸(DNA)和核糖核酸(RNA)的总称，是由许多核苷酸单体聚合成的生物大分子化合物。在本文中，术语“核酸”与术语“多核苷酸”被认为具有相同的含义；因此，术语“核酸”与术语“多核苷酸”可互换使用。

核苷酸单体由五碳糖、磷酸基和含氮碱基组成。如果五碳糖是核糖，则形成的聚合物是RNA；如果五碳糖是脱氧核糖，则形成的聚合物是DNA。核苷酸中的含氮碱基可以包括但不局限于：腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)和胞嘧啶(C)。所述核苷酸可以是天然存在的或人工合成的。因此，本文所述的“核苷酸”包括但不局限于：腺苷单磷酸(AMP)、鸟苷单磷酸(GMP)、胸苷单磷酸(TMP)、尿苷单磷酸(UMP)、胞嘧啶核苷单磷酸(CMP)、环状腺苷单磷酸(cAMP)、环状鸟苷单磷酸(cGMP)脱氧腺苷单磷酸(dAMP)、脱氧鸟苷单磷酸(dGMP)、脱氧胸苷单磷酸(dTMP)、脱氧尿苷单磷酸(dUMP)和脱氧胞苷单磷酸(dCMP)。优选的，所述核苷酸选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。

在本申请中，多肽或多肽结构域的“片段”是指在所述多肽或多肽结构域的氨基和/或羧基末端有一个或多个(例如，几个、几十个或100个等等)氨基酸残基缺失的多肽或多肽结构域，但该片段仍保留有所期望的活性。例如，Prp43解旋酶的片段表示在野生型Prp43的氨基和/或羧基末端有一个或多个(例如，1-5个、1-10个、1-20个、1-50个、1-100个、1-150个、1-200个，或者例如20个、30个、40个、50个、60个、70个、80个或90个)氨基酸残基缺失但仍保留有解旋酶活性的多肽序列。

通常，多肽或结构域的片段包含其原始序列长度的至少50％、55％、60％、65％、70％、75％、80％、85％、90％、92％、、94％、96％、98％或99％的长度。在本申请中，取决于原始多肽或结构域的长度，多肽或结构域的片段包含至少50个氨基酸，例如至少60个氨基酸、至少70个氨基酸、至少80个氨基酸、至少90个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少350个氨基酸、至少400个氨基酸、至少500个氨基酸、至少650个氨基酸、或至少700个氨基酸。在本申请中，多肽或结构域的片段也可以包含少于700个氨基酸，例如少于600个氨基酸、少于500个氨基酸、少于400个氨基酸、少于300个氨基酸、少于200个氨基酸、或少于100个氨基酸。

术语“表达”包括参与多肽产生的任何步骤，包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

“表达载体”包含编码多肽的多核苷酸，该多核苷酸可操作地连接至适当的控制序列(例如启动子，以及转录和翻译终止信号)以用于在体外表达和/或翻译。表达载体可以是任何载体(例如，质粒或病毒)，该表达载体可以方便地经历重组DNA程序并且可以引起多核苷酸的表达。载体的选择将通常取决于载体与要导入载体的细胞的相容性。载体可以是线性或闭环质粒。载体可以是自主复制载体，即这样的载体，所述载体作为染色体外实体存在，所述载体的复制独立于染色体复制，为例如质粒、染色体外元件、微型染色体或人工染色体。或者，载体可以是这样的载体，所述载体当被引入宿主细胞时整合到基因组中并与其所整合到的染色体一起复制。整合克隆载体可以整合在宿主细胞的染色体中的随机或预定靶基因座处。载体系统可以是单一载体或质粒或两种或更多种载体或质粒，所述载体或质粒一起含有待引入宿主细胞基因组的总DNA，或转座子。

本文所用的术语“控制序列”是指在特定生物体内或体外参与编码序列表达的调节的组分。控制序列的示例是转录起始序列、终止序列、启动子、前导序列、信号肽、前肽、前原肽或增强子序列；夏因-达尔加诺序列(Shine-Delgarno sequence)、阻遏物或激活物序列；有效的RNA处理信号，例如剪接和多腺苷酸化信号；稳定化细胞质mRNA的序列；增强翻译效率的序列(例如，核糖体结合位点)；增强蛋白质稳定性的序列；以及当需要时，增强蛋白质分泌的序列。

如本文所定义的“宿主细胞”是适用于遗传操纵并且可以在可用于生产目标产物(如本申请所述的Prp43解旋酶)的生物体。宿主细胞可以是在自然界中发现的宿主细胞，或来源于亲本宿主细胞的遗传操纵或经典诱变后的宿主细胞。有利地，宿主细胞是重组宿主细胞。宿主细胞可以是原核、古细菌或真核宿主细胞。原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、植物、动物、或昆虫宿主细胞。

针对核酸或蛋白质(或酶)使用时，术语“重组”是指该核酸或蛋白质(或酶)与其天然形式相比，已经通过人工干预进行了序列修饰。当涉及细胞(例如宿主细胞)时，术语“重组”表示该细胞的基因组如果与其天然形式相比则已经通过人工干预进行了序列修饰。在本文中，术语“重组”与“经修饰”被认为同义。

针对经修饰的多肽或酶使用时，术语“置换”表示相应的野生型多肽或酶中存在的天然氨基酸残基被另一种氨基酸残基代替。在本文中，术语“氨基酸置换”与“氨基酸取代”被认为同义。

本文所用的术语“变体”或“突变体”具有相同含义，可互换地使用。它们可以指多肽或核酸。变体是指相对于参考序列(通常为核酸或多肽的野生形式)存在一个或多个位置处的置换、插入、缺失、截短、颠换等。可以通过例如位点饱和诱变、扫描诱变、插入诱变、随机诱变、定点诱变和定向进化以及本领域技术人员已知的各种其他重组方法来产生变体。核酸的变异基因可以通过本领域已知的技术人工合成。

“成熟多肽”在本文中定义为这样的多肽，所述多肽处于其最终形式下并且在将mRNA翻译成多肽并对所述多肽进行翻译后修饰后获得。翻译后修饰包括N-末端加工、C-末端截短、糖基化、磷酸化，以及通过切割去除前导序列(诸如信号肽和/或前肽)。

两个多肽序列或核酸序列之间的相似性可以用其同源性来表示。在本文中，两个序列之间的“同一性”或“同源性”被认为具有相同含义，在本文中可互换使用。为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比，对序列进行比对以实现最佳匹配，序列同一性是两个序列之间在比对区域上相同匹配的百分比。两个氨基酸序列之间或两个多核苷酸序列之间的序列同源性百分比可以使用公知的算法来确定，例如用于比对两个序列的Needleman和Wunsch算法(Needleman,S.B.和Wunsch, C.D.(1970)J.Mol.Biol.48,443-453)。例如可以使用来自EMBOSS程序包的NEEDLE程序来进行。本领域技术人员将理解，当使用不同的算法或特定算法的不同参数时，可能会产生略微不同的结果，但是两个序列之间的同一性百分比不会显著改变。

本申请所述的“开口”是指野生型Prp43解旋酶本身带有的多核苷酸结合结构域的开口，也可以指与Prp43解旋酶结合的多核苷酸结合部分的开口，所述的开口为使得多核苷酸与Prp43解旋酶解离的开口，并且该开口可以不是一直存在的，但是至少在一种构象状态下包含至少一个开口。本申请所述的“经修饰的Prp43解旋酶”或者包含经修饰的Prp43解旋酶的构建体含有一个或多个开口。经过修饰Prp43解旋酶，使得解旋酶的同一单体上有两个或多个部分连接以减小开口的大小。

本申请所述的“一个以上”、“至少一个”、“一个或多个”或“一个或更多个”包括：一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、或更多个等等。

本申请所述的“两个以上”或“两个或多个”或“两个或以上”包括：两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、或更多个等等。

本申请所述的“多个”包括但不限于：三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、或更多个等等。

本申请所述的“和/或”包括择一列出的项目以及任何数量的项目组合。

本申请所述的“包括”、“含有”或“包含”是开放式的描述，表示含有所描述的指定成分或步骤，以及不会产生实质影响的其他指定成分或步骤。特别地，当上述术语用于描述蛋白质或核酸的序列时，表示所述蛋白质或核酸既可以是由所述序列组成，或者也可以是在所述蛋白质或核酸的一端或两端可以具有额外的氨基酸残基或核苷酸，但所述蛋白质或核酸仍然具有本申请所述的活性(例如其控制多核苷酸移动的能力等等)。

Prp43解旋酶

Prp43解旋酶是一种已知的解旋酶，其结构和功能在现有技术中已有研究和报道，例如可参见Marcel J.Tauchert et.al,“Structural and functional analysis of the RNA helicase Prp43 from the thermophilic eukaryote Chaetomium thermophilum”,Acta Cryst.,2016,F72,112–120。但是，未见有使用Prp43解旋酶用于纳米孔测序或控制多核苷酸分子移动通过纳米孔的报道。

Prp43解旋酶属于SF2超家族的DEAH/RHA解旋酶，能结合单链DNA或RNA，以3’-5’方向进行移位或解旋双链DNA或RNA核酸，同属于该家族的解旋酶还包括Prp22解旋酶、Prp2解旋酶、MLE解旋酶、DHX9解旋酶等。

Prp43解旋酶的3D结构和其组成结构域已经在现有技术中被阐明。例如，图1是嗜热毛壳菌(Chaetomium thermophilum)来源的Prp43解旋酶(SEQ ID NO:1)的3D结构示意图。Prp43解旋酶除了解旋酶常有的RecA1(P97-R273)和RecA2(T274-T458)两个核心结构域之外，还包含若干结构域：N端结构域(M1-L96)，C端的WH结构域(Y459-P526)、Ratchet结构域(L527-V640)和OB结构域(S641-A764)等。RecA1和RecA2包含7个保守的基序(Motifs),其中Ia(TQPRRVAA)、Ib(TDGQLLR)和IV(LLFLTG)与底物核酸相互作用，基序I(GSGKT)、II(DEAH)、V(TNIAETSLT)和VI(QRAGRAGR)则与核苷酸的结合有关，而基序III(SAT)则耦联核苷酸的水解和核酸的移位或解旋。

Prp43解旋酶在RecA1和RecA2结构域的顶端富含带正电荷氨基酸，与C端的WH结构域、Ratchet结构域和OB结构域一起形成环绕单链DNA或RNA的通道。

发明人发现虽然Prp43解旋酶与单链DNA或RNA具有较强的亲和力，但该过程仍然是一个热力学动态平衡过程，并不能完全保持控制目标核酸的过孔移动，尤其是目标核酸的长度较长时，比如1000个碱基长度、5000个碱基长度、10000个碱基长度、100000个碱基长度或更长碱基长度的核酸。发明人发现可以通过对Prp43解旋酶进行修饰，保证酶与核酸的结合并持续控制核酸穿过纳米孔。具体地，发明人发现，在Prp43解旋酶的RecA1结构域、RecA2结构域和/或Ratchet结构域中引入一个或多个半胱氨酸或非天然氨基酸，可以减小Prp43解旋酶的多核苷酸结合结构域的开口大小，进而改善其目标核酸的结合能力。

因此，本申请的第一方面涉及一种经修饰的Prp43解旋酶，包括RecA1结构域、RecA2结构域和Ratchet结构域，相对于对应的野生型Prp43解旋酶或其片段而言所述经修饰的Prp43解旋酶包括在选自RecA1结构域、RecA2结构域、Ratchet结构域的至少一个结构域中引入的1、2、3、4、5、6、7、8、9、10、11个或更多个半胱氨酸的插入或置换，和/或1、2、3、4、5、6、7、8、9、10、11个或更多个非天然氨基酸的插入或置换。

优选的，可以在下列任意一组中引入一个至少一个半胱氨酸残基和/或至少一个非天然氨基酸：

(a)RecA1结构域；

(b)RecA2结构域；

(c)Ratchet结构域；

(d)RecA1结构域和Ratchet结构域；

(e)RecA2结构域和Ratchet结构域。

本申请所述的非天然氨基酸包括但不限于：4-叠氮基-L-苯丙氨酸(Faz)，4-乙酰基-L-苯丙氨酸，3-乙酰基-L-苯丙氨酸，4-乙酰乙酰基-L苯丙氨酸，O-烯丙基-L-酪氨酸，3-(苯基硒烷基)-L-丙氨酸，O-2-丙炔-1-基-L-酪氨酸，4(二羟基硼基)-L-苯丙氨酸，4-[(乙基硫烷基)羰基]-L-苯丙氨酸，(2S)-2-氨基-3-{4-[(丙烷-2-基硫烷基)羰基]苯基}丙酸，(2S)-2-氨基-3-{4-[(2-氨基-3-硫烷基丙酰基)氨基]苯基}丙酸，O-甲基-L-酪氨酸，4-氨基-L-苯丙氨酸，4-氰基-L-苯丙氨酸，3-氰基-L-苯丙氨酸，4-氟-L-苯丙氨酸，4-碘-L-苯丙氨酸，4-溴-L-苯丙氨酸，O-(三氟甲基)酪氨酸，4-硝基L-苯丙氨酸，3-羟基-L-酪氨酸，3-氨基-L-酪氨酸，3-碘-L-酪氨酸，4-异丙基-L-苯丙氨酸，3-(2-萘基)-L-丙氨酸，4-苯基-L-苯丙氨酸，(2S)-2-氨基-3-(萘-2-基氨基)丙酸，6-(甲基硫烷基)正亮氨酸，6-氧-L-赖氨酸，D-酪氨酸，(2R)-2-羟基-3-(4-羟基苯基)丙酸，(2R)-2氨基辛酸酯3-(2，2′-二吡啶-5-基)-D-丙氨酸，2-氨基-3-(8-羟基-3-喹啉基)丙酸，4-苯甲酰-L-苯丙氨酸，S-(2-硝基苄基)半胱氨酸，(2R)-2-氨基-3-[(2-硝基苄基)硫烷基]丙酸，(2S)-2-氨基-3-[(2-硝基苄基)氧基]丙酸，O-(4， 5-二甲氧基-2-硝基苄基)-L-丝氨酸，(2S)-2-氨基-6-({[(2-硝基苄基)氧基]羰基}氨基)己酸，O-(2-硝基苄基)-L-酪氨酸，2-硝基苯丙氨酸，4-[(E)-苯基二氮烯基]-L-苯丙氨酸，4-[3-(三氟甲基)-3H-二吖丙啶基-3基]-D-苯丙氨酸，2-氨基-3-[[5-(二甲基氨基)-1-萘基]磺酰基氨基]丙酸，(2S)-2-氨基4-(7-羟基-2-氧-2H-色烯-4-基)丁酸，(2S)-3-[(6-乙酰基萘-2-基)氨基]-2-氨基丙酸，4(羧基甲基)苯丙氨酸，3-硝基-L-酪氨酸，O-硫基-L-酪氨酸，(2R)-6-乙酰氨基-2-氨基己酸酯，1-甲基组氨酸，2-氨基壬酸，2-氨基癸酸，L-同质半胱氨酸，5-硫烷基正缬氨酸，6-硫烷基-L-正亮氨酸，5-(甲基硫烷基)-L-正缬氨酸，N6-{[(2R，3R)-3-甲基-3，4-二氢-2H-吡咯2-基]羰基}-L-赖氨酸，N6-[(苄基氧基)羰基]赖氨酸，(2S)-2-氨基-6-[(环戊基羰基)氨基]己酸，N6-[(环戊基氧基)羰基]-L-赖氨酸，(2S)-2-氨基-6-{[(2R)-四氢呋喃-2-基羰基]氨基}己酸，(2S)-2-氨基-8-[(2R，3S)-3-乙炔基四氢呋喃-2-基]-8-氧基辛酸，N6-(叔丁氧基羰基)-L-赖氨酸，(2S)-2-羟基-6-({[(2-甲基-2-丙烷基)氧基]羰基}氨基)己酸，N6-[(烯丙氧基)羰基]赖氨酸，(2S)-2-氨基-6-({[(2-叠氮苄基)氧基]羰基}氨基)己酸，N6L-脯氨酰基-L-赖氨酸，(2S)-2-氨基-6-{[(丙-2-炔-1-基氧基)羰基]氨基}己酸或N6-[(2叠氮乙氧基)羰基]-L-赖氨酸。

本申请中的“Prp43解旋酶”应该按照其广义来理解，并认为涵盖了Prp43解旋酶(例如SEQ ID NO:1)的同源蛋白。通常，只要一种酶具有DNA/RNA解旋活性，含有RecA1结构域、RecA2结构域和/或Ratchet结构域，且与SEQ ID NO:1具有至少30％的同源性，例如至少35％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性，则可以认为其属于Prp43解旋酶。因此，一些被称为HrpA解旋酶或HrpB解旋酶的解旋酶(例如表1中所列出的那些)也被认为落入本申请中的“Prp43解旋酶”范围内。

本申请所述的Prp43解旋酶可以是各种常规来源的Prp43解旋酶，例如所述Prp43解旋酶可以来源于Chaetomium thermophilum、Bathycoccus prasinos、Uncultured bacterium、Archaeon、Parcubacteria、Sorangium cellulosum、Candidatus Sungbacteria、Mycolicibacterium chitae、Parcubacteria、 Thermodesulforhabdus norvegica、Deltaproteobacteria、Puniceicoccales、Desulfobacterium vacuolatum或Desulfobacter sp.或来源于病毒基因组(viral metagenome)等。表1给出了一些可以用于本申请的同源Prp43解旋酶的示例，但是本申请的Prp43解旋酶并不限于这些例子。

表1：ctPrp43同源蛋白示例

最优选的，申请所述的Prp43解旋酶是来源于嗜热毛壳菌(Chaetomium thermophilum)的。

因此，在一些优选实施方式中，本申请提供了一种经修饰的Prp43解旋酶，所述Prp43解旋酶包含SEQ ID NO:1或其片段的变体，所述变体包括在RecA1结构域、RecA2结构域和/或Ratchet结构域中引入的1、2、3、4、5、6、7、8、9、10、11个或更多个半胱氨酸的插入或置换，和/或1、2、3、4、5、6、7、8、9、10、11个或更多个非天然氨基酸的插入或置换。

在一些优选实施方式中，所述变体包括在对应于SEQ ID NO:1的M157、Q161、D165、F181、E182、N183、R324、L328、E332、R335、L351、P352、P353、H354、D321、E320、R358、P563、A564、N565、D603、K605、K606、H609、Y615、R616、S619、N623、A626或K630中的任一个或两个以上的位置上引入至少一个半胱氨酸残基和/或至少一个非天然氨基酸残基。更优选地，所引入的半胱氨酸残基或非天然氨基酸残基位于对应于SEQ ID NO:1的F181、P352、S619或N623中的任一个或两个以上的位置。

已经发现，将野生型Prp43解旋酶的N端结构域去除，更有利于控制核苷酸的移动。因此，在一些优选实施方式中，所述经修饰的Prp43解旋酶包括N端结构域的去除，优选地去除N端的位置1开始的至少96个、至少90个、至少80个、至少70个、至少60个、至少50个、至少40个或至少30个残基。对于SEQ ID NO:1而言，优选地去除M1-N60，即优选使用SEQ ID NO:1的T61-A764片段，并在此基础上引入一个或更多个半胱氨酸的插入或置换，和/或一个或更多个非天然氨基酸的插入或置换。

为提高本申请所述的Prp43解旋酶与目标多核苷酸结合的稳定性，降低从目标多核苷酸上解脱的能力，还可以引入2个或2个以上的半胱氨酸残基或非天然氨基酸残基，且在引入的半胱氨酸与半胱氨酸之间相互连接、在引入的非天然氨基酸与非天然氨基酸之间相互连接、在引入的半胱氨酸与非天然氨基酸之间相互连接、在引入的半胱氨酸与天然氨基酸之间相互连接，或者在引入的非天然氨基酸与天然氨基酸之间相互连接。

优选的，可以使任何数目和组合的两个以上引入的半胱氨酸与非天然氨基酸相互连接。例如，可以使2、3、4、5、6、7、8或更多个半胱氨酸和 /或非天然氨基酸相互连接。一个或多个半胱氨酸可以与一个或多个半胱氨酸连接。一个或多个半胱氨酸可以与一个或多个非天然氨基酸诸如Faz连接。一个或多个非天然氨基酸诸如Faz可以与一个或多个非天然氨基酸诸如Faz连接。一个或多个半胱氨酸可以与一个或多个解旋酶上的天然氨基酸连接。一个或多个非天然氨基酸诸如Faz可以与一个或多个解旋酶上的天然氨基酸连接。

优选的，所述的连接可以是任何连接方式，包括暂时连接或者永久的连接方式，例如共价连接或氢键连接或静电相互作用或π-π相互作用或疏水相互作用等。在本发明的另一个具体实施方式中，所述的连接可以是永久的，例如共价连接。可以采用化学交联剂进行共价连接，其长度可以从一个碳(碳酰氯型连接器)到多个埃变化。例如马来酰亚胺、活性酯、琥珀酰亚胺、叠氮化物、烷烃、烯烃、炔烃(诸如二苯并环辛炔醇(DIBO或DBCO)，二氟环炔烃和线性炔烃)等。又例如聚乙二醇(PEGs)、多肽、多糖、脱氧核糖核酸(DNA)、肽核酸(PNA)、苏糖核酸(TNA)、甘油核酸(GNA)、饱和的和不饱和的烃或聚酰胺等等的线性分子，又例如TMAD等等的催化试剂，可以通过-S-S键进行连接。

在本发明的某些具体实施方式中，采用TMAD催化剂使得F181和N623位置或P352和S619位置引入的半胱氨酸残基与半胱氨酸残基之间共价连接。

在一些优选实施方式中，所述经修饰的Prp43解旋酶还包括对于一个或多个半胱氨酸残基的置换，更优选为对应于SEQ ID NO:1的C148、C214、C303、C323、C377、C441、C508、C543、C608的一个或多个半胱氨酸残基被置换，更优选地半胱氨酸残基被置换为丙氨酸、甘氨酸、缬氨酸、异亮氨酸、亮氨酸、苯丙氨酸、酪氨酸、丝氨酸、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、蛋氨酸、色氨酸、谷氨酰胺、天冬酰胺或脯氨酸残基。

在一些优选实施方式中，为了进一步使所述Prp43解旋酶具有持续、稳定地以一定速率控制多核苷酸移动的能力，所述经修饰的Prp43解旋酶还进一步包含选自以下组的一个或多个氨基酸修饰：

(a)一个或多个与核苷酸相互作用的氨基酸被置换；

(b)一个或多个与NTP和/或二价金属离子(如Mg ²⁺)结合相关的氨基酸被置换；

(c)一个或多个与跨膜孔相互作用的氨基酸被置换；

(d)降低Prp43解旋酶的表面的负电荷的进一步修饰。

优选的，所述与核苷酸相互作用且被置换的氨基酸包括但不限于：对应于SEQ ID NO:1的R152、R153、R180、T195、Q198、R201、E316、E317、G349、T381、N382、K403、K405、L416、P526、P557、R562、Q558、H688、P689、T708、K710、Y712、R714。进一步优选的，至少一个与单链DNA、RNA或双链DNA、RNA中一个或多个核苷酸的磷酸基团相互作用的氨基酸被置换。

优选的，所述一个或多个与NTP和/或二价金属离子(如Mg ²⁺)结合相关的氨基酸包括但不限于：对应于SEQ ID NO:1的T126、D218、S387、E219、R432、R435、T121、K125、T127、T389、R162、D391、F360。

优选的，所述一个或多个与跨膜孔相互作用的氨基酸包括但不限于：对应于SEQ ID NO:1的C303、E336、D288、R287、E286、E284、E291。

进一步优选的，用包含较大侧链的氨基酸取代至少一个与单链DNA、RNA或双链DNA、RNA中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸。所述较大侧链包括增加数目的碳原子，具有增加的长度，增加的分子体积和/或具有增加的范德华体积。所述较大侧链增加了所述至少一个氨基酸与所述单链或双链DNA中一个或多个核苷酸之间的(i)静电相互作用；(ii)氢键和/或(iii)阳离子-pi相互作用。所述较大侧链的氨基酸不是丙氨酸(A)、半胱氨酸(C)、甘氨酸(G)、硒代半胱氨酸(U)、甲硫氨酸(M)、天冬氨酸(D)或谷氨酸(E)。

优选的，所述的Prp43解旋酶进一步被修饰降低其表面的负电荷。所述的Prp43解旋酶还包含增加净正电荷的取代。优选的，所述的Prp43解旋酶还包含对表面带负电的氨基酸、极性或非极性氨基酸进行取代或修饰。进一步优选的，所述的取代包括带正电的氨基酸、不带电荷的氨基酸取代带负电的氨基酸、不带电荷的氨基酸、芳香族氨基酸、极性或非极性氨基酸。其中，所述的带正电的氨基酸、不带电荷的氨基酸、极性、非极性氨基酸或芳香族氨基酸可以是天然的或非天然的氨基酸，其可以是人工合成的或者经过修饰的天然氨基酸。

本申请所述所述的Prp43解旋酶经修饰后，可以与对应的野生型的Prp43解旋酶的氨基酸序列具有至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性。

在一些更优选的实施方式中，所述Prp43解旋酶为SEQ ID NO:1的变体(即来源于Chaetomium thermophilum)，且所述SEQ ID NO:1的变体包括在SEQ ID NO:1的F181和/或N623位置上引入至少一个半胱氨酸残基和/或至少一个非天然氨基酸；或者所述SEQ ID NO:1的变体包括在SEQ ID NO:1的P352和/或S619位置上引入至少一个半胱氨酸残基和/或至少一个非天然氨基酸。

在一些更优选的实施方式中，所述Prp43解旋酶为SEQ ID NO:1的变体(即来源于Chaetomium thermophilum)，且所述SEQ ID NO:1的变体还包括SEQ ID NO:1的至少一个或多个半胱氨酸被取代。取代的氨基酸可以为丙氨酸、甘氨酸、缬氨酸、异亮氨酸、亮氨酸、苯丙氨酸、酪氨酸、丝氨酸、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、蛋氨酸、色氨酸、谷氨酰胺、天冬酰胺、脯氨酸。优选的，所述的一个或多个被取代的半胱氨酸为C148、C214、C303、C323、C377、C441、C508、C543、C608。

在一些更优选的实施方式中，所述Prp43解旋酶为SEQ ID NO:1的变体(即来源于Chaetomium thermophilum)，且所述SEQ ID NO:1的变体去除N端结构域的M1至N60序列，进一步优选的去除N端的M1至L96序列。本发明的一个具体案例中是去除了N端结构域M1至N60序列的解旋酶。

在一些更优选的实施方式中，所述Prp43解旋酶为SEQ ID NO:1的变体(即来源于Chaetomium thermophilum)，且所述SEQ ID NO:1的变体与SEQ ID NO:1的氨基酸序列具有至少30％、至少40％、至少50％、至少 60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性。更优选地，所述Prp43解旋酶为经修饰的SEQ ID NO:1的T61-A764片段。

在一些更优选的实施方式中，所述Prp43解旋酶为经修饰的SEQ ID NO:1的T61-A764片段(来源于Chaetomium thermophilum)，且所述修饰为F181C/N623C/C508S或P352C/S619C/C508S。

另外，本申请所述的Prp43解旋酶可以被修饰以助于鉴定或纯化，例如通过添加组氨酸残基(His标签)，天冬氨酸残基(asp标签)，链霉亲和素标签，Flag标签，SUMO标签，GST标签或MBP标签，或通过添加信号序列以促进它们从细胞中分泌，该细胞中的多肽不天然地含有该信号序列。引入遗传标签的替换方式是通过化学反应将标签连到Prp43解旋酶上的天然或人工位点。

本申请所述的Prp43解旋酶可以是Prp43解旋酶寡聚体形式，所述的Prp43解旋酶寡聚体包含一个或多个的本申请所述的Prp43解旋酶。

在一些实施方式中，所述的Prp43解旋酶寡聚体还可以包含野生型Prp43解旋酶或其他类型的解旋酶。其中，所述的其他类型的解旋酶可以为Hel308解旋酶、XPD解旋酶、Dda解旋酶、RecD2解旋酶、TraI解旋酶或TrwC解旋酶等等。

优选的，所述的Prp43解旋酶与野生型Prp43解旋酶之间、Prp43解旋酶与Prp43解旋酶之间、野生型Prp43解旋酶与野生型Prp43解旋酶、Prp43解旋酶与其他类型解旋酶之间或者野生型Prp43解旋酶与其他类型解旋酶之间，可以通过头对头、尾对尾或者头对尾的方式连接或排列。

优选的，所述的Prp43解旋酶寡聚体包含两个以上的本申请所述的Prp43解旋酶，其中，所述的Prp43解旋酶可以是不同的或者相同的。

蛋白构建体

在生理功能中，Prp43解旋酶参与了前体mRNA加工过程中由U2.U5.U6snRNPs组成的内含子剪接体的解离，该过程中酶功能的发挥需要与两个含有富含甘氨酸基序(G-Path motif)的辅助蛋白Ntr1和Ntr2相互作用，以激活其ATP水解活性和解旋活性；Prp43解旋酶也参与了核糖体合成过程，以帮助18S和25S的rRNAs前体的成熟，该过程也需要富含G-Path基序的蛋白Pfa1和Gno1蛋白的激活。

Prp43解旋酶在生理功能条件下需要含有G-Path结构域的辅助蛋白激活其ATP水解活性和解旋活性。虽然在缺少辅助蛋白的条件下该酶具有微弱的活性，更优地是在辅助激活蛋白的存在下其ATP水解和解旋活性更强。特别地，发明人发现含有G-Path结构域辅助蛋白的单独部分片段仍具有激活功能。

因此，在本申请的第二方面，提供了一种蛋白构建体，其包括本申请第一方面所述的经修饰的Prp43解旋酶，以及在所述Prp43解旋酶的C端或N端融合的辅助激活蛋白Paf1的G-Path结构域或含有G-Path结构域的Paf1的片段。该蛋白构建体也可以视为一种融合蛋白。

这种经修饰的Prp43解旋酶构建体，由于在Prp43解旋酶的C端或N端融合了辅助激活蛋白Paf1或其同源蛋白的G-Path结构域或含有G-Path结构域的片段，使修饰后的解旋酶ATP水解和或解旋活性明显增强，更有利于控制纳米孔核酸测序中核酸的过孔移动。

所述蛋白构建体中，经修饰的Prp43解旋酶的数目可以为一个或多个。

所述蛋白构建体中，所述辅助激活蛋白Paf1可以是本领域常规使用的各种来源的Paf1蛋白，例如可以是来源于Chaetomium thermophilum var.thermophilum、Thermothielavioides terrestris、Thermothelomyces thermophilus、Podospora anserina、Neurospora tetrasperma、Coniochaeta sp.、Monosporascus sp.、Hypoxylon sp.、Madurella mycetomatis或Coniochaeta pulveracea的Paf1。

表2给出了一些可以用于本申请的Prp43解旋酶构建体的同源Paf1蛋白的示例，但是本申请的Paf1蛋白并不限于这些例子。

表2：ctPfa1同源蛋白

优选的，所述G-path结构域序列为上述Pfa1辅助蛋白或其同源蛋白中对应SEQ ID NO:16的K662-G742片段(即SEQ ID NO:26的序列)的序列或其变体的序列。

在一些优选的实施方式中，在所述蛋白构建体中，所述辅助激活蛋白Paf1的氨基酸序列为SEQ ID NO:16或与SEQ ID NO:16的氨基酸序列具有至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性的变体的氨基酸序列，并且所述辅助激活蛋白Paf1具有激活Prp43解旋酶的功能。

在一些更优选的实施方式中，所述Paf1的G-Path结构域为SEQ ID NO:16的K662-G742片段。

在最优选的实施方式中，在所述蛋白构建体中，所述Prp43解旋酶包括SEQ ID NO:1的序列或其变体，所述Pfa1辅助激活蛋白包括SEQ ID NO:16序列或其变体、或SEQ ID NO:16的G-Path结构域序列SEQ ID NO:26(对应SEQ ID NO:16序列的K662-G742片段)或其变体。

本申请所述的蛋白构建体可以被修饰以助于鉴定或纯化，例如通过添加组氨酸残基(His标签)，天冬氨酸残基(asp标签)，链霉亲和素标签，Flag标签，SUMO标签，GST标签或MBP标签或Strep TagII标签，或通过添加信号序列以促进它们从细胞中分泌，该细胞中的多肽不天然地含有该信号序列。引入遗传标签的替换方式是通过化学反应将标签连到蛋白构建体上的天然或人工位点。

核酸

本申请的第三方面，提供了一种核酸，所述的核酸编码本申请第一方面所述的Prp43解旋酶和/或本申请第二方面所述的蛋白的构建体。

表达载体

本申请的第四个方面，提供了一种表达载体，所述的表达载体包含本申请第三方面所述的核酸。优选的，所述的核酸可操作的连接至表达载体中的调控元件，其中所述的调控元件优选为启动子。在本申请的一些具体实施方式中，所述的启动子选自T7、trc、lac、ara或λL。优选的，所述的表达载体包括但不限于质粒、病毒或噬菌体。

本领域技术人员已知有多种用于将核酸插入核酸构建体或表达载体中的方法，参见例如Sambrook和Russell,Molecular Cloning:A Laboratory Manual，第3版，CSHL Press,Cold Spring Harbor,NY,2001。

宿主细胞

本申请的第五方面，提供了一种宿主细胞，所述的宿主细胞包含本申请第三方面所述的核酸或本申请第四方面所述的表达载体。优选的，所述的宿主细胞包括但不限于大肠杆菌。在本申请的一个具体实施方式中，所述的宿主细胞选自BL21(DE3)、JM109(DE3)、B834(DE3)、TUNER、C41(DE3)、Rosetta2(DE3)、Origami、Origami B等等。

Prp43解旋酶或蛋白构建体的制备方法

遗传改造技术，诸如酶在宿主细胞中的过表达、对宿主细胞的遗传修饰、或杂交技术是本领域中已知的方法，诸如在Sambrook和Russel(2001)"Molecular Cloning:A Laboratory Manual(第3版)，Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press或F.Ausubel等人编著，"Current protocols in molecular biology",Green Publishing and Wiley Interscience,New York(1987)中描述的那些技术。

例如，在本申请的一个具体实施方式中，经修饰的Prp43解旋酶的制备方法包括：根据本申请所述Prp43解旋酶和或辅助激活蛋白或激活结构域的氨基酸序列，获得编码Prp43解旋酶的核酸序列，酶切连接至表达载体后转化至大肠杆菌中，诱导表达和纯化，获得所述Prp43解旋酶。

Prp43解旋酶或蛋白构建体的应用

本申请的Prp43解旋酶或蛋白构建体可以用于控制多核苷酸分子移动或是用于表征目标多核苷酸。

本发明所述的Prp43解旋酶是一种在链测序过程中控制目标多核苷酸移动的有用工具，当提供了促进移动的常规必要组分时，Prp43解旋酶沿着DNA或RNA以3’-5’的方向移动，但DNA或RNA在孔中的定向(取决于DNA或RNA的哪个末端被捕获)意味着Prp43解旋酶可以用于逆着所施加的场的方向或顺着施加的场的方向将DNA或RNA移进孔。通过在野生型Prp43解旋酶中引入半胱氨酸残基和/或至少一个非天然氨基酸，可以有效减少Prp43解旋酶或构建体上多核苷酸结合结构域或多核苷酸结合部分开口的大小或开闭，以及目标多核苷酸被解开的开口的大小或开闭，从而显著降低Prp43解旋酶从目标多核苷酸上解脱的能力，提高控制目标多核苷酸通过孔的能力。通过在野生型Prp43解旋酶或者修饰后的Prp43解旋酶的C端或N端融合G-path结构域或含有G-Path结构域的多肽，可以有效提升修饰后的Prp43解旋酶的ATP水解活性或者解旋活性，从而提高控制目标多核苷酸通过孔的能力。

优选的，所述的控制多核苷酸移动为控制多核苷酸穿过孔的移动。所述的孔为纳米孔，所述的纳米孔为跨膜孔。该孔可以是天然的或人造的，包括但不限于生物孔、固态孔或生物与固态杂交的孔。优选的，所述的方法可以包含一个或多个的Prp43解旋酶共同控制多核苷酸的移动。

优选的，重复步骤(a)和(b)一次或多次。

优选的，所述的方法中可以使用任意数量的本申请所述的Prp43解旋酶。优选可以为一个或多个，更优选为1、2、3、4、5、6、7、8、9个或更多个。其中，所述的两个以上本申请所述的Prp43解旋酶可以相同或不同。也可以包含野生型Prp43解旋酶或者其他类型的解旋酶。进一步的，两个以上解旋酶之间可以连接或者只是通过分别结合在多核苷酸上而排列发挥控制多核苷酸移动的功能。

优选的，所述的方法还包括横跨与所述解旋酶或构建体，和目标多核苷酸接触的孔施加电势差的步骤。

优选的，所述的孔是允许水合离子在施加的电势的驱动下从膜的一侧流向膜的另一层的结构。进一步优选的，所述的孔为纳米孔，所述的纳米孔为跨膜孔。所述跨膜孔为目标多核苷酸的移动提供了通道。进一步优选的，所述的孔选自生物孔、固态孔或生物与固态杂交的孔。

在一些具体实施方式中，所述的孔包括但不限于衍生自耻垢分枝杆菌孔蛋白A、耻垢分枝杆菌孔蛋白B、耻垢分枝杆菌孔蛋白C、耻垢分枝杆菌孔蛋白D、溶血素、胞溶素、白细胞介素、外膜孔蛋白F、外膜孔蛋白G、外膜磷脂酶A、WZA或奈瑟氏菌自转运脂蛋白等等。

所述的膜可以为任何现有技术中存在的膜，优选为两性分子层，即一种由具有至少一个亲水性部分和至少一个亲脂性或疏水性部分的两性分子诸如磷脂质形成的层，两性分子可以是合成的或天然存在的。进一步优选的，所述的膜为脂质双层膜。所述的目标多核苷酸可以使用任何已知的方法连接到膜上。如果膜是两性分子层，如脂质双分子层，所述多核苷酸优选通过在所述膜中存在的多肽或通过在所述膜中存在的疏水锚被连接到该膜上。其中，疏水锚优选为脂质、脂肪酸、甾醇、碳纳米管或氨基酸。

优选的，当在孔施加一种力(如电压)，目标多核苷酸通过孔的速率被Prp43解旋酶或构建体所控制，从而获得一种可识别的稳定的电流水平，用于确定目标多核苷酸的特征。

优选的，所述的目标多核苷酸为单链、双链或至少一部分是双链的。

进一步优选的，所述的目标多核苷酸可以通过标签、间隔物、甲基化、氧化或损伤的方式进行修饰。

在本申请的一个具体实施方式中，所述的目标多核苷酸为至少一部分是双链的。其中所述的双链部分构成Y衔体结构，所述的Y衔体结构包含优先螺入所述孔的前导序列。

进一步优选的，所述的目标多核苷酸的长度可以为10-100000个碱基或更多个碱基。

在本申请的一个具体实施方式中，所述的目标多核苷酸的长度可以为至少10个、至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少1000个、至少2000个、至少5000个、至少10000个、至少50000个或至少100000个碱基等等。

优选的，所述的解旋酶结合到单链多核苷酸的内部核苷酸中。

优选的，所述的目标多核苷酸为DNA或RNA。

优选的，当所述的目标多核苷酸为RNA时，为提高要被测序的RNA穿过孔的能力和效率，将RNA修饰为包含非RNA多核苷酸。

优选的，RNA修饰的步骤包含将DNA前导区与待测RNA的3’末端连接。还包括将待测RNA反转录的步骤

优选的，所述的一个或多个特征选自目标多核苷酸的来源、长度、同一性、序列、二级结构或目标多核苷酸是否被修饰。进一步优选的，所述的一个或多个特征通过电测量和/或光学测量进行。

进一步优选的，通过电测量和/或光测量产生电信号和/或光信号，而每种核苷酸对应一种信号水平，继而将电信号和/或光信号转化为核苷酸的特征。

在本申请的一个具体实施方式中，所述的电测量包括但不限于电流测量、阻抗测量、隧道测量、风洞测量或场效应晶体管(FET)测量等等。

本申请所述的电信号选自电流、电压、隧穿、电阻、电位、电导率或横向电测量的测量值。

在一些具体实施方式中，所述的电信号为穿过所述孔的电流。

优选的，所述的表征还包括应用改进型维特比算法。

传感器和分析装置

优选的，所述的分析装置选自试剂盒、装置或传感器。

进一步优选的，所述的分析装置是试剂盒，所述的试剂盒中还包括包含脂质双层的芯片。所述的孔横跨脂质双层。本申请所述的试剂盒包含一个或多个脂质双层，每个脂质双层包含一个或多个所述的孔。本申请所述的试剂盒还包括实施表征目标多核苷酸的试剂或装置。优选的，所述的试剂包括缓冲剂、PCR扩增所需的工具。

下面结合附图和具体实施例对本申请的实施方式作进一步的解释和说明。这些实施例仅仅是为了解释和说明本申请的各个方面，而不能被理解为对本申请的范围的限制。

附图说明

图1示出了来自于嗜热毛壳菌(Chaetomium thermophilum)的N端(M1-N60)截短的野生型Prp43解旋酶(SEQ ID NO:1)的3D结构示意图。

图2示出了N端(M1-N60)截短的野生型Prp43解旋酶、经修饰的Prp43解旋酶Prp43-2(F181C/N623C/C508S)、经修饰的Prp43解旋酶Prp43-3(P352C/S619C/C508S)、N端(M1-N60)截短的蛋白构建体Prp43-GP、N端(M1-N60)截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)和N端(M1-N60)截短的蛋白构建体Prp43-GP-3(P352C/S619C/C508S)的单链DNA依赖ATP水解活性检测。

图3示出了N端(M1-N60)截短的野生型Prp43解旋酶、经修饰的 Prp43解旋酶Prp43-2(F181C/N623C/C508S)、经修饰的Prp43解旋酶Prp43-3(P352C/S619C/C508S)、N端(M1-N60)截短的蛋白构建体Prp43-GP、N端(M1-N60)截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)和N端(M1-N60)截短的蛋白构建体Prp43-GP-3(P352C/S619C/C508S)的单链RNA依赖ATP水解活性检测。

图4示出了低盐条件下N端(M1-N60)截短的野生型Prp43解旋酶或N端(M1-N60)截短的蛋白构建体Prp43-GP、N端(M1-N60)截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)与单链DNA的亲和力曲线。

图5示出了N端(M1-N60)截短的野生型Prp43解旋酶、N端(M1-N60)截短的蛋白构建体Prp43-GP和N端(M1-N60)截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)的凝胶迁移实验结果。其中，泳道1是T44-37-FAM底物，泳道2是野生型Prp43解旋酶和T44-37-FAM底物结合的复合物，泳道3是野生型Prp43解旋酶和T44-37-FAM底物结合后进行TMAD催化处理的产物，泳道4是Prp43-GP解旋酶和T44-37-FAM底物结合的复合物，泳道5是Prp43-GP解旋酶和T44-37-FAM底物结合后进行TMAD催化处理的产物，泳道6是Prp43-GP-2解旋酶突变体和T44-37-FAM底物结合的复合物，泳道7是Prp43-GP-2解旋酶突变体和T44-37-FAM底物结合后进行TMAD催化处理的产物。

图6示出了DNA构建体X的示意图，其中A区对应序列SEQ ID NO:32其5’末端连接到4个iSpC3间隔区(B区)，该间隔区连接到C区对应序列SEQ ID NO:33的3’末端，C区序列的5’末端连接到D区对应序列SEQ ID NO:34，该构建体的E区对应序列SEQ ID NO:35与F区对应序列SEQ ID NO:36(其具有3’胆固醇系链)杂交。

图7示出了N端(M1-N60)截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)控制DNA构建体X通过MspA纳米孔移动时的电流轨迹示例(y轴坐标为电流(pA，0到100)，x轴坐标为时间(h:m:s))。

图8说明：示出了RNA构建体Y示意图，其中SEQ ID NO:37(标记为D)其3’末端连接到20个iSpC3间隔区(标记为A)，其5’末端连接到4个iSpC3间隔区(标记为B)，该间隔区连接到SEQ ID NO:38(标记为C)的3’末端，该构建体的SEQ ID NO:39(标记为E)区域与SEQ ID NO:40(标记为F，其具有3’胆固醇系链)杂交。

图9示出了N端(M1-N60)截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)控制RNA构建体Y穿过MspA纳米孔的电流轨迹示例(y轴坐标为电流(pA，0到100)，x轴坐标为时间(h:m:s))。

实施例

以下各实施例中未具体注明的实验操作细节可以参考本文为所引用的参考文献，所采用的实验试剂和仪器设备均为常规商业可得的试剂或仪器。

实施例1

野生型Prp43解旋酶和经修饰的解旋酶Prp43以及蛋白构建体均采用标准的分子生物学方法进行制备，其原理和操作过程为本领域技术人员所熟知(参见本文为所引用的参考文献)。

N端截短的野生型Prp43解旋酶(即T61-A764片段)：将N端截短Prp43解旋酶T61-A764片段(对应于SEQ ID NO:1的Prp43解旋酶氨基酸序列去除了N端结构域的M1至N60片段)对应的核酸序列(SEQ ID NO:28，由金斯瑞生物科技股份有限公司提供)通过酶切连接方式连接至载体pGS-21a(金斯瑞生物科技股份有限公司，货号SD0121)中，经测序验证正确后转化至表达感受态宿主细胞BL21(DE3)(北京全式金生物技术有限公司，货号CD601-02)中。从平板上挑选单克隆接种至100ml氨苄抗性的液体LB培养基，37℃过夜培养后第二天转接至大瓶培养基中扩大培养，待OD600达到0.4-0.8左右时，添加终浓度为0.5mM的异丙基-β-D-硫代半乳糖苷(IPTG)，16℃过夜诱导表达12小时左右，低温离心收集的菌体经过裂解缓冲液重悬后高压均质破碎，高速离心收集上清液，进行后续的蛋白层析纯化，具体包括镍离子亲和层析、离子交换层析和分子筛分离，目标蛋白经酶切切除GST标签后经过镍离子亲和层析柱后收集流穿的目的蛋白，切除GST标签后的目标蛋白使用SDS-PAGE凝胶电泳检测。切除标签后的截短Prp43蛋白(去除了N端结构域的M1至N60)经过SDS-PAGE检测，显示目的蛋白大小正确，可用于后续的测试和分析。

N端截短Prp43解旋酶T61-A764片段融合GP结构域蛋白突变体Prp43-GP-2(F181C/N623C/C508S)(即SEQ ID NO:27)：按照N端截短Prp43解旋酶T61-A764片段的相同制备方法进行制备，只是将起始序列由对应于N端截短Prp43解旋酶T61-A764片段的核酸序列(SEQ ID NO:28)替换为SEQ ID NO:30。切除标签后的蛋白构建体Prp43-GP-2，经过SDS-PAGE检测，显示目的蛋白大小正确，可用于后续的测试和分析。

按照上述相同方法，采用不同的起始核酸序列，分别制备经修饰的N端(M1-N60)截短的Prp43解旋酶和蛋白构建体：Prp43-2(F181C/N623C/C508S)、经修饰的Prp43解旋酶Prp43-3(P352C/S619C/C508S)、N端(M1-N60)截短的蛋白构建体Prp43-GP和N端(M1-N60)截短的蛋白构建体Prp43-GP-3(P352C/S619C/C508S)。其中所用的启示核酸序列分别如下表3中所示。

表3：实施例中使用的蛋白或蛋白构建体及其制备

实施例2

本实施例对N端(M1-N60)截短的野生型Prp43解旋酶、经修饰的Prp43解旋酶Prp43-2(F181C/N623C/C508S)、经修饰的Prp43解旋酶Prp43-3(P352C/S619C/C508S)、N端截短的蛋白构建体Prp43-GP、N端截短的蛋白构建体Prp43-GP-2(F181C/N623C/C508S)和N端截短的蛋白构建体Prp43-GP-3(P352C/S619C/C508S)在结合或孵育单链DNA或单链RNA底物时的ATP水解活性进行了测试。

(1)材料与方法

本实施例使用吸光光度法对Prp43解旋酶的ATPase水解活性进行检测。具体步骤是，准备含有50uM磷酸盐的预混溶液，将50uL的磷酸盐标准溶液移入950uL的超纯水中，给管道编号。

表4：标准品制备

在96孔板的重复孔中加入25nM Prp43解旋酶样品,加入0.5nM M13ssDNA，用测试Buffer(10mM HEPES,600mM KCL,5mM Mg2+)将样品加入10uL的最终体积，30℃反应30min，加入终浓度为1mM TMAD，30℃反应30min。在重复的孔中加入10uL(10mM HEPES,50mM KCL,5mM Mg2+)缓冲液作为阴性对照。高水平的磷酸盐会导致样品背景，要更正此背景。反应混合物加入后，立即在每个背景空白孔中加入160uL工作试剂，使反应停止。不需要进行最初的30min的孵化，然后可以从样本读数中减去背景空白读数。根据表4、表5的方案设置反应组合。每个样品、背景空白或阴性对照反应需要70uL的反应混合物。

表5：样品制备

每孔加70uL反应混合液，空白背景，阴性对照。不要添加到标准品中。在室温下培养反应30min。在每个孔中加入160uL工作试剂，在室温下再孵育15min，终止酶反应，生成比色产物。酶标仪读取所有样品、标准品和对照品的600-660nm处的吸光度[620nm处的最大吸光度(A620)]。

(2)结果

N端(M1-N60)截短的野生型Prp43解旋酶和修饰的Prp43解旋酶或蛋白构建体在分别和DNA或RNA结合后的ATP水解活性如图2和图3所示。从图2、图3可知：在Prp43解旋酶或突变体的C端融合了G-Path激活结构域之后，该酶的ATP水解活性得到了明显的提升；在Prp43解旋酶中引入两个半胱氨酸后，同样改善了ATP水解活性。

实施例3

本实施例使用荧光偏振方法对N端(M1-N60)截短的野生型Prp43解旋酶或经修饰的蛋白构建体Prp43-GP和Prp43-GP-2(F181C/N623C/C508S)在单链DNA的亲和力进行了测试。

(1)材料与方法

N端(M1-N60)截短的野生型解旋酶或修饰后的解旋酶按如下浓度梯度进行稀释：800nM,400nM,200nM,100nM,50nM,25nM,12.5nM,6.25nM,3.125nM,1.56nM,BLANK，酶与10nM单链DNA底物在结合Buffer(10mM HEPES,50mM KCl,5％Glycerol,ph7.0)中孵育20min后，在530nM激发光和560nM发射光下读取其偏振值并拟合绘制亲和力曲线，每个酶浓度设置三个重复。

(2)结果

拟合结果如图4所示，N端(M1-N60)截短的Prp43解旋酶在C端融合了G-Path结构域，即Prp43-GP解旋酶，或在Prp43-GP基础上进行定点突变的修饰酶Prp43-GP-2(F181C/N623C/C508S)与单链DNA的亲和力在低盐条件下与野生型没有明显的差别。

实施例4

本实施例通过凝胶迁移实验来检测N端(M1-N60)截短的野生型Prp43 解旋酶或经修饰的蛋白构建体Prp43-GP和Prp43-GP-2(F181C/N623C/C508S)结合DNA的情况，包括TMAD催化剂催化突变体中突变体位点F181C和N623C之间形成二硫键后对核酸结合力的增强作用。

(1)材料和方法

本实验条件如下，在Buffer(10mM HEPES,50mM KCl,PH7.0)中加入30nM的FAM荧光基团标记的单链多聚胸腺嘧啶底物T44-37-FAM，然后分别加入使用终浓度为120nM的野生型Prp43解旋酶和修饰修饰的Prp43-2、Prp43-GP-2解旋酶,在30℃孵育1.5h；使用终浓度为酶的1000倍TMAD交联剂进行催化突变位点半胱氨酸的交联，30℃孵育1.5h。

(2)结果

凝胶迁移实验结果如图5所示，野生型Prp43解旋酶与DNA结合后在电泳条件下酶与核酸脱落情况较严重，修饰体Prp43-GP解旋酶与DNA结合后在电泳条件下酶与核酸脱落相比野生型Prp43解旋酶稍微好点，而修饰体突变体Prp43-GP-2与DNA结合效果较好,无论经过TMAD处理与否都没有明显的酶从核酸上脱落现象。

实施例5

本实施例显示了N端(M1-N60)截短的修饰体突变体解旋酶Prp43-GP-2(F181C/N623C/C508S)控制DNA构建体X穿过MspA纳米孔的运动。

(1)材料和方法

制备如图6所示的DNA构建体X：A区对应序列(SEQ ID NO:32)的5’末端连接到4个iSpC3间隔区(B区)，该间隔区连接到C区对应序列(SEQ ID NO:33)的3’末端，C区序列的5’末端连接到D区对应序列(SEQ ID NO:34)，该构建体的E区对应序列(SEQ ID NO:35)与F区对应序列(SEQ ID NO:36，其具有3’胆固醇系链)杂交。将浓度为10uM的A、B、C、D区段合成连接在一起的片段，与E片段、F片段按照1:1:1比例加入到退火缓冲液(10mM Tris，pH7.0,50mM NaCl)中，按照98℃10min，-0.1℃/0.6s，300个循环，65℃5min,-0.1℃/0.6s，400个循环的流程进行退火处理(其中，A、B、C、D、E、F片段由生工生物工程(上海)股份有限公司提供)。

将制备的DNA构建体X和修饰体突变体解旋酶Prp43-GP-2(F181C/N623C/C508S)或N端截短的野生型Prp43-GP在25℃的缓冲液(10mM HEPES，pH 8.0，50mM NaCl，5％甘油)中一起预孵育30分钟，加入1000倍于解旋酶浓度的TMAD催化剂室温孵育处理30分钟。由嵌入1,2-二乙醇酰基-甘油-3-胆碱磷酸脂质双分子层的MspA纳米孔(MspA蛋白序列为SEQ ID NO:31，按照Michael Faller et al.，“The Structure of a Mycobacterial Outer-Membrane Channel”,Science 303,1189(2004)；DOI:10.1126/science.1094114所述进行制备)获得电测量信号。通过Montal-Mueller技术，在PTFE膜上的～25μm直径孔穴形成双分子层，隔开两个约100μL的缓冲溶液。所有实验在所述缓冲液中进行。使用装配有数字转换器的放大器测定单通道电流。将Ag/AgCl电极连接到所述缓冲液中使得顺式隔间连接到放大器的接地端，并且反式隔间连接到活性电极。

在所述双分子层实现单孔之后，将DNA多核苷酸和修饰体突变体解旋酶Prp43-GP-2(F181C/N623C/C508S)或N端截短的野生型Prp43-GP的复合物添加到电生理学室的顺式隔间的70μL缓冲液中以引发解旋酶-DNA复合体在所述纳米孔的捕获。根据需要通过向所述顺式隔间添加二价金属(5mM MgCl ₂)和NTP(2.86μM ATP)激活解旋酶ATP酶活性。实验在+180mV的恒定电势下实施。

(2)结果

结果显示DNA构建体X的移动被解旋酶Prp43-GP-2(F181C/N623C/C508S)控制，结果见图7，Prp43-GP-2解旋酶控制了接近200bp的DNA构建体穿过所述纳米孔的移位。相对应地，N端截短的野生型Prp43(T61-A764片段)或构建体Prp43-GP则难以获得构建体X的A/B/C/D片段通过纳米孔所产生的的持续电流信号。

实施例6

本实施例显示了N端(M1-N60)截短的修饰体突变体解旋酶Prp43-GP-2(F181C/N623C/C508S)控制RNA构建体Y穿过MspA纳米孔的运动。

(1)材料与方法

制备如图8所示的RNA构建体：将D区对应序列(SEQ ID NO:37)的3’末端连接到20个iSpC3间隔区(A区)，其5’末端连接到4个iSpC3间隔区(B区)，该间隔区连接到C区对应序列(SEQ ID NO:38)的3’末端，该构建体的E区对应序列(SEQ ID NO:39)与F区对应序列(SEQ ID NO:40)杂交。将浓度为10uM的A、B、C、D区段合成连接在一起的片段，与E片段、F片段按照1:1:1比例加入到退火缓冲液(10mM Tris，pH7.0,50mM NaCl)中，按照98℃10min，-0.1℃/0.6s，300个循环，65℃5min,-0.1℃/0.6s，400个循环的流程进行退火处理(其中，A、B、C、D、E、F片段由生工生物工程(上海)股份有限公司提供)。

将制备的RNA构建体和Prp43-GP-2或N端截短的野生型Prp43-GP在30℃的缓冲液(10mM HEPES，pH 7.0，50mM NaCl)中一起预孵育30分钟。由嵌入1,2-二乙醇酰基-甘油-3-胆碱磷酸脂质双分子层的MspA纳米孔(MspA蛋白序列为SEQ ID NO:31，按照Michael Faller et al.，“The Structure of a Mycobacterial Outer-Membrane Channel”,Science 303,1189(2004)；DOI:10.1126/science.1094114所述进行制备)获得电测量信号。通过Montal-Mueller技术，在PTFE膜上的～25μm直径孔穴形成双分子层，隔开两个约100μL的缓冲溶液。所有实验在所述缓冲液中进行。使用装配有数字转换器的放大器测定单通道电流。将Ag/AgCl电极连接到所述缓冲液中使得顺式隔间连接到放大器的接地端，并且反式隔间连接到活性电极。

在所述双分子层实现单孔之后，将RNA多核苷酸构建体和Prp43-GP-2解旋酶或N端截短的野生型Prp43-GP添加到电生理学室的顺式隔间的70μL缓冲液中以引发解旋酶-RNA复合体在所述纳米孔的捕获。根据需要通过向所述顺式隔间添加二价金属(5mM MgCl ₂)和NTP(5mM ATP)激活解旋酶ATP酶活性。实验在+180mV的恒定电势下实施。

(2)结果

结果显示RNA构建体被Prp43-GP-2解旋酶控制的RNA移动，Prp43-GP-2解旋酶控制的RNA移动的结果见图9。Prp43-GP-2解旋酶控制的RNA移动为3秒长并对应于接近30bp的RNA构建体穿过所述纳米孔的移位。相对应地，N端截短的野生型Prp43(T61-A764片段)或N端截短的构建体Prp43-GP则难以获得构建体Y的A/B/C/D片段通过纳米孔所产生的的持续电流信号。

本文中描述了本发明的优选实施方式和具体实施例，但是这些实施方式和实施例仅作为示例提供，而非用来限制本发明。在不脱离本发明的情况下，本领域技术人员现在将想到许多变化、改变和替换。因此，本发明还应涵盖任何此类替代方案、修改、变体或等效形式。

Claims

一种经修饰的Prp43解旋酶，包括RecA1结构域、RecA2结构域和Ratchet结构域，相对于对应的野生型Prp43解旋酶或其片段而言所述经修饰的Prp43解旋酶包括在选自RecA1结构域、RecA2结构域、Ratchet结构域的至少一个结构域中引入的1、2、3、4、5、6、7、8、9、10、11个或更多个半胱氨酸的插入或置换，和/或1、2、3、4、5、6、7、8、9、10、11个或更多个非天然氨基酸的插入或置换。
如权利要求1所述的经修饰的Prp43解旋酶，其中所述引入的半胱氨酸残基或非天然氨基酸残基位于对应于SEQ ID NO:1的M157、Q161、D165、F181、E182、N183、R324、L328、E332、R335、P353、L351、P352、H354、D321、E320、R358、P563、A564、N565、D603、K605、K606、H609、Y615、R616、S619、N623、A626或K630中的任一个或两个以上的位置，优选地位于对应于SEQ ID NO:1的F181、P352、S619或N623中的任一个或两个以上的位置。
如权利要求1或2所述的经修饰的Prp43解旋酶，其中所述野生型Prp43解旋酶的片段是Prp43解旋酶的N端结构域被去除后所得片段，优选地去除N端的位置1开始的至少96个、至少90个、至少80个、至少70个、至少60个、至少50个、至少40个或至少30个残基。
如权利要求1至3任一项所述的经修饰的Prp43解旋酶，其中所述经修饰的Prp43解旋酶还包括对于一个或多个半胱氨酸残基的置换，优选为对应于SEQ ID NO:1的C148、C214、C303、C323、C377、C441、C508、C543、C608的一个或多个半胱氨酸残基被置换，更优选地半胱氨酸残基被置换为丙氨酸、甘氨酸、缬氨酸、异亮氨酸、亮氨酸、苯丙氨酸、酪氨酸、丝氨酸、苏氨酸、天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、蛋氨酸、色氨酸、谷氨酰胺、天冬酰胺或脯氨酸残基。
如权利要求1至4任一项所述的经修饰的Prp43解旋酶，其中所述被引入的半胱氨酸残基和非天然氨基酸残基总个数为2个或以上，并且在至少一个被引入的半胱氨酸或非天然氨基酸残基与另一个被引入的半胱氨酸或非天然氨基酸残基之间形成相互连接。
如权利要求5所述的经修饰的Prp43解旋酶，其中所述连接选自共价连接或氢键连接或静电相互作用或π-π相互作用或疏水相互作用等，优选共价连接。
如权利要求6所述的经修饰的Prp43解旋酶，其中所述共价连接是-S-S键或者是通过选自碳酰氯、马来酰亚胺、活性酯、琥珀酰亚胺、叠氮化物、烷烃、烯烃、炔烃、聚乙二醇(PEGs)、多肽、多糖、脱氧核糖核酸(DNA)、肽核酸(PNA)、苏糖核酸(TNA)、甘油核酸(GNA)、聚酰胺或TMAD的交联剂或催化剂实现的共价连接。
如权利要求1至7任一项所述的经修饰的Prp43解旋酶，其中所述经修饰的Prp43解旋酶还包含选自以下组的一个或多个氨基酸修饰：

(a)一个或多个与核苷酸相互作用的氨基酸被置换；

(b)一个或多个与NTP和/或二价金属离子结合相关的氨基酸被置换；

(c)一个或多个与跨膜孔相互作用的氨基酸被置换；

(d)降低Prp43解旋酶的表面的负电荷的进一步修饰。
如权利要求1至8任一项所述的经修饰的Prp43解旋酶，其来源于Chaetomium thermophilum、Bathycoccus prasinos、Uncultured bacterium、Archaeon、Parcubacteria、Sorangium cellulosum、Candidatus Sungbacteria、Mycolicibacterium chitae、Parcubacteria、Thermodesulforhabdus norvegica、Deltaproteobacteria、Puniceicoccales、Desulfobacterium vacuolatum或Desulfobacter sp.或来源于病毒基因组(viral metagenome)。
如权利要求1至8任一项所述的经修饰的Prp43解旋酶，其中所述野生型Prp43解旋酶是选自具有以下序列之一的Prp43解旋酶：SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15。
如权利要求1至8任一项所述的经修饰的Prp43解旋酶，其与对应的野生型的Prp43解旋酶的氨基酸序列具有至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性。
如权利要求1至8任一项所述的经修饰的Prp43解旋酶，其来源于Chaetomium thermophilum，优选地其与SEQ ID NO:1的氨基酸序列具有至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性。
如权利要求1至3任一项所述的经修饰的Prp43解旋酶，其来源于Chaetomium thermophilum，且所述引入的半胱氨酸残基或非天然氨基酸残基位于对应于SEQ ID NO:1的F181、P352、S619或N623中的任一个或多个位置。
如权利要求13所述的经修饰的Prp43解旋酶，其为经修饰的SEQ ID NO:1的T61-A764片段，且所述修饰选自F181C/N623C/C508S和P352C/S619C/C508S。
如权利要求1至14任一项所述的经修饰的Prp43解旋酶，其为寡聚体形式，包含一个或多个如权利要求1至12任一项所述的经修饰的Prp43解旋酶。
一种蛋白构建体，其包括如权利要求1至15任一项所述的经修饰的Prp43解旋酶，以及在所述Prp43解旋酶的C端或N端融合的辅助激活蛋白Paf1的G-Path结构域或含有G-Path结构域的Paf1片段。
如权利要求16所述的蛋白构建体，其中包含一个或多个所述经修饰的Prp43解旋酶。
如权利要求16或17所述的蛋白构建体，其中所述辅助激活蛋白Paf1是来源于Chaetomium thermophilum var.thermophilum、Thermothielavioides terrestris、Thermothelomyces thermophilus、Podospora anserina、Neurospora tetrasperma、Coniochaeta sp.、Monosporascus sp.、Hypoxylon sp.、Madurella mycetomatis或Coniochaeta pulveracea的Paf1。
如权利要求16或17所述的蛋白构建体，其中所述辅助激活蛋白Paf1的氨基酸序列选自SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、或SEQ ID NO:25，或具有与SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:25其中之一的氨基酸序列具有至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性的变体的氨基酸序列，并且所述辅助激活蛋白Paf1具有激活Prp43解旋酶的功能。
如权利要求16或17所述的蛋白构建体，其中所述Paf1的G-Path结构域为SEQ ID NO:16序列的K662-G742片段(SEQ ID NO:26)或与SEQ ID NO:26的氨基酸序列具有至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或至少99.9％的同源性的变体的氨基酸序列，并且所述变体具有激活Prp43解旋酶的功能。
如权利要求16所述的蛋白构建体，其中所述Prp43解旋酶为SEQ ID NO:1的T61-A764片段，并且在对应于SEQ ID NO:1的F181、P352、S619或N623中的任一个或两个以上的位置处具有引入的1个或多个半胱氨酸的插入或置换和/或非天然氨基酸的插入或置换，且所述辅助激活蛋白Paf1的氨基酸序列为SEQ ID NO:16。
如权利要求16所述的蛋白构建体，其中所述Prp43解旋酶为SEQ ID NO:1的T61-A764，并且还具有选自F181C/N623C/C508S和P352C/S619C/C508S的修饰，且所述Prp43解旋酶的C端与氨基酸序列为SEQ ID NO:26的多肽融合。
一种编码如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体的核酸。
如权利要求23所述的核酸，其中所述核酸被包含在选自于质粒、病毒或噬菌体的载体中。
一种包含如权利要求23所述核酸的表达载体。
如权利要求25所述的表达载体，其中所述表达载体选自于质粒、病毒或噬菌体。
如权利要求25或26所述的表达载体，其中所述表达载体进一步包含用于控制所述核酸的表达的调控元件。
如权利要求27所述的表达载体，其中所述调控元件是与所述核酸可操作地连接的启动子。
如权利要求28所述的表达载体，其中所述启动子选自T7、trc、lac、ara或λL。
包含如权利要求23或24所述的核酸或包含如权利要求25至28任一项所述表达载体的宿主细胞。
如权利要求30所述的宿主细胞，其为大肠杆菌(Escherichia coli.)。
一种制备如权利要求16至22任一项所述的蛋白构建体的方法，包括：提供SEQ ID NO:1的多肽或其变体和SEQ ID NO:26的多肽或其变体，在SEQ ID NO:1的多肽或其变体中引入至少一个半胱氨酸残基和/或至少一个非天然氨基酸，然后在所得多肽的C端或N端融合SEQ ID NO:26的多肽或其变体，形成所述蛋白构建体。
一种制备如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体的方法，包括：包括培养如权利要求30或31所述的宿主细胞，并进行诱导表达，然后纯化所得表达产物。
一种控制多核苷酸分子移动的方法，包括将所述多核苷酸分子与如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体接触。
如权利要求34所述的控制多核苷酸分子移动的方法，其中所述多核苷酸分子被控制穿过纳米孔，所述的纳米孔为跨膜孔。
如权利要求35所述的控制多核苷酸分子移动的方法，其中所述跨膜孔选自蛋白孔、固态孔或生物与固态杂交的孔，优选地所述的蛋白孔选自于耻垢分枝杆菌孔蛋白A、耻垢分枝杆菌孔蛋白B、耻垢分枝杆菌孔蛋白C、耻垢分枝杆菌孔蛋白D、溶血素、胞溶素、白细胞介素、外膜孔蛋白F、外膜孔蛋白G、外膜磷脂酶A、WZA或奈瑟氏菌自转运脂蛋白。
一种表征目标多核苷酸的方法，所述的方法包括：

(a)将目标多核苷酸与如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体接触，使得所述Prp43解旋酶或蛋白构建体控制所述目标多核苷酸移动穿过一纳米孔；

(b)获取目标多核苷酸中的核苷酸与所述纳米孔相互作用时的一个或多个特征，从而表征所述目标多核苷酸。
如权利要求37所述的表征目标多核苷酸的方法，其中所述方法进一步包括跨所述纳米孔施加电势差的步骤。
如权利要求37或38所述的表征目标多核苷酸的方法，其中所述方法使用一个或多个所述Prp43解旋酶或蛋白构建体。
如权利要求37或38所述的表征目标多核苷酸的方法，其中所述的纳米孔为跨膜孔，所述跨膜孔选自蛋白孔、固态孔或生物与固态杂交的孔，优选地所述的蛋白孔选自于耻垢分枝杆菌孔蛋白A、耻垢分枝杆菌孔蛋白B、耻垢分枝杆菌孔蛋白C、耻垢分枝杆菌孔蛋白D、溶血素、胞溶素、白细胞介素、外膜孔蛋白F、外膜孔蛋白G、外膜磷脂酶A、WZA或奈瑟氏菌自转运脂蛋白。
如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体在表征目标多核苷酸或控制目标多核苷酸穿过孔的移动中的用途。
一种用于表征目标多核苷酸的分析装置，所述的分析装置包含一个或多个纳米孔、一个或多个如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体、以及一个或多个容器。
如权利要求42所述的用于表征目标多核苷酸的分析装置，所述分析装置中还包括包含脂质双层的芯片，其中所述的纳米孔横跨脂质双层。
如权利要求42或43所述的用于表征目标多核苷酸的分析装置，所述分析装置中还包括缓冲剂、PCR扩增试剂。
如权利要求42、43或44所述的用于表征目标多核苷酸的分析装置，所述的分析装置是试剂盒或传感器。
一种形成表征目标多核苷酸的传感器的方法，包括提供纳米孔，和在所述纳米孔和如权利要求1至15任一项所述的经修饰的Prp43解旋酶或如权利要求16至22任一项所述的蛋白构建体之间形成复合物。