CN120700007A - 安麻吩金类抗生素的合成基因簇与合成方法 - Google Patents
安麻吩金类抗生素的合成基因簇与合成方法Info
- Publication number
- CN120700007A CN120700007A CN202410346704.8A CN202410346704A CN120700007A CN 120700007 A CN120700007 A CN 120700007A CN 202410346704 A CN202410346704 A CN 202410346704A CN 120700007 A CN120700007 A CN 120700007A
- Authority
- CN
- China
- Prior art keywords
- seq
- fsoe
- polypeptide
- compound
- fsoa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0077—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
- C12N9/0081—Cholesterol monooxygenase (cytochrome P 450scc)(1.14.15.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
- C12P33/20—Preparation of steroids containing heterocyclic rings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
- C12R2001/66—Aspergillus
- C12R2001/69—Aspergillus oryzae
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明涉及安麻吩金类抗生素的合成基因簇与合成方法。具体地,本发明分离了安麻吩金类抗生素fuscoatroside生物合成中C3位连接β‑D‑吡喃葡萄糖的羊齿烷型骨架、C2位氧化成α‑OH、E环C19‑C20氧化开裂以及C2位羟基乙酰化的关键作用基因,分别命名为fsoA、fsoD、fsoE和fsoF,并且提供了其编码多肽。本发明提供了人工融合酶基因efuA(TC)fsoA(GT),并在此基础上异源表达efuA(TC)fsoA(GT)、fsoD、fsoE和fsoF四个基因可以合成安麻吩金前体(13)。本发明阐明了P450酶FsoE介导的C‑C键断裂功能,并提供了FsoE的关键催化活性残基。本发明首次报道了该类化合物生物合成途径,为实现其绿色高效合成奠定了重要的基础。
Description
技术领域
本发明属于基因工程和生物合成领域,特别涉及一类安麻吩金类抗生素的生物合成。
背景技术
安麻吩金类抗生素是在羊齿烷型三萜骨架的基础上,C3β-OH连接β-D-吡喃葡萄糖,C2位氧化成α-OH以及E环C19-C20开裂形成的一类结构特殊的真菌三萜。代表性的化合物包括安麻吩金(enfumafungin)[1],fuscoatroside[2],kolokosideA[3],WF11605[4]。安麻吩金类抗生素不仅结构新颖,还具有突出的抗真菌活性,其中以安麻吩金为前体开发的艾瑞芬净(ibrexafungerp)已获得美国FDA的临床用药审批,用于口服治疗妇科侵袭性念珠菌感染病[5]。目前,艾瑞芬净主要通过原始菌株发酵获得安麻吩金后水解成苷元,再经化学修饰获得,存在发酵周期长,产率低,工艺复杂等问题。此外,由于安麻吩金类抗生素结构复杂并含有多个手性中心,其化学全合成至今未见报道。因此,阐明安麻吩金类抗生素的生物合成机制不仅可解决该类化合物的药源问题,而且也为利用生物合成技术发现活性更优的安麻吩金类衍生物奠定基础。
2018年,有研究人员首次从Hormonema carpetanum ATCC 74360基因组中发现了安麻吩金潜在的生物合成基因簇(图8),共有12个基因,其中包括3个P450酶基因,但基因efuF和efuA之间的间隔较大,提示它们可能并不属于同一个基因簇。随后,研究者对基因簇中萜环化酶与糖基转移酶的融合基因efuA进行了敲除,发现efuA的突变菌株不再产生安麻吩金,从而首次鉴定了安麻吩金的生物合成基因簇[6]。在此基础上,研究者对安麻吩金的生物合成途径进行了推测(图9),并提出了一个多酶介导的E环开裂过程,首先C19在P450酶作用下发生氧化生成C19羰基,接着发生Baeyer-Villiger(BV酶)反应形成6元内酯环,然后内酯环发生水解开环、脱水以及还原生成最终产物[6]。上述推测的BV裂环途径存在三处疑点:首先,关键的C20-C21位双键中间体产物是可以稳定存在的产物,但从自然界还没有发现过;其次,该途径需要的BV酶、酯酶、脱水酶以及还原酶在基因簇中无法找到;最后,开裂前后C21位的手性高度保守,提示C21的氢在反应中很可能没有脱去过,基于此,我们认为E环C19-C20的开裂很可能存在其它未知的碳碳断裂机制。综上,虽然安麻吩金的基因簇已有报道,但是该基因簇中包括efuA在内的所有基因的功能未被阐明,安麻吩金的生物合成机制目前仍不清楚。
在前期的研究中,发明人从美国农业研究菌种保藏中心(NRRL)获得了一株棕黑腐质霉真菌HumicolafuscoatraNRRL22980,其能够高产安麻吩金类抗生素fuscoatroside,这为发明人研究安麻吩金类抗生素的生物合成机制奠定了物质基础。
发明内容
发明人从美国农业研究菌种保藏中心(NRRL)获得了一株产安麻吩金类抗生素fuscoatroside的真菌菌株Humicola fuscoatra NRRL 22980,并从该菌株中分离获得了fuscoatroside的生物合成基因簇。该基因簇包含四个基因(fsoA,fsoD,fsoE,fsoF),这四个基因能够在米曲霉异源宿主中合成fuscoatroside。其中,含有萜环化酶(TC)结构域和糖基转移酶(GT)结构域的融合酶FsoA负责催化2,3(S)-环氧角鲨烯形成C-3位连接有β-D-吡喃葡萄糖基的羊齿烷骨架,P450酶FsoD负责在C2位氧化生成C2α羟基,P450酶FsoE负责催化C19-C20断裂形成一个氧化的羧基基团和一个还原的甲基基团,酰基转移转移酶FsoF负责在C2α羟基上进行乙酰化。这也是本领域首次鉴定出负责安麻吩金类抗生素fuscoatroside的基因,即只需要四个基因(fsoA,fsoD,fsoE,fsoF)就能生成最终的C19-C20断裂产物fuscoatroside,明显不同于文献中推测的安麻吩金类抗生素的生物合成途径。
此外,发明人将融合酶FsoA中的GT结构域与已报道的安麻吩金融合酶EfuA中的TC结构域进行融合,形成人工融合酶基因efuA(TC)fsoA(GT),然后将efuA(TC)fsoA(GT)与三个后修饰基因(fsoD,fsoE,fsoF)同时在米曲霉异源宿主中进行表达,可以合成安麻吩金前体化合物13。
发明人利用底物饲养实验,进一步阐明了P450氧化酶FsoE的功能,发现其能独自催化E-环C19-C20位发生裂解形成左边羧基,右边为甲基的结构,这在已报道的所有P450酶中从未观察到的现象。为了探究P450氧化酶FsoE的催化机制,发明人基于AlphaFold2与AlphaFill对FsoE进行同源建模(其中血红素与保守残基C517共价连接),然后采用AutoDock Vina将化合物10对接至FsoE的蛋白模型中,寻找到了催化E环裂解的相关关键残基(R315,F148,F259,F337,W339,F557,N344,Y143)。根据对接结果,我们对这些残基进行了点突变,并通过饲养实验来研究关键残基的催化功能。结果显示:当N344和R315突变成A时,完全消除了FsoE的酶活性,这暗示着R315和N344可能通过与底物C3羟基和C19酮基形成氢键的关键作用。此外,W339和F337这两个非极性残基的突变也完全消除了FsoE的催化活性,这表明这些活性位点可能通过疏水相互作用结合底物。此外,靠近E环的四个残基(F557A、F259A、F148A和Y143A)的突变仍然产生了C19羰基产物10,并且,F557A几乎将底物9转化为化合物10。然而,所有四个突变体却不能产生E环断裂产物,这表明F557、F259、F148和Y143在催化C-C键断裂形成开环产物11的方面起着关键作用。除此之外,将143位点的Y突变成F时,结果显示Y143F突变体只能将底物9转化为化合物10而不是化合物11,这表明Y143上的羟基对C-C键裂解很重要。以上的结果促进了我们对FsoE的理解,并为其在C-C键断裂中的发展和利用提供了宝贵的见解。
本发明的第一方面提供了一种分离的或合成的多肽,其选自:
(a)FsoA多肽,其包含SEQ ID NO:1所示的多肽序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的多肽序列;
(b)FsoD多肽,其包含SEQ ID NO:2所示的多肽序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的多肽序列;
(c)FsoE多肽,其包含SEQ ID NO:3所示的多肽序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的多肽序列;
(d)FsoF多肽,其包含SEQ ID NO:4所示的多肽序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的多肽序列;和
(e)EfuA(TC)FsoA(GT)多肽,其包含SEQ ID NO:5所示的多肽序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的多肽序列。
在一个实施方案中,所述FsoA多肽、FsoD多肽、FsoE多肽和FsoF多肽序列来源于棕黑腐质霉Humicolafuscoatra NRRL 22980。
在一个实施方案中,所述EfuA(TC)FsoA(GT)多肽的GT结构域即FsoA(GT)来源棕黑腐质霉Humicolafuscoatra NRRL 22980,并且所述EfuA(TC)FsoA(GT)多肽的TC结构域即EfuA(TC)来源于真菌Hormonema carpetanum ATCC 74360。
本发明的第二方面提供了一种编码第一方面多肽的多核苷酸。在优选的实施方案中,所述多核苷酸包含选自以下的序列:
(i)SEQ ID NO:6所示的核酸序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的核酸序列;
(ii)SEQ ID NO:7所示的核酸序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的核酸序列;
(iii)SEQ ID NO:8所示的核酸序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的核酸序列;
(iv)SEQ ID NO:9所示的核酸序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的核酸序列;和
(v)SEQ ID NO:10所示的核苷酸序列或者与其具有至少70%序列同一性,优选具有80%、85%、90%、93%、95%、97%、98%、99%序列同一性的核酸序列。
“百分比同一性”指2个最佳比对的DNA或蛋白质区段在组分例如核苷酸序列或氨基酸序列比对窗口自始自终不变的程度。关于测试序列和参考序列的比对区段的“同一性分数”是通过比对窗口由2个比对区段序列共有的相同组分的数目除以参考区段中序列组分的总数目,所述总数目是完整的测试序列或完整的参考序列中的较小者。“百分比同一性”(“同一性%”)是同一性分数乘100。
本发明的第三方面提供了一种表达盒,其包含根据本发明第二方面的多核苷酸。
本发明的第四方面提供了一种载体,如表达载体,其包含了本发明第二方面所述的多核苷酸或第三方面所述的表达盒。
本发明的第五方面提供了一种宿主细胞,其包含本发明第二方面所述的多核苷酸、第三方面所述的表达盒或第四方面所述的载体。
编码本发明的酶的基因和基因产物可在异源宿主细胞,例如细菌细胞、真菌细胞,例如酵母细胞中表达。用于表达本发明的多核苷酸分子的异源宿主细胞可以是存在于真菌或细菌家族中并在宽温度、pH值和溶剂耐受性范围内生长的微生物宿主。例如,预期任何细菌、酵母和丝状真菌可为表达本发明核酸分子的合适宿主。宿主菌株的实例包括但不限于细菌、真菌或酵母物种例如腐质霉属(Humicola)、毕赤酵母属(Pichia)、曲霉属(Aspergillus)、木霉属(Trichoderma)、糖酵母属(Saccharomyces)、发夫酵母属(Phaffia)、克鲁维酵母属(Kluyveromyces)、耶氏酵母属(Yarrowia)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)、沙门氏菌属(Salmonella)、芽孢杆菌属(Bacillus)、不动杆菌属(Acinetobacter)、发酵单胞菌属(Zymomonas)、土壤杆菌属(Agrobacterium)、赤细菌属(Erythrobacter)、绿菌属(Chlorobium)、着色菌属(Chromatium)、黄杆菌属(Flavobacterium)、噬纤维菌属(Cytophaga)、红细菌属(Rhodobacter)、红球菌属(Rhodococcus)、链霉菌属(Streptomyces)、短杆菌属(Brevibacterium)、棒状杆菌属(Corynebacteria)、分支杆菌属(Mycobacterium)、异常球菌属(Deinococcus)、埃希氏菌属(Escherichia)、欧文氏菌属(Erwinia)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、鞘氨醇单胞菌属(Sphingomonas)、甲基单胞菌属(Methylomonas)、甲基细菌属(Methylobacter)、甲基球菌属(Methylococcus)、甲基弯菌属(Methylosinus)、甲基微菌属(Methylomicrobium)、甲基孢囊菌属(Methylocystis)、产碱菌属(Alcaligenes)、集胞蓝细菌属(Synechocystis)、聚球蓝细菌属(Synechococcus)、鱼腥蓝细菌属(Anabaena)、硫杆菌属(Thiobacillus)、甲烷杆菌属(Methanobacterium)、克雷伯氏菌属(Klebsiella)和粘球菌属(Myxococcus)物种。
在一个实施方案中,所述宿主细胞为真菌细胞。
在一个优选实施方案中,所述宿主细胞为棕黑腐质霉,例如Humicolafuscoatra细胞。在另一个优选实施方案中,所述细胞为米曲霉细胞。
在一个实施方案中,所述宿主细胞为细菌细胞,例如大肠杆菌细胞。
可用于转化上述宿主细胞的载体是本领域熟知的。通常,载体包含指导相关基因转录和翻译的序列、可选标记和允许自主复制或染色体整合的序列。合适的载体包含含有转录起始控制的基因5'区域和控制转录终止的DNA片段3'区域。
本发明的第六个方面提供一种安麻吩金类抗生素fuscoatroside或其前体的生物合成方法,其包括将FsoA、FsoD、FsoE和FsoF多肽中的一种或多种与2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖(UDPG)底物接触。
在一个实施方案中,所述合成方法包括:在宿主细胞中表达FsoA、FsoD、FsoE和FsoF多肽的一种或多种,使其催化底物合成fuscoatroside或其前体;和从所述宿主细胞分离fuscoatroside或其前体。在一个实施方案中,所述宿主细胞含有2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖(UDPG)底物。在一个实施方案中,所述宿主细胞是米曲霉宿主细胞。
在一个实施方案中,所述合成方法包括在米曲霉宿主中同时表达fsoA、fsoD、fsoE和fsoF。
在一个实施方案中,所述合成方法包括在米曲霉宿主中单独表达fsoA。
在一个实施方案中,所述合成方法包括在米曲霉宿主中同时表达fsoA和fsoD。
在一个实施方案中,所述合成方法包括在米曲霉宿主中同时表达fsoA和fsoE。
在一个实施方案中,所述合成方法包括在米曲霉宿主中同时表达fsoA、fsoD和fsoF。
在一个实施方案中,所述合成方法包括在米曲霉宿主中同时表达fsoA、fsoD和fsoE。
本发明的第七个方面提供一种安麻吩金前体化合物13或其前体的生物合成方法,其包括将EfuA(TC)FsoA(GT)、FsoD、FsoE和FsoF多肽中的一种或多种与2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖(UDPG)底物接触。
在一个实施方案中,所述合成方法包括:在宿主细胞中表达EfuA(TC)FsoA(GT)、FsoD、FsoE和FsoF多肽中的一种或多种,使其催化底物合成化合物13;和从所述宿主细胞分离化合物13,所述化合物13的结构如下:
在一个实施方案中,所述宿主细胞含有2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖(UDPG)底物。在一个实施方案中,所述宿主细胞是米曲霉宿主细胞。
在一个实施方案中,所述合成方法包括在米曲霉宿主中同时表达EfuA(TC)FsoA(GT)、FsoD、FsoE和FsoF多肽。
在上述方面中,多肽的表达是通过将编码所述多肽的多核苷酸引入宿主细胞,例如米曲霉宿主细胞中而实现的。
本发明的第八个方面提供一种催化羊齿烷型化合物的E-环C19-C20位发生裂解的多肽,其包含与SEQ ID NO:3所示氨基酸序列的R315、F148、F259、F337、W339、F557、N344和Y143对应的氨基酸残基。
本发明的第九个方面提供一种催化羊齿烷型化合物的E-环C19-C20为发生裂解的方法,其包括将本发明第一方面所述的FsoE多肽或第八个方面所述的多肽与羊齿烷型化合物接触。
在一个实施方案中,所述方法包括在宿主细胞中表达本发明第一方面所述的FsoE多肽或第八个方面所述的多肽,使其催化羊齿烷型化合物的E-环C19-C20位发生裂解。
在一个实施方案中,所述宿主细胞是米曲霉宿主细胞。
在一个实施方案中,所述羊齿烷型化合物在C19位连接有结构;
在一个具体实施方案中,所述羊齿烷型化合物为9和10,其结构如下式所示:
本发明的第十个方面提供P450酶FsoE介导C-C键断裂的关键催化位点,其是与SEQID NO:3所示氨基酸序列的R315、F148、F259、F337、W339、F557、N344和Y143对应的氨基酸残基。
本发明的第十一方面提供了本发明第一方面或第八方面所述的多肽、第二方面所述的多核苷酸、第三方面所述的表达盒、第四方面所述的载体或第五方面所述的细胞在安麻吩金类抗生素合成中的用途。
本发明的第十二方面提供了一种试剂盒,其包含本发明第一方面或第八方面所述的多肽、第二方面所述的多核苷酸、第三方面所述的表达盒、第四方面所述的载体或第五方面所述的细胞。
本发明的技术效果:1)本发明从Humicolafuscoatra NRRL 22980中发现了合成以fuscoatroside为代表的一类安麻吩金类抗生素的合成基因fsoA、fsoD、fsoE和fsoF;2)fsoA、fsoD、fsoE和fsoF同时在米曲霉中表达时,能利用米曲霉自身的2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖合成化合物fuscoatroside(1);3)fsoA单独在米曲霉中表达时,能够利用米曲霉自身的2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖合成化合物2和3;4)fsoA和fsoD同时在米曲霉中表达时,能够生产化合物4和5;5)fsoA和fsoE同时在米曲霉中表达时,能够生产化合物6和7;6)fsoA、fsoD和fsoE同时在米曲霉中表达时,能够生产化合物8,9,10和11;7)fsoA、fsoD和fsoF同时在米曲霉中表达时,能够生产化合物12;8)本发明将融合酶FsoA中的GT结构域与已报道的安麻吩金融合酶EfuA中TC结构域进行融合,形成人工融合酶基因efuA(TC)fsoA(GT)。9)efuA(TC)fsoA(GT),fsoD,fsoE,fsoF同时在米曲霉异源宿主中进行表达时,能利用米曲霉自身的2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖合成安麻吩金前体(13);10)本发明利用单独表达fsoE的米曲霉菌株与化合物9或10进行体内饲养实验,可分别获得E环裂解的化合物12。11)本发明利用AlphaFold2,AlphaFill,AutoDockVina软件对fsoE进行同源建模以及分子对接,找到了负责FsoE催化C-C键断裂的关键氨基酸(R315,F148,F259,F337,W339,F557,N344,Y143),并利用底物9进行饲养实验,揭示了关键氨基酸在催化中发挥的作用。12)本发明开拓了安麻吩金类抗生素的生物合成方法,具有过程简单、立体选择专一性高、环境污染小等优点,成为生产具有良好生物活性的安麻吩金类抗生素的重要途径。
附图说明
图1显示了具有代表性的安麻吩金类抗生素结构式,包括安麻吩金(enfumafungin),fuscoatroside,kolokoside A和WF11605。
图2显示了fuscoatroside化合物与安麻吩金前体(13)的生物合成基因。图2A显示了本发明鉴定的来自HumicolafuscoatraNRRL22980的fuscoatroside生物合成基因簇;图2B显示了核心的人工融合酶基因具体融合方案以及安麻吩金前体化合物(13)的结构。
图3显示了fuscoatroside基因簇在米曲霉中异源表达的代谢产物分析。图3A显示了一次性表达整个fuscoatroside基因簇的米曲霉菌株提取物LC-MS检测图谱;图3B显示了逐步表达fuscoatroside基因簇中各基因的米曲霉菌株提取物LC-MS检测图谱。
图4显示了安麻吩金类抗生素fuscoatroside可能的生物合成途径。
图5显示了安麻吩金前体(13)的生物合成途径。图5A显示同时表达efuA(TC)fsoA(GT),fsoD,fsoE,fsoF的米曲霉菌株提取物ELSD检测图谱。图5B显示安麻吩金前体(13)的生物合成过程。
图6显示了化合物9与10分别饲养至仅表达fsoE基因的米曲霉菌株中的检测图谱;图6A为只表达fsoE基因的米曲霉菌株分别与底物9与10的体内反应HPLC图谱,检测波长为UV 208nm;图6B显示了FsoE催化E环裂解的可能的机制。
图7显示了FsoE介导C-C键断裂的关键氨基酸残基的寻找。图7A为预测的底物10位于疏水活性口袋中,并找到了口袋周围的氨基酸残基;图7B为化合物9饲养至含FsoE点突变体的米曲霉中的实验结果。
图8显示现有技术文献[6]中对潜在的安麻吩金生物合成基因簇及每个基因的预测功能。
图9显示现有技术文献[6]中推测的安麻吩金生物合成途径。
具体实施方式
术语“羊齿烷型三萜骨架”,是以一种存在于自然界中的一类化合物,其母核由四个六元环与一个五元环构成,其中A环与D环为椅式构象,B环和C环为扭船式构象,A/B、C/D、D/E环均为反式骈合。羊齿烷型三萜是以角鲨烯或2,3(S)-环氧角鲨烯为前体环化而成的,由于环化过程中发生不同的碳正离子重排以及去质子化,导致形成不同双键位置的羊齿烷型三萜骨架。目前,从真菌中发现的羊齿烷骨架主要是以2,3(S)-环氧角鲨烯为前体环化而成的,其中包括三种不同双键位置的骨架:isomotiol、motiol、fernenol(见下式)。
术语“安麻吩金类抗生素”,是一类在羊齿烷型三萜骨架的基础上,C3β-OH连接β-D-吡喃葡萄糖、C2位氧化成α-OH、E环C19-C20开裂形成的一类结构特殊的真菌三萜。目前,真菌中发现具有代表性的安麻吩金类抗生素包括:安麻吩金(enfumafungin),fuscoatroside,kolokoside A,WF11605(图1)。
本发明所提供的FsoA蛋白是一种含萜环化酶(TC)保守域—糖基转移酶(GT)保守域的融合酶,FsoD蛋白和FsoE蛋白为一种P450氧化酶,FsoF蛋白为一种乙酰基转移酶。
在一种具体实施方案中,四个蛋白同时在米曲霉中表达时,四个蛋白能利用米曲霉自身的2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖原料合成fuscoatroside(1)。
在另一种具体实施方案中,在米曲霉中表达fsoA时,获得的菌株能够生产化合物2、化合物3。
在另一种具体实施方案中,在米曲霉中同时表达fsoA和fsoD时,获得的菌株能够生产化合物4、化合物5。
在另一种具体实施方案中,在米曲霉中同时表达fsoA和fsoE时,获得的菌株能够生产化合物6、化合物7。
在另一种具体实施方案中,在米曲霉中同时表达fsoA、fsoD和fsoE时,获得的菌株能够生产化合物8、化合物9、化合物10和化合物11。
在另一种具体实施方案中,在米曲霉中同时表达fsoA、fsoD和fsoF时,获得的菌株能够生产化合物12。
在一种具体实施方案中,本发明所提供的EfuA(TC)FsoA(GT)蛋白为人工融合形成的,其是由融合酶FsoA中的GT结构域与已报道的安麻吩金融合酶EfuA中TC结构域通过头尾连接的方式连接而成。
在一种具体实施方案中,efuA(TC)fsoA(GT),fsoD,fsoE,fsoF四个蛋白同时在米曲霉中表达时,四个蛋白能利用米曲霉自身的2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖原料合成安麻吩金前体化合物(13)。
在本发明的一个实施方案中,利用单独表达fsoE的米曲霉菌株与化合物9或10进行体内饲养实验,可分别获得E环裂解的化合物12。
在本发明的一个实施方案中,利用AlphaFold2,AlphaFill,AutoDock Vina软件对fsoE进行同源建模以及分子对接,找到了负责FsoE催化C-C键断裂的关键氨基酸(R315,F148,F259,F337,W339,F557,N344,Y143),并利用底物9进行饲养实验,揭示了关键氨基酸在催化中发挥的作用。
下文通过实施例来理解本发明,然而,要理解的是,这些实施例不限制本发明。现在已知的或进一步开发的本发明的变化被认为落入本文中描述的和以下要求保护的本发明范围之内。
实施例1:候选基因的获得
HumicolafuscoatraNRRL22980(购自美国农业研究菌种保藏中心(NRRL)室温保存在土豆琼脂(PDA)培养基(PDA培养基组成:土豆200g(去皮,切块,煮沸10min,收集滤液),葡萄糖20g,技术琼脂粉15g,去离子水定容至1L,121℃灭菌30分钟)上,取少量菌丝接种到土豆液体(PDB)培养基(PDB培养基组成:土豆200g(去皮,切块,煮沸10min,收集滤液),葡萄糖20g,去离子水定容至1L,121℃灭菌30分钟)中,28℃,转速220转/分钟,振荡培养2天。过滤收集菌丝,液氮研磨,苯酚氯仿法提取总DNA。将提取好的基因组送至上海生工生物工程有限公司进行全基因组测序,使用的测序平台为Illumina HiSeq 2500系统。序列分析使用软件SOAPdenovo(version2.04,http://soap.genomics.org.cn/soapdenovo.html)完成。最后,利用生物信息分析手段获得了与fuscoatroside生物合成相关的基因簇(图2A)。FsoA(多肽序列如SEQ ID NO:1所示,核酸序列如SEQ ID NO:6所示)、FsoD(多肽序列如SEQ IDNO:2所示,核酸序列如SEQ ID NO:7所示)、FsoE(多肽序列如SEQ ID NO:3所示,核酸序列如SEQ ID NO:8所示)和FsoF(多肽序列如SEQ ID NO:4所示,核酸序列如SEQ ID NO:9所示)作为最终的候选研究基因。此外,还设计了人工融合的EfuA(TC)FsoA(GT)(多肽序列如SEQ IDNO:5所示,核酸序列如SEQ ID NO:10所示)(图2B)。
实施例2:构建米曲霉表达菌株
Fuscoatroside的基因表达质粒构建。fsoA,fsoD,fsoE和fsoF以菌株Humicolafuscoatra NRRL 22980基因组DNA为模板,通过相应的引物对Inf-fsoA-F(SEQ ID NO:11)/Inf-fsoA-R(SEQ ID NO:12)、Inf-fsoD-F(SEQ ID NO:13)/Inf-fsoD-R(SEQ ID NO:14)、Inf-fsoE-F(SEQ ID NO:15)/Inf-fsoE-R(SEQ ID NO:16)、Inf-fsoF-F(SEQ ID NO:17)/Inf-fsoF-R(SEQ ID NO:18)扩增,使用In fusion连接方法,连接到米曲霉(AspergillusoryzaeNSAR1,日本东京大学阿部郁朗教授提供)表达质粒pTAex3或者pUSA质粒(日本东京大学阿部郁朗教授提供)中,形成重组质粒(pTAex3-fsoA,pTAex3-fsoD,pTAex3-fsoE,pTAex3-fsoF,pUSA-fsoD,pUSA-fsoE)。以重组质粒pTAex3-fsoD和pTAex3-fsoE为模板,通过相应的引物对Inf-pAdeA-Parm-F(SEQ ID NO:19)/Inf-pTAex3-Tamy-R1(SEQ ID NO:20)和Inf-pTAex3-Parm-F1(SEQ ID NO:21)/Inf-pAdeA-Tamy-R(SEQ ID NO:22)扩增含有淀粉酶amyB启动子(promoter)和终止子(terminator)的DNA表达框,使用Infusion连接方法,连接到XbaI酶切后的pAdeA质粒(日本东京大学阿部郁朗教授提供)中构建两基因表达质粒pAdeA-fsoD-fsoE。同样地,以重组质粒pTAex3-fsoD和pTAex3-fsoF为模板,通过上述相同的方式,构建两基因表达质粒pAdeA-fsoD-fsoF。
人工融合酶的表达质粒构建。以已报道的efuA(TC)基因为模板,通过相应的引物对Inf-efuA(TC)-F(SEQ ID NO:23)/Inf-efuA(TC)-fsoA(GT)-R(SEQ ID NO:24)扩增出efuA(TC);以fsoA(GT)基因为模板,通过相应的引物对Inf-efuA(TC)fsoA(GT)-F(SEQ ID NO:25)/Inf-fsoA(GT)-R(SEQ ID NO:26)扩增出fsoA(GT)。接下来,将扩增出的efuA(TC)与fsoA(GT)同时连接至表达质粒pTAex3中,形成重组质粒pTAex3-efuA(TC)fsoA(GT)。
FsoE的突变基因表达质粒构建。以重组质粒pTAex3-fsoE为模板,通过相应的突变引物对FsoE-Y143A-F(SEQ ID NO:27)/FsoE-Y143A-R(SEQ ID NO:28),FsoE-F148A-F(SEQID NO:29)/FsoE-F148A-R(SEQ ID NO:30),FsoE-F259A-F(SEQ ID NO:31)/FsoE-F259A-R(SEQ ID NO:32),FsoE-R315A-F(SEQ ID NO:33)/FsoE-R315A-R(SEQ ID NO:34),FsoE-F337A-F(SEQ ID NO:35)/FsoE-F337A-R(SEQ ID NO:36),FsoE-W339A-F(SEQ ID NO:37)/FsoE-W339A-R(SEQ ID NO:38),FsoE-N344A-F(SEQ ID NO:39)/FsoE-N344A-R(SEQ ID NO:40),FsoE-C517F-F(SEQ ID NO:41)/FsoE-C517A-R(SEQ ID NO:42),FsoE-F557A-F(SEQ IDNO:43)/FsoE-F557A-R(SEQ ID NO:44),FsoE-Y143F-F(SEQ ID NO:45)/FsoE-Y143A-R(SEQID NO:28)扩增,使用In fusion连接方法,连接到米曲霉表达质粒pTAex3,形成突变的重组质粒(pTAex3-fsoE-Y143A,pTAex3-fsoE-F148A,pTAex3-fsoE-F259A,pTAex3-fsoE-R315A,pTAex3-fsoE-F337A,pTAex3-fsoE-W339A,pTAex3-fsoE-N344A,pTAex3-fsoE-C517A,pTAex3-fsoE-F557A,pTAex3-fsoE-Y143F)。
实施例3:米曲霉(A.oryzae NSAR1)原生质体制备及转染。
1)取20μL的米曲霉的孢子保存液加入到含有10mLDPY培养基(DPY培养基组成:糊精20g,多聚蛋白胨10g,酵母提取物5g,七水硫酸镁0.5g,磷酸二氢钾5g,腺嘌呤0.1g,去离子水定容至1L,121℃高温灭菌30分钟)中,28℃,200rpm震荡培养1-2天。
2)将上述菌种培养液加入至100mL DPY培养基中,28℃,200rpm震荡培养1-2天。
3)取15mL左右的菌液,利用灭菌好的注射筒过滤器进行过滤,将菌体压干,用灭菌后的药勺将菌体取出,放入新的50mL离心管中,加入经0.22μm微孔滤膜过滤除菌的10mL TFsolution 1(TF solution 1的组成:马来酸0.058g,硫酸铵0.79g,Yatalase0.1g,pH 5.5)。
4)30℃的恒温箱中震荡3小时,至上清明显秽浊且呈淡红色。利用注射筒过滤器,将原生质体过滤到50mL的试管中,如发生堵塞,可用竹签挑一下棉花表面。
5)加入等量的TF solution2(TF solution2的组成:山梨醇87.4g,二水氯化钙2.94g,氯化钠0.82g,1MTris-HCl(pH7.5)4mL,去离子水定容至400mL,121℃高温灭菌30分钟)(10mL),上下颠倒试管,轻轻混匀,4℃,1500rpm,离心10分钟。
6)除去上清,加入5mL的TF solution 2,4℃,1500rpm,离心10分钟,除去上清,加入适量的TF solution 2,使原生质体浓度为1-5×107/mL,上下颠倒混悬。
7)取200μL的原生质体溶液至15mL的离心管中,加入浓度为1μg/μL的相应的表达质粒10μL,轻轻地混匀。
8)在冰上静置30分钟。期间将M筛选培养基(上层和下层)在微波炉中溶解,在50℃水浴中保温。
9)向7中的混悬液中分三次分别加入250μL,250μL,850μL的TF solution3(TFsolution 3的组成:PEG4000120g,二水氯化钙1.47g,1MTris-HCl(pH7.5)2mL,去离子水定容至200mL,121℃灭菌30分钟),每次加入后,都枪头吹打混匀,在室温下静置20分钟。
10)加入5mL的TF solution 2,上下颠倒试管,轻轻混匀。
11)4℃,1500rpm,离心10分钟,除去上清,加入200μL的TF solution 2,用1mL的枪轻轻地混悬,加入到含下层M筛选培养基(下层M筛选培养基的组成:氯化钾0.5g,氯化钠0.5g,氯化铵2g,硫酸铵1g,磷酸二氢钾1g,七水硫酸镁0.5g,七水硫酸亚铁0.02g,葡萄糖20g,技术琼脂粉15g,山梨醇218.6g,加入相应的筛选营养物质(如单独导入一个质粒时:pTAex3质粒→1.5g甲硫氨酸+0.1g腺嘌呤;pUSA质粒→1g精氨酸+0.1g腺嘌呤;pAdeA质粒→1.5g甲硫氨酸+1g精氨酸),去离子水定容至1L,pH为5.5,121℃灭菌30分钟)的培养皿中央。在培养皿的周围迅速加入5mL 50℃保温的上层M筛选培养基(上层M筛选培养基的组成:氯化钾0.5g,氯化钠0.5g,氯化铵2g,硫酸铵1g,磷酸二氢钾1g,七水硫酸镁0.5g,七水硫酸亚铁0.02g,葡萄糖20g,技术琼脂粉8g,山梨醇218.6g,加入相应的筛选营养物质(如单独导入一个质粒时:pTAex3质粒→1.5g甲硫氨酸+0.1g腺嘌呤;pUSA质粒→1g精氨酸+0.1g腺嘌呤;pAdeA质粒→1.5g甲硫氨酸+1g精氨酸),去离子水定容至1L,121℃灭菌30分钟),快速混匀。
12)待平板吹干后,用封口膜密封,倒置于培养箱中,28℃培养3-5天。随后,挑取米曲霉转化菌株,接种于M稳定培养基(M稳定培养基的组成:氯化钾0.5g,氯化钠0.5g,氯化铵2g,硫酸铵1g,磷酸二氢钾1g,七水硫酸镁0.5g,七水硫酸亚铁0.02g,技术琼脂粉15g,葡萄糖20g,加入相应的筛选营养物质(如单独一个质粒时:pTAex3质粒→1.5g甲硫氨酸+0.1g腺嘌呤;pUSA质粒→1g精氨酸+0.1g腺嘌呤;pAdeA质粒→1.5g甲硫氨酸+1g精氨酸),去离子水定容至1L,121℃灭菌30分钟)上进行传代1-2次。
实施例4:用于合成Fuscoatroside的米曲霉表达菌株代谢产物分析。
表达目标基因的米曲霉(按照实施例3制备)转化菌株接种到10mL DPY培养基中,28℃,200rpm振荡培养2天作为种子液。然后将种子液接种到100mLCD-starch培养基(CD-starch培养基组成:硝酸钠3g,氯化钾2g,七水硫酸镁0.5g,磷酸二氢钾1g,七水硫酸亚铁0.02g,多聚蛋白胨10g,可溶性淀粉20g,腺嘌呤0.1g,pH为5.5,去离子水定容至1L,121℃灭菌30分钟)中,28℃,200rpm振荡培养5天。发酵完成后,使用漏斗过滤收集菌丝体,并将菌丝体压干,然后加入无水乙醇浸泡过夜。将浸泡后的菌丝体超声提取30min,减压浓缩,用色谱甲醇溶解提取物用于LC-MS分析。结果如图3和图4所示,FsoA在米曲霉中能催化产生羊齿烷型骨架化合物2以及C3葡萄糖的羊齿烷型骨架化合物3,确定了融合FsoA中的TC结构域是负责C8-C9位双键的羊齿烷型骨架的形成,而GT结构域是负责C3位α羟基上的β-D-吡喃葡萄糖糖基化;FsoA与FsoD在米曲霉中共同作用产生化合物4和化合物5,确定了FsoD是负责在C2氧化形成α羟基;FsoA与FsoE在米曲霉中中共同作用产生化合物6和化合物7,确定了FsoE是负责催化C19-C20位碳键断裂,形成左边为羧基,右边为甲基的结构;FsoA、FsoD和FsoE在米曲霉中中共同作用产生化合物8、化合物9、化合物10和化合物11;FsoA、FsoD和FsoF在米曲霉中中共同作用产生化合物12;FsoA、FsoD、FsoE和FsoF四个基因在米曲霉中完全足够合成fuscoatroside(1)。
LC-MS条件如下:
LC-MS分析采用戴安UltiMate 3000,配备有UltiMate3000 Diode ArrayDetector以及Bruker amaZon SLAPCI源低分辨质谱。液相分析柱为COSMOSIL 5μm C18column(5μm,4.6×150mm)。流动相为去离子水(含有0.1%甲酸)以及乙腈(含0.1%甲酸)。梯度设置为50%-100%乙腈(0-10min),100%-100%乙腈(10-50min);流速1mL/min。
实施例5:用于合成安麻吩金前体(13)的米曲霉表达菌株代谢产物分析。
表达目标基因的米曲霉转化菌株(按照实施例3制备)接种到10mL DPY培养基中,28℃,200rpm振荡培养2天作为种子液。然后将种子液接种到100mLCD-starch培养基中,28℃,200rpm振荡培养6天。发酵完成后,菌丝体用无水乙醇浸泡过夜,超声提取30min,菌液培养基用乙酸乙酯萃取。将菌丝体和菌液培养基的提取物混合在一起,减压浓缩,最后用色谱甲醇溶解用于ELSD分析。结果如图5所示,在米曲霉中同时表达efuA(TC)fsoA(GT),fsoD,fsoE以及fsoF可以产生安麻吩金前体(13),确定了人工融合酶EfuA(TC)FsoA(GT)是负责C3位连有β-D-吡喃葡萄糖糖的C9-C11位双键羊齿烷型骨架的形成。
ELSD条件如下:
ELSD分析采用戴安UltiMate 3000,配备有UltiMate3000 DiodeArrayDetector以及Alltech(Grace)2000ES ELSD检测器。液相分析柱为COSMOSIL5μmC18 column(5μm,4.6×150mm)。流动相为去离子水(含有0.1%甲酸)以及乙腈(含0.1%甲酸)。梯度设置为50%-100%乙腈(0-30min),100%-100%乙腈(30-50min);流速1mL/min。
实施例6:P450氧化酶FsoE的底物饲养实验
按照实施例3中的方法,构建只含有pTAex3-fsoE的米曲霉转染菌株。首先,将含米曲霉单基因菌株(对照组为空白米曲霉)接种至10mLDPY培养基中,28℃,200rpm下培养2-3天。然后,将上述培养液加入到100mL CD-starch培养基中诱导目的基因表达,28℃,200rpm下培养1天后,向培养基中加入DMSO溶解好的底物(化合物9或化合物10),再继续培养4天。最后,用漏斗过滤收集菌丝体,并将菌体压干,然后加入无水乙醇浸泡菌体,超声提取,减压浓缩,提取物用色谱甲醇溶解后用于HPLC分析。结果如图6所示,FsoE在米曲霉中既能催化化合物9产生化合物10与11,又能催化化合物10产生化合物11。上述结果说明FsoE介导的E环开裂过程首先是将C19氧化成C19β羟基,然后氧化成C19羰基,最后再发生C19-C20开裂形成的。
HPLC条件如下:
HPLC分析采用戴安UltiMate 3000,配备有UltiMate3000 Diode ArrayDetector。液相分析柱为COSMOSIL 5μm C18 column(5μm,4.6×150mm)。流动相为去离子水(含有0.1%甲酸)以及乙腈(含0.1%甲酸)。梯度设置为50%-100%乙腈(0-30min),100%-100%乙腈(30-50min);流速1mL/min。
实施例7:P450氧化酶FsoE的点突变实验
我们使用AlphaFold2和AlphaFill构建了FsoE的酶模型,其中血红素与保守残基C517共价连接。然后,使用AutoDock对底物10进行分子对接,发现了一个由8个不同氨基酸残基(R315、F148、F259、F337、W339、F557、N344、Y143)包围的疏水性活性口袋(图7A)。根据分子对接结果,我们对这些残基进行了点突变实验,并通过饲养实验来研究关键残基的催化功能。按照实施例3中的方法,构建只含有pTAex3-fsoE突变质粒的米曲霉转染菌株。首先,将含米曲霉单基因菌株(对照组为空白米曲霉)接种至10mLDPY培养基中,28℃,200rpm下培养2-3天。然后,将上述培养液加入到100mL CD-starch培养基中诱导目的基因表达,28℃,200rpm下培养1天后,向培养基中加入DMSO溶解好的化合物9,再继续培养3-4天。最后,用漏斗过滤收集菌丝体,并将菌体压干,然后加入无水乙醇浸泡菌体,超声提取,减压浓缩,提取物用色谱甲醇溶解后用于LC-MS分析。结果如图7B所示,当N344和R315突变成A时,完全消除了FsoE的酶活性,这暗示着R315和N344可能通过与底物C3羟基和C19羰基的形成氢键的关键作用。此外,W339和F337这两个非极性残基的突变也完全消除了FsoE的催化活性,这表明这些活性位点可能通过疏水相互作用结合底物。此外,靠近E环的四个残基(F557A、F259A、F148A和Y143A)的突变仍然产生了C19羰基产物10,并且F557A几乎将底物9转化为化合物10。然而,所有四个突变体却不能产生E环断裂产物,这表明F557、F259、F148和Y143在催化C-C键断裂形成开环产物11的方面起着关键作用。除此之外,将143位点的Y突变成F时,结果显示Y143F突变体只能将底物9转化为化合物10而不是化合物11,这表明Y143上的羟基对C-C键裂解很重要。
LC-MS分析采用戴安UltiMate 3000,配备有UltiMate3000 Diode ArrayDetector以及Bruker amaZon SLAPCI源低分辨质谱。液相分析柱为COSMOSIL 5μm C18column(5μm,4.6×150mm)。流动相为去离子水(含有0.1%甲酸)以及乙腈(含0.1%甲酸)。梯度设置为50%-100%乙腈(0-30min),100%-100%乙腈(30-50min);流速1mL/min。
实施例8:化合物的分离纯化和结构鉴定
实施例8.1化合物分离纯化
上述实施例中涉及到的化合物分析纯化的方法及结果汇总如下:
化合物1的分离纯化:发酵5L含有fsoADEF的转染菌株,菌丝体用无水乙醇浸泡过夜,超声提取30min,重复提取3次。菌液培养基用乙酸乙酯萃取2次,重复提取3次。将菌丝体和菌液培养基的提取物混合在一起,经ODS柱层析洗脱(甲醇-水→30%,50%,70%,90%,100%v/v)得到5个馏分。馏分4经HPLC制备(60%乙腈-水,0.1%甲酸,3mL/min)得到目标化合物1。
化合物2的分离纯化:发酵1L含有fsoA的转染菌株,收集菌体,用无水乙醇浸泡过夜,超声提取30min,重复提取3次。提取物经硅胶柱洗脱(环己烷-乙酸乙酯→100:0,98:2,95:5,90:10,80:20,乙酸乙酯,甲醇v/v)得到7个馏分。从馏分3中获得目标化合物2。
化合物3的分离纯化:称取苷元化合物2(20mg)以及D-葡萄糖三氯乙酰亚胺酯糖基供体(50mg),一起加入到50mL干燥过的圆底烧瓶中,然后加入适量的分子筛,再加入10mL干燥的二氯甲烷,放置冰上搅拌20min,待体系温度降到0℃时,滴加50μL催化剂TMSOTf,继续在冰上反应2-3h,然后在室温下反应过夜,TLC监控反应进程,反应结束后加入几滴三乙胺终止反应。然后过滤,减压浓缩,得到反应粗样。将上述得到的粗样,溶解于10mL甲醇/二氯甲烷(1:1)的混合溶剂中,加入80mg甲醇钠,使得反应的体系的pH值>9,在室温下反应过夜,TLC监控反应进程,反应结束后,加入酸性阳离子交换树脂进行中和,使体系的pH值达到中性。然后过滤,减压浓缩,得到脱去保护基的粗样。最后使用硅胶柱层析分离(目标化合物在乙酸乙酯层)以及HPLC制备(100%甲醇,3mL/min)得到糖基化合物3。最后,经LC-MS比对确定了上述糖基化获得的化合物3为米曲霉fsoA转染株菌株中的代谢产物3。
化合物4的分离纯化:将化合物12溶解于12mL甲醇/二氯甲烷(1:1)的混合溶剂中,再加入80mg甲醇钠,使得反应的体系的pH值>9,常温搅拌,过夜反应。TLC监控反应进程,反应结束后,加入酸性阳离子交换树脂进行中和,使体系的pH值达到中性。然后过滤,减压浓缩。经HPLC制备(100%甲醇,3mL/min)得到混合物4。再经HPLC二次制备纯化(90%乙腈:10%四氢呋喃,3mL/min)得到化合物4。最后,经LC-MS比对确定了上述脱乙酰化获得的化合物4为米曲霉fsoAD转染株菌株中的代谢产物4。
化合物5的分离纯化:发酵5L含有fsoAD的转染菌株,收集菌体,用无水乙醇浸泡过夜,超声提取30min,重复提取3次。提取物经硅胶柱洗脱(环己烷-乙酸乙酯→100:0,95:5,90:10,80:20,70:30,50:50,乙酸乙酯,甲醇v/v)得到8个馏分。从馏分5中得到目标化合物5。
化合物6和7的分离纯化:发酵5L含有fsoAE的转染菌株,收集菌体,用无水乙醇浸泡过夜,超声提取30min,重复提取3次。提取物经硅胶柱洗脱(环己烷-乙酸乙酯→100:0,95:5,90:10,80:20,70:30,60:40,50:50,乙酸乙酯,甲醇v/v)得到9个馏分。馏分8经HPLC制备(85%乙腈-水,0.1%甲酸,3mL/min)得到目标化合物6。馏分4经HPLC制备(100%甲醇,3mL/min)得到目标化合物7。
化合物8的分离纯化:将化合物fuscoatroside(1)溶解于12mL甲醇/二氯甲烷(1:1)的混合溶剂中,再加入80mg甲醇钠,使得反应的体系的pH值>9,常温搅拌,过夜反应。TLC监控反应进程,反应结束后,加入酸性阳离子交换树脂进行中和,使体系的pH值达到中性。然后过滤,减压浓缩。经HPLC制备(60%乙腈-水,0.1%甲酸,3mL/min)得到化合物8。最后,经LC-MS比对确定了上述脱乙酰化获得的化合物8为米曲霉fsoADE转染株菌株中的代谢产物8。
化合物9、10和11的分离纯化:发酵10L含有fsoADE的转染菌株,收集菌体,用无水乙醇浸泡过夜,超声提取30min,重复提取3次。提取物经硅胶柱洗脱(环己烷-乙酸乙酯→100:0,90:10,85:15,80:20,70:30,50:50,乙酸乙酯,甲醇v/v)得到8个馏分。馏分6经HPLC制备(85%乙腈-水,0.1%甲酸,3mL/min)得到目标化合物9和11。馏分3经HPLC制备(88%乙腈-水,0.1%甲酸,3mL/min)得到目标化合物10。
化合物12的分离纯化:发酵5L含有fsoADF的转染菌株,收集菌体,用无水乙醇浸泡过夜,超声提取30min,重复提取3次。提取物经硅胶柱洗脱(环己烷-乙酸乙酯→90:10,85:15,80:20,75:25,65:35,50:50,乙酸乙酯,甲醇v/v)得到8个馏分。馏分8经HPLC制备(100%甲醇,3mL/min)得到目标化合物12。
化合物13的分离纯化:发酵5L含有efuA(TC)fsoA(GT)+fsoDEF的转染菌株,28℃,220rpm,培养6天后过滤,将菌体与菌液分离,菌液培养基用乙酸乙酯萃取3次,经ODS柱层析洗脱(甲醇-水,0.1%甲酸→30%,50%,70%,85%,90%,95%,100%v/v)得到7个馏分。馏分5经HPLC制备(70%乙腈-水,0.1%甲酸,3mL/min)得到目标化合物13。
实施例8.2实施例涉及的化合物的结构、名称、编号以及核磁确认数据
化合物1的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物2的核磁数据归属(溶剂为氘代氯仿,100MHz碳谱,400MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物3的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物4的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物5的核磁数据归属(溶剂为氘代氯仿,100MHz碳谱,400MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
b这些数据是在600MHz核磁共振光谱仪上收集。
化合物6的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物7的核磁数据归属(溶剂为氘代氯仿,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物8的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物9的核磁数据归属(溶剂为氘代氯仿,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物10的核磁数据归属(溶剂为氘代氯仿,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物11的核磁数据归属(溶剂为氘代氯仿,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物12的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
化合物13的核磁数据归属(溶剂为氘代吡啶,150MHz碳谱,600MHz氢谱)
a由于重叠或复杂的多重性而导致的不可分辨信号在报告时没有指定多重性。
本发明涉及的序列如下:
氨基酸序列
>FsoA(SEQ ID NO:1)
MDMAPDELDELRGSAQRALEQAIDFSFSCQQDDGHWVAPVSADATFTAQYVMFKHAIPALNLDISGAEAAALRHWLLGDQNAAEGSWGLAPGLPGNLSTTVEAYLALRLLGVPSSNPALQQARRFVLAHGGISRVRFFTRFFLATFGLFPWSAIPQMPAELILMPKWAPLNIYVLSSWARSTLIPILVVRHHEPLYPLPNAQSDPNSGFLDELWLDPTNKEVPFAPPLWDMFHGRDRDVVKLAFTLGDKALAQIGGLKKGPQRRLALRRCIEWLLEHQEETGDWAGFFPPMHGSVWALLLEGFSLEHDVVKRGLEALERLAVNDESGKWLQSTVSPCWDTALMVKALCDAGLGLGGAEAAKGNRHARVTTAVDWVRSLQLLGPQGDWRVYSRNQRPGGWSFEYNNTWYPDVDDTAVVVMMLVTHDPAAVESNAVEMGIEWILGMQNHDGGWGAFDTNNDALWLHKIPFSDMDSLVDPSTSDVTGRMLECFGMLLTHRKGGLRLRPELSQRLHESAQKALAFLFREQTASGAWWGRWGCNYNYGTTNVLRGLPAFCGDKEVARAALRAVLWLEKCQNKDGGWGETLLSYGHPDLAGKGPSTAAHTAWALDALLRFRPASDPALQKGVQWLVSNQVPKTEEKRHWASWPSDLYVGTGFPNVLYLGYPFYHHHFAISALARFLDRTDEPDQDRDLPLLMTRHVVTTLTRHDILLMVLGSRGDIDVFLSIAGKLAKNRHRVRVATHPAHQQLVEAHGFEFYDVGGGPDEFAQVLGREPNLLWSVIRGDLGRLRQSLCRTFARFWEAGYGSNNTRNARNADPKANGIADSRPFVADLIVSTPATTVHVHAAETLRAPLVLIAAQPTLPTREFPHVFTMNKPRYSPGSWWNYATFFFLELLNWLAMGSFVNKLRVHTYKMKPLCWVWATQDFLTAKIPLVCLWSSNVVPRPPEWHDEVMVAGSTTLAQVDQFTPPLSLLEFLNADMEKPTVVVSFGSMFIADPPALISAIASAAAQVRAKVVICRSWRWKLESSLASLPSHTYVADAIPHSWLLPRVDGFVHHGGAGHTAAGLRAGVPMLITPFFLDQHFWAAKVHNLGLGPEPLEIMMRAGTVAGIQTHQGKMQFAQSMQDLLSGQYSRRCAEMSERVRAETDGANVAADVIERELGSALARSGHCAVVPALPAQWQHAESGLALCGVAAASLVTSGMLDWDDLDAITRIDWIARRQKDPKSRLHAICFVADWLGHAFGMLLAVAGWLLQLVGDVRSVGRVKPHHNTDPIRLAMMERSMFDLNFAKQGLAEAELKGGAFEELLARRWRAAVAAAFERRMERTGNMLLGEGCQG*
>FsoD(SEQ ID NO:2)
MYDITLAAVSIGLFFYVGARAVLKCLFPRQTSFPKHVPVVGVRDEMLSITRASLRQLTNGITTLLDGYSKHGQRNRPFVLYDPSAQPELLLPVQHIRWFSEQPDSKLSSHGVRQERHAVRYLHMGDQVELESTTRFIRYASNDRLNRHLENLQGLLHDEVRRSVDCVFGSQRQAQDDHWKEINLYGAMQDLVFPIMCRVFLGKELGESDEERGRVLTVFRRYLMAMGISTIFIGELPRLLKGVVARVVRIPLAYYRSQTLRMLVPLVRSQLSRTKHDEDDDDERGSDFIKHCANLSTKSTLSGTSSEAGPDLIAEWIMMLAGSLGFAGSSSTIIQATNLILDLVNTPPELLALQQLRHEAERTLQDDSNWTQAASFRQQKLADSAIRESLRLHPILIKGLTKEVVTPNGLELPDDENTTIPMGSWVGVPVLGIHQDERFYPQASEYRPFRFVEQAEAARTQA GGGSYEDAPEAAKPTTTYLGFGYGRHACPGRWFAVLMLKMILSYVLLHYDVESTGPAPKTRVLGDAALPPFRATIRVRKRKLGSE*
>FsoE(SEQ ID NO:3)
MNSTLTSKMTVQDALVDNGLLGKGTRSLLMAVAITYAISWINWFFTSWQSSRAVAAAKRAGPGQLKRPPTLPSAVPVVGHIFQFLLGGHAFMSRAAKHYGLGVPVRINLATFPSYIVSGRDCVAAFLKDQGRQLSRIPRGLNYMEHAFGCPHEFVHQFKPRDDVDIEHQMHTALQTMLAGNGLEVLAGRYQTEVAHAALSTSLMGKEHEWTELPDLCSFVEDHVLEAATRALYGPHLVALNPTLARDFWTFNRRVKSMFMGVPKWLNPSAVRARDKMTDNVKRWQLYAAEHCNIDEIPDDVEWEPFYGSRYTRVRQKLLTKRDIMNESARAAENLAFIWATNANSVPSAIWFLLETLHDPSLEKQVRARLQAARTESTDENPLNFDVNKLTSDSLLQSMFAEILRLRVAALVVRQPTDAKGFSLPGGWHIKPKETLSMSTRTELMDPGVWNAGDAANPHPLDSFWAERFLVYPDDPRSGPLREPKRRFGAATNSEPYFSLDGCTWSWVPFGGGRQLCPGRHFAKCEILLTSAIFLSAFEIELLTDKLPGPDEGVYGFGTMPPNGKVPCRIRRRKIVSV*
>FsoF(SEQ ID NO:4)
MNHTIISLALIFFQLTTTALVVGFTSREHLFLRAIGSVPQGFSAYHQIVFLCSHISNPVNRAFLGAASVFLVILYVDAAILSRWTFASQSPTSSLGGLIPPTTRDTPKTQNNATTAETSASFLRKLSFGFLIALQSRFPATPWAVPRLPPFHKADPKHTPTKSAFLLKNTTKCLVYLLLLRATSGLGNPDDNPVVFASDRIPLFSRLGDKGPGGITLSEIGTRVGAVMGYWAIQYAVIDLLYSLLAVVAVSLHLTDVKGWVPVFGSVSDARGVRLFWGQFYHQLVRQGCSSIAHYITYFILRFRKDSGSLAARYVFMTLVFAVSGVFHTLSDVSQGIPLGESGAMRFFVLQAIGIMLEDGFQAIVSRRRQSGHHGRGKLERVLGSVSGPVWLVTWLTWTSPGWIYMSLQRDRGVPIIPF*
>EfuA(TC)FsoA(GT)(SEQ ID NO:5)
MPSYHNTDKTLLGDARQSLQQAVDYSLGCQQPDGHWVAPVMADATFTAQYVFFKHQIPELSLDEDGPEIQRWLLGEQTADGSWTLAPDLPGNLSTTVEAYLALRILGVPKSDQAMLRARDFVVRNGGVEGVRFFTRFFLATFGLVPWTAIPQMPAELILLPTFMFLNIYVLSSWARSTLIPILLVRHHEPVYALPNGQSANNNFLDELWCNPGEKNIPFALPLWDLLRRYQWIEFAFTLLDHILALFGGLRRWPCRHMALKRCTAWLLEHQEESGDWAGFFPPIHGSIWALLLDGFSFQSEVIRLGMEALERLVVIDPKGKWVQSTVSPCWDTALMANALCDAGMSGDTRLAKATQWLRDRQLMVSHGDWRNYANTQQAGGWSFQYFNSFYPDVDDTAVVIMTLIKEDPNCTNSDCVMNGVEWMLGMQSRDGGWGAFDVNNNARWLHKIPFSDMDSLVDPSTSDVTGRILECLGLLLSQRKSPLSPRWRHRLQASSAKAIAFLAKEQESSGAWWGRWGNNYHYGTANVLRGLAWFAQTDPSAQMMCMRTLSWIDETQNADGGWGETLASYVDKSLAGLGRSTAAHTAWALESLLRFRLPSDQAIERGVRWLIDNQQPNVDGYYYGTKWQAGAGQGASWRFDHAYVGTGFPSVLYLGYPYYHHLFPIQALSRYIDKASRQGIETLRIPSSSAVILDRPNVLLMTRHVVTTLTRH DILLMVLGSRGDIDVFLSIAGKLAKNRHRVRVATHPAHQQLVEAHGFEFYDVGGGPDEFAQVLGREPNLLWSVIRGDLGRLRQSLCRTFARFWEAGYGSNNTRNARNADPKANGIADSRPFVADLIVSTPATTVHVHAAETLRAPLVLIAAQPTLPTREFPHVFTMNKPRYSPGSWWNYATFFFLELLNWLAMGSFVNKLRVHTYKMKPLCWVWATQDFLTAKIPLVCLWSSNVVPRPPEWHDEVMVAGSTTLAQVDQFTPPLSLLEFLNADMEKPTVVVSFGSMFIADPPALISAIASAAAQVRAKVVICRSWRWKLESSLASLPSHTYVADAIPHSWLLPRVDGFVHHGGAGHTAAGLRAGVPMLITPFFLDQHFWAAKVHNLGLGPEPLEIMMRAGTVAGIQTHQGKMQFAQSMQDLLSGQYSRRCAEMSERVRAETDGANVAADVIERELGSALARSGHCAVVPALPAQWQHAESGLALCGVAAASLVTSGMLDWDDLDAITRIDWIARRQKDPKSRLHAICFVADWLGHAFGMLLAVAGWLLQLVGDVRSVGRVKPHHNTDPIRLAMMERSMFDLNFAKQGLAEAELKGGAFEELLARRWRAAVAAAFERRMERTGNMLLGEGCQG*
核苷酸序列(DNA)
>fsoA(SEQ ID NO:6)
ATGGACATGGCGCCAGACGAGTTGGATGAGCTCAGGGGCAGCGCCCAGCGGGCACTTGAGCAGGCCATCGACTTCTCTTTCAGCTGCCAGCAAGATGACGGACACTGGGTGGCGCCCGTCTCAGCCGACGCCACATTCACAGCTCAGTATGTAATGTTCAAGCACGCCATTCCAGCTCTCAACCTGGACATCAGCGGAGCCGAGGCAGCGGCCCTCCGTCACTGGCTTCTCGGAGACCAAAATGCGGCTGAAGGCTCTTGGGGTCTTGCTCCTGGGCTACCGGGAAACTTGTCTACCACAGTCGAGGCATACCTCGCCCTTCGACTCCTCGGTGTACCATCGTCGAACCCAGCACTGCAACAAGCACGCCGTTTTGTGCTGGCTCATGGTGGAATCTCTCGGGTTCGATTTTTTACACGGTTCTTCCTCGCAACCTTTGGCCTGTTTCCGTGGAGCGCCATCCCTCAGATGCCAGCCGAGCTTATACTCATGCCGAAATGGGCTCCCCTGAATATCTACGTCCTCTCATCGTGGGCACGCAGCACCCTGATCCCCATCCTGGTGGTCCGTCATCACGAGCCCCTGTACCCCCTGCCAAATGCCCAAAGCGACCCAAACAGCGGCTTTCTGGACGAACTATGGCTTGACCCAACAAACAAGGAGGTGCCGTTTGCACCGCCGTTGTGGGACATGTTTCATGGGAGAGACCGCGATGTCGTCAAGCTCGCTTTCACTTTGGGGGACAAGGCCCTTGCGCAAATTGGGGGCCTGAAAAAAGGGCCCCAGCGTCGACTTGCCCTTCGGCGTTGCATTGAGTGGCTGCTAGAGCATCAGGAAGAGACGGGCGACTGGGCTGGCTTTTTCCCGCCCATGCACGGCAGTGTCTGGGCGTTGCTTCTTGAAGGCTTTTCTTTGGAACACGACGTCGTGAAGCGGGGACTCGAGGCACTCGAGCGTCTGGCTGTCAACGACGAGAGCGGCAAGTGGCTGCAATCCACAGTGTCGCCGTGCTGGGACACTGCGCTCATGGTCAAGGCCCTTTGCGACGCTGGCCTTGGGCTCGGGGGAGCAGAGGCAGCGAAGGGAAACCGTCATGCGCGGGTCACGACCGCCGTTGATTGGGTCCGCTCACTACAACTCCTCGGCCCTCAGGGTGACTGGCGGGTTTACAGCCGCAACCAGCGCCCGGGGGGCTGGAGTTTCGAGTACAACAACACCTGGTACCCAGATGTGGATGACACGGCGGTTGTGGTCATGATGCTTGTG ACGCACGATCCGGCTGCTGTCGAGTCCAATGCCGTTGAAATGGGAATCGAGTGGATTCTTGGGATGCAAAACCACGACGGCGGATGGGGTGCGTTCGACACCAACAACGACGCGCTCTGGCTGCACAAGATTCCTTTCAGCGACATGGACAGCCTCGTCGACCCCAGCACGTCTGATGTGACGGGTCGGATGCTGGAGTGTTTTGGGATGCTCTTGACGCACAGAAAAGGAGGCCTTCGCCTCCGCCCCGAGCTTTCTCAGCGTTTGCATGAATCGGCGCAAAAGGCGTTGGCGTTTCTGTTCAGGGAACAGACGGCCTCAGGTGCGTGGTGGGGACGCTGGGGCTGCAACTACAACTATGGCACAACCAACGTACTCCGCGGTTTGCCCGCTTTCTGCGGAGATAAGGAGGTAGCCAGGGCGGCTCTGCGCGCGGTTCTCTGGCTCGAGAAGTGCCAGAACAAGGATGGCGGTTGGGGCGAGACGTTGCTGTCGTACGGCCACCCAGATCTGGCTGGAAAAGGTCCCAGCACGGCCGCACACACCGCATGGGCGCTGGATGCATTGCTCCGTTTCCGCCCAGCATCCGATCCAGCCTTGCAGAAAGGCGTCCAGTGGCTTGTATCGAATCAAGTTCCCAAGACAGAAGAGAAACGCCATTGGGCCTCATGGCCCTCGGACTTGTATGTTGGCACTGGCTTCCCGAATGTGCTCTACCTTGGATACCCGTTTTACCACCACCACTTTGCCATCTCGGCACTCGCACGGTTTCTCGACAGGACCGACGAACCGGATCAGGACCGTGATCTGCCGCTCCTCATGACTCGGCACGTTGTCACAACGCTCACCCGCCACGACATACTCCTGATGGTTTTGGGTAGCCGAGGCGACATTGACGTGTTCCTCAGCATCGCTGGGAAACTCGCCAAGAATAGACACAGGGTCCGTGTTGCTACTCACCCCGCTCATCAGCAGCTGGTGGAAGCGCACGGATTCGAGTTCTACGATGTTGGCGGAGGCCCAGACGAATTCGCTCAGGTACTCGGCCGTGAGCCCAACTTGCTCTGGTCTGTTATCCGCGGCGACCTTGGCAGGCTGCGGCAGTCCCTGTGTCGTACTTTTGCGCGGTTTTGGGAAGCTGGTTACGGCAGCAACAATACGCGTAACGCCCGCAACGCTGACCCCAAAGCAAATGGGATAGCTGACTCTCGCCCATTTGTGGCCGATCTTATTGTCTCGACACCGGCCACAACTGTCCATGTCCACGCAGCAGAAACTCTGCGGGCTCCTCTCGTATTGATAGCCGCCCAACCTACGCTACCCACACGAGAGTTTCCTCACGTCTTTACTATGAACAAGCCTCGCTACTCGCCAGGCTCTTGGTGGAACTATGCGACCTTTTTCTTCTTGGAGCTCTTGTAAGTGCCTACTCTCACTCCCTGGATGGTCAGACTGAGGCTGATGTTGTAACCCTTGTTCAAGAAACTGGTTGGCAATGGGTTCGTTCGTGAACAAGCTCCGAGTGCACACCTACAAGATGAAGCCCCTTTGTTGGGTATGGGCGACGCAAGATTTCCTCACGGCCAAGATTCCTCTCGTTTGCCTTTGGTCATCAAACGTCGTTCCCCGACCGCCGGAATGGCATGATGAAGTGATGGTTGCCGGCAGTACCACCCTCGCGCAAGTGGACCAGTTCACACCGCCACTCTCCCTCCTGGAATTCTTGAATGCGGACATGGAGAAGCCCACCGTGGTCGTCAGCTTTGGATCGATGTTCATTGCGGACCCACCTGCACTGATCTCTGCCATAGCCTCGGCGGCGGCTCAAGTGAGGGCAAAGGTGGTCATTTGCAGAAGCTGGCGATGGAAGTTGGAGTCTAGCTTGGCCTCCTTGCCTAGCCACACGTACGTGGCTGACGCCATCCCTCACAGCTGGCTGCTACCCCGTGTCGACGGCTTTGTGCATCATGGTGGGGCGGGACACACAGCAGCGGGCCTTCGAGCTGGAGTCCCAATGCTGATTACGCCCTTCTTCCTCGACCA ACATTTCTGGGCAGCAAAGGTACACAATCTGGGACTCGGTCCAGAACCGCTCGAGATCATGATGCGCGCTGGGACCGTGGCTGGCATACAAACTCACCAAGGAAAGATGCAATTCGCGCAGAGCATGCAGGACTTGCTGTCAGGGCAGTACAGCAGGCGGTGTGCCGAGATGTCTGAGCGAGTTCGAGCTGAGACCGACGGTGCCAACGTCGCTGCCGATGTGATCGAACGCGAGCTAGGGTCGGCACTGGCCCGTTCCGGCCACTGTGCTGTGGTGCCAGCGCTTCCAGCTCAGTGGCAGCATGCCGAATCTGGGTTGGCGTTGTGCGGAGTAGCGGCAGCGAGCCTCGTCACATCCGGCATGCTTGACTGGGACGACCTAGACGCAATCACACGCATCGATTGGATCGCGAGGCGGCAAAAGGACCCCAAGTCACGTCTCCACGCAATCTGCTTCGTGGCAGATTGGCTTGGTCACGCTTTTGGCATGCTTCTTGCTGTGGCCGGGTGGCTTCTGCAGTTAGTCGGAGATGTACGCAGTGTGGGCCGGGTGAAACCGCACCATAACACCGATCCAATTCGTCTAGCAATGATGGAAAGGAGCATGTTCGACTTGAACTTTGCCAAACAGGGGTTGGCAGAGGCGGAGCTCAAAGGGGGGGCTTTTGAGGAGCTCTTGGCGCGAAGATGGAGGGCTGCAGTGGCCGCCGCGTTTGAGCGGAGGATGGAAAGGACGGGAAATATGCTGCTGGGTGAGGGCTGTCAAGGATAG*
>fsoD(SEQ ID NO:7)
ATGTACGACATCACACTTGCCGCAGTCTCCATCGGACTCTTTTTCTACGTGGGAGCGAGGGCTGTTCTCAAGTGCCTTTTCCCGCGACAAACCTCGTTTCCCAAACATGTACCCGTTGTTGGAGTTCGGGATGAAATGCTGAGCATTACTCGGGCTTCGCTCCGGCAACTCACAAATGGCATCACCACCTTGCTCGATGGATACAGCAAGGCAAGTATTGGTTGTGGTGCATGCCGACTTCCAATCTAGCGAAGAAATGGCTGACGGTCCGTTCAAGCATGGTCAACGGAATCGCCCATTTGTTCTCTATGACCCCAGCGCTCAACCCGAGCTGCTCCTGCCGGTACAGCATATCCGCTGGTTCTCTGAACAGCCCGACTCCAAACTGAGCAGCCATGGAGTTCGCCAGGAGCGCCATGCTGTGCGCTACCTCCACATGGGCGACCAAGTCGAACTTGAATCAACAACGCGATTCATTCGGTATGCTTCAAATGACCGACTTAACCGGCACCTCGAAAATCTGCAAGGACTCCTTCATGACGAAGTCCGCCGGAGTGTTGACTGCGTTTTTGGGAGCCAGAGGCAAGCCCAGGATGACCACTGGAAAGAAATCAATCTCTATGGGGCCATGCAGGACCTCGTTTTCCCGATCATGTGCAGGGTCTTTTTGGGAAAGGAGCTTGGGGAGAGTGACGAGGAGCGGGGGCGAGTTCTAACAGTCTTTCGACGGTATCTGATGGCAATGGGTATCAGCACCATCTTCATCGGAGAGCTGCCCCGGTTGCTGAAAGGCGTTGTTGCCCGTGTTGTTCGAATACCGTTGGCCTACTACAGAAGCCAAACCTTGCGGATGCTGGTCCCATTGGTCCGATCGCAGTTATCACGAACCAAGCATGACGAGGATGATGATGATGAGAGGGGATCGGATTTTATCAAACACTGTGCCAACCTCTCCACGAAGAGCACACTGAGTGGAACCAGCAGCGAAGCTGGCCCGGACTTGATCGCCGAGTGGATCATGATGTTGGCAGGTTCTCTTGTGACCAAAGGCGCTGAGCAGAGCCGGAAGCTAACAGATTGTCTCCAGGGGTTTGCCGGTTCCTCGTCTACGATTATCCAAGCGACCAACCTGATCCTTGATCTC GTCAACACACCGCCTGAGCTGCTGGCGCTGCAACAACTCCGTCACGAGGCCGAAAGGACTCTTCAAGACGACTCGAACTGGACCCAGGCTGCAAGCTTTCGCCAACAAAAACTGGCCGACAGTGCCATCAGGGAGAGCCTACGCCTGCACCCAATCCTTATCAAGGGCCTGACTAAGGAAGTGGTTACCCCAAATGGTCTGGAGCTGCCCGATGACGAGAACACAACAATACCAATGGGCAGCTGGGTCGGGGTACCTGTGTTGGGTATTCATCAAGATGAAAGGTTCTACCCTCAGGCATCGGAATATCGTCCCTTCCGCTTTGTCGAGCAAGCAGAGGCGGCGCGGACGCAAGCTGGGGGAGGATCATACGAAGACGCACCTGAAGCAGCTAAACCAACCACCACGTACTTGGGCTTTGGGTATGGCCGCCACGCTTGGTAAGTTATTACAAATTCTGCCCTGCATCTCTTCAACACATGCTAACCACCTCTCCGGTGCGCCGTGTAGTCCCGGTCGGTGGTTCGCAGTCTTGATGCTCAAAATGATATTGTCGTATGTCCTCCTTCACTACGATGTCGAATCCACTGGTCCCGCTCCGAAGACAAGGGTGCTCGGGGACGCAGCGCTACCCCCATTTCGGGCAACCATCAGGGTTCGAAAGAGGAAACTCGGTTCTGAATGA*
>fsoE(SEQ ID NO:8)
ATGAACAGCACACTCACCTCCAAGATGACCGTCCAAGACGCCTTGGTCGACAACGGTCTCCTTGGAAAAGGCACACGCTCTCTGTTGATGGCAGTGGCCATTACCTATGCTATCAGCTGGATCAATTGGTTCTTTACGTCGTGGCAGTCATCACGAGCCGTGGCGGCGGCTAAGCGTGCGGGACCGGGTCAGTTAAAACGACCTCCCACGCTGCCTTCGGCGGTCCCCGTTGTCGGTCACATCTTCCAGTTTCTCCTGGGCGGGCATGCCTTCATGTCGAGAGCAGCGTAAGTGATCCTTTGACCTCGTTGCTTGCTATCGTTTGCTTACTTTGTTTGACAGAAAACATTATGGTCTCGGGGTACCCGTACGCATCAATCTGGCCACCTTCCCAAGTTACATTGTGTCAGGCCGTGATTGTGTTGCTGCTTTCCTCAAAGACCAAGGACGCCAGCTATCCCGCATTCCACGTGGACTTAACTACATGGAGCATGCGTTTGGTTGCCCCCATGAGTTTGTGCACCAGTTCAAGCCTCGTGACGATGTCGACATTGAGCATCAGATGCACACCGCGTTGCAGACCATGCTGGCTGGCAACGGACTCGAGGTGCTTGCGGGCCGCTACCAGACCGAGGTTGCACATGCTGCACTCTCGACTTCTTTGATGGGAAAGGAGCACGAGTGGACCGAGCTGCCAGACCTGTGTTCCTTTGTTGAGGACCACGTTCTCGAGGCCGCGACACGGGCTTTATATGGCCCACACTTGGTGGCTCTCAACCCGACGCTTGCCCGTGATTTCTGGACGTTTAATCGGCGTGTCAAGTCTATGTTCATGGGCGTTCCCAAGTGGCTCAACCCATCAGCCGTGCGGGCCCGCGACAAGATGACAGACAACGTCAAGCGCTGGCAGCTCTACGCAGCCGAACACTGCAACATCGACGAGATTCCCGATGACGTGGAGTGGGAGCCTTTCTACGGGAGCCGGTATACCCGCGTTCGCCAGAAGTTGCTTACCAAACGGGACATCATGAACGAGTCGGCTCGTGCGGCTGAGAACCTCGCTTTCATCTGGGCGTACGTTACCACTTTCAATTCAATGAGCGGTGTTTGCTAACATGTCTGTTTCTCACTCTTCCAGTACAAACGCCAACTCTGTCCCTTCTGCTATCTGGTTTCTCCTTGAAACGCTCCACGATCCGTCTCTAGAGAAGCAGGTCAGAGCGAGGCTGCAAGCTGCTCGGACTGAGTCGACGGACGAGAATCCGCTCAACTTC GATGTCAACAAACTCACTTCCGACTCCCTTCTCCAGTCAATGTTTGCGGAGATACTGCGGTTGCGTGTGGCTGCTCTTGTGGTCCGCCAGCCCACAGACGCAAAGGGGTTCTCCCTTCCTGGTGGCTGGCACATCAAACCAAAGGAGACACTCAGCATGTCGACGCGCACTGAACTGATGGACCCTGGTGTTTGGAACGCCGGAGACGCCGCCAATCCACACCCTCTTGATAGTTTCTGGGCCGAGCGCTTTCTGGTTTACCCAGACGACCCGCGGAGCGGCCCCCTCCGGGAGCCGAAGCGAAGATTCGGGGCTGCCACAAACAGCGAGCCGTACTTCTCACTTGACGGATGCACATGGAGTTGGGTGCCATTTGGTGGTGGGCGACAGTTGTGCCCCGGCCGTCATTTTGCCAAGTGTGAAATTCTTCTGACCTCTGCTATCTTTCTGTCGGCGTTCGAGATTGAACTGTTGACAGATAAGTTGCCGGGGCCTGATGAGGGCGTCTACGGGTTTGGGACGATGCCTCCGAACGGCAAAGTGCCTTGCAGAATTCGCAGGAGGAAGATTGTCTCGGTTTAA*
>fsoF(SEQ ID NO:9)
ATGAATCACACAATTATTTCCCTGGCGCTTATCTTCTTCCAGCTCACTACAACGGCCCTAGTGGTTGGGTTCACGAGCCGTGAGCATCTCTTTCTCCGTGCCATTGGCTCAGTTCCCCAAGGGTTCTCGGCCTACCACCAGATCGTTTTCCTCTGCAGCCACATCAGCAACCCCGTAAACCGCGCATTTCTTGGAGCTGCCAGCGTCTTTCTCGTCATTCTCTATGTCGACGCTGCTATTCTAAGCCGCTGGACCTTTGCCTCACAAAGCCCGACGTCCAGCCTTGGTGGGCTTATACCGCCCACAACCAGAGATACTCCCAAGACTCAAAACAATGCCACGACAGCTGAGACATCGGCGTCGTTTCTGAGGAAACTCAGCTTTGGCTTTCTTATTGCGCTCCAAAGCCGTTTCCCAGCTACTCCATGGGCAGTCCCTCGACTTCCTCCTTTTCACAAAGCCGACCCAAAGCATACTCCCACCAAGTCAGCGTTTCTCTTGAAGAACACAACCAAGTGTCTAGTCTACCTCTTACTTCTCCGCGCTACCAGCGGGTTAGGAAATCCGGATGACAACCCTGTTGTGTTTGCGTCTGACCGCATCCCGCTCTTCTCGCGGTTGGGGGACAAGGGACCAGGAGGCATCACGTTGTCAGAGATAGGCACGAGGGTTGGCGCTGTCATGGGATATTGGGCCATACAGTATGCCGTCATCGACTTACTGTATAGTCTGCTGGCGGTGGTGGCCGTCTCTCTCCACTTGACGGATGTTAAGGGCTGGGTACCGGTTTTTGGGTCTGTTTCTGACGCGAGAGGGGTGAGGCTGTTCTGGGGGCAATTCTACCACCAACTCGTTCGACAGGGCTGCAGCAGCATTGCGCACTACATCACATACTTCATCTTGCGGTTTCGCAAAGACAGCGGCTCGCTGGCAGCTCGATATGTTTTCATGACCTTGGTGTTTGCCGTGTCCGGGGTTTTTCACACGCTGAGTGACGTGTCACAAGGGATCCCACTGGGTGAAAGCGGCGCCATGCGCTTCTTCGTTCTCCAGGCAATAGGCATCATGCTAGAAGACGGGTTTCAGGCCATTGTCTCTCGGAGAAGGCAATCTGGACATCATGGTCGAGGAAAACTTGAGAGGGTTTTGGGGAGCGTCAGTGGCCCCGTGTGGTTGGTCACTTGGTTAACATGGACTTCGCCAGGTTGGATCTATATGTCTTTGCAGAGGGACAGAGGTGTGCCTATTATTCCTTTCTAG*
>efuA(TC)fsoA(GT)(SEQ ID NO:10)
ATGCCGTCTTACCACAACACGGACAAGACACTCTTGGGTGATGCTCGTCAATCTCTACAGCAGGCTGTCGACTATTCGCTAGGATGCCAACAACCTGATGGTCACTGGGTGGCTCCAGTTATGGCAGATGCAACCTTTACTGCACAGTATGTCTTTTTCAAGCACCAAATCCCGGAACTCTCGTTGGACGAGGATGGTCCCGAGATCCAGAGGTGGCTTTTGGGCGAGCAAACAGCAGACGGCTCATGGACTCTTGCGCCTGACCTACCAGGCAATCTGTCTACTACCGTCGAAGCCTACCTTGCCTTACGCATACTTGGTGTTCCCAAGTCCGACCAAGCAATGTTACGAGCACGAGATTTTGTGGTCCGTAATGGCGGCGTAGAAGGCGTGCGTTTTTTCACACGCTTCTTCCTTGCGACTTTTGGCCTGGTTCCCTGGACTGCTATCCCGCAGATGCCTGCCGAATTGATACTGCTACCGACCTTTATGTTCCTTAACATCTATGTGCTGTCATCATGGGCACGGAGCACTTTGATTCCCATTCTGTTGGTCCGGCATCACGAACCAGTATATGCCTTGCCCAATGGGCAAAGCGCTAATAACAACTTCTTGGACGAGCTTTGGTGTAATCCTGGCGAAAAGAACATACCTTTCGCACTACCACTTTGGGATCTCCTCCGGAGATACCAGTGGATCGAATTCGCATTCACACTTCTCGACCACATACTTGCCTTGTTCGGAGGGCTGCGAAGGTGGCCATGTCGTCATATGGCCCTGAAAAGGTGCACCGCATGGCTACTCGAGCATCAGGAGGAGTCTGGCGATTGGGCTGGCTTCTTCCCTCCAATCCATGGCAGTATATGGGCACTGCTCCTTGATGGCTTTTCGTTCCAATCCGAAGTCATTCGCCTAGGTATGGAAGCGTTGGAACGTCTTGTTGTTATCGACCCGAAAGGGAAATGGGTGCAGTCGACAGTATCTCCCTGTTGGGACACAGCTCTCATGGCGAATGCCTTGTGCGATGCCGGTATGAGCGGCGATACTCGTCTAGCAAAAGCAACGCAGTGGCTTCGGGACCGACAGCTGATGGTCTCTCACGGTGACTGGCGCAACTATGCAAACACCCAACAGGCTGGAGGATGGAGCTTCCAGTATTTTAATTCATTCTACCCGGACGTTGATGACACAGCGGTCGTCATAATGACACTCATCAAGGAAGATCCGAATTGTACCAACTCCGACTGCGTGATGAATGGCGTTGAATGGATGCTTGGGATGCAGAGCCGAGACGGTGGGTGGGGAGCTTTCGATGTGAACAACAACGCACGCTGGCTGCACAAGATCCCCTTCAGTGACATGGACAGCCTCGTGGACCCAAGCACGTCAGATGTCACTGGGCGGATCTTAGAATGCCTTGGTCTGTTGCTATCGCAGAGGAAAAGCCCCCTGTCACCGCGTTGGAGGCATCGCCTTCAAGCGTCCTCTGCGAAAGCAATCGCGTTCCTCGCCAAAGAACAAGAGTCTTCAGGCGCGTGGTGGGGCAGATGGGGCAACAATTACCACTATGGCACGGCAAACGTTCTTCGAGGCCTAGCCTGGTTCGCACAAACTGACCCTAGTGCACAAATGATGTGCATGCGTACGCTTTCCTGGATTGACGAGACTCAAAACGCTGATGGAGGTTGGGGAGAAACACTAGCATCATACGTCGATAAATCACTGGCTGGTCTTGGTAGAAGCACTGCCGCACACACTGCCTGGGCCCTCGAGTCCCTGCTACGCTTCCGTTTACCATCTGATCAAGCTATCGAGCGAGGTGTACGATGGCTCATTGACAATCAGCAACCGAATGTGGACGGCTATTACTACGGAACGAAATGGCAGGCAGGCGCAGGTCAAGGAGCATCCTGGCGCTTCGATCATGCCTATGTTGGTACAGGATTCCCAAGTGTTCTTTATCTGGGCTATCCCTATTACCATCATCTGTTTCCGATCCAAGCCCTGAGTCGTTACATTGACAAGGCAAGTCGCCAAGGTATTGAGACGTTGAGGATACCATCCTCGTCTGCTGTTATTCTTGACCGTCCGAACGTACTCTTGATGACTCGGCACGTTGTCACAACGCTCACCCGCCACGACATACTCCTGATGGTTTTGGGTAGCCGAGGCGACATTGACGTGTTCCTCAGCATCGCTGGGAAACTCGCCAAGAATAGACACAGGGTCCGTGTTGCTACTCACCCCGCTCATCAGCAGCTGGTGGAAGCGCACGGATTCGAGTTCTACGATGTTGGCGGAGGCCCAGACGAATTCGCTCAGGTACTCGGCCGTGAGCCCAACTTGCTCTGGTCTGTTATCCGCGGCGACCTTGGCAGGCTGCGGCAGTCCCTGTGTCGTACTTTTGCGCGGTTTTGGGAAGCTGGTTACGGCAGCAACAATACGCGTAACGCCCGCAACGCTGACCCCAAAGCAAATGGGATAGCTGACTCTCGCCCATTTGTGGCCGATCTTATTGTCTCGACACCGGCCACAACTGTCCATGTCCACGCAGCAGAAACTCTGCGGGCTCCTCTCGTATTGATAGCCGCCCAACCTACGCTACCCACACGAGAGTTTCCTCACGTCTTTACTATGAACAAGCCTCGCTACTCGCCAGGCTCTTGGTGGAACTATGCGACCTTTTTCTTCTTGGAGCTCTTGTAAGTGCCTACTCTCACTCCCTGGATGGTCAGACTGAGGCTGATGTTGTAACCCTTGTTCAAGAAACTGGTTGGCAATGGGTTCGTTCGTGAACAAGCTCCGAGTGCACACCTACAAGATGAAGCCCCTTTGTTGGGTATGGGCGACGCAAGATTTCCTCACGGCCAAGATTCCTCTCGTTTGCCTTTGGTCATCAAACGTCGTTCCCCGACCGCCGGAATGGCATGATGAAGTGATGGTTGCCGGCAGTACCACCCTCGCGCAAGTGGACCAGTTCACACCGCCACTCTCCCTCCTGGAATTCTTGAATGCGGACATGGAGAAGCCCACCGTGGTCGTCAGCTTTGGATCGATGTTCATTGCGGACCCACCTGCACTGATCTCTGCCATAGCCTCGGCGGCGGCTCAAGTGAGGGCAAAGGTGGTCATTTGCAGAAGCTGGCGATGGAAGTTGGAGTCTAGCTTGGCCTCCTTGCCTAGCCACACGTACGTGGCTGACGCCATCCCTCACAGCTGGCTGCTACCCCGTGTCGACGGCTTTGTGCATCATGGTGGGGCGGGACACACAGCAGCGGGCCTTCGAGCTGGAGTCCCAATGCTGATTACGCCCTTCTTCCTCGACCAACATTTCTGGGCAGCAAAGGTACACAATCTGGGACTCGGTCCAGAACCGCTCGAGATCATGATGCGCGCTGGGACCGTGGCTGGCATACAAACTCACCAAGGAAAGATGCAATTCGCGCAGAGCATGCAGGACTTGCTGTCAGGGCAGTACAGCAGGCGGTGTGCCGAGATGTCTGAGCGAGTTCGAGCTGAGACCGACGGTGCCAACGTCGCTGCCGATGTGATCGAACGCGAGCTAGGGTCGGCACTGGCCCGTTCCGGCCACTGTGCTGTGGTGCCAGCGCTTCCAGCTCAGTGGCAGCATGCCGAATCTGGGTTGGCGTTGTGCGGAGTAGCGGCAGCGAGCCTCGTCACATCCGGCATGCTTGACTGGGACGACCTAGACGCAATCACACGCATCGATTGGATCGCGAGGCGGCAAAAGGACCCCAAGTCACGTCTCCACGCAATCTGCTTCGTGGCAGATTGGCTTGGTCACGCTTTTGGCATGCTTCTTGCTGTGGCCGGGTGGCTTCTGCAGTTAGTCGGAGATGTACGCAGTGTGGGCCGGGTGAAACCGCACCATAACACCGATCCAATTCGTCTAGCAATGATGGAAAGGAGCATGTTCGACTTGAACTTTGCCAAACAGGGGTTGGCAGAGGCGGAGCTCAAAGGGGGGGCTTTTGAGGAGCTCTTGGCGCGAAGATGGAGGGCTGCAGTGGCCGCCGCGTTTGAGCGGAGGATGGAAAGGACGGGAAATATGCTGCTGGGTGAGGGCTGTCAAGGATAG*
引物序列
>Inf-fsoA-F(SEQ ID NO:11)
TCGAGCTCGGTACCCACACACAATGGACATGGCGC
>Inf-fsoA-R(SEQ ID NO:12)
CTACTACAGATCCCCAACCTATCCTTGACAGCCCTC
>Inf-fsoD-F(SEQ ID NO:13)
TCGAGCTCGGTACCCCAGTACCGCGAGATGTACGA
>Inf-fsoD-R(SEQ ID NO:14)
CTACTACAGATCCCCCCGCAACCACTCATTCAGAA
>Inf-fsoE-F(SEQ ID NO:15)
TCGAGCTCGGTACCCCTAAACCATGAACAGCACAC
>Inf-fsoE-R(SEQ ID NO:16)
CTACTACAGATCCCCATTCTCCGACAGCTTAAACC
>Inf-fsoF-F(SEQ ID NO:17)
TCGAGCTCGGTACCCTCCCGTGAAACAATGAATCA
>Inf-fsoF-R(SEQ ID NO:18)
CTACTACAGATCCCCGAGACGAAGATGGGCATTTA
>Inf-pAdeA-Parm-F(SEQ ID NO:19)
GCAGGTCGACTCTAGACGACTCCAATCTTCAAGAGC
>Inf-pTAex3-Tamy-R1(SEQ ID NO:20)
AACGCGCTCGCGAGCAAGTACCATACAGTACCGCG
>Inf-pTAex3-Parm-F1(SEQ ID NO:21)
GCTCGCGAGCGCGTTCCACTGCATCATCAGTCTAG
>Inf-pAdeA-Tamy-R(SEQ ID NO:22)
TAGTAGATCCTCTAGAGTAAGATACATGAGCTTCGG
>Inf-efuA(TC)-F(SEQ ID NO:23)
TCGAGCTCGGTACCCATGCCGTCTTACCACAACAC
>Inf-efuA(TC)fsoA(GT)-R(SEQ ID NO:24)
CAAGAGTACGTTCGGACGGT
>Inf-efuA(TC)fsoA(GT)-F(SEQ ID NO:25)
CCGAACGTACTCTTGATGACTCGGCACGTTGTCAC
>Inf-fsoA(GT)-R(SEQ ID NO:26)
CTACTACAGATCCCCCTATCCTTGACAGCCCTCAC
>FsoE-Y143A-F(SEQ ID NO:27)
GCATTCCACGTGGACTTAACGCCATGGAGCATGCGTTTGGTT
>FsoE-Y143A-R(SEQ ID NO:28)
GTTAAGTCCACGTGGAATGC
>FsoE-F148A-F(SEQ ID NO:29)
>TTAACTACATGGAGCATGCGGCCGGTTGCCCCCATGAGTTTG
>FsoE-F148A-R(SEQ ID NO:30)
CGCATGCTCCATGTAGTTAA
>FsoE-F259A-F(SEQ ID NO:31)
ATCGGCGTGTCAAGTCTATGGCCATGGGCGTTCCCAAGTGGC
>FsoE-F259A-R(SEQ ID NO:32)
CATAGACTTGACACGCCGAT
>FsoE-R315A-F(SEQ ID NO:33)
GGAGCCGGTATACCCGCGTTGCCCAGAAGTTGCTTACCAAAC
>FsoE-R315A-R(SEQ ID NO:34)
AACGCGGGTATACCGGCTCC
>FsoE-F337A-F(SEQ ID NO:35)
GTGCGGCTGAGAACCTCGCTGCCATCTGGGCGTACGTTACCA
>FsoE-F337A-R(SEQ ID NO:36)
AGCGAGGTTCTCAGCCGCAC
>FsoE-W339A-F(SEQ ID NO:37)
CTGAGAACCTCGCTTTCATCGCCGCGTACGTTACCACTTTC
>FsoE-W339A-R(SEQ ID NO:38)
GATGAAAGCGAGGTTCTCAG
>FsoE-N344A-F(SEQ ID NO:39)
ACTCTTCCAGTACAAACGCCGCCTCTGTCCCTTCTGCTATCT
>FsoE-N344A-R(SEQ ID NO:40)
GGCGTTTGTACTGGAAGAGT
>FsoE-C517A-F(SEQ ID NO:41)
TTGGTGGTGGGCGACAGTTGGCCCCCGGCCGTCATTTTGCCA
>FsoE-C517A-R(SEQ ID NO:42)
CAACTGTCGCCCACCACCAA
>FsoE-F557A-F(SEQ ID NO:43)
CTGATGAGGGCGTCTACGGGGCCGGGACGATGCCTCCGAACG
>FsoE-F557A-R(SEQ ID NO:44)
CCCGTAGACGCCCTCATCAG
>FsoE-Y143F-F(SEQ ID NO:45)
GCATTCCACGTGGACTTAACTTTATGGAGCATGCGTTTGGTT
参考文献:
1.Schwartz,R.E.;Smith,S.K.;Onishi,J.C.;Meinz,M.;Kurtz,M.;Giacobbe,R.A.;Wilson,K.E.;Liesch,J.;Zink,D.;Horn,W.;Morris,S.;Cabello,A.;Vicente,F.Isolation and Structural Determination ofEnfumafungin,a TriterpeneGlycoside Antifungal Agent That is a Specific Inhibitor ofGlucanSynthesis.J.Am.Chem.Soc.2000,122,4882-4886.
2.Joshi,B.K.;Gloer,J.B.;Wicklow,D.T.BioactiveNatural Products from aSclerotium-Colonizing Isolate ofHumicolafuscoatra.J.Nat.Prod.2002,65,1734-1737.
3.Deyrup,S.T.;Gloer,J.B.;O’Donnell,K.;Wicklow,D.T.Kolokosides A-D:Triterpenoid Glycosides from aHawaiian Isolate ofXylaria sp.J.Nat.Prod.2007,70,378-382.
4.Shigematsu,N.;Tsujii,E.;Kayakiri,N.;Takase,S.;Tanaka,H.;Tada,T.WF11605,an Antagonist ofLeukotriene B4 Produced by a Fungus.J.Antibiot.(Tokyo)1992,45,704-708.
5.Phillips,N.A.;Rocktashel,M.;Merjanian,L.Ibrexafungerp for theTreatment of Vulvovaginal Candidiasis:Design,Development and Place inTherapy.Drug Des.Devel.Ther.2023,17,363-367.
6.Kuhnert,E.;Li,Y.;Lan,N.;Yue,Q.;Chen,L.;Cox,R.J.;An,Z.;Yokoyama,K.;Bills,G.F.Enfumafungin Synthase Represents a Novel Lineage of FungalTriterpene Cyclases.Environ.Microbiol.2018,20,3325-3342.
Claims (13)
1.一种分离的或合成的多肽,其特征在于,所述多肽选自:
a)包含SEQ ID NO:1所示氨基酸序列的FsoA多肽,
b)包含SEQ ID NO:2所示氨基酸序列的FsoD多肽,
c)包含SEQ ID NO:3所示氨基酸序列的FsoE多肽,
d)包含SEQ ID NO:4所示氨基酸序列的FsoF多肽,和
e)包含SEQ ID NO:5所示氨基酸序列的EfuA(TC)FsoA(GT)多肽。
2.一种多核苷酸,其特征在于,所述多核苷酸编码权利要求1所述的多肽。
3.根据权利要求2所述的多核苷酸,其特征在于,所述多核苷酸选自:
(i)包含SEQ ID NO:6所示序列的核苷酸序列;
(ii)包含SEQ ID NO:7所示序列的核苷酸序列;
(iii)包含SEQ ID NO:8所示序列的核苷酸序列;
(iv)包含SEQ ID NO:9所示序列的核苷酸序列;和
(v)包含SEQ ID NO:10所示序列的核苷酸序列。
4.载体,其特征在于,所述载体包含权利要求2或3所述的多核苷酸。
5.宿主细胞,其特征在于,所述细胞包含权利要求4所述的载体;优选地,所述细胞为真菌细胞或细菌细胞;更优选地,所述真菌细胞选自棕黑腐质霉(Humicolafuscoatra)和米曲霉(Aspergillusoryzae)细胞;所述细菌细胞为大肠杆菌(Escherichia coli)细胞。
6.一种安麻吩金类抗生素fuscoatroside(1)或其前体的生物合成方法,其包括将权利要求1的a)-d)的多肽中的一种或多种与2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖(UDPG)底物接触;优选地,所述合成方法包括:
在宿主细胞,优选米曲霉宿主细胞中表达权利要求1的a)-d)的多肽中的一种或多种,使其催化底物合成fuscoatroside或其前体;和从所述宿主细胞分离fuscoatroside或其前体,所述化合物fuscoatroside的结构如下:
7.一种安麻吩金前体化合物13或其前体的生物合成方法,其包括将权利要求1的b)-e)的多肽中的一种或多种与2,3(S)-环氧角鲨烯和尿苷二磷酸葡萄糖(UDPG)底物接触;优选地,所述合成方法包括:
在宿主细胞,优选米曲霉宿主细胞中表达权利要求1的b)-e)的多肽中的一种或多种,使其催化底物合成化合物13或其前体;和从所述宿主细胞分离化合物13或其前体,所述化合物13的结构如下:
8.一种催化羊齿烷型化合物的E-环C19-C20位发生裂解的多肽,其包含与SEQ ID NO:3所示氨基酸序列的R315、F148、F259、F337、W339、F557、N344和Y143对应的氨基酸残基。
9.一种催化羊齿烷型化合物的E-环C19-C20位发生裂解的方法,其包括将权利要求1所述的FsoE多肽或权利要求10所述的多肽与羊齿烷型化合物接触;优选地,所述方法包括在宿主细胞,优选米曲霉宿主细胞中表达权利要求1所述的FsoE多肽或权利要求10所述的多肽,使其催化羊齿烷型化合物的E-环C19-C20位发生裂解。
10.根据权利要求9所述的方法,其中所述的羊齿烷型化合物结构为:
11.一种催化羊齿烷型化合物的E-环C19-C20位发生裂解的多肽的催化位点,其是与SEQ ID NO:3所示氨基酸序列的R315、F148、F259、F337、W339、F557、N344和Y143对应的氨基酸残基。
12.权利要求1或8所述的多肽、权利要求2或3所述的多核苷酸、权利要求4所述的载体或权利要求5所述的宿主细胞在安麻吩金类抗生素合成中的用途。
13.一种试剂盒,其特征在于,包含权利要求1或8所述的多肽、权利要求2或3所述的多核苷酸、权利要求4所述的载体、或权利要求5所述的宿主细胞。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202410346704.8A CN120700007A (zh) | 2024-03-25 | 2024-03-25 | 安麻吩金类抗生素的合成基因簇与合成方法 |
| PCT/CN2025/084271 WO2025201218A1 (zh) | 2024-03-25 | 2025-03-24 | 安麻吩金类抗生素的合成基因簇与合成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202410346704.8A CN120700007A (zh) | 2024-03-25 | 2024-03-25 | 安麻吩金类抗生素的合成基因簇与合成方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN120700007A true CN120700007A (zh) | 2025-09-26 |
Family
ID=97115800
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202410346704.8A Pending CN120700007A (zh) | 2024-03-25 | 2024-03-25 | 安麻吩金类抗生素的合成基因簇与合成方法 |
Country Status (2)
| Country | Link |
|---|---|
| CN (1) | CN120700007A (zh) |
| WO (1) | WO2025201218A1 (zh) |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114134054B (zh) * | 2021-11-01 | 2024-06-18 | 武汉合生科技有限公司 | 一种高产萜类化合物的米曲霉底盘菌株及萜类天然产物自动化高通量挖掘平台的搭建 |
| CN114350524B (zh) * | 2022-01-07 | 2024-04-23 | 暨南大学附属第一医院(广州华侨医院) | Mycoleptodiscin型吲哚倍半萜化合物、其生物合成方法及其用途 |
| CN117551163B (zh) * | 2023-09-26 | 2026-04-28 | 中国人民解放军海军军医大学 | 一种安麻吩金类似物及其制备方法与应用 |
-
2024
- 2024-03-25 CN CN202410346704.8A patent/CN120700007A/zh active Pending
-
2025
- 2025-03-24 WO PCT/CN2025/084271 patent/WO2025201218A1/zh active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| WO2025201218A1 (zh) | 2025-10-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20200087220A (ko) | 생물 전환으로 타우로우루소데옥시콜산을 제조하는 방법 및 그 응용 | |
| CN115161208B (zh) | 酿酒酵母基因工程菌及其生产葫芦素中间体的应用 | |
| CN112142585B (zh) | Mangicols二倍半萜化合物、合成方法、基因簇、核酸分子、构建体及其应用 | |
| CN110396507B (zh) | 源自Cnuibacter physcomitrellae的L-泛解酸内酯脱氢酶 | |
| US20250236894A1 (en) | Application of transgenic saccharomyces cerevisiae engineering bacteria of hemsleya chinensis cytochrome oxidase in preparation of cucurbitacin intermediate | |
| JPH0622780A (ja) | 新規真菌株及びそれを用いた抗生物質産生方法 | |
| CN113402357B (zh) | 一类5-12-5三环二倍半萜骨架化合物及其制备 | |
| CN107574173A (zh) | 一种重组质粒及其用于构建红曲色素高产菌株的方法 | |
| CN114350524A (zh) | Mycoleptodiscin型吲哚倍半萜化合物、其生物合成方法及其用途 | |
| CN101613711B (zh) | 安哥拉糖胺糖基合成酶及糖基转移酶多基因共表达系统的构建及其应用 | |
| CN114940980B (zh) | 一类倍半萜聚酮合成基因及其应用 | |
| CN120700007A (zh) | 安麻吩金类抗生素的合成基因簇与合成方法 | |
| CN119286746A (zh) | 高产9α-羟基雄甾-4-烯-3,17-二酮的基因工程菌及其构建方法与应用 | |
| CN118126969A (zh) | 氧化酶突变体、dna分子、表达载体、宿主细胞及其应用与3-羟基补身醇的制备方法 | |
| CN113025549B (zh) | 一种星孢菌素骨架化合物的生物糖基化合成体系及其合成方法 | |
| CN113444737A (zh) | 细胞色素p450酶及其在合成灵芝三萜类化合物中的应用 | |
| CN107903227B (zh) | 琥珀酸酐类化合物、与其相关的基因和蛋白及其制备方法 | |
| CN120005914B (zh) | 雪胆细胞色素氧化酶HcCYP89A140基因及其应用 | |
| WO2020177568A1 (zh) | 新型LL-D49194 α1类似物,及其制备方法和应用 | |
| CN115247179B (zh) | 一种聚酮化合物骨架及其后修饰物的生物合成基因簇及其应用 | |
| CN114561309B (zh) | 一种亚细胞区室化生产衣康酸的解脂耶氏酵母工程菌及应用 | |
| CN111349647B (zh) | CRISPR/Cas9介导的附加内源RBS的微生物次级代谢产物强化启动系统 | |
| CN114410604B (zh) | 环氧化物水解酶及其编码基因和应用 | |
| CN118834774A (zh) | 一种米曲霉工程菌、构建方法及用大米生产灵芝酸前体hldo和灵芝酸hldoa的应用和方法 | |
| CN120648663A (zh) | P450酶和酶组合物、核酸、表达载体、生物工程菌株、方法及应用 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |