RU2810729C2 - Production of fucosylated oligosaccharides in bacillus - Google Patents
Production of fucosylated oligosaccharides in bacillus Download PDFInfo
- Publication number
- RU2810729C2 RU2810729C2 RU2021137548A RU2021137548A RU2810729C2 RU 2810729 C2 RU2810729 C2 RU 2810729C2 RU 2021137548 A RU2021137548 A RU 2021137548A RU 2021137548 A RU2021137548 A RU 2021137548A RU 2810729 C2 RU2810729 C2 RU 2810729C2
- Authority
- RU
- Russia
- Prior art keywords
- bacillus
- coli
- cell
- fucose
- gdp
- Prior art date
Links
- 241000193830 Bacillus <bacterium> Species 0.000 title claims abstract description 184
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 40
- 229920001542 oligosaccharide Polymers 0.000 title claims description 82
- 150000002482 oligosaccharides Chemical class 0.000 title claims description 82
- 210000004027 cell Anatomy 0.000 claims abstract description 185
- 235000014469 Bacillus subtilis Nutrition 0.000 claims abstract description 88
- 241000588724 Escherichia coli Species 0.000 claims abstract description 76
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 64
- LQEBEXMHBLQMDB-JGQUBWHWSA-N GDP-beta-L-fucose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 LQEBEXMHBLQMDB-JGQUBWHWSA-N 0.000 claims abstract description 59
- LQEBEXMHBLQMDB-UHFFFAOYSA-N GDP-L-fucose Natural products OC1C(O)C(O)C(C)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C3=C(C(N=C(N)N3)=O)N=C2)O1 LQEBEXMHBLQMDB-UHFFFAOYSA-N 0.000 claims abstract description 50
- SNFSYLYCDAVZGP-UHFFFAOYSA-N UNPD26986 Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(OC(O)C(O)C2O)CO)OC(CO)C(O)C1O SNFSYLYCDAVZGP-UHFFFAOYSA-N 0.000 claims abstract description 37
- 229940062827 2'-fucosyllactose Drugs 0.000 claims abstract description 31
- HWHQUWQCBPAQQH-UHFFFAOYSA-N 2-O-alpha-L-Fucosyl-lactose Natural products OC1C(O)C(O)C(C)OC1OC1C(O)C(O)C(CO)OC1OC(C(O)CO)C(O)C(O)C=O HWHQUWQCBPAQQH-UHFFFAOYSA-N 0.000 claims abstract description 31
- 108010060845 lactose permease Proteins 0.000 claims abstract description 29
- 230000000694 effects Effects 0.000 claims abstract description 23
- 238000012217 deletion Methods 0.000 claims abstract description 18
- 230000037430 deletion Effects 0.000 claims abstract description 18
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims abstract description 17
- 244000063299 Bacillus subtilis Species 0.000 claims abstract description 16
- 230000002779 inactivation Effects 0.000 claims abstract description 15
- 241000894007 species Species 0.000 claims abstract description 9
- 101100280818 Escherichia coli (strain K12) fcl gene Proteins 0.000 claims abstract description 7
- 230000028070 sporulation Effects 0.000 claims abstract description 6
- 101150088678 manB gene Proteins 0.000 claims abstract description 3
- 210000000130 stem cell Anatomy 0.000 claims abstract description 3
- HWHQUWQCBPAQQH-BWRPKUOHSA-N 2-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O HWHQUWQCBPAQQH-BWRPKUOHSA-N 0.000 claims abstract 8
- 101100075927 Aspergillus aculeatus mndA gene Proteins 0.000 claims abstract 2
- 101100022282 Escherichia coli O157:H7 manC2 gene Proteins 0.000 claims abstract 2
- 108050006002 RNA polymerase sigma factor FliA Proteins 0.000 claims abstract 2
- 230000001771 impaired effect Effects 0.000 claims abstract 2
- 101150032120 manC gene Proteins 0.000 claims abstract 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 claims description 40
- 239000008101 lactose Substances 0.000 claims description 39
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 12
- 101710098620 Alpha-1,2-fucosyltransferase Proteins 0.000 claims description 9
- 101150021436 yesZ gene Proteins 0.000 claims description 7
- 238000012258 culturing Methods 0.000 claims description 6
- 102000005936 beta-Galactosidase Human genes 0.000 claims 2
- 238000000605 extraction Methods 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 18
- 239000000126 substance Substances 0.000 abstract description 4
- 230000014509 gene expression Effects 0.000 description 55
- 239000002773 nucleotide Substances 0.000 description 47
- 125000003729 nucleotide group Chemical group 0.000 description 47
- 230000015572 biosynthetic process Effects 0.000 description 37
- 108700026244 Open Reading Frames Proteins 0.000 description 30
- SNFSYLYCDAVZGP-OLAZETNGSA-N 2'-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@H](O)[C@@H]1O SNFSYLYCDAVZGP-OLAZETNGSA-N 0.000 description 28
- 108010019236 Fucosyltransferases Proteins 0.000 description 27
- 102000006471 Fucosyltransferases Human genes 0.000 description 26
- 108020004705 Codon Proteins 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 21
- 102000004169 proteins and genes Human genes 0.000 description 21
- 239000002609 medium Substances 0.000 description 19
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 18
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 18
- 239000000758 substrate Substances 0.000 description 18
- 108090000765 processed proteins & peptides Proteins 0.000 description 17
- 108090000769 Isomerases Proteins 0.000 description 16
- PTVXQARCLQPGIR-SXUWKVJYSA-N beta-L-fucose 1-phosphate Chemical compound C[C@@H]1O[C@H](OP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O PTVXQARCLQPGIR-SXUWKVJYSA-N 0.000 description 16
- 235000020256 human milk Nutrition 0.000 description 16
- 230000010354 integration Effects 0.000 description 16
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 15
- 108010062427 GDP-mannose 4,6-dehydratase Proteins 0.000 description 15
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 102000004195 Isomerases Human genes 0.000 description 14
- 108010064833 guanylyltransferase Proteins 0.000 description 14
- 108091000115 phosphomannomutase Proteins 0.000 description 14
- WJPIUUDKRHCAEL-UHFFFAOYSA-N 3FL Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(O)C1O WJPIUUDKRHCAEL-UHFFFAOYSA-N 0.000 description 13
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 13
- 102000002312 GDPmannose 4,6-dehydratase Human genes 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 229920001184 polypeptide Polymers 0.000 description 13
- 101150065268 tapA gene Proteins 0.000 description 13
- AUNPEJDACLEKSC-ZAYDSPBTSA-N 3-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O AUNPEJDACLEKSC-ZAYDSPBTSA-N 0.000 description 12
- 108010038016 Mannose-1-phosphate guanylyltransferase Proteins 0.000 description 12
- 102000030605 Phosphomannomutase Human genes 0.000 description 12
- 239000001963 growth medium Substances 0.000 description 12
- 210000004251 human milk Anatomy 0.000 description 12
- 238000004520 electroporation Methods 0.000 description 11
- 230000037361 pathway Effects 0.000 description 11
- 102100026189 Beta-galactosidase Human genes 0.000 description 10
- AEMOLEFTQBMNLQ-VANFPWTGSA-N D-mannopyranuronic acid Chemical compound OC1O[C@H](C(O)=O)[C@@H](O)[C@H](O)[C@@H]1O AEMOLEFTQBMNLQ-VANFPWTGSA-N 0.000 description 10
- 101001021764 Escherichia coli (strain K12) L-fucose-proton symporter Proteins 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 229920001817 Agar Polymers 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 9
- 239000008272 agar Substances 0.000 description 9
- 230000001580 bacterial effect Effects 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 101150106565 gmd gene Proteins 0.000 description 9
- 230000001717 pathogenic effect Effects 0.000 description 9
- 101150082349 pmi gene Proteins 0.000 description 9
- MVMSCBBUIHUTGJ-GDJBGNAASA-N GDP-alpha-D-mannose Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=C(NC(=O)C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O MVMSCBBUIHUTGJ-GDJBGNAASA-N 0.000 description 8
- SHZGCJCMOBCMKK-PQMKYFCFSA-N L-Fucose Natural products C[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O SHZGCJCMOBCMKK-PQMKYFCFSA-N 0.000 description 8
- 239000006137 Luria-Bertani broth Substances 0.000 description 8
- 239000002253 acid Substances 0.000 description 8
- 150000001413 amino acids Chemical group 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- 239000013613 expression plasmid Substances 0.000 description 8
- 101150033422 gmuF gene Proteins 0.000 description 8
- 230000003834 intracellular effect Effects 0.000 description 8
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 7
- 239000003242 anti bacterial agent Substances 0.000 description 7
- 230000001588 bifunctional effect Effects 0.000 description 7
- FZIVHOUANIQOMU-UHFFFAOYSA-N lacto-N-fucopentaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)OC(CO)C2O)NC(C)=O)OC(CO)C(O)C1O FZIVHOUANIQOMU-UHFFFAOYSA-N 0.000 description 7
- 244000052769 pathogen Species 0.000 description 7
- 238000003752 polymerase chain reaction Methods 0.000 description 7
- 238000004064 recycling Methods 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- MVMSCBBUIHUTGJ-UHFFFAOYSA-N 10108-97-1 Natural products C1=2NC(N)=NC(=O)C=2N=CN1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O MVMSCBBUIHUTGJ-UHFFFAOYSA-N 0.000 description 6
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- 101100325906 Bacillus subtilis (strain 168) ganA gene Proteins 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 241000606124 Bacteroides fragilis Species 0.000 description 6
- 108700010070 Codon Usage Proteins 0.000 description 6
- FZIVHOUANIQOMU-YIHIYSSUSA-N alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@H](O)[C@@H]1O FZIVHOUANIQOMU-YIHIYSSUSA-N 0.000 description 6
- 229940088710 antibiotic agent Drugs 0.000 description 6
- 230000002255 enzymatic effect Effects 0.000 description 6
- 101150001899 lacY gene Proteins 0.000 description 6
- 101150026430 manA gene Proteins 0.000 description 6
- 230000000813 microbial effect Effects 0.000 description 6
- 235000016709 nutrition Nutrition 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 5
- 108010045674 Fucose-1-phosphate guanylyltransferase Proteins 0.000 description 5
- 102100040648 L-fucose kinase Human genes 0.000 description 5
- TVVLIFCVJJSLBL-SEHWTJTBSA-N Lacto-N-fucopentaose V Chemical compound O[C@H]1C(O)C(O)[C@H](C)O[C@H]1OC([C@@H](O)C=O)[C@@H](C(O)CO)O[C@H]1[C@H](O)[C@@H](OC2[C@@H](C(OC3[C@@H](C(O)C(O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@@H](CO)O1 TVVLIFCVJJSLBL-SEHWTJTBSA-N 0.000 description 5
- 150000007513 acids Chemical class 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 108010001671 galactoside 3-fucosyltransferase Proteins 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 238000003753 real-time PCR Methods 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 101100325905 Bacillus licheniformis (strain ATCC 14580 / DSM 13 / JCM 2505 / CCUG 7422 / NBRC 12200 / NCIMB 9375 / NCTC 10341 / NRRL NRS-1264 / Gibson 46) lacA gene Proteins 0.000 description 4
- 108010078791 Carrier Proteins Proteins 0.000 description 4
- 101100447641 Cellvibrio japonicus (strain Ueda107) ganB gene Proteins 0.000 description 4
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 4
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 4
- 102100037047 Fucose-1-phosphate guanylyltransferase Human genes 0.000 description 4
- RTVRUWIBAVHRQX-PMEZUWKYSA-N Fucosyllactose Chemical compound C([C@H]1O[C@@H]([C@H]([C@@H](O[C@@H]2[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@@H]1O)O)OC)O[C@H]1OC[C@@H](O)[C@H](O)[C@@H]1O RTVRUWIBAVHRQX-PMEZUWKYSA-N 0.000 description 4
- 229930195725 Mannitol Natural products 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- RCQTVEFBFUNTGM-UHFFFAOYSA-N bacillibactin Natural products CC1OC(=O)C(NC(=O)CNC(=O)C=2C(=C(O)C=CC=2)O)C(C)OC(=O)C(NC(=O)CNC(=O)C=2C(=C(O)C=CC=2)O)C(C)OC(=O)C1NC(=O)CNC(=O)C1=CC=CC(O)=C1O RCQTVEFBFUNTGM-UHFFFAOYSA-N 0.000 description 4
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- RCQTVEFBFUNTGM-BDVHUIKKSA-N corynebactin Chemical compound N([C@@H]1C(=O)O[C@@H]([C@@H](C(=O)O[C@H](C)[C@H](NC(=O)CNC(=O)C=2C(=C(O)C=CC=2)O)C(=O)O[C@@H]1C)NC(=O)CNC(=O)C=1C(=C(O)C=CC=1)O)C)C(=O)CNC(=O)C1=CC=CC(O)=C1O RCQTVEFBFUNTGM-BDVHUIKKSA-N 0.000 description 4
- 235000013350 formula milk Nutrition 0.000 description 4
- 108010083136 fucokinase Proteins 0.000 description 4
- 235000021472 generally recognized as safe Nutrition 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 238000009776 industrial production Methods 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 210000000936 intestine Anatomy 0.000 description 4
- 239000000594 mannitol Substances 0.000 description 4
- 235000010355 mannitol Nutrition 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 235000021251 pulses Nutrition 0.000 description 4
- 101150001065 tapB gene Proteins 0.000 description 4
- 229960004799 tryptophan Drugs 0.000 description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 241000193738 Bacillus anthracis Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 101100449690 Bacillus licheniformis (strain ATCC 14580 / DSM 13 / JCM 2505 / CCUG 7422 / NBRC 12200 / NCIMB 9375 / NCTC 10341 / NRRL NRS-1264 / Gibson 46) blaSE gene Proteins 0.000 description 3
- 101100043757 Bacillus subtilis (strain 168) bpr gene Proteins 0.000 description 3
- 101100043755 Bacillus subtilis (strain 168) epr gene Proteins 0.000 description 3
- 101100238373 Bacillus subtilis (strain 168) mpr gene Proteins 0.000 description 3
- 101100460774 Bacillus subtilis (strain 168) nprB gene Proteins 0.000 description 3
- 101100049732 Bacillus subtilis (strain 168) wprA gene Proteins 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- 206010012735 Diarrhoea Diseases 0.000 description 3
- 101100381938 Dichelobacter nodosus bprV gene Proteins 0.000 description 3
- 101710089384 Extracellular protease Proteins 0.000 description 3
- PNHLMHWWFOPQLK-BKUUWRAGSA-N GDP-4-dehydro-6-deoxy-alpha-D-mannose Chemical compound O[C@H]1[C@@H](O)C(=O)[C@@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(NC(N)=N3)=O)N=C2)O1 PNHLMHWWFOPQLK-BKUUWRAGSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 3
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 101710149136 Protein Vpr Proteins 0.000 description 3
- 102000004139 alpha-Amylases Human genes 0.000 description 3
- 108090000637 alpha-Amylases Proteins 0.000 description 3
- HXXFSFRBOHSIMQ-RWOPYEJCSA-L alpha-D-mannose 1-phosphate(2-) Chemical compound OC[C@H]1O[C@H](OP([O-])([O-])=O)[C@@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-RWOPYEJCSA-L 0.000 description 3
- 229940024171 alpha-amylase Drugs 0.000 description 3
- 101150009206 aprE gene Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- DMYPRRDPOMGEAK-XWDFSUOISA-N beta-D-Galp-(1->3)-[alpha-L-Fucp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-[alpha-L-Fucp-(1->3)]-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O4)O)[C@H](O[C@H]4[C@H]([C@H](O)[C@H](O)[C@H](C)O4)O)[C@@H](CO)O3)NC(C)=O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)OC(O)[C@@H]1O DMYPRRDPOMGEAK-XWDFSUOISA-N 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 101150011371 dapA gene Proteins 0.000 description 3
- 150000002016 disaccharides Chemical class 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- 101150092956 fucP gene Proteins 0.000 description 3
- 101150037328 ganA gene Proteins 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- DMYPRRDPOMGEAK-UHFFFAOYSA-N lacto-N-difucohexaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(C(O)C(O)C(CO)O4)O)C(OC4C(C(O)C(O)C(C)O4)O)C(CO)O3)NC(C)=O)C(O)C(CO)O2)O)C(CO)OC(O)C1O DMYPRRDPOMGEAK-UHFFFAOYSA-N 0.000 description 3
- IEQCXFNWPAHHQR-UHFFFAOYSA-N lacto-N-neotetraose Natural products OCC1OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC1OC(CO)C(O)C(O)C1O IEQCXFNWPAHHQR-UHFFFAOYSA-N 0.000 description 3
- -1 lacto-N-neotetraose Chemical class 0.000 description 3
- 235000013336 milk Nutrition 0.000 description 3
- 239000008267 milk Substances 0.000 description 3
- 210000004080 milk Anatomy 0.000 description 3
- 101150112117 nprE gene Proteins 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- 101150030737 yvmC gene Proteins 0.000 description 3
- ZPEFXARQZVAHGO-DCSYEGIMSA-N 3,3'-neotrehalosadiamine Chemical compound O[C@@H]1[C@@H](N)[C@H](O)[C@@H](CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](N)[C@H](O)[C@@H](CO)O1 ZPEFXARQZVAHGO-DCSYEGIMSA-N 0.000 description 2
- VLKSXJAPRDAENT-OWGHDAAGSA-N 3-[(3r,6r,9s,16s,19r,22s,25s)-3,9-bis(2-amino-2-oxoethyl)-16-[(1r)-1-hydroxyethyl]-19-(hydroxymethyl)-6-[(4-hydroxyphenyl)methyl]-13-octyl-2,5,8,11,15,18,21,24-octaoxo-1,4,7,10,14,17,20,23-octazabicyclo[23.3.0]octacosan-22-yl]propanoic acid Chemical compound C([C@H]1NC(=O)[C@H](CC(N)=O)NC(=O)CC(NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]2CCCN2C(=O)[C@@H](CC(N)=O)NC1=O)CCCCCCCC)C1=CC=C(O)C=C1 VLKSXJAPRDAENT-OWGHDAAGSA-N 0.000 description 2
- RCIPRGNHNAEGHR-ZLHAWHIKSA-N 3-[(3s,6s,13s,16r,19r,22r,25r,28s)-6,13,19,22-tetrakis(2-amino-2-oxoethyl)-16-(hydroxymethyl)-25-[(4-hydroxyphenyl)methyl]-10-(11-methyltridecyl)-2,5,8,12,15,18,21,24,27-nonaoxo-1,4,7,11,14,17,20,23,26-nonazabicyclo[26.3.0]hentriacontan-3-yl]propanamide Chemical compound C([C@H]1NC(=O)[C@@H]2CCCN2C(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CC(NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](CO)NC(=O)[C@@H](CC(N)=O)NC(=O)[C@@H](CC(N)=O)NC1=O)CCCCCCCCCCC(C)CC)C1=CC=C(O)C=C1 RCIPRGNHNAEGHR-ZLHAWHIKSA-N 0.000 description 2
- 101100098790 Aeromonas hydrophila tapC gene Proteins 0.000 description 2
- 101001027098 Arabidopsis thaliana Fucose-1-phosphate guanylyltransferase Proteins 0.000 description 2
- 101000885514 Arabidopsis thaliana Putative fucosyltransferase-like protein Proteins 0.000 description 2
- 108700016166 Bacillus subtilis sboA Proteins 0.000 description 2
- XFOUAXMJRHNTOP-UHFFFAOYSA-N Bacilysin Natural products CC(N)C(=O)NC(C(O)=O)CC1CCC(=O)C2OC12 XFOUAXMJRHNTOP-UHFFFAOYSA-N 0.000 description 2
- 108010062877 Bacteriocins Proteins 0.000 description 2
- 241000606125 Bacteroides Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- AFWTZXXDGQBIKW-UHFFFAOYSA-N C14 surfactin Natural products CCCCCCCCCCCC1CC(=O)NC(CCC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)O1 AFWTZXXDGQBIKW-UHFFFAOYSA-N 0.000 description 2
- JSWKNDSDVHJUKY-MNVIWFPGSA-N CC[C@@H](C)[C@@H]1NC(=O)[C@@H]2CS[C@@H](C)[C@@H](NC(=O)[C@@H]3CS[C@@H](C)[C@@H](NC(=O)[C@H](Cc4ccccc4)NC(=O)[C@@H]4NC(=O)[C@@H]([NH3+])CS[C@H]4C)C(=O)N[C@@H](CC(C)C)C(=O)N4CCC[C@H]4C(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N3)C(=O)N[C@@H](CC(C)C)C(=O)NC([C@H](C)S\C=C/NC1=O)C(=O)NC(=C)C(=O)N[C@@H](CCC([O-])=O)C(=O)N2 Chemical compound CC[C@@H](C)[C@@H]1NC(=O)[C@@H]2CS[C@@H](C)[C@@H](NC(=O)[C@@H]3CS[C@@H](C)[C@@H](NC(=O)[C@H](Cc4ccccc4)NC(=O)[C@@H]4NC(=O)[C@@H]([NH3+])CS[C@H]4C)C(=O)N[C@@H](CC(C)C)C(=O)N4CCC[C@H]4C(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N3)C(=O)N[C@@H](CC(C)C)C(=O)NC([C@H](C)S\C=C/NC1=O)C(=O)NC(=C)C(=O)N[C@@H](CCC([O-])=O)C(=O)N2 JSWKNDSDVHJUKY-MNVIWFPGSA-N 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- SGGJJTTZBRPIKP-GGQKFFLHSA-N C\C=C1/NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](Cc2ccccc2)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(C)=O)[C@@H](C)OC1=O)C(C)C Chemical compound C\C=C1/NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](Cc2ccccc2)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(C)=O)[C@@H](C)OC1=O)C(C)C SGGJJTTZBRPIKP-GGQKFFLHSA-N 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- NBSCHQHZLSJFNQ-QTVWNMPRSA-N D-Mannose-6-phosphate Chemical compound OC1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H](O)[C@@H]1O NBSCHQHZLSJFNQ-QTVWNMPRSA-N 0.000 description 2
- ZUWUQYGHRURWCL-UHFFFAOYSA-N Difficidin Natural products CC1CC=CC=CC=CCCCC(OP(O)(O)=O)C(C)=CC=CCC(CCC(C)=CC=C)OC(=O)CC1=C ZUWUQYGHRURWCL-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 108010045656 Mycobacillin Proteins 0.000 description 2
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 2
- ACFIXJIJDZMPPO-NNYOXOHSSA-N NADPH Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](OP(O)(O)=O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 ACFIXJIJDZMPPO-NNYOXOHSSA-N 0.000 description 2
- 241001263478 Norovirus Species 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 241000831652 Salinivibrio sharmensis Species 0.000 description 2
- 101710084578 Short neurotoxin 1 Proteins 0.000 description 2
- 108010056079 Subtilisins Proteins 0.000 description 2
- 102000005158 Subtilisins Human genes 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 108010066353 TL 119 Proteins 0.000 description 2
- 101710182532 Toxin a Proteins 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- ZUWUQYGHRURWCL-XUIVTPDHSA-N [(4e,6e,12z,14z,16e)-7,19-dimethyl-2-[(3e)-3-methylhexa-3,5-dienyl]-20-methylidene-22-oxo-1-oxacyclodocosa-4,6,12,14,16-pentaen-8-yl] dihydrogen phosphate Chemical compound CC1C\C=C\C=C/C=C\CCCC(OP(O)(O)=O)\C(C)=C\C=C\CC(CC\C(C)=C\C=C)OC(=O)CC1=C ZUWUQYGHRURWCL-XUIVTPDHSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- CMQZRJBJDCVIEY-JEOLMMCMSA-N alpha-L-Fucp-(1->3)-[beta-D-Galp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O[C@@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)[C@@H]1NC(C)=O CMQZRJBJDCVIEY-JEOLMMCMSA-N 0.000 description 2
- RQNFGIWYOACERD-OCQMRBNYSA-N alpha-L-Fucp-(1->4)-[alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](CO)O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@@H]2NC(C)=O)O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)O[C@H](CO)[C@H](O)[C@@H]1O RQNFGIWYOACERD-OCQMRBNYSA-N 0.000 description 2
- DUKURNFHYQXCJG-JEOLMMCMSA-N alpha-L-Fucp-(1->4)-[beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)O[C@@H]1CO DUKURNFHYQXCJG-JEOLMMCMSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 108010026917 bacillibactin Proteins 0.000 description 2
- 108700023668 bacilysin Proteins 0.000 description 2
- XFOUAXMJRHNTOP-PFQXTLEHSA-N bacilysin Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)C[C@@H]1CCC(=O)[C@@H]2O[C@H]12 XFOUAXMJRHNTOP-PFQXTLEHSA-N 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- RKLXDNHNLPUQRB-TVJUEJKUSA-N chembl564271 Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]2C(C)SC[C@H](N[C@@H](CC(N)=O)C(=O)NC(=O)[C@@H](NC2=O)CSC1C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NC(=C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NC(=O)C(=C\C)/NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]2NC(=O)CNC(=O)[C@@H]3CCCN3C(=O)[C@@H](NC(=O)[C@H]3N[C@@H](CC(C)C)C(=O)NC(=O)C(=C)NC(=O)CC[C@H](NC(=O)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC=4C5=CC=CC=C5NC=4)CSC3)C(O)=O)C(C)SC2)C(C)C)C(C)SC1)C1=CC=CC=C1 RKLXDNHNLPUQRB-TVJUEJKUSA-N 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 108700001679 corynebactin Proteins 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229960003276 erythromycin Drugs 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- CUOJDWBMJMRDHN-VIHUIGFUSA-N fengycin Chemical compound C([C@@H]1C(=O)N[C@H](C(=O)OC2=CC=C(C=C2)C[C@@H](C(N[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCC(N)=O)C(=O)N1)[C@@H](C)O)=O)NC(=O)[C@@H](CCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)C[C@H](O)CCCCCCCCCCCCC)[C@@H](C)CC)C1=CC=C(O)C=C1 CUOJDWBMJMRDHN-VIHUIGFUSA-N 0.000 description 2
- 108010002015 fengycin Proteins 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 101150086432 lacA gene Proteins 0.000 description 2
- RQNFGIWYOACERD-UHFFFAOYSA-N lacto-N-Difucosylhexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O RQNFGIWYOACERD-UHFFFAOYSA-N 0.000 description 2
- OQIUPKPUOLIHHS-UHFFFAOYSA-N lacto-N-difucohexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O OQIUPKPUOLIHHS-UHFFFAOYSA-N 0.000 description 2
- FKADDOYBRRMBPP-UHFFFAOYSA-N lacto-N-fucopentaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)OC1CO FKADDOYBRRMBPP-UHFFFAOYSA-N 0.000 description 2
- CMQZRJBJDCVIEY-UHFFFAOYSA-N lacto-N-fucopentaose III Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C1NC(C)=O CMQZRJBJDCVIEY-UHFFFAOYSA-N 0.000 description 2
- 229940062780 lacto-n-neotetraose Drugs 0.000 description 2
- 108010067215 mersacidin Proteins 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- NTIBMIIYTKPBNR-UHFFFAOYSA-N methoxymethyl 2-hydroxybenzoate Chemical compound COCOC(=O)C1=CC=CC=C1O NTIBMIIYTKPBNR-UHFFFAOYSA-N 0.000 description 2
- 238000013048 microbiological method Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- MGMBOQJARKXIAL-LCLLRQAKSA-N mycobacillin Chemical compound C([C@H]1C(=O)N[C@@H](CO)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](C(N[C@H](CCC(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@H](CC(O)=O)C(=O)N2CCC[C@H]2C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CC(O)=O)C(=O)N1)C(O)=O)C(O)=O)=O)CC(C)C)C1=CC=C(O)C=C1 MGMBOQJARKXIAL-LCLLRQAKSA-N 0.000 description 2
- 108700030603 mycosubtiline Proteins 0.000 description 2
- 235000013557 nattō Nutrition 0.000 description 2
- RBMYDHMFFAVMMM-PLQWBNBWSA-N neolactotetraose Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O RBMYDHMFFAVMMM-PLQWBNBWSA-N 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- CUOJDWBMJMRDHN-UHFFFAOYSA-N plipastatin Chemical compound N1C(=O)C(CCC(N)=O)NC(=O)C2CCCN2C(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)O)NC(=O)C(NC(=O)C(CCCN)NC(=O)C(CCC(O)=O)NC(=O)CC(O)CCCCCCCCCCCCC)CC(C=C2)=CC=C2OC(=O)C(C(C)CC)NC(=O)C1CC1=CC=C(O)C=C1 CUOJDWBMJMRDHN-UHFFFAOYSA-N 0.000 description 2
- 108010069329 plipastatin Proteins 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 101150015218 repL gene Proteins 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 229930188204 rhizocticin Natural products 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 108010045452 sublancin 168 Proteins 0.000 description 2
- 108010082567 subtilin Proteins 0.000 description 2
- NRQODXJXWWUXFE-LYQFAKRDSA-N subtilosin a Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H]1N(C(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)CN)[C@@H](C)O)[C@@H](C)CC)C(C)C)CCC1 NRQODXJXWWUXFE-LYQFAKRDSA-N 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- NJGWOFRZMQRKHT-UHFFFAOYSA-N surfactin Natural products CC(C)CCCCCCCCCC1CC(=O)NC(CCC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)O1 NJGWOFRZMQRKHT-UHFFFAOYSA-N 0.000 description 2
- NJGWOFRZMQRKHT-WGVNQGGSSA-N surfactin C Chemical compound CC(C)CCCCCCCCC[C@@H]1CC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)O1 NJGWOFRZMQRKHT-WGVNQGGSSA-N 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 101150115649 tapC gene Proteins 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 239000011573 trace mineral Substances 0.000 description 2
- 235000013619 trace mineral Nutrition 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- TYALNJQZQRNQNQ-UHFFFAOYSA-N #alpha;2,6-sialyllactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OCC1C(O)C(O)C(O)C(OC2C(C(O)C(O)OC2CO)O)O1 TYALNJQZQRNQNQ-UHFFFAOYSA-N 0.000 description 1
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- CILYIEBUXJIHCO-UHFFFAOYSA-N 102778-91-6 Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC2C(C(O)C(O)OC2CO)O)OC(CO)C1O CILYIEBUXJIHCO-UHFFFAOYSA-N 0.000 description 1
- DVGKRPYUFRZAQW-UHFFFAOYSA-N 3 prime Natural products CC(=O)NC1OC(CC(O)C1C(O)C(O)CO)(OC2C(O)C(CO)OC(OC3C(O)C(O)C(O)OC3CO)C2O)C(=O)O DVGKRPYUFRZAQW-UHFFFAOYSA-N 0.000 description 1
- 241000702462 Akkermansia muciniphila Species 0.000 description 1
- 101710184263 Alkaline serine protease Proteins 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000193375 Bacillus alcalophilus Species 0.000 description 1
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 101000912017 Bacillus subtilis (strain 168) Pulcherriminic acid synthase Proteins 0.000 description 1
- 101100007262 Bacillus subtilis (strain 168) comS gene Proteins 0.000 description 1
- 101100344120 Bacillus subtilis (strain 168) lutP gene Proteins 0.000 description 1
- 244000075779 Bacillus subtilis subsp natto Species 0.000 description 1
- 241000770536 Bacillus thermophilus Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 206010004016 Bacterial diarrhoea Diseases 0.000 description 1
- 241000839135 Bacteroides nordii CL02T12C05 Species 0.000 description 1
- 241000962950 Bacteroides ovatus ATCC 8483 Species 0.000 description 1
- 241000073659 Bacteroides vulgatus ATCC 8482 Species 0.000 description 1
- 241000186000 Bifidobacterium Species 0.000 description 1
- 241000283725 Bos Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000328900 Candidatus Solibacter Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 240000001817 Cereus hexagonus Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- 101710120485 Cyclo(L-leucyl-L-leucyl) synthase Proteins 0.000 description 1
- 101710116120 Cyclo(L-tyrosyl-L-tyrosyl) synthase Proteins 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 102000003849 Cytochrome P450 Human genes 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 101100013697 Drosophila melanogaster FucT6 gene Proteins 0.000 description 1
- 241000283087 Equus Species 0.000 description 1
- 241001014021 Escherichia coli O55:H7 Species 0.000 description 1
- 101150010169 FUT2 gene Proteins 0.000 description 1
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 206010016952 Food poisoning Diseases 0.000 description 1
- 208000019331 Foodborne disease Diseases 0.000 description 1
- PNHLMHWWFOPQLK-ZQXLIXSRSA-N GDP-4-dehydro-beta-L-fucose Chemical compound O[C@H]1[C@H](O)C(=O)[C@H](C)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C3=C(C(N=C(N)N3)=O)N=C2)O1 PNHLMHWWFOPQLK-ZQXLIXSRSA-N 0.000 description 1
- 102100040837 Galactoside alpha-(1,2)-fucosyltransferase 2 Human genes 0.000 description 1
- 208000005577 Gastroenteritis Diseases 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241001503513 Helicobacter bilis Species 0.000 description 1
- 241000647964 Helicobacter hepaticus ATCC 51449 Species 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101710091950 L-fucose kinase Proteins 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 101001010029 Lactobacillus helveticus Putative phosphotransferase enzyme IIA component Proteins 0.000 description 1
- BRHHWBDLMUBZQQ-JZEMXWCPSA-N Lactodifucotetraose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]([C@H](O)[C@H](O)CO)[C@H](C=O)O[C@@H]1[C@H](O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 BRHHWBDLMUBZQQ-JZEMXWCPSA-N 0.000 description 1
- LKOHREGGXUJGKC-UHFFFAOYSA-N Lactodifucotetraose Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)OC2CO)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O LKOHREGGXUJGKC-UHFFFAOYSA-N 0.000 description 1
- 241001387858 Lentisphaera Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 101710175377 Mannose-1-phosphate guanylyltransferase ManC Proteins 0.000 description 1
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- CILYIEBUXJIHCO-UITFWXMXSA-N N-acetyl-alpha-neuraminyl-(2->3)-beta-D-galactosyl-(1->4)-beta-D-glucose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O[C@H](CO)[C@@H]1O CILYIEBUXJIHCO-UITFWXMXSA-N 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- OIZGSVFYNBZVIK-UHFFFAOYSA-N N-acetylneuraminosyl-D-lactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O OIZGSVFYNBZVIK-UHFFFAOYSA-N 0.000 description 1
- 241000080590 Niso Species 0.000 description 1
- 241000714209 Norwalk virus Species 0.000 description 1
- 241000369774 Norwalk-like virus Species 0.000 description 1
- JOIQQNUVTASCEM-UHFFFAOYSA-N O.[Na].[Na].C(C=C/C(=O)O)(=O)O Chemical compound O.[Na].[Na].C(C=C/C(=O)O)(=O)O JOIQQNUVTASCEM-UHFFFAOYSA-N 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 102100035362 Phosphomannomutase 2 Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 101710100421 Plantazolicin Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- XLJLYVFWFVRDFG-UHFFFAOYSA-N Pulcherrimin Natural products C1=C2C(OC=3C(C4=O)=C(O)C=C(C=3)OC)=C4OCC2=C2OCOC2=C1 XLJLYVFWFVRDFG-UHFFFAOYSA-N 0.000 description 1
- 101710198273 RNA polymerase sigma factor SigF Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 241000192031 Ruminococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 101100111413 Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) lacZ gene Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- AXQLFFDZXPOFPO-UHFFFAOYSA-N UNPD216 Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC(C1O)C(O)C(CO)OC1OC1C(O)C(O)C(O)OC1CO AXQLFFDZXPOFPO-UHFFFAOYSA-N 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- RCITVHFNWJIDNA-UHFFFAOYSA-K [NH4+].[NH4+].[NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O.[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O Chemical compound [NH4+].[NH4+].[NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O.[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O RCITVHFNWJIDNA-UHFFFAOYSA-K 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 208000012873 acute gastroenteritis Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HXXFSFRBOHSIMQ-RWOPYEJCSA-N alpha-D-mannose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-RWOPYEJCSA-N 0.000 description 1
- TYALNJQZQRNQNQ-JLYOMPFMSA-N alpha-Neup5Ac-(2->6)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O1 TYALNJQZQRNQNQ-JLYOMPFMSA-N 0.000 description 1
- 229930193139 amicoumacin Natural products 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 238000009360 aquaculture Methods 0.000 description 1
- 244000144974 aquaculture Species 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 239000003899 bactericide agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical class COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 description 1
- IEQCXFNWPAHHQR-YKLSGRGUSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O IEQCXFNWPAHHQR-YKLSGRGUSA-N 0.000 description 1
- AXQLFFDZXPOFPO-UNTPKZLMSA-N beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O([C@@H]1O[C@H](CO)[C@H](O)[C@@H]([C@H]1O)O[C@H]1[C@@H]([C@H]([C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)NC(=O)C)[C@H]1[C@H](O)[C@@H](O)[C@H](O)O[C@@H]1CO AXQLFFDZXPOFPO-UNTPKZLMSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 230000002210 biocatalytic effect Effects 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000003022 colostrum Anatomy 0.000 description 1
- 235000021277 colostrum Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 235000021310 complex sugar Nutrition 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 108010079306 galactoside 2-alpha-L-fucosyltransferase Proteins 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229960002442 glucosamine Drugs 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 150000004676 glycans Chemical group 0.000 description 1
- 101150060137 gmuR gene Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 235000013402 health food Nutrition 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 239000003501 hydroponics Substances 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000003262 industrial enzyme Substances 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- USIPEGYTBGEPJN-UHFFFAOYSA-N lacto-N-tetraose Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC1C(O)C(CO)OC(OC(C(O)CO)C(O)C(O)C=O)C1O USIPEGYTBGEPJN-UHFFFAOYSA-N 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- WMYQZGAEYLPOSX-JOEMMLBASA-N lex-lactose Chemical compound OC1[C@@H](O)[C@@H](O)[C@@H](C)O[C@@H]1O[C@H]1C(O[C@H]2[C@@H](C(O)C(O)C(CO)O2)O)[C@@H](CO)O[C@@H](O[C@@H]2[C@H]([C@H](OC(C(O)CO)[C@H](O)[C@@H](O)C=O)OC(CO)C2O)O)C1NC(C)=O WMYQZGAEYLPOSX-JOEMMLBASA-N 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- DKHGMERMDICWDU-GHDNBGIDSA-N menaquinone-4 Chemical compound C1=CC=C2C(=O)C(C/C=C(C)/CC/C=C(C)/CC/C=C(C)/CCC=C(C)C)=C(C)C(=O)C2=C1 DKHGMERMDICWDU-GHDNBGIDSA-N 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 150000002772 monosaccharides Chemical group 0.000 description 1
- 101150042268 mtlA gene Proteins 0.000 description 1
- 101150029660 mtlF gene Proteins 0.000 description 1
- 108010009719 mutanolysin Proteins 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- SKALCVOFYPVXLA-IBHRWLNOSA-N plantazolicin Chemical compound N([C@@H]([C@@H](C)CC)C=1OC=C(N=1)C=1OC=C(N=1)C=1OC=C(N=1)C=1OC=C(N=1)C=1OC(C)[C@H](N=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)C([C@@H](C)CC)NC(=O)C(=C(O1)C)N=C1C(=C(O1)C)N=C1C(N=1)=CSC=1C(=C(O1)C)N=C1C1=CSC([C@H](CCCNC(N)=N)N(C)C)=N1 SKALCVOFYPVXLA-IBHRWLNOSA-N 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 239000003910 polypeptide antibiotic agent Substances 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 235000013406 prebiotics Nutrition 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- XENTWZJLVFFYPY-UHFFFAOYSA-L pulcherrimin Chemical compound CC(C)CC1=C2O[Fe]O[N+]2=C(CC(C)C)C2=[N+]1O[Fe]O2 XENTWZJLVFFYPY-UHFFFAOYSA-L 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000001054 red pigment Substances 0.000 description 1
- 238000003329 reductase reaction Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 239000009754 rhamnogalacturonan I Substances 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 101150067544 sigF gene Proteins 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 231100000033 toxigenic Toxicity 0.000 description 1
- 230000001551 toxigenic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000011728 vitamin K2 Substances 0.000 description 1
- 208000008918 voyeurism Diseases 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Abstract
Description
Настоящее изобретение относится к областям техники генной инженерии, в частности к генной инженерии клеток Bacillus для продукции фукозилированных олигосахаридов и к микробной продукции фукозилированных олигосахаридов с использованием указанных генетически сконструированных клеток Bacillus.The present invention relates to the fields of genetic engineering, in particular to the genetic engineering of Bacillus cells for the production of fucosylated oligosaccharides and to the microbial production of fucosylated oligosaccharides using these genetically engineered Bacillus cells.
Предшествующий уровень техникиPrior Art
Человеческое грудное молоко обладает оптимальными питательными свойствами для грудных детей. Сахариды, которые присутствуют в человеческом грудном молоке, представляют собой основной компонент человеческого молока, превосходя жиры и белки. Помимо лактозы, которая служит источником энергии, человеческое грудное молоко содержит от примерно 5 до 25 граммов на литр молекул сложных сахаров, а именно, олигосахаридов. Данные олигосахариды обнаружены в значимых концентрациях только в человеческом молоке, и они суммарно известны как олигосахариды грудного молока (ОГМ).Human breast milk has optimal nutritional properties for infants. Sugars, which are present in human breast milk, are the main component of human milk, superior to fats and proteins. In addition to lactose, which serves as a source of energy, human breast milk contains from about 5 to 25 grams per liter of complex sugar molecules, namely oligosaccharides. These oligosaccharides are found in significant concentrations only in human milk, and they are collectively known as human milk oligosaccharides (HMOs).
На сегодняшний день идентифицировано приблизительно 200 структурно отличающихся ОГМ. Указанные ОГМ основаны на дисахариде - лактозе (состоящей из группировки глюкозы (Glc) и группировки галактозы (Gal)) и несут дополнительные остатки моносахаридов, которые основаны на N-ацетил-глюкозамине (GlcNAc), фукозе (Fuc), салициловой кислоте (NeuNAc) и галактозе (Gal). Концентрация и состав ОГМ в человеческом грудном молоке варьирует среди индивидуумов и на протяжении периода лактации от вплоть до 20 г/л в молозиве до 5-10 г/л в зрелом молоке.To date, approximately 200 structurally distinct OGMs have been identified. These HGMs are based on the disaccharide lactose (consisting of a glucose group (Glc) and a galactose group (Gal)) and carry additional monosaccharide residues that are based on N-acetyl-glucosamine (GlcNAc), fucose (Fuc), salicylic acid (NeuNAc) and galactose (Gal). The concentration and composition of HMOs in human breast milk varies among individuals and throughout the lactation period, from up to 20 g/L in colostrum to 5-10 g/L in mature milk.
Молоко женщин, принадлежащее к так называемому «фенотипу секретора», содержит высокое содержание α-1,2-фукозилированных ОГМ. У данных женщин экспрессируется ген FUT2, кодирующий так называемую «фукозилтрансферазу 2». Наиболее распространенными ОГМ в их молоке являются 2'-фукозиллактоза (2'-FL - от англ. 2'-fucosyllactose; Fuc(α1-2)Gal(β1-4)Glc) и лакто-N-фукопентаоза-I (LNPF-I - от англ.lacto-N-fucopentaose-I; Fuc(α1-2)Gal(β1-3)GlcNAc(β1-3)Gal(β1-4)Glc).The milk of women belonging to the so-called “secretor phenotype” contains high levels of α-1,2-fucosylated HGMs. These women express the FUT2 gene, which encodes the so-called “fucosyltransferase 2”. The most common HGMs in their milk are 2'-fucosyllactose (2'-FL - from the English 2'-fucosyllactose; Fuc(α1-2)Gal(β1-4)Glc) and lacto-N-fucopentaose-I (LNPF- I - from English lacto-N-fucopentaose-I; Fuc(α1-2)Gal(β1-3)GlcNAc(β1-3)Gal(β1-4)Glc).
Олигосахариды грудного молока не перевариваются во время их прохождения через кишечник грудных детей. За счет их устойчивости в кишечнике грудного ребенка они демонстрируют полезные действия. Более конкретно, ОГМ, как было показано, являются пребиотическими, поскольку они служат источником углерода для комменсальных микроорганизмов родов Bifidobacterium, Bacteroides и Lactobacillus. Таким образом, ОГМ поддерживают пролиферацию данных микроорганизмов в кишечниках грудных детей.Breast milk oligosaccharides are not digested as they pass through the intestines of infants. Due to their stability in the intestines of the infant, they demonstrate beneficial effects. More specifically, HMOs have been shown to be prebiotic because they serve as a carbon source for commensal microorganisms of the genera Bifidobacterium, Bacteroides, and Lactobacillus. Thus, OGM support the proliferation of these microorganisms in the intestines of infants.
Олигосахариды грудного молока также непосредственно уменьшают колонизацию кишечника грудного ребенка патогенами за счет того, что они предотвращают прилипание указанных патогенов к структурам гликана на поверхности слизистой кишечника. ОГМ функционируют как ловушка, благодаря их структурному сходству с гликанами поверхности эпителия, и ингибируют инвазию патогенов, снижая, вследствие этого, риск инфекций.Breast milk oligosaccharides also directly reduce pathogen colonization of the infant's intestine by preventing said pathogens from adhering to glycan structures on the surface of the intestinal mucosa. OGMs function as decoys due to their structural similarity to epithelial surface glycans and inhibit pathogen invasion, thereby reducing the risk of infections.
Показано, что альфа-1,2-фукозилированные ОГМ защищают от инфицирований Campylobacter jejuni, возбудителем наиболее распространенных бактериальных диарей. α-1,2-Фукозилированные ОГМ также ассоциированы с защитой от диареи, обусловленной термостойким токсином Escherichia coli. Кроме того, риск инфицирований калицивирусами, опосредующими диарею, снижается за счет высокого содержания α-1,2-фукозилированных ОГМ в грудном молоке. ОГМ, главным образом фукозилированный ОГМ лакто-N-фукопентаоза V (LNFP-V; Gal(β1-3)GlcNAc (β1-3)Gal(β1-4)[Fucα1-3]Glc), связывается(ются) с участком связывания токсина А из Clostridium difficile с углеводом, наиболее распространенной причины внутрибольничной диареи. Таким образом, ОГМ, по-видимому, препятствуют взаимодействию токсина toxin А из С. difficile с клеточными рецепторами.Alpha-1,2-fucosylated HMOs have been shown to protect against infections by Campylobacter jejuni, the causative agent of the most common bacterial diarrhea. α-1,2-Fucosylated HMOs are also associated with protection against heat-stable toxin-induced diarrhea in Escherichia coli. In addition, the risk of infections with caliciviruses that mediate diarrhea is reduced by the high content of α-1,2-fucosylated HMOs in breast milk. OGM, mainly fucosylated OGM lacto-N-fucopentaose V (LNFP-V; Gal(β1-3)GlcNAc (β1-3)Gal(β1-4)[Fucα1-3]Glc), binds to the binding site toxin A from Clostridium difficile with carbohydrate, the most common cause of hospital-acquired diarrhea. Thus, OGMs appear to interfere with the interaction of toxin A from C. difficile with cellular receptors.
Кроме того, прилипание Pseudomonas aeruginosa к эпителиальным клеткам значимо ингибировалось 2-FL и 3-фукозиллактозой (3-FL - от англ. 3-fucosyllactose; Gal(β1-4)[Fucα1-3]Glc). Связывание норовирусов (вирусов Норуолк, NLV - от англ. Norwalk-like virus), основной причины острого гастроэнтерита, с антигенами группы гисто-крови, предотвращается α-1,2-фукозилированными ОГМ, а также α-1,3-фукозилированными ОГМ. Это указывает на потенциал данных ОГМ в отношении ингибирования связывания капсида норовируса с гликанами рецептора хозяина.In addition, the adherence of Pseudomonas aeruginosa to epithelial cells was significantly inhibited by 2-FL and 3-fucosyllactose (3-FL - from English 3-fucosyllactose; Gal(β1-4)[Fucα1-3]Glc). The binding of noroviruses (Norwalk viruses, NLV - from the English Norwalk-like virus), the main cause of acute gastroenteritis, with histo-blood group antigens is prevented by α-1,2-fucosylated OGM, as well as α-1,3-fucosylated OGM. This indicates the potential of these OGMs to inhibit the binding of the norovirus capsid to host receptor glycans.
Благодаря известной пользе от ОГМ и главным образом фукозилированных ОГМ экономически целесообразный способ их синтеза является желательным таким образом, чтобы данные олигосахариды или по меньшей мере некоторые из данных олигосахаридов стали доступными в качестве добавки к детской питательной смеси.Due to the known benefits of HMOs and primarily fucosylated HMOs, an economically feasible method for their synthesis is desirable such that these oligosaccharides, or at least some of these oligosaccharides, become available as an additive to infant formula.
Из-за ограниченной поставки и сложностей получения чистых фракций отдельных олигосахаридов грудного молока, были разработаны химические пути синтеза некоторых данных сложных молекул. Однако и химический синтез, и биокаталитические подходы оказались коммерчески нерациональными. Кроме того, в частности химический синтез олигосахаридов грудного молока включает применение нескольких вредных химических веществ, которые накрадывают риск загрязнения конечного продукта.Due to limited supply and difficulties in obtaining pure fractions of individual human milk oligosaccharides, chemical routes have been developed to synthesize some of these complex molecules. However, both chemical synthesis and biocatalytic approaches have proven to be commercially unsustainable. In addition, the chemical synthesis of human milk oligosaccharides in particular involves the use of several harmful chemicals that pose a risk of contamination of the final product.
Из-за проблем, возникающих при химическом синтезе олигосахаридов грудного молока, были разработаны ферментативные подходы к получению ОГМ. На сегодняшний день, раскрыта микробная продукция нескольких ОГМ, таких как 2'-фукозиллактоза, 3-фукозиллактоза, лакто-N-тетраоза, лакто-N-неотетраоза, лакто-N-фукопентаоза I, лакто-N-дифукогексаоза II, 3'-сиалиллактоза и 6'-сиалиллактоза, с использованием главным образом генетически сконструированных штаммов Escherichia coli.Due to problems encountered in the chemical synthesis of human milk oligosaccharides, enzymatic approaches to the production of HMOs have been developed. To date, the microbial production of several HGMs, such as 2'-fucosyllactose, 3-fucosyllactose, lacto-N-tetraose, lacto-N-neotetraose, lacto-N-fucopentaose I, lacto-N-difucohexaose II, 3'- sialyllactose and 6'-sialyllactose, using mainly genetically engineered Escherichia coli strains.
На сегодняшний день рекомбинантные клетки Е. coli используют для микробной продукции ОГМ в промышленном масштабе. Однако род Escherichia coli содержит патогенные члены, а также непатогенные члены. Несмотря на то, что непатогенные штаммы Е. coli используют для микробной продукции ОГМ, такие непатогенные Е. coli не считают безопасными для изготовления продуктов, которые предназначены для потребления человеком во множестве областей. Таким образом, микробные клетки родов, которые расценивались бы как безопасные в таких областях, необходимы для изготовления соединений, которые предназначены для потребления человеком, для получения официального одобрения указанных продуктов для их коммерциализации в указанных областях.Today, recombinant E. coli cells are used for microbial production of OGM on an industrial scale. However, the genus Escherichia coli contains pathogenic members as well as non-pathogenic members. Although non-pathogenic E. coli strains are used for microbial production of HGM, such non-pathogenic E. coli are not considered safe for the manufacture of products intended for human consumption in a variety of applications. Thus, microbial cells of genera that would be regarded as safe in such areas are required for the manufacture of compounds that are intended for human consumption in order to obtain regulatory approval of said products for their commercialization in said areas.
Проблема решается посредством использования бактериальных клеток рода Bacillus, которые расцениваются как безопасные для потребления человеком, и которые способны продуцировать фукозилированный олигосахарид.The problem is solved by using bacterial cells of the genus Bacillus, which are considered safe for human consumption and which are capable of producing fucosylated oligosaccharide.
Бактерии рода Bacillus являются грамположительными, палочковидными микробными клетками, образующими эндоспоры, или аэробных, или факультативно анаэробных видов. Род Bacillus принадлежит к типу Фирмикуты. Геном членов рода Bacillus имеет тенденцию к парам оснований А-Т в своей частоте использования кодонов. Виды Bacillus почти повсеместно распространены в природе. Например, они могут быть найдены в почве (В. subtilis), а также встречаются в экстремальных условиях окружающей среды, таких как высокий рН (В. alcalophilus), высокая температура (В. thermophilus) или высокое содержание солей (В. halodurans).Bacteria of the genus Bacillus are gram-positive, rod-shaped, endospore-forming microbial cells of either aerobic or facultative anaerobic species. The genus Bacillus belongs to the phylum Firmicutes. The genome of members of the genus Bacillus tends toward A-T base pairs in its codon usage frequency. Bacillus species are almost ubiquitous in nature. For example, they can be found in soil (B. subtilis) and are also found in extreme environmental conditions such as high pH (B. alcalophilus), high temperature (B. thermophilus) or high salt content (B. halodurans).
Род Bacillus включает 266 видов, имеющих название, которые включают свободноживущие виды, а также паразитарные патогенные виды. Два вида Bacillus считаются с медицинской точки зрения значимыми: В. anthracis, который вызывает сибирскую язву, и В. cereus, который вызывает пищевое отравление. Третий вид, В. thuringiensis, является важным патогеном насекомых, продуцирующим токсин, который может уничтожать насекомых. Таким образом, он используется в качестве инсектицида для контроля над насекомыми-вредителями.The genus Bacillus contains 266 named species, which include free-living species as well as parasitic pathogenic species. Two species of Bacillus are considered medically significant: B. anthracis, which causes anthrax, and B. cereus, which causes food poisoning. The third species, B. thuringiensis, is an important insect pathogen that produces a toxin that can kill insects. Thus, it is used as an insecticide to control insect pests.
Из-за их статуса GRAS (от англ. generally recognized as safe - общепризнан безопасным), несколько видов Bacillus, например, В. amyloliquefaciens, В. licheniformis и В. subtilis, используются в биотехнологической продукции разных белков и соединений, используемых в пищевой и фармацевтической промышленности.Due to their GRAS (generally recognized as safe) status, several Bacillus species, such as B. amyloliquefaciens, B. licheniformis and B. subtilis, are used in biotechnological production of various proteins and compounds used in food and pharmaceutical industry.
В. amyloliquefaciens является источником рестриктазы BamHI, и также синтезирует природный белок - антибиотик барназу. Кроме того, В. amyloliquefaciens продуцирует плантазолицин, антибиотик с селективной активностью в отношении B. anthracis. Альфа-амилаза из В. amyloliquefaciens часто используется в гидролизе крахмала. В. amyloliquefaciens также является источником субтилизина, который катализирует распад белков.B. amyloliquefaciens is a source of the BamHI restriction enzyme and also synthesizes a natural protein, the antibiotic barnase. In addition, B. amyloliquefaciens produces plantazolicin, an antibiotic with selective activity against B. anthracis. Alpha-amylase from B. amyloliquefaciens is often used in starch hydrolysis. B. amyloliquefaciens is also a source of subtilisin, which catalyzes the breakdown of proteins.
В. amyloliquefaciens представляет собой бактерию-колонизатора корней, которая используется для того, чтобы бороться с некоторыми патогенами корней растений в сельском хозяйстве, водной культуре и гидропонике, поскольку она оказывает действие против бактериальных и грибковых патогенов, и может предотвращать инфицирование в результате конкурентного исключения или вытеснения в конкурентной борьбе нежелательного патогена.B. amyloliquefaciens is a root colonizing bacterium that is used to control some plant root pathogens in agriculture, aquaculture and hydroponics because it has effects against bacterial and fungal pathogens and can prevent infection through competitive exclusion or displacement of an unwanted pathogen in competition.
Ее высокая способность секретировать щелочную сериновую протеазу сделала В. licheniformis одной из наиболее важных бактерий в промышленном производстве фермента. Субтилизин Carlsberg, секретируемый В. licheniformis, используют в качестве протеазы для моющих средств, и он продается под торговым названием Alcalase®.Its high ability to secrete alkaline serine protease has made B. licheniformis one of the most important bacteria in the industrial production of the enzyme. Carlsberg subtilisin, secreted by B. licheniformis, is used as a protease for detergents and is sold under the trade name Alcalase®.
В. subtilis представляет собой бактерию, позитивную в отношении каталазы, которая обнаружена в почве и желудочно-кишечном тракте жвачных животных и человека. В. subtilis и вещества, происходящие из данной бактерии, не содержащей эндотоксин, оценивались разными авторитетными органами в отношении их безопасности и пользы в применении в пищевой продукции. В Соединенных Штатах ферменты карбогидраза и протеаза из В. subtilis общепризнаны безопасными (GRAS) Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA - от англ. Food and Drug Administration). Bacillus subtilis также присвоен статус «квалифицированной презумпции безопасности» Европейским агентством по безопасности продуктов питания.B. subtilis is a catalase-positive bacterium that is found in the soil and gastrointestinal tract of ruminants and humans. B. subtilis and substances derived from this endotoxin-free bacterium have been evaluated by various authorities for their safety and benefit in food applications. In the United States, the carbohydrase and protease enzymes from B. subtilis are generally recognized as safe (GRAS) by the US Food and Drug Administration (FDA). Bacillus subtilis has also been given "qualified presumption of safety" status by the European Food Safety Authority.
Кроме того, нетоксигенные и непатогенные штаммы В. subtilis обычно используются в пищевой промышленности. Например, ферментированные соевые бобы в виде натто, которые обычно потребляют в Японии, содержат вплоть до 10 жизнеспособных клеток В. subtilis на грамм. Ферментированные бобы признают за их вклад в здоровую флору кишечника и поглощение витамина K2. Продукт натто и В. subtilis var. natto в качестве его основного компонента представляют собой FOSHU (от англ. Foods for Specified Health Use - пищевые продукты, специально используемые для поддержания здоровья), одобренные министерством здравоохранения, труда и социальной защиты Японии в качестве эффективных для сохранения здоровья.In addition, non-toxigenic and non-pathogenic strains of B. subtilis are commonly used in the food industry. For example, fermented soybeans in the form of natto, which are commonly consumed in Japan, contain up to 10 viable B. subtilis cells per gram. Fermented beans are recognized for their contribution to healthy gut flora and vitamin K2 absorption. The product of natto and B. subtilis var. natto as its main component are FOSHU (Foods for Specified Health Use), approved by the Ministry of Health, Labor and Welfare of Japan as effective for maintaining health.
С В. subtilis легко работать, она быстро растет, и условия культивирования являются простыми. Рекомбинантные штаммы В. subtilis используют в продукции полигидроксиалканолатов, гиалуроновой кислоты и разных ферментов, таких как амилаза и протеазы.B. subtilis is easy to work with, grows quickly, and culture conditions are simple. Recombinant strains of B. subtilis are used in the production of polyhydroxyalkanolates, hyaluronic acid and various enzymes such as amylase and proteases.
С природными изолятами В. subtilis дикого типа сложно работать, по сравнению с лабораторными штаммами, которые подвергались процессам одомашнивания на основе мутагенеза и селекции. Данные одомашненные штаммы часто обладают улучшенными способностями к развитию природной компетентности (поглощению и интеграции ДНК окружающей среды), росту и потере способностей, необходимых «в дикой природе». В В. subtilis линейная ДНК, а также мультимерные формы плазмидной ДНК активно поглощаются природными компетентными клетками.Natural isolates of wild-type B. subtilis are difficult to work with compared to laboratory strains that have been subjected to domestication processes based on mutagenesis and selection. These domesticated strains often have improved abilities to develop natural competence (uptake and integration of environmental DNA), growth, and loss of abilities required "in the wild." In B. subtilis, linear DNA, as well as multimeric forms of plasmid DNA, are actively taken up by natural competent cells.
В определенных физиологических условиях маленькая субпопуляция клеток В. subtilis становится компетентной. В В. subtilis природная компетентность регулируется сложной регуляторной сетью. Ключевые регуляторы в данной сети представляют собой, среди прочих, мастер регулятор компетентности ComK и транскрипционный мастер регулятор споруляции Spo0A. Эффективность трансформации клеток В. subtilis и возможно эффективность интеграции ДНК в их геном можно улучшать посредством генной инженерии. Это может быть достигнуто посредством эктопической интеграции экспрессионной кассеты, содержащей регулируемый промотор (например, промотор, индуцируемый маннитом PmtlA) и гены сотK и comS, в геном В. subtilis. Дополнительно, данная стратегия обеспечивает трансформацию В. subtilis за счет природной компетентности с использованием сложной среды (например, LB).Under certain physiological conditions, a small subpopulation of B. subtilis cells becomes competent. In B. subtilis, natural competence is regulated by a complex regulatory network. Key regulators in this network are, among others, the master competence regulator ComK and the transcriptional master sporulation regulator Spo0A. The efficiency of transformation of B. subtilis cells and possibly the efficiency of DNA integration into their genome can be improved through genetic engineering. This can be achieved by ectopic integration of an expression cassette containing a regulated promoter (eg, the P mtlA mannitol-inducible promoter) and the cellK and comS genes into the B. subtilis genome. Additionally, this strategy enables transformation of B. subtilis through natural competence using a complex environment (eg, LB).
Для продукции фукозилированных сахаридов В. subtilis можно генетически модифицировать разными способами.To produce fucosylated saccharides, B. subtilis can be genetically modified in a variety of ways.
Интеграцию генов и/или (одновременную) инактивацию генов посредством нарушения или удаления можно достигать посредством гомологичной рекомбинации. Для эффективной гомологичной рекомбинации по меньшей мере 400-500 п.н. гомологичных плечей необходимы в В. subtilis.Gene integration and/or (simultaneous) gene inactivation through disruption or deletion can be achieved through homologous recombination. For efficient homologous recombination, at least 400-500 bp. homologous arms are required in B. subtilis.
Еще один способ для направленного конструирования генома представляет собой современную систему CRISPR-Cas9. Данный быстрый и безмаркерный инструмент редактирования генома можно использовать для крупномасштабных геномных делеций, маленьких и больших вставок ДНК, сайленсинга генов посредством введения стоп-кодона, а также введения точечных мутаций. Никаких предварительных геномных модификаций не требуется в случае лишенного изъянов редактирования генома посредством CRISPR-Cas9.Another method for targeted genome design is the modern CRISPR-Cas9 system. This fast, marker-free genome editing tool can be used for large-scale genomic deletions, small and large DNA insertions, gene silencing through stop codon insertion, and the introduction of point mutations. No prior genomic modifications are required for flawless genome editing via CRISPR-Cas9.
Случайная хромосомная интеграция генов и инсерционный мутагенез могут быть выполнены, используя модифицированный транспозон mariner. Данная система не связана с горячими точками в В. subtilis, одновременно демонстрируя высокую эффективность в случайной эктопической интеграции.Random chromosomal gene integration and insertional mutagenesis can be performed using a modified mariner transposon. This system is not associated with hot spots in B. subtilis, while demonstrating high efficiency in random ectopic integration.
Несмотря на то, что виды Bacillus используют для промышленной продукции ферментов, на сегодняшний день не представлены клетки Bacillus для промышленной продукции олигосахаридов, в частности, фукозилированных олигосахаридов.Although Bacillus species are used for industrial enzyme production, Bacillus cells are not currently available for industrial production of oligosaccharides, particularly fucosylated oligosaccharides.
В китайской патентной заявке CN 108 410 787 А раскрыты рекомбинантные клетки Bacillus subtilis, которые синтезируют лактил-N-неотетраозу. Указанные рекомбинантные клетки В. subtilis имеют ген лактопермеазы, который интегрируют в геном клетки. Кроме того, указанная клетка Bacillus, которая несет плазмиду, содержащую ген бета-1,3-N-глюкозаминтрансферазы и ген β-1,4-галактозилотансферазы. Клетки В. subtilis можно культивировать в присутствии экзогенной лактозы и они синтезируют лактил-N-неотетраозу при титрах вплоть до примерно 1 г/л, что слишком мало для экономически целесообразного промышленного производства.Chinese patent application CN 108 410 787 A discloses recombinant Bacillus subtilis cells that synthesize lactyl-N-neotetraose. These recombinant B. subtilis cells have a lactopermease gene, which is integrated into the cell genome. In addition, said Bacillus cell which carries a plasmid containing a beta-1,3-N-glucosamine transferase gene and a beta-1,4-galactosyltransferase gene. B. subtilis cells can be cultured in the presence of exogenous lactose and synthesize lactyl-N-neotetraose at titers as low as about 1 g/L, which is too low for economical industrial production.
Несмотря на то, что во множестве патентных заявок упоминается Bacillus в качестве рода, который подходит для продукции олигосахаридов, таких как лакто-N-неотетраоза, никакого коммерческого применения Bacillus для продукций фукозилированных олигосахаридов, в частности фукозилированных олигосахаридов грудного молока, еще не было реализовано, предположительно из-за значительных усилий в модификации метаболизма, которые требуются для реализации необходимых путей биосинтеза для продукции ОГМ в Bacillus. Тогда как указанная выше В. subtilis для продукции LNnT зависит от субстратов-доноров, которые встречаются в природе в клетках В. subtilis, продукция фукозилированного олигосахарида в Bacillus требует реализации гетерологичного метаболического пути в клетке для обеспечения требуемого субстрата-донора - ГДФ (гуанозиндифосфат)-фукозы.Although numerous patent applications mention Bacillus as a genus that is suitable for the production of oligosaccharides such as lacto-N-neotetraose, no commercial application of Bacillus for the production of fucosylated oligosaccharides, in particular human milk fucosylated oligosaccharides, has yet been realized. presumably due to the significant metabolic modification effort required to implement the necessary biosynthetic pathways for OGM production in Bacillus. While the above B. subtilis production of LNnT depends on donor substrates that occur naturally in B. subtilis cells, the production of fucosylated oligosaccharide in Bacillus requires the implementation of a heterologous metabolic pathway in the cell to provide the required donor substrate - HDP (guanosine diphosphate) - fucose.
В китайской патентной заявке CN 109 735 479 А раскрыты рекомбинантные клетки Bacillus subtilis для осуществления синтеза 2'-фукозиллактозы, где уровень экспрессии фермента-транспортера лактозы повышен, и где клетка экспрессирует фукозокиназу, фосфатгуанинтрансферазу и фукозилтрансферазу. Сообщалось, что выход 2'-фукозиллактозы в ферментационной среде составлял от 0,424 г/л до 1,042 г/л.Chinese patent application CN 109 735 479 A discloses recombinant Bacillus subtilis cells to carry out the synthesis of 2'-fucosyllactose, where the expression level of lactose transporter enzyme is increased, and where the cell expresses fucosokinase, phosphate guanine transferase and fucosyl transferase. The yield of 2'-fucosyllactose in the fermentation medium was reported to range from 0.424 g/L to 1.042 g/L.
Тем не менее цель настоящего изобретения заключалась в предложении бактериальной клетки рода Bacillus для продукции фукозилированных олигосахаридов.However, the object of the present invention was to provide a bacterial cell of the genus Bacillus for the production of fucosylated oligosaccharides.
Цель достигнута посредством предложения клетки Bacillus, в которой имеется лактозопермеаза для импортирования экзогенной лактозы в клетку, путь биосинтеза ГДФ-фукозы de novo для предоставления ГДФ-фукозы и фукозилтрансфераза для переноса группировки фукозы от ГДФ-фукозы на лактозу. Указанную клетку Bacillus можно культивировать в присутствии экзогенной лактозы с получением фукозилированного олигосахарида.The goal is achieved by proposing a Bacillus cell that has a lactose permease to import exogenous lactose into the cell, a de novo GDP-fucose biosynthetic pathway to provide GDP-fucose, and a fucosyltransferase to transfer the fucose moiety from GDP-fucose to lactose. Said Bacillus cell can be cultured in the presence of exogenous lactose to produce a fucosylated oligosaccharide.
КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Согласно первому аспекту предложена неспорообразующая бактериальная клетка рода Bacillus для получения фукозилированного олигосахарида, где в клетке Bacillus имеется лактозопермеаза, путь биосинтеза ГДФ-фукозы и фукозилтрансфераза.According to the first aspect, a non-spore-forming bacterial cell of the genus Bacillus is proposed for producing a fucosylated oligosaccharide, wherein the Bacillus cell has a lactose permease, a GDP-fucose biosynthetic pathway, and a fucosyltransferase.
Согласно второму аспекту предложено применение неспорообразующей бактериальной клетки рода Bacillus согласно первому аспекту для получения фукозилированного олигосахарида.According to the second aspect, the use of a non-spore-forming bacterial cell of the genus Bacillus according to the first aspect is proposed for the production of a fucosylated oligosaccharide.
Согласно третьему аспекту предложен способ получения фукозилированного олигосахарида, включающий:According to a third aspect, there is provided a method for producing a fucosylated oligosaccharide, comprising:
- предоставление неспорообразующей бактериальной клетки рода Bacillus, где в указанной клетке Bacillus имеется лактозопермеаза, путь биосинтеза ГДФ-фукозы и фукозилтрансфераза, акцептирующая лактозу;- providing a non-spore-forming bacterial cell of the genus Bacillus, wherein said Bacillus cell contains lactose permease, a pathway for the biosynthesis of GDP-fucose and a fucosyltransferase that accepts lactose;
- культивирование клетки Bacillus в культуральной среде, содержащей лактозу, и в условиях, которые являются пермиссивными в отношении клетки Bacillus, с продукцией фукозилированного олигосахарида, и- culturing the Bacillus cell in a culture medium containing lactose and under conditions that are permissive to the Bacillus cell, producing a fucosylated oligosaccharide, and
- возможно, извлечение фукозилированного олигосахарида из культуральной среды и/или клетки Bacillus.- possibly extracting the fucosylated oligosaccharide from the culture medium and/or Bacillus cells.
Согласно четвертому аспекту предложены фукозилированные олигосахариды, которые были продуцированы клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза ГДФ-фукозы и фукозилтрансфераза.According to a fourth aspect, fucosylated oligosaccharides are provided that have been produced by a Bacillus cell that contains lactose permease, the GDP-fucose biosynthetic pathway, and fucosyltransferase.
Согласно пятому аспекту предложено применение фукозилированного олигосахарида, который был продуцирован клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза ГДФ-фукозы и фукозилтрансфераза, для изготовления питательной композиции.According to a fifth aspect, there is proposed the use of a fucosylated oligosaccharide that has been produced by a Bacillus cell in which lactose permease, the GDP-fucose biosynthetic pathway and fucosyltransferase are present, to produce a nutritional composition.
Согласно шестому аспекту предложены питательные композиции, содержащие по меньшей мере один фукозилированный олигосахарид, который продуцирован клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза ГДФ-фукозы и фукозилтрансфераза.According to a sixth aspect, nutritional compositions are provided containing at least one fucosylated oligosaccharide that is produced by a Bacillus cell that contains lactose permease, the GDP-fucose biosynthetic pathway, and fucosyltransferase.
Подробное описаниеDetailed description
Настоящее изобретение относится к клеткам Bacillus для продукции фукозилированных олигосахаридов, их применению и способам получения фукозилированных олигосахаридов посредством культивирования указанных клеток Bacillus в культуральной среде, содержащей лактозу, и в условиях, которые являются пермиссивными в отношении продукции указанного фукозилированного олигосахарида указанной клеткой Bacillus.The present invention relates to Bacillus cells for the production of fucosylated oligosaccharides, their use and methods for producing fucosylated oligosaccharides by culturing said Bacillus cells in a culture medium containing lactose and under conditions that are permissive for the production of said fucosylated oligosaccharide by said Bacillus cell.
Для того, чтобы иметь способность продуцировать фукозилированный олигосахарид, клетка Bacillus должна предоставлять фукозилтрансферазе субстрат-донор, содержащий группировку фукозы, и субстрат-акцептор, представляющий собой дисахарид или олигосахарид, таким образом, чтобы фукозилтрансфераза могла переносить группировку фукозы от субстрата-донора на указанный субстрат-акцептор, с образованием, вследствие этого, фукозилированного олигосахарида.In order to have the ability to produce a fucosylated oligosaccharide, the Bacillus cell must provide the fucosyltransferase with a donor substrate containing a fucose moiety and an acceptor substrate, which is a disaccharide or oligosaccharide, such that the fucosyltransferase can transfer the fucose moiety from the donor substrate to said substrate -acceptor, resulting in the formation of a fucosylated oligosaccharide.
Следует понимать, что фукозилированный олигосахарид, который предназначена продуцировать указанная клетка Bacillus, представляет собой желательный фукозилированный олигосахарид, тогда как другие фукозилированные олигосахариды, которые могут быть образованы за счет разнородности фукозилтрансферазы во время продукции желательного фукозилированного олигосахарида, считаются нежелательными фукозилированными олигосахаридами или побочными продуктами. Подходящий субстрат-донор представляет собой ГДФ-L-фукозу, и подходящий субстрат-акцептор для образования фукозиллактозы представляет собой дисахарид - лактозу. Полученный желательный фукозилированный олигосахарид представляет собой 2'-фукозиллактозу, 3-фукозиллактозу или 2',3-дифукозиллактозу.It should be understood that the fucosylated oligosaccharide that said Bacillus cell is designed to produce is the desired fucosylated oligosaccharide, while other fucosylated oligosaccharides that may be formed by fucosyltransferase heterogeneity during production of the desired fucosylated oligosaccharide are considered undesired fucosylated oligosaccharides or by-products. A suitable donor substrate is GDP-L-fucose, and a suitable acceptor substrate for the formation of fucosyllactose is the disaccharide lactose. The resulting desired fucosylated oligosaccharide is 2'-fucosyllactose, 3-fucosyllactose or 2',3-difucosyllactose.
Клетки Bacillus дикого типа как не синтезируют лактозу внутриклеточно, так и не поглощают и не метаболизируют экзогенную лактозу. Однако лактоза представляет собой субстрат-акцептор для группировки фукозы под действием фукозилтрансферазы, акцептирующей лактозу, в образовании некоторых фукозилированных олигосахаридов. Следовательно, с возможностью продуцировать фукозилированный олигосахарид, такой как 2'-фукозиллактоза, 3-фукозиллактоза или 2',3-дифукозиллактоза, клетка Bacillus должна обладать способностью предоставления лактозы фукозилтрансферазе, акцептирующей лактозу, или посредством образования лактозы внутриклеточно и/или посредством поглощения лактозы извне.Wild-type Bacillus cells neither synthesize lactose intracellularly nor absorb or metabolize exogenous lactose. However, lactose is a substrate acceptor for the moiety of fucose by lactose-accepting fucosyltransferase in the formation of some fucosylated oligosaccharides. Therefore, with the ability to produce a fucosylated oligosaccharide such as 2'-fucosyllactose, 3-fucosyllactose or 2',3-difucosyllactose, the Bacillus cell must have the ability to provide lactose to lactose-accepting fucosyltransferase, either by producing lactose intracellularly and/or by uptake of lactose externally .
В одном воплощении клетка Bacillus для продуцирования фукозилированного олигосахарида может поглощать экзогенную лактозу, имея лактозопермеазу. Термин «экзогенный» в отношении лактозы, в том виде, в котором он используется в данном документе, относится к лактозе, которая не происходит из клетки Bacillus, а именно, являясь внутриклеточно синтезированной клеткой Bacillus, а которая происходит снаружи по отношению к клетке Bacillus, и которую добавляют к культуральной среде, в которой выращивают клетку Bacillus для получения фукозилированного олигосахарида.In one embodiment, a Bacillus cell for producing fucosylated oligosaccharide can take up exogenous lactose by having lactose permease. The term "exogenous" in relation to lactose, as used herein, refers to lactose that does not originate from the Bacillus cell, namely, being intracellularly synthesized by the Bacillus cell, but that originates externally to the Bacillus cell, and which is added to the culture medium in which the Bacillus cell is grown to produce a fucosylated oligosaccharide.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована с возможностью поглощать экзогенную лактозу, а именно для того, чтобы иметь лактозопермеазу. Таким образом, в клетке Bacillus для продукции фукозилированного олигосахарида имеется гетерологичная лактозопермеаза. Подходящая лактозопермеаза представляет собой LacY Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to take up exogenous lactose, namely to have lactose permease. Thus, the Bacillus cell requires a heterologous lactose permease to produce fucosylated oligosaccharide. A suitable lactose permease is E. coli LacY or a functional variant thereof.
Термин «гетерологичный», в том виде, в котором он используется в данном документе, в отношении белков, полипептидов, ферментов и транспортеров, а также в отношении молекул нуклеиновой кислоты и/или нуклеотидных последовательностей, относится к молекуле, которая не является нативной в отношении вида клетки, которая содержит указанную молекулу. Термин «ненативный» указывает на то, что указанная молекула отсутствует в клетке-предшественнике, встречающейся в природе или дикого типа, а именно, клетке того же вида, который наиболее часто встречается в природе, клетки Bacillus.The term “heterologous”, as used herein, in relation to proteins, polypeptides, enzymes and transporters, as well as in relation to nucleic acid molecules and/or nucleotide sequences, refers to a molecule that is not native to the type of cell that contains the specified molecule. The term "non-native" indicates that the molecule is not present in a naturally occurring or wild-type progenitor cell, namely a cell of the same species that is most commonly found in nature, the Bacillus cell.
Термин «функциональный вариант», в том виде, в котором он используется в данном документе, в отношении ферментов и/или транспортных молекул, относится к белкам или полипептидам, обладающим такой же активностью (ферментативной, каталитической или транслоцирующей), как и фермент или транспортер, на который ссылаются, но который имеет аминокислотную последовательность, отличную от аминокислотной последовательности молекулы фермента или транспортера, на которую ссылаются. Таким образом, типичный вариант белка/полипептида отличается по аминокислотной последовательности от белка/полипептида, на который ссылаются. Вариант и белок/полипептид, на который ссылаются, может отличаться по аминокислотной последовательности одной или более заменами, присоединениями и/или делециями в любой комбинации. Следовательно, термин «функциональный вариант» включает усеченные версии белка/полипептида, на который ссылаются, которые обладают такой же активностью, как и белок/полипептид, на который ссылаются. Замещенный или вставленный аминокислотный остаток может представлять собой или может не представлять собой аминокислотный остаток, кодируемый генетическим кодом. Вариант белка/полипептида может представлять собой встречающийся в природе, как например, аллельный вариант, или он может представлять собой вариант, который не известно, чтобы встречался в природе. Варианты белков/полипептидов, не встречающиеся в природе, могут быть созданы посредством методик мутагенеза, посредством прямого синтеза или посредством других методов генной инженерии, известных специалистам в данной области. В пределах объема настоящего раскрытия в термин «вариант» также включены белки и межвидовые гомологи, которые имеют аминокислотную последовательность/последовательность нуклеиновой кислоты, которая обладает более чем примерно 60%-ной идентичностью аминокислотных последовательностей, 65%-ной, 70%-ной, 75%-ной, 80%-ной, 85%-ной, 90%-ной, предпочтительно 91%-ной, 92%-ной, 93%-ной, 94%-ной, 95%-ной, 96%-ной, 97%-ной, 98%-ной или 99%-ной или большей идентичностью аминокислотных последовательностей, предпочтительно, на протяжении области из по меньшей мере примерно 25, 50, 100, 200, 500, 1000 или более аминокислот, с референсным полипептидом.The term "functional variant", as used herein, in relation to enzymes and/or transport molecules, refers to proteins or polypeptides having the same activity (enzymatic, catalytic or translocation) as the enzyme or transporter , which is referred to, but which has an amino acid sequence different from the amino acid sequence of the enzyme or transporter molecule being referred to. Thus, an exemplary protein/polypeptide variant differs in amino acid sequence from the referenced protein/polypeptide. The variant and referenced protein/polypeptide may differ in amino acid sequence by one or more substitutions, additions and/or deletions in any combination. Therefore, the term “functional variant” includes truncated versions of the referenced protein/polypeptide that have the same activity as the referenced protein/polypeptide. The substituted or inserted amino acid residue may or may not be an amino acid residue encoded by the genetic code. The protein/polypeptide variant may be a naturally occurring variant, such as an allelic variant, or it may be a variant that is not known to occur in nature. Variants of proteins/polypeptides not found in nature can be created through mutagenesis techniques, through direct synthesis, or through other genetic engineering techniques known to those skilled in the art. Within the scope of the present disclosure, the term “variant” also includes proteins and interspecies homologs that have an amino acid/nucleic acid sequence that has greater than about 60% amino acid sequence identity, 65%, 70%, 75 %, 80%, 85%, 90%, preferably 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% or greater amino acid sequence identity, preferably over a region of at least about 25, 50, 100, 200, 500, 1000 or more amino acids, with the reference polypeptide.
Термин «такая же активность», в том виде, в котором он используется в данном документе, относится к ферментативной, каталитической активности или активности транспортировки белка/полипептида лишь с точки зрения качества. Следовательно, «функциональный вариант» также включает варианты, которые обладают повышенной или пониженной активностью, по сравнению с активностью белка/полипептида, на который ссылаются.The term “same activity”, as used herein, refers to the enzymatic, catalytic or transport activity of a protein/polypeptide only from a quality standpoint. Therefore, a “functional variant” also includes variants that have increased or decreased activity relative to the activity of the referenced protein/polypeptide.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать или экспрессировать нуклеотидную последовательность, которая кодирует лактозопермеазу, предпочтительно нуклеотидную последовательность, которая кодирует лактозопермеазу LacY Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain or express a nucleotide sequence that encodes a lactose permease, preferably a nucleotide sequence that encodes E. coli LacY lactose permease or a functional variant thereof.
Лактозопермеаза LacY Е. coli кодируется областью, кодирующей белок (а именно, открытая рамка считывания) гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1). Следовательно, в одном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует лактозопермеазу LacY Е. coli или ее функциональный вариант.E. coli LacY lactose permease is encoded by the protein coding region (namely, open reading frame) of the E. coli lacY gene (Gen Bank accession number: NP_414877.1). Therefore, in one embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli LacY lactose permease or a functional variant thereof.
В одном дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную лактозопермеазу, приспособлена к частоте использования кодона Bacillus. Частота использования кодона В. subtilis, например, необычна тем, что суммарное содержание GC ниже примерно 45%, содержание GC первой буквы данных кодонов выше примерно 51%, содержание CG второй буквы данных кодонов ниже примерно 36,1% и содержание CG третьей буквы данных кодонов ниже примерно 46%.In one additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous lactose permease is adapted to the codon frequency of Bacillus. The codon usage frequency of B. subtilis, for example, is unusual in that the total GC content is below about 45%, the GC content of the first letter of these codons is above about 51%, the CG content of the second letter of these codons is below about 36.1%, and the CG content of the third letter of data codons below approximately 46%.
Для экспрессии лактозопермеазы клетка Bacillus содержит рекомбинантный ген лактозопермеазы, где нуклеотидная последовательность, которая кодирует лактозопермеазу, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию открытой рамки считывания лактозопермеазы.To express lactose permease, the Bacillus cell contains a recombinant lactose permease gene, wherein the nucleotide sequence that encodes the lactose permease is operably linked to expression control sequences that mediate expression of the lactose permease open reading frame.
Термин «функционально связанный», в том виде, в котором он используется в данном документе, будет означать функциональную связь между последовательностью контроля экспрессии нуклеотидной кислоты/гена (такой как промотор, сигнальная последовательность или ряд сайтов связывания транскрипционных факторов) и второй последовательностью нуклеиновой кислоты (обычно называемой «областью, кодирующей белок», «открытой рамкой считывания» и иногда даже «геном»), где последовательность контроля экспрессии влияет на транскрипцию и/или трансляцию нуклеотидной последовательности, соответствующей второй последовательности. Соответственно, термин «промотор» обозначает последовательности ДНК, которые обычно «предшествуют» открытой рамке считывания в ДНК-полимере и обеспечивают сайт инициации транскрипции в мРНК. «Регуляторные» последовательности ДНК, также обычно расположенные «выше» (то есть, предшествуя) открытой рамки считывания в данном ДНК-полимере, связывают белки, которые определяют частоту (или скорость) инициации транскрипции. В совокупности называемые «промоторной/регуляторной» или «контрольной» ДНК-последовательностью, данные последовательности, которые предшествуют выбранной открытой рамке считывания (или серии открытых рамок считывания) в функциональном ДНК-полимере способствуют определению того, будет ли происходить транскрипция (и в конечном итоге экспрессия) открытой рамки считывания. Последовательности ДНК, которые «следуют за» геном в ДНК-полимере и обеспечивают сигнал для терминации транскрипции в мРНК, называются последовательностями, «терминирующими» транскрипцию.The term "operably linked", as used herein, will mean a functional relationship between a nucleic acid/gene expression control sequence (such as a promoter, a signal sequence, or a series of transcription factor binding sites) and a second nucleic acid sequence ( commonly referred to as a "protein coding region", an "open reading frame" and sometimes even a "genome"), where an expression control sequence influences the transcription and/or translation of a nucleotide sequence corresponding to a second sequence. Accordingly, the term “promoter” refers to the DNA sequences that typically “precede” the open reading frame in the DNA polymer and provide the transcription initiation site in the mRNA. "Regulatory" DNA sequences, also usually located "upstream" (that is, preceding) the open reading frame in a given DNA polymer, bind proteins that determine the frequency (or rate) of transcription initiation. Collectively referred to as a "promoter/regulator" or "control" DNA sequence, the sequence data that precedes a selected open reading frame (or series of open reading frames) in a functional DNA polymer helps determine whether transcription will occur (and ultimately expression) open reading frame. DNA sequences that “follow” a gene in a DNA polymer and provide a signal to terminate transcription in mRNA are called transcription termination sequences.
Рекомбинантный ген лактозопермеазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant lactose permease gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
Экспрессия гетерологичного гена лактозопермеазы в клетке Bacillus позволяет полученной клетке Bacillus поглощать извне поставляемую лактозу из культуральной среды. Поглощенная лактоза может затем служить субстратом-акцептором для фукозилтрансферазы (см. ниже в данном документе).Expression of a heterologous lactose permease gene in a Bacillus cell allows the resulting Bacillus cell to take up externally supplied lactose from the culture medium. The absorbed lactose can then serve as an acceptor substrate for fucosyltransferase (see later in this document).
Клетка Bacillus для продукции фукозилированного олигосахарида должна иметь способность предоставлять субстрат-донор для переноса группировки фукозы на субстрат-акцептор. Субстрат-донор для группировки фукозы представляет собой ГДФ-фукозу. Следовательно, клетка Bacillus должна иметь способность внутриклеточно продуцировать ГДФ-фукозу. Для внутриклеточного биосинтеза ГДФ-фукозы, в клетке Bacillus имеется путь биосинтеза ГДФ-фукозы. Bacillus генетически сконструирована для того, чтобы иметь путь биосинтеза ГДФ-фукозы. Путь биосинтеза ГДФ-фукозы может представлять собой или путь биосинтеза ГДФ-фукозы de novo и/или реутилизационный путь ГДФ-фукозы.For the Bacillus cell to produce fucosylated oligosaccharide, it must have the ability to provide a donor substrate for the transfer of the fucose moiety to the acceptor substrate. The donor substrate for the fucose moiety is GDP-fucose. Therefore, the Bacillus cell must have the ability to produce GDP-fucose intracellularly. For the intracellular biosynthesis of GDP-fucose, the Bacillus cell has a pathway for the biosynthesis of GDP-fucose. Bacillus is genetically engineered to have a GDP-fucose biosynthetic pathway. The GDP-fucose biosynthetic pathway may be either a de novo GDP-fucose biosynthetic pathway and/or a GDP-fucose recycling pathway.
В одном воплощении в клетке Bacillus имеется путь биосинтеза ГДФ-фукозы de novo для внутриклеточного биосинтеза ГДФ-фукозы. Клетка Bacillus генетически сконструирована для того, чтобы иметь путь биосинтеза ГДФ-фукозы de novo.In one embodiment, the Bacillus cell has a de novo GDP-fucose biosynthetic pathway for intracellular biosynthesis of GDP-fucose. The Bacillus cell is genetically engineered to have a de novo pathway for the biosynthesis of GDP-fucose.
Путь биосинтеза ГДФ-фукозы de novo включает активности следующих ферментов:The de novo biosynthesis pathway of GDP-fucose includes the activities of the following enzymes:
1. фруктозо-6-фосфатизомераза;1. fructose-6-phosphate isomerase;
2. фосфоманномутаза;2. phosphomannomutase;
3. ГДФ:маннозо-1-фосфатгуанилилтрансфераза;3. GDP: mannose-1-phosphate guanylyltransferase;
4. ГДФ-маннозо-4,6-дегидратаза; и4. GDP-mannose-4,6-dehydratase; And
5. ГДФ-фукозосинтаза.5. GDP fucose synthase.
Следовательно, в клетке Bacillus для получения фукозилированного олигосахарида имеется фруктозо-6-фосфатизомераза (обычно также обозначаемая маннозо-6-фосфатизомеразой), фосфоманномутаза, ГДФ:маннозо-1-фосфатгуанилилтрансфераза, ГДФ-маннозо-4,6-дегидратаза и ГДФ-фукозосинтаза.Therefore, the Bacillus cell has fructose-6-phosphate isomerase (commonly also referred to as mannose-6-phosphate isomerase), phosphomannomutase, GDP:mannose-1-phosphate guanylyltransferase, GDP-mannose-4,6-dehydratase and GDP-fucose synthase to produce fucosylated oligosaccharide.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы иметь фруктозо-6-фосфатизомеразу, фосфоманномутазу, ГДФ:маннозо-1-фосфатгуанилилтрансферазу, ГДФ-маннозо-4,6-дегидратазу и ГДФ-фукозосинтазу.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to have fructose-6-phosphate isomerase, phosphomannomutase, GDP:mannose-1-phosphate-guanylyltransferase, GDP-mannose-4,6-dehydratase and GDP-fucose synthase.
Путь биосинтеза ГДФ-фукозы de novo начинается с изомеризации фруктозо-6-фосфата до маннозо-6-фосфата, реакции, которая катализируется фруктозо-6-фосфатизомеразой. В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует фруктозо-6-фосфатизомеразу. Подходящий фруктозо-6-фосфат представляет собой ManA Е. coli или его функциональный вариант. Типичная нуклеотидная последовательность представляет собой нуклеотидную последовательность, которая кодирует ManA Е. coli.The de novo biosynthesis pathway of GDP-fucose begins with the isomerization of fructose 6-phosphate to mannose 6-phosphate, a reaction that is catalyzed by fructose 6-phosphate isomerase. In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes fructose-6-phosphate isomerase. Suitable fructose 6-phosphate is E. coli ManA or a functional variant thereof. A typical nucleotide sequence is the nucleotide sequence that encodes E. coli ManA.
Фруктозо-6-фосфатизомераза ManA Е. coli кодируется областью, кодирующей белок, гена тапА Е. coli (номер доступа GenBank: NP_416130.3). Таким образом, в дополнительном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ManA Е. coli или его функциональный вариант.E. coli fructose-6-phosphate isomerase ManA is encoded by the protein-coding region of the E. coli manA gene (GenBank accession number: NP_416130.3). Thus, in a further embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli ManA or a functional variant thereof.
Фруктозо-6-фосфатизомераза ManA Е. coli кодируется открытой рамкой считывания гена тапА Е. coli (номер доступа GenBank: NP_416130.3). Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus содержит ген тапА Е. coli или его функциональный вариант.The E. coli fructose-6-phosphate isomerase ManA is encoded by the open reading frame of the E. coli manA gene (GenBank accession number: NP_416130.3). Thus, in an additional and/or alternative embodiment, the Bacillus cell contains the E. coli tapA gene or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей фруктозо-6-фосфатизомеразу, приспособлена к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding fructose-6-phosphate isomerase is adapted to the codon frequency of Bacillus.
Другие подходящие фруктозо-6-фосфатизомеразы представляют собой ManA В. subtilis и белки-паралоги GmuF В. subtilis (YdhS) и Pmi В. subtilis (Yvyl) или их функциональные варианты. Иллюстративные нуклеотидные последовательности представляют собой нуклеотидные последовательности, которые кодируют ManA В. subtilis, GmuF В. subtilis или Pmi В. subtilis. Фруктозо-6-фосфатизомеразу ManA В. subtilis кодирует открытая рамка считывания гена тапА В. subtilis (номер доступа Gen Bank: NP_389084.1).Other suitable fructose-6-phosphate isomerases are B. subtilis ManA and the paralog proteins B. subtilis GmuF (YdhS) and B. subtilis Pmi (Yvyl) or functional variants thereof. Exemplary nucleotide sequences are nucleotide sequences that encode B. subtilis ManA, B. subtilis GmuF, or B. subtilis Pmi. The B. subtilis fructose-6-phosphate isomerase ManA is encoded by the open reading frame of the B. subtilis manA gene (Gen Bank accession number: NP_389084.1).
Фруктозо-6-фосфатизомераза ManA В. subtilis кодируется областью, кодирующей белок, гена тапА В. subtilis (номе доступа GenBank: (NP_389084.1)). Таким образом, в дополнительном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ManA В. subtilis или его функциональный вариант. Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus содержит ген тапА В. subtilis или его функциональный вариант.В еще одном дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодировала ген gmuF В. subtilis или его функциональный вариант, и/или нуклеотидную последовательность, которая кодирует ген pmi В. subtilis или его функциональный вариант.B. subtilis fructose-6-phosphate isomerase ManA is encoded by the protein coding region of the B. subtilis manA gene (GenBank accession number: (NP_389084.1)). Thus, in a further embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes B. subtilis ManA or a functional variant thereof. Thus, in a further and/or alternative embodiment, the Bacillus cell contains the B. subtilis tapA gene or a functional variant thereof. In yet another additional and/or alternative embodiment, the Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes the gmuF gene B. subtilis or a functional variant thereof, and/or a nucleotide sequence that encodes the B. subtilis pmi gene or a functional variant thereof.
В дополнительном и/или альтернативном воплощении экспрессия нативного гена тапА, нативного гена gmuF и/или нативного гена pmi может быть повышена. Экспрессия нативного гена тапА, нативного гена gmuF и/или нативного гена pmi может быть повышена по той причине, что эндогенный промотор по меньшей мере одного из нативного гена тапА, нативного гена gmuF и нативного гена pmi заменен более сильным промотором, а именно промотором, опосредующим повышенный уровень экспрессии, по сравнению с нативным промотором гена тапА, гена gmuF и гена pmi, соответственно. В еще одном дополнительном или альтернативном воплощении экспрессия нативного гена тапА, нативного гена gmuF и/или нативного гена pmi может быть усилена по той причине, что дополнительные копии нативного гена тапА, нативного гена gmuF и/или нативного гена pmi размножаются в клетке Bacillus.In a further and/or alternative embodiment, expression of the native tapA gene, native gmuF gene and/or native pmi gene may be increased. The expression of the native tapA gene, the native gmuF gene and/or the native pmi gene may be increased because the endogenous promoter of at least one of the native tapA gene, the native gmuF gene and the native pmi gene is replaced by a stronger promoter, namely a promoter mediating increased expression level compared to the native promoter of the tapA gene, gmuF gene and pmi gene, respectively. In yet another additional or alternative embodiment, expression of the native tapA gene, native gmuF gene, and/or native pmi gene may be enhanced because additional copies of the native tapA gene, native gmuF gene, and/or native pmi gene are propagated in the Bacillus cell.
В еще одном дополнительном и/или альтернативном воплощении экспрессия нативного гена тапА может усиливаться в результате делеции или функциональной инактивации гена тапР, кодирующего транспортер маннозы, приводящей к конститутивной экспрессии нативного гена тапА.In yet another additional and/or alternative embodiment, expression of the native tapA gene may be enhanced by deletion or functional inactivation of the tapP gene encoding the mannose transporter, resulting in constitutive expression of the native tapA gene.
В еще одном дополнительном или альтернативном воплощении экспрессия нативного гена gmuF может быть усилена в результате делеции или функциональной инактивации гена gmuR, кодирующего соответствующий репрессор транскрипции.In yet another additional or alternative embodiment, expression of the native gmuF gene may be enhanced by deletion or functional inactivation of the gmuR gene encoding the corresponding transcriptional repressor.
Для экспрессии фруктозо-6-фосфатизомеразы клетка Bacillus содержит рекомбинантный ген фруктозо-6-фосфатизомеразы, в котором нуклеотидная последовательность, которая кодирует фруктозо-6-фосфатизомеразу, функционально связана с последовательностями контроля экспрессии.For expression of fructose-6-phosphate isomerase, the Bacillus cell contains a recombinant fructose-6-phosphate isomerase gene in which the nucleotide sequence that encodes fructose-6-phosphate isomerase is operably linked to expression control sequences.
Рекомбинантный ген фруктозо-6-фосфатизомеразы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant fructose-6-phosphate isomerase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
На второй стадии биосинтеза de novo ГДФ-фукозы маннозо-6-фосфат превращается в маннозо-1-фосфат под действием ферментативной активности фосфоманномутазы. В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует фосфоманномутазу.In the second step of de novo biosynthesis of GDP-fucose, mannose-6-phosphate is converted to mannose-1-phosphate by the enzymatic activity of phosphomannomutase. In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a phosphomannomutase.
Подходящая фосфоманномутаза представляет собой фосфоманномутазу ManB Е. coii. Таким образом, в дополнительном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ManB Е. coli или ее функциональный вариант.A suitable phosphomannomutase is E. coii phosphomannomutase ManB. Thus, in a further embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli ManB or a functional variant thereof.
Фосфоманномутаза ManB Е. coli кодируется нуклеотидной последовательностью области, кодирующей белок, ген тапВ Е. coli (номер доступа Gen Bank: NP_416552.1). Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus содержит ген тапВ Е. coli или его функциональный вариант.E. coli phosphomannomutase ManB is encoded by the nucleotide sequence of the protein-coding region of the E. coli manB gene (Gen Bank accession number: NP_416552.1). Thus, in an additional and/or alternative embodiment, the Bacillus cell contains the E. coli tapB gene or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей фосфоманномутазу, приспособлена к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding phosphomannomutase is adapted to the codon frequency of Bacillus.
Для экспрессии фосфоманномутазы клетка Bacillus содержит рекомбинантный ген фосфоманномутазы, в котором нуклеотидная последовательность, которая кодирует фосфоманномутазу, функционально связана с последовательностями контроля экспрессии.To express phosphomannomutase, the Bacillus cell contains a recombinant phosphomannomutase gene in which the nucleotide sequence that encodes the phosphomannomutase is operably linked to expression control sequences.
Рекомбинантный ген фосфоманномутазы может быть интегрирован в хромосому Bacillus или присутствовать в клетке Bacillus в виде эписомальной версии на плазмиде.The recombinant phosphomannomutase gene may be integrated into the Bacillus chromosome or present in the Bacillus cell as an episomal version on a plasmid.
Следующая стадия в пути биосинтеза ГДФ-фукозы cfe novo представляет собой образование ГДФ-маннозы посредством следующей реакции:The next step in the cfe novo GDP-fucose biosynthetic pathway is the formation of GDP-mannose through the following reaction:
α-D-маннозо-1-фосфат+ГТФ+Н+=>дифосфат+ГДФ-α-D-маннозаα-D-mannose-1-phosphate+GTP+H + =>diphosphate+GDP-α-D-mannose
Превращение маннозо-1-фосфата в ГДФ-маннозу опосредовано ГДФ:маннозо-1-фосфатгуанилилтрансферазой. Таким образом, в клетке Bacillus для продукции фукозилированного олигосахарида имеется гетерологичная ГДФ:маннозо-1-фосфатгуанилилтрансфераза. Подходящая ГДФ:маннозо-1-фосфатгуанилилтрансфераза представляет собой ManC Е. coli или ее функциональный вариант.The conversion of mannose-1-phosphate to GDP-mannose is mediated by GDP:mannose-1-phosphate guanylyltransferase. Thus, in the Bacillus cell, a heterologous GDP:mannose-1-phosphate guanylyltransferase is available for the production of fucosylated oligosaccharide. A suitable GDP:mannose-1-phosphate guanylyl transferase is E. coli ManC or a functional variant thereof.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ГДФ:маннозо-1-фосфатгуанилилтрансферазу. Иллюстративная нуклеотидная последовательность представляет собой нуклеотидную последовательность, которая кодирует ManC Е. coli. Таким образом, в дополнительном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ManC Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a GDP:mannose-1-phosphate guanylyltransferase. An exemplary nucleotide sequence is a nucleotide sequence that encodes E. coli ManC. Thus, in a further embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli ManC or a functional variant thereof.
ГДФ:маннозо-1-фосфатгуанилилтрансфераза ManC Е. coli кодируется открытой рамкой считывания гена тапС Е. coli (номер доступа Gen Bank: NP_416553.1). Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus содержит ген тапС Е. coli или его функциональный вариант.The E. coli GDP:mannose-1-phosphate guanylyltransferase ManC is encoded by the open reading frame of the E. coli tapC gene (Gen Bank accession number: NP_416553.1). Thus, in an additional and/or alternative embodiment, the Bacillus cell contains the E. coli taC gene or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей ГДФ:маннозо-1-фосфатгуанилилтрансферазу, приспособлена к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon usage frequency of the nucleotide sequence encoding GDP:mannose-1-phosphate guanylyltransferase is adapted to the codon usage frequency of Bacillus.
В случае экспрессии ГДФ:маннозо-1-фосфатгуанилилтрансферазы в клетке Bacillus содержится рекомбинантный ген ГДФ:маннозо-1-фосфатгуанилилтрансеразы, в котором нуклеотидная последовательность, которая кодирует ГДФ:маннозо-1-фосфатгуанилилтрансферазу, функционально связана с последовательностями контроля экспрессии.When GDP:mannose-1-phosphate guanylyltransferase is expressed, the Bacillus cell contains a recombinant GDP:mannose-1-phosphate guanylyltranserase gene in which the nucleotide sequence that encodes the GDP:mannose-1-phosphate guanylyltransferase is operably linked to expression control sequences.
Рекомбинантный ген ГДФ:маннозо-1-фосфатгуанилилтрансферазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде.The recombinant GDP:mannose-1-phosphate guanylyltransferase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid.
На последующей стадии пути ГДФ-фукозы de novo, катализируемой ГДФ-маннозо-4,6-дегидратазой, ГДФ-D-манноза превращается в ГДФ-4-дегидро-6-дезокси-D-маннозу.In a subsequent step in the de novo GDP-fucose pathway, catalyzed by GDP-mannose-4,6-dehydratase, GDP-D-mannose is converted to GDP-4-dehydro-6-deoxy-D-mannose.
Таким образом, в клетке Bacillus для получения фукозилированного олигосахарида имеется ГДФ-маннозо-4,6-дегидратаза. Подходящей ГДФ-маннозо-4,6-дегидратазой является Gmd Е. coll.Thus, in the Bacillus cell, GDP-mannose-4,6-dehydratase is available to produce fucosylated oligosaccharide. A suitable GDP-mannose-4,6-dehydratase is Gmd E. coll.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ГДФ-маннозо-4,6-дегидратазу. Иллюстративная нуклеотидная последовательность представляет собой нуклеотидную последовательность, которая кодирует Gmd Е. coll. Таким образом, в дополнительном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует Gmd Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes GDP-mannose-4,6-dehydratase. An exemplary nucleotide sequence is a nucleotide sequence that encodes E. coll Gmd. Thus, in a further embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli Gmd or a functional variant thereof.
ГДФ-маннозо-4,6-дегидратаза Gmd Е. coli кодируется открытой рамкой считывания гена gmd Е. coli (номер доступа Gen Bank: NP_416557.1). Таким образом, в дополнительном и/или альтернативном воплощении в клетке Bacillus содержится ген gmd Е. coli или его функциональный вариант.The E. coli GDP-mannose 4,6-dehydratase Gmd is encoded by the open reading frame of the E. coli gmd gene (Gen Bank accession number: NP_416557.1). Thus, in an additional and/or alternative embodiment, the Bacillus cell contains the E. coli gmd gene or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей ГДФ-маннозо-4,6-дегидратазу, приспособлена к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding GDP-mannose-4,6-dehydratase is adapted to the codon frequency of Bacillus.
В случае экспрессии ГДФ-маннозо-4,6-дегидратазы, в клетке Bacillus содержится рекомбинантный ген ГДФ-маннозо-4,6-дегидратазы, в котором нуклеотидная последовательность, которая кодирует ГДФ-маннозо-4,6-дегидратазу, функционально связана с последовательностями контроля экспрессии.In the case of expression of GDP-mannose-4,6-dehydratase, the Bacillus cell contains a recombinant GDP-mannose-4,6-dehydratase gene in which the nucleotide sequence that encodes GDP-mannose-4,6-dehydratase is operably linked to the sequences expression control.
Рекомбинантный ген ГДФ-маннозо-4,6-дегидратазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде.The recombinant GDP-mannose-4,6-dehydratase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid.
В конечной реакции пути биосинтеза de novo ГДФ-фукозы ГДФ-4-дегидро-6-дезокси-D-манноза превращается в ГДФ-фукозу в результате двухстадийной NADPH (от англ. reduced nicotinamide adenine dinucleotide phosphate восстановленный никотинамидадениндинуклеотидфосфат)-зависимой реакции. Данное превращение опосредовано ГДФ-фукозосинтазой и включает эпимеразную реакцию и редуктазную реакцию. Указанная эпимеразная реакция превращает ГДФ-4-кето-6-дезоксиманнозу в ГДФ-4-кето-6-дезоксигалактозу, которая затем восстанавливается до ГДФ-фукозы.In the final reaction of the de novo GDP-fucose biosynthesis pathway, GDP-4-dehydro-6-deoxy-D-mannose is converted to GDP-fucose as a result of a two-step NADPH (reduced nicotinamide adenine dinucleotide phosphate)-dependent reaction. This conversion is mediated by GDP fucose synthase and includes an epimerase reaction and a reductase reaction. This epimerase reaction converts GDP-4-keto-6-deoxymannose to GDP-4-keto-6-deoxygalactose, which is then reduced to GDP-fucose.
Таким образом, в клетке Bacillus для продукции фукозилированного олигосахарида имеется ГДФ-фукозосинтаза. Подходящей ГДФ-фукозосинтазой является WcaG Е. coli или ее функциональный вариант.Thus, the Bacillus cell has GDP-fucose synthase for the production of fucosylated oligosaccharide. A suitable GDP fucose synthase is E. coli WcaG or a functional variant thereof.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует ГДФ-фукозосинтазу. Иллюстративная нуклеотидная последовательность представляет собой нуклеотидную последовательность, которая кодирует WcaG Е. coli. Таким образом, в дополнительном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует WcaG Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes GDP fucose synthase. An exemplary nucleotide sequence is a nucleotide sequence that encodes E. coli WcaG. Thus, in a further embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli WcaG or a functional variant thereof.
ГДФ-фукозосинтаза WcaG Е. coli кодируется открытой рамкой считывания гена wcaG Е. coli (номер доступа Gen Bank: NP_416556.1). Таким образом, в дополнительном и/или альтернативном воплощении в клетке Bacillus содержится ген wcaG Е. coli или его функциональный вариант.The E. coli GDP-fucose synthase WcaG is encoded by the open reading frame of the E. coli wcaG gene (Gen Bank accession number: NP_416556.1). Thus, in an additional and/or alternative embodiment, the Bacillus cell contains the E. coli wcaG gene or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей ГДФ-фукозосинтазу, приспособлена к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding GDP fucose synthase is adapted to the codon frequency of Bacillus.
В случае экспрессии ГДФ-фукозосинтазы, в клетке Bacillus содержится рекомбинантный ген ГДФ-фукозосинтазы, в котором нуклеотидная последовательность, которая кодирует ГДФ-фукозосинтазу, функционально связана с последовательностями контроля экспрессии.In the case of expression of GDP fucose synthase, the Bacillus cell contains a recombinant GDP fucose synthase gene in which the nucleotide sequence that encodes GDP fucose synthase is operably linked to expression control sequences.
Рекомбинантный ген ГДФ-фукозосинтазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде.The recombinant GDP fucose synthase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid.
В дополнительном и/или альтернативном воплощении в клетке Bacillus имеется реутилизационный путь ГДФ-фукозы для внутриклеточного биосинтеза ГДФ-фукозы. В пути реутилизации ГДФ-L-фукозы свободная цитоплазматическая фукоза фосфорилирована под действием L-фукокиназы с образованием L-фукозо-L-фосфата, который затем дополнительно превращается в ГДФ-L-фукозу.In an additional and/or alternative embodiment, the Bacillus cell has a GDP-fucose recycling pathway for intracellular biosynthesis of GDP-fucose. In the GDP-L-fucose recycling pathway, free cytoplasmic fucose is phosphorylated by L-fucokinase to form L-fucose-L-phosphate, which is then further converted to GDP-L-fucose.
Реутилизационный путь для биосинтеза ГДФ-фукозы включает следующие ферменты:The recycling pathway for the biosynthesis of GDP-fucose includes the following enzymes:
I. фукозокиназа; иI. fucosokinase; And
II. L-фукозо-1-фосфатгуанилилтрансфераза.II. L-fucose-1-phosphate guanylyltransferase.
Следовательно, в клетке Bacillus для продукции фукозилированного олигосахарида, в которой имеется реутилизационный путь ГДФ-фукозы, имеется фукозокиназа и L-фукозо-1-фосфатгуанилилтрансфераза.Therefore, in the Bacillus cell, fucosokinase and L-fucose-1-phosphate guanylyltransferase are available for the production of fucosylated oligosaccharide, which has a GDP-fucose recycling pathway.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы иметь фукозокиназу и L-фукозо-1-фосфатгуанилилтрансферазу.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to have fucosokinase and L-fucose-1-phosphate guanylyl transferase.
Фукозокиназа, также называемая фукокиназой, АТФ:6-дезокси-L-галактозо-1-фосфотрансфераза, АТФ:β-L-фукозо-1-фосфотрансфераза или L-фукокиназная активность, L-фукозокиназная активность катализирует реакцию L-фукоза+АТФ → β-L-фукозо-1-фосфат+АДФ+2 Н+.Fucosokinase, also called fucokinase, ATP:6-deoxy-L-galactose-1-phosphotransferase, ATP:β-L-fucose-1-phosphotransferase or L-fucokinase activity, L-fucose kinase activity catalyzes the reaction L-fucose+ATP → β -L-fucose-1-phosphate + ADP + 2 H + .
Затем L-фукозо-1-фосфатгуанилилтрансфераза или ГДФ-L-фукозопирофосфорилаза превращает указанный β-L-фукозс-1-фосфат в ГДФ-L-фукозу.L-fucose-1-phosphate guanylyltransferase or GDP-L-fucose pyrophosphorylase then converts said β-L-fucose-1-phosphate into GDP-L-fucose.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует фукозокиназу или ее функциональный вариант, и L-фукозо-1-фосфатгуанилилтрансферазу или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes fucosokinase or a functional variant thereof, and L-fucose-1-phosphate guanylyltransferase or a functional variant thereof.
В дополнительном и/или альтернативном воплощении фукозокиназа и L-фукозо-1-фосфатгуанилилтрансфераза объединены в одном единственном полипептиде. Подходящие гены для трансформации, кодирующие фукозокиназу, фукозо-1-фосфатгуанилилтрансферазу и/или бифункциональную L-фукозо-1-фосфатгуанилилтрансферазу, могут быть получены из родов Bacteroides, Lentisphaera, Ruminococcus, Solibacter, Arabidopsis, Oryza, Physcomitrella, Vitis, Danio, Bos, Equus, Macaca, Pan, Homo, Rattus, Mus и Xenopus. Пример бифункциональной фукозокиназы/L-фукозо-1-фосфатгуанилилтрансферазы найден в Bactericides fragilis.In an additional and/or alternative embodiment, fucosokinase and L-fucose-1-phosphate guanylyl transferase are combined in one single polypeptide. Suitable transformation genes encoding fucosokinase, fucose-1-phosphate guanylyltransferase and/or bifunctional L-fucose-1-phosphate guanylyltransferase can be obtained from the genera Bacteroides, Lentisphaera, Ruminococcus, Solibacter, Arabidopsis, Oryza, Physcomitrella, Vitis, Danio, Bos, Equus, Macaca, Pan, Homo, Rattus, Mus and Xenopus. An example of a bifunctional fucose kinase/L-fucose-1-phosphate guanylyltransferase is found in Bactericides fragilis.
В В. fragilis бифункциональная фукозокиназа/L-фукозо-1-фосфатгуанилилтрансфераза Fkp кодируется геном fkp В. fragilis (номер доступа GenBank AY849806).In B. fragilis, the bifunctional fucose kinase/L-fucose-1-phosphate guanylyltransferase Fkp is encoded by the B. fragilis fkp gene (GenBank accession no. AY849806).
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует Fkp В. fragilis или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes B. fragilis Fkp or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидных последовательностей, кодирующих фукозокиназу, фукозо-1-фосфатгуанилилтрансферазу и/или бифункциональную фукозокиназу/L-фукозо-1-фосфатгуанилилтрансферазу, приспособлена к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon usage frequency of nucleotide sequences encoding fucosokinase, fucose-1-phosphate guanylyltransferase and/or bifunctional fucosokinase/L-fucose-1-phosphate guanylyltransferase is adjusted to the codon usage frequency of Bacillus.
В случае экспрессии фукозокиназы и фукозо-1-фосфатгуанилилтрансферазы, в клетке Bacillus содержится по меньшей мере один рекомбинантный ген, в котором область, кодирующая белок, кодирующая фукозокиназу и L-фукозо-1-фосфатгуанилилтрансферазу и/или бифункциональную фукозокиназу/L-фукозо-1-фосфатгуанилилтрансферазу фукозокиназу, функционально связана с последовательностями контроля экспрессии.In the case of expression of fucosokinase and fucose-1-phosphate guanylyltransferase, the Bacillus cell contains at least one recombinant gene in which the protein coding region encoding fucosokinase and L-fucose-1-phosphate guanylyltransferase and/or bifunctional fucosokinase/L-fucose-1 -phosphate guanylyl transferase fucosokinase, functionally linked to expression control sequences.
Рекомбинантный ген фукозокиназы, ген фукозо-1-фосфатгуанилилтрансферазы и/или ген бифункциональной фукозокиназы/L-фукозо-1-фосфатгуанилилтрансферазы, может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде.The recombinant fucosokinase gene, the fucose-1-phosphate guanylyltransferase gene and/or the bifunctional fucosokinase/L-fucose-1-phosphate guanylyltransferase gene, can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid.
В случае внутриклеточного образования фукозиллактозы в клетке Bacillus имеется фукозилтрансфераза. Ферментативная активность фукозилтрансферазы переносит группировку фукозы с субстрата-донора на субстрат-акцептор. Для биосинтеза фукозиллактозы указанный субстрат-акцептор представляет собой лактозу. Следовательно, фукозилтрансфераза представляет собой фукозилтрансферазу, акцептирующую лактозу.In the case of intracellular formation of fucosyllactose, the Bacillus cell contains fucosyltransferase. The enzymatic activity of fucosyltransferase transfers the fucose moiety from the donor substrate to the acceptor substrate. For the biosynthesis of fucosyllactose, said acceptor substrate is lactose. Therefore, fucosyltransferase is a lactose-accepting fucosyltransferase.
Фукозилтрансфераза выбрана из группы, состоящей из α-1,2-фукозилтрансфераз для биосинтеза 2'-фукозиллактозы и α-1,3-фукозилтрансфераз для биосинтеза 3-фукозиллактозы.The fucosyltransferase is selected from the group consisting of α-1,2-fucosyltransferases for the biosynthesis of 2'-fucosyllactose and α-1,3-fucosyltransferases for the biosynthesis of 3-fucosyllactose.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать по меньшей мере одну нуклеотидную последовательность, которая кодирует фукозилтрансферазу.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express at least one nucleotide sequence that encodes a fucosyltransferase.
Для получения 2'-фукозиллактозы (2'-FL) α-1,2-фукозилтрансферазы WbgL из O126 Е. coli и FucT2 из Helicobacter pylori (ЕР 2 479 263 В1), α-1,2-фукозилтрансферазы WblA из Vibrio cholera O22, FutD из Н. bilis АТСС 437879, FutE из Н cinaede CCUG 18818, FutN из Bacteroides vulgatus АТСС 8482, FutO из Bacteroides ovatus АТСС 8483, WbgN из E. coli O55:H7, Bft1 и Bft3 из Bacteroides fragilis NCTC 9343 (WO 2014/018596 A2), и α-1,2-фукозилтрансферазы FucT2 из H. pylori для синтеза сахаридов Lewis Y и Lewis В (US 6670160 B2) были описаны и являются подходящими α-1,2-фукозилтрансферазами для биосинтеза 2'-FL в клетках Bacillus.For the production of 2'-fucosyllactose (2'-FL) α-1,2-fucosyltransferase WbgL from E. coli O126 and FucT2 from Helicobacter pylori (EP 2 479 263 B1), α-1,2-fucosyltransferase WblA from Vibrio cholera O22 , FutD from H. bilis ATCC 437879, FutE from H cinaede CCUG 18818, FutN from Bacteroides vulgatus ATCC 8482, FutO from Bacteroides ovatus ATCC 8483, WbgN from E. coli O55:H7, Bft1 and Bft3 from Bacteroides fragilis NCTC 934 3 (WO 2014 /018596 A2), and α-1,2-fucosyltransferases FucT2 from H. pylori for the synthesis of Lewis Y and Lewis B saccharides (US 6670160 B2) have been described and are suitable α-1,2-fucosyltransferases for the biosynthesis of 2'-FL in Bacillus cells.
Для получения 3-фукозиллактозы описаны α-1,3-фукозилтрансфераза Amuc из Akkermansia muciniphila и FucT6 и FucT7 из Bacteroides fragilis (ЕР 2 439 264 А1), α-1,3-фукозилтрансфераза FutA из Н. pylori (US 2014/ 0120611 А1), и они являются подходящими α-1,3-фукозилтрансферазами для биосинтеза 3-FL в клетках Bacillus. Кроме того, в WO 2016/040531 А1 раскрыта α-1,3-фукозилтрансфераза CafC из В. nordii CL02T12C05 для синтеза 3-фукозиллактозы и лактодифукотетраозы, и CafD из Н. hepaticus АТСС51449 для продукции LNnFP-III.To obtain 3-fucosyllactose, α-1,3-fucosyltransferase Amuc from Akkermansia muciniphila and FucT6 and FucT7 from Bacteroides fragilis (EP 2 439 264 A1), α-1,3-fucosyltransferase FutA from H. pylori (US 2014/0120611 A1) are described ), and they are suitable α-1,3-fucosyltransferases for 3-FL biosynthesis in Bacillus cells. In addition, WO 2016/040531 A1 discloses α-1,3-fucosyltransferase CafC from B. nordii CL02T12C05 for the synthesis of 3-fucosyllactose and lactodifucotetraose, and CafD from H. hepaticus ATCC51449 for the production of LNnFP-III.
Дополнительные фукозилтрансферазы, которые могут быть экспрессированы в клетках Bacillus, для продукции фукозилированных сахаридов раскрыты в WO 2019/0088133 А1, который включен в данный документ посредством ссылки.Additional fucosyltransferases that can be expressed in Bacillus cells to produce fucosylated saccharides are disclosed in WO 2019/0088133 A1, which is incorporated herein by reference.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей фукозилтрансферазу, приспособлена к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the fucosyltransferase is adapted to the codon frequency of Bacillus.
В случае экспрессии фукозилтрансферазы клетка Bacillus содержит по меньшей мере один рекомбинантный ген, в котором область, кодирующая белок, кодирующая фукозилтрансферазу, функционально связана с последовательностями контроля экспрессии.In the case of fucosyltransferase expression, the Bacillus cell contains at least one recombinant gene in which the protein-coding region encoding the fucosyltransferase is operably linked to expression control sequences.
Рекомбинантный ген фукозилтрансферазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде.The recombinant fucosyltransferase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid.
В дополнительном и/или альтернативном воплощении клетка Bacillus для продукции фукозилированного олигосахарида может поглощать L-фукозу. Способность поглощать L-фукозу является преимуществом клеток Bacillus, в которых имеется реутилизационный путь ГДФ-фукозы.In a further and/or alternative embodiment, the Bacillus cell may ingest L-fucose to produce fucosylated oligosaccharide. The ability to absorb L-fucose is an advantage of Bacillus cells, which have a GDP-fucose recycling pathway.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы сделать возможным или улучшить поглощение L-фукозы. Таким образом, в клетке Bacillus имеется гетерологичная L-фукозопермеаза. Подходящая L-фукозопермеаза представляет собой FucP Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to enable or improve the uptake of L-fucose. Thus, the Bacillus cell contains heterologous L-fucose permease. A suitable L-fucose permease is E. coli FucP or a functional variant thereof.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует L-фукозопермеазу, предпочтительно нуклеотидную последовательность, которая кодирует FucP Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes L-fucose permease, preferably a nucleotide sequence that encodes E. coli FucP or a functional variant thereof.
L-фукозопермеаза Е. coli кодируется областью, кодирующей белок, гена fucP Е. coli (номер доступа Gen Bank: NP_417281.1). Следовательно, клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует FucP Е. coli или ее функциональный вариант.E. coli L-fucose permease is encoded by the protein coding region of the E. coli fucP gene (Gen Bank accession number: NP_417281.1). Therefore, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes E. coli FucP or a functional variant thereof.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей L-фукозопермеазу, приспособлена к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding L-fucose permease is adapted to the codon frequency of Bacillus.
Для экспрессии L-фукозопермеазы в клетке Bacillus содержится рекомбинантный ген L-фукозопермеазы, в котором нуклеотидная последовательность, которая кодирует L-фукозопермеазу, функционально связана с последовательностями контроля экспрессии.To express L-fucose permease, the Bacillus cell contains a recombinant L-fucose permease gene in which the nucleotide sequence that encodes L-fucose permease is operably linked to expression control sequences.
Рекомбинантный ген L-фукозопермеазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде.The recombinant L-fucose permease gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid.
В дополнительном и/или альтернативном воплощении клетка Bacillus для продукции фукозилированного олигосахарида не обладает никакой β-галактозидазной активностью или обладает сниженной β-галактозидазной активностью, по сравнению с клеткой дикого типа того же вида.In a further and/or alternative embodiment, a fucosylated oligosaccharide-producing Bacillus cell has no or reduced β-galactosidase activity compared to a wild-type cell of the same species.
Внутриклеточный биосинтез фукозилированных олигосахаридов требует импортирования лактозы в качестве субстрата-акцептора для фукозилтрансферазы, акцептирующей лактозу. Любая внутриклеточная ферментативная активность, которая гидролизует поглощенную лактозу, будет воздействовать на эффективность образования фукозиллактозы, поскольку пул внутриклеточной лактозы будет уменьшен. Таким образом, будет преимущественным, если клетка Bacillus для продукции фукозилированного олигосахарида не будет обладать или будет обладать по меньшей мере, по сравнению с клеткой Bacillus дикого типа, сниженной активностью бета-галактозидазы.Intracellular biosynthesis of fucosylated oligosaccharides requires the import of lactose as an acceptor substrate for lactose-accepting fucosyltransferase. Any intracellular enzymatic activity that hydrolyzes ingested lactose will affect the efficiency of fucosyllactose formation because the pool of intracellular lactose will be reduced. Thus, it will be advantageous if the Bacillus cell to produce fucosylated oligosaccharide has no or at least reduced beta-galactosidase activity compared to a wild-type Bacillus cell.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для устранения или по меньшей мере уменьшения активности β-галактозидазы клетки.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to eliminate or at least reduce the cell's β-galactosidase activity.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации гена дапА. В еще одном воплощении клетка Bacillus генетически сконструирована для снижения уровня экспрессии гена дапА, по сравнению с клеткой Bacillus дикого типа.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered through deletion or functional inactivation of the dapA gene. In yet another embodiment, a Bacillus cell is genetically engineered to reduce the expression level of the dapA gene compared to a wild-type Bacillus cell.
Ген ganA Bacillus также называется yvfH или 1асА. Он представляет собой ген регулона GanR, который содержит гены, кодирующие ферменты, участвующие в утилизации галактана. Ген ganA кодирует бета-галактозидазу, которая участвует в утилизации галактана Bacillus.The Bacillus ganA gene is also called yvfH or 1acA. It is a GanR regulon gene that contains genes encoding enzymes involved in galactan utilization. The ganA gene encodes beta-galactosidase, which is involved in the utilization of Bacillus galactan.
Делеция или функциональная инактивация гена ganA устраняет GanA-опосредуемую β-галактозидазную активность в клетке Bacillus, в то время как уменьшение уровня экспрессии ganA снижает количество GanA в клетке Bacillus и, следовательно, β-галактозидазную активность, которая могла бы препятствовать биосинтезу фукозилированного олигосахарида.Deletion or functional inactivation of the ganA gene eliminates GanA-mediated β-galactosidase activity in the Bacillus cell, while reducing the level of ganA expression reduces the amount of GanA in the Bacillus cell and therefore β-galactosidase activity, which would interfere with fucosylated oligosaccharide biosynthesis.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации гена yesZ. Ген yesZ Bacillus кодирует бета-галактозидазу YesZ, которая играет роль в деградации рамногалактуронана, происходящего из клеточных стенок растений. Экспрессия гена yesZ Bacillus индуцируется рамногалактуронаном I. В еще одном воплощении клетка Bacillus генетически сконструирована для того, чтобы уменьшать уровень экспрессии гена yesZ, по сравнению с клеткой Bacillus дикого типа.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered through deletion or functional inactivation of the yesZ gene. The Bacillus yesZ gene encodes YesZ beta-galactosidase, which plays a role in the degradation of rhamnogalacturonan derived from plant cell walls. Expression of the Bacillus yesZ gene is induced by rhamnogalacturonan I. In yet another embodiment, a Bacillus cell is genetically engineered to reduce the level of expression of the yesZ gene relative to a wild-type Bacillus cell.
Делеция или функциональная инактивация гена yesZ устраняет YesZ-опосредуемую β-галактозидазную активность в клетке Bacillus, тогда как уменьшение уровня экспрессии yesZ снижает количество YesZ в клетке Bacillus и, следовательно, β-галактозидазную активность, которая могла бы препятствовать биосинтезу фукозилированного олигосахарида.Deletion or functional inactivation of the yesZ gene eliminates YesZ-mediated β-galactosidase activity in the Bacillus cell, whereas reducing the level of yesZ expression reduces the amount of YesZ in the Bacillus cell and, therefore, β-galactosidase activity, which would interfere with the biosynthesis of fucosylated oligosaccharide.
Когда В. subtilis поступает в постэкспоненциальную фазу роста, они (начинают) продуцируют большие количества внеклеточных протеаз. Чужеродные белки часто являются чувствительными к протеазам. Таким образом, штамм, не содержащий экзопротеазу, является желательным для повышения стабильности гетерологичных белков и для обеспечения аккумуляции высоких уровней чужеродных белков. Геном Bacillus кодирует по меньшей мере восемь внеклеточных протеаз, а именно, nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA. Таким образом, в дополнительном и/или альтернативном воплощении клетка генетически сконструирована в том смысле, что по меньшей мере один ген, кодирующий внеклеточную протеазу, был удален или функционально инактивирован, предпочтительно, по меньшей мере один из генов, выбранных из группы, состоящей из nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA. Предпочтительно, два, три, четыре, пять, шест, семь или восемь генов, выбранных из группы, состоящей из nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA, удалены или функционально инактивированы.When B. subtilis enters the post-exponential growth phase, they (begin to) produce large amounts of extracellular proteases. Foreign proteins are often sensitive to proteases. Thus, an exoprotease-free strain is desirable to enhance the stability of heterologous proteins and to allow the accumulation of high levels of foreign proteins. The Bacillus genome encodes at least eight extracellular proteases, namely, nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA. Thus, in a further and/or alternative embodiment, the cell is genetically engineered in the sense that at least one gene encoding an extracellular protease has been deleted or functionally inactivated, preferably at least one of the genes selected from the group consisting of nprE , aprE, epr, bpr, mpr, nprB, vpr and wprA. Preferably, two, three, four, five, six, seven or eight genes selected from the group consisting of nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA are deleted or functionally inactivated.
В. subtilis синтезирует пульхерриминовую кислоту при росте в средах, содержащих углевод, такой как глюкоза или лактоза. Выделяемая пульхерриминовая кислота образует красный пигмент пульхерримин, соль пульхерриминовой кислоты (хелат железа (III)), где железо находится в среде для выращивания. Образование данного нежелательного побочного продукта во время процессов ферментации можно предотвратить/аннулировать посредством делеции или нарушения генов yvmC и/или сурХ. Ген yvmC кодирует цикподипептидсинтазу, и ген сурХ кодирует цитохром Р450 цикло-l-лейцил-l-лейцилдипептидоксидазу.B. subtilis synthesizes pulcherrimic acid when growing in media containing carbohydrates such as glucose or lactose. The released pulcherrimic acid forms the red pigment pulcherrimin, a salt of pulcherrimic acid (iron(III) chelate), where the iron is present in the growth medium. The formation of this undesirable by-product during fermentation processes can be prevented/abrogated by deletion or disruption of the yvmC and/or surX genes. The yvmC gene encodes cyclodipeptide synthase, and the surX gene encodes cytochrome P450 cyclo-l-leucyl-l-leucyl dipeptide oxidase.
Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована так, чтобы по меньшей мере один из генов yvmC и сурХ удален или функционально инактивирован.Thus, in a further and/or alternative embodiment, the Bacillus cell is genetically engineered such that at least one of the yvmC and surX genes is deleted or functionally inactivated.
В ризобактерии В. subtilis имеются гены для синтеза более чем 20 антибиотиков. Среди них имеются пептидные антибиотики, подобно лантибиотикам Bacillus subtilis и лантибиотик-подобным пептидам (субтилин, эрицин S, мерсацидин, субланцин 168, субтилозин А), и нерибосомно синтезируемые (пептидные) антибиотики (сурфактин, итурин, бацилломицин, микосубтилин, коринебактин/ бациллибактин, фенгицин, плипастатин, микобациллин, TL-119, бацилизин, бацилизоцин, амикумацин, 3,3'-неотрегалосадиамин, диффицидин, ризоктицин).The rhizobacterium B. subtilis contains genes for the synthesis of more than 20 antibiotics. Among them there are peptide antibiotics, like the lantibiotics of Bacillus subtilis and lantibiotic-like peptides (subtilin, ericin S, mersacidin, sublancin 168, subtilosin A), and non-ribosomally synthesized (peptide) antibiotics (surfactin, iturin, bacillomycin, mycosubtilin, corynebactin/bacillibactin, fengycin, plipastatin, mycobacillin, TL-119, bacilysin, bacilisocin, amicumacin, 3,3'-neotrehalosadiamine, difficidin, rhizocticin).
Для продукции фукозилированного олигосахарида предпочтительно использовать клетку Bacillus, которая не продуцирует антибиотик. Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus не синтезирует один или более антибиотиков, выбранных из группы, состоящей из лантибиотиков и лантибиотик-подобных пептидов, таких как субтилин, эрицин S, мерсацидин, субланцин 168, субтилозин А; нерибосомно синтезируемых (пептидных) антибиотиков, таких как сурфактин, итурин, бацилломицин, микосубтилин, коринебактин/бациллибактин, фенгицин, плипастатин, микобациллин, TL-119, бацилизин, бацилизоцин, амикумацин, 3,3'-неотрегалозадиамин, диффицидин и ризоктицин. Клетка Bacillus может быть генетически сконструирована с получением клетки Bacillus, которая не синтезирует один или более из указанных антибиотиков.For the production of fucosylated oligosaccharide, it is preferable to use a Bacillus cell that does not produce the antibiotic. Thus, in an additional and/or alternative embodiment, the Bacillus cell does not synthesize one or more antibiotics selected from the group consisting of lantibiotics and lantibiotic-like peptides, such as subtilin, ericin S, mersacidin, sublancin 168, subtilosin A; non-ribosomally synthesized (peptide) antibiotics such as surfactin, iturin, bacillomycin, mycosubtilin, corynebactin/bacillibactin, fengycin, plipastatin, mycobacillin, TL-119, bacilysin, bacilizocin, amicoumacin, 3,3'-neotrehalosadiamine, difficidin and rhizocticin. A Bacillus cell can be genetically engineered to produce a Bacillus cell that does not synthesize one or more of these antibiotics.
Клетки Bacillus дикого типа могут образовывать споры. Споруляцию, а именно процесс образования спор, у бактерий рассматривают как реакцию бактериальной клетки, которая инициирует программу развития, приводящую к образованию дочерних клеток отличной морфологии и направления развития. Споруляцию Bacillus исследовали как основную модель дифференцировки клеток. Во время споруляции палочковидная клетка Bacillus делится асимметрично, что приводит вследствие этого к получению двух генетически идентичных клеток с разной морфологией и направлениями развития.Wild-type Bacillus cells can form spores. Sporulation, namely the process of spore formation, in bacteria is considered as a reaction of a bacterial cell that initiates a developmental program leading to the formation of daughter cells of different morphology and developmental direction. Bacillus sporulation has been studied as a major model of cell differentiation. During sporulation, the rod-shaped Bacillus cell divides asymmetrically, resulting in two genetically identical cells with different morphologies and developmental directions.
Однако при промышленном получении нежелательно, если бактериальный штамм - продуцент образует споры во время ферментации. Таким образом, предпочтительно использовать клетки Bacillus для продукции фукозилированных олигосахаридов, которые не способны образовывать споры. Такие клетки Bacillus называются «неспорообразующими».However, in industrial production, it is undesirable if the producing bacterial strain forms spores during fermentation. Thus, it is preferable to use Bacillus cells to produce fucosylated oligosaccharides, which are not capable of spore formation. Such Bacillus cells are called "non-spore-forming".
Предпочтительно, неспорообразующая клетка Bacillus, способная продуцировать фукозилированный олигосахарид, происходила из одного из штаммов В. Subtilis, перечисленных в Таблице 1.Preferably, the non-sporulating Bacillus cell capable of producing fucosylated oligosaccharide is derived from one of the B. subtilis strains listed in Table 1.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации Spo0A. Подходящая функциональная инактивация Spo0A включает делецию участка фосфорилирования, где фосфотрансферазы Spo0F и Spo0B фосфорилируют Spo0A.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered through deletion or functional inactivation of Spo0A. Suitable functional inactivation of Spo0A involves deletion of the phosphorylation site where the phosphotransferases Spo0F and Spo0B phosphorylate Spo0A.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации генов, кодирующих фактор сигма SigE (sigE) и/или фактор сигма SigF (sigF).In a further and/or alternative embodiment, the Bacillus cell is genetically engineered by deletion or functional inactivation of genes encoding the sigma factor SigE (sigE) and/or the sigma factor SigF (sigF).
Клетка Bacillus по изобретению способна продуцировать фукозилированный олигосахарид, при культивации в присутствии лактозы в среде и в условиях, которые являются пермиссивными в отношении клетки Bacillus для продукции фукозилированного олигосахарида.The Bacillus cell of the invention is capable of producing fucosylated oligosaccharide when cultured in the presence of lactose in a medium and under conditions that are permissive for the Bacillus cell to produce fucosylated oligosaccharide.
Согласно второму аспекту предложено применение клетки Bacillus, как ранее описано в данном документе, для продукции фукозилированного олигосахарида, предпочтительно, фукозилированного олигосахарида грудного молока, такого как 2'-FL, 3-FL или 2',3-DiFL.A second aspect provides the use of a Bacillus cell, as previously described herein, for the production of a fucosylated oligosaccharide, preferably a human milk fucosylated oligosaccharide such as 2'-FL, 3-FL or 2',3-DiFL.
Поскольку Bacillus обычно расценивают как безопасную, продукция фукозилированных олигосахаридов для потребления человеком с использованием организма-продуцента, который в общем считается безопасным, также будет считаться безопасной, при условии, что изменения в клетках Bacillus для продукции фукозилированного олигосахарида не влияют на безопасность штамма-продуцента в отношении здоровья человека и окружающей среды. Следовательно, ожидают, что будет меньше проблем, влияющих на официальное одобрение фукозилированного олигосахарида для потребления человеком, в частности, фукозилированных олигосахаридов грудного молока для потребления человеком, более конкретно, для детской питательной смеси, которая состоит из или содержит фукозилированный олигосахарид, который был продуцирован посредством использования клетки Bacillus, как описано в данном документе. Таким образом, одобрение продуцируемых микробами фукозилированных олигосахаридов в детской питательной смеси и питательных композициях органами регулирования, а также среди потребителей, должно быть лучше.Because Bacillus is generally regarded as safe, the production of fucosylated oligosaccharides for human consumption using a producing organism generally considered safe will also be considered safe, provided that changes in the Bacillus cells to produce the fucosylated oligosaccharide do not affect the safety of the producing strain in regarding human health and the environment. Therefore, it is expected that there will be fewer problems affecting the approval of a fucosylated oligosaccharide for human consumption, in particular, fucosylated human milk oligosaccharides for human consumption, more particularly for an infant formula that consists of or contains a fucosylated oligosaccharide that has been produced by using Bacillus cells as described herein. Thus, the acceptance of microbially produced fucosylated oligosaccharides in infant formula and nutritional compositions by regulatory authorities as well as by consumers should be improved.
Согласно третьему аспекту предложен способ получения фукозилированного олигосахарида, который включает:According to a third aspect, there is provided a method for producing a fucosylated oligosaccharide, which includes:
- предоставление неспорообразующей клетки Bacillus, которая генетически сконструирована для того, чтобы иметь лактозопермеазу, путь биосинтеза ГДФ-фукозы и фукозилтрансферазу;- providing a non-sporulating Bacillus cell that is genetically engineered to have a lactose permease, a GDP-fucose biosynthetic pathway and a fucosyltransferase;
- культивирование клетки Bacillus в культуральной среде, содержащей лактозу, и в условиях, которые являются пермиссивными в отношении продукции фукозилированного олигосахарида, и- culturing the Bacillus cell in a culture medium containing lactose and under conditions that are permissive for the production of fucosylated oligosaccharide, and
возможно извлечение фукозилированного олигосахарида из культуральной среды и/или из клетки Bacillus.it is possible to extract the fucosylated oligosaccharide from the culture medium and/or from the Bacillus cell.
Неспорообразующая клетка Bacillus, которая предложена, представляет собой клетку Bacillus, как описано в данном документе.The non-sporulating Bacillus cell that is provided is a Bacillus cell as described herein.
В дополнительном и/или альтернативном воплощении фукозилированный олигосахарид выбран из группы, состоящей из 2'-фукозиллактозы (2'-FL), 3-фукозиллактозы (3-FL), 2',3-фукозиллактозы (DiFL - от англ. 2',3-difucosyllactose), лакто-N-фукопентаозы I (LNFP I - от англ. lacto-N-fucopentaose I), лакто-N-неофукопентаозы I (LNnFP I - от англ. lacto-N-neofucopentaose I), лакто-N-фукопентаозы II (LNFP II - от англ. lacto-N-fucopentaose II), лакто-N-фукопентаозы III (LNFP III - от англ. lacto-N-fucopentaose III), лакто-N-фукопентаозы V (LNFP V - от англ. lacto-N-fucopentaose V), лакто-N-неофукопентаозы V (LNnFP V - от англ. lacto-N-neofucopentaose V), лакто-N-дифукогексаозы I (LNDH I - от англ. lacto-N-difucohexaose I) и лакто-N-дифукогексаозы II (LND - от англ. lacto-N-difucohexaose II).In an additional and/or alternative embodiment, the fucosylated oligosaccharide is selected from the group consisting of 2'-fucosyllactose (2'-FL), 3-fucosyllactose (3-FL), 2',3-fucosyllactose (DiFL - from English 2', 3-difucosyllactose), lacto-N-fucopentaose I (LNFP I - from the English lacto-N-fucopentaose I), lacto-N-neofucopentaose I (LNnFP I - from the English lacto-N-neofucopentaose I), lacto-N -fucopentaose II (LNFP II - from English lacto-N-fucopentaose II), lacto-N-fucopentaose III (LNFP III - from English lacto-N-fucopentaose III), lacto-N-fucopentaose V (LNFP V - from English lacto-N-fucopentaose V), lacto-N-neofucopentaose V (LNnFP V - from English lacto-N-neofucopentaose V), lacto-N-difucohexaose I (LNDH I - from English lacto-N-difucohexaose I ) and lacto-N-difucohexaose II (LND - from English lacto-N-difucohexaose II).
В дополнительном и/или альтернативном воплощении культуральная среда содержит L-фукозу, в частности, для культивирования клетки Bacillus для продукции фукозилированного олигосахарида, в которой имеется реутилизационный путь ГДФ-фукозы для обеспечения ГДФ-фукозы в качестве субстрата-донора для фукозилтрансферазы.In a further and/or alternative embodiment, the culture medium contains L-fucose, in particular for culturing a Bacillus cell to produce a fucosylated oligosaccharide that has a GDP-fucose recycling pathway to provide GDP-fucose as a donor substrate for fucosyltransferase.
Изобретение также относится к фукозилированным олигосахаридам, которые были продуцированы клеткой Bacillus, и/или способу, как описано в данном документе, к применению указанных фукозилированных олигосахаридов для изготовления питательной композиции, предпочтительно, детской питательной смеси, добавки к рациону или продукта лечебного питания. Кроме того, настоящее изобретение также относится к питательным композициям, содержащим фукозилированный олигосахарид, который был продуцирован клеткой Bacillus, и/или способу, как описано в данном документе.The invention also relates to fucosylated oligosaccharides that have been produced by a Bacillus cell and/or to a method as described herein for the use of said fucosylated oligosaccharides for the manufacture of a nutritional composition, preferably an infant formula, dietary supplement or health food product. In addition, the present invention also relates to nutritional compositions containing a fucosylated oligosaccharide that has been produced by a Bacillus cell and/or a method as described herein.
Настоящее изобретение будет описано относительно конкретных воплощений и со ссылкой на графические материалы, но данное изобретение не ограничивается ими, а только формулой изобретения. Кроме того, термины первый, второй и тому подобное в описании и в формуле изобретения используются для проведения различия между похожими элементами и не обязательно для описания последовательности, во времени, в пространстве, по рангу или любым другим образом. Следует понимать, что термины, используемые таким образом, являются взаимозаменяемыми в соответствующих обстоятельствах, и что воплощения изобретения, описанные в данном документе, способны работать в последовательностях, отличных от описанных или проиллюстрированных в данном документе.The present invention will be described with respect to specific embodiments and with reference to drawings, but the invention is not limited thereto, but only by the claims. In addition, the terms first, second, and the like in the specification and claims are used to distinguish between like elements and not necessarily to describe sequence, in time, space, rank, or any other manner. It should be understood that the terms used in this manner are interchangeable in appropriate circumstances, and that the embodiments of the invention described herein are capable of operating in sequences other than those described or illustrated herein.
Следует отметить, что термин «содержащий», используемый в формуле изобретения, не следует считать ограничивающимся средствами, перечисленными в дальнейшем; он не исключает других элементов или стадий. Таким образом, его следует считать определяющим наличие заявленных признаков, целых чисел, стадий или компонентов, на которые ссылаются, но он не исключает наличие или добавление одного или более других признаков, целых чисел, стадий или компонентов или их групп. Таким образом, объем выражения «устройство, содержащее средства А и В» не следует ограничивать устройствами, состоящими только из компонентов А и В. Оно означает, что в отношении настоящего изобретения, единственными релевантными компонентами устройства являются А и В.It should be noted that the term “comprising” as used in the claims should not be considered limited to the means listed below; it does not exclude other elements or stages. Thus, it should be considered to determine the presence of the claimed features, integers, steps or components referred to, but it does not exclude the presence or addition of one or more other features, integers, steps or components or groups thereof. Thus, the scope of the expression "device comprising means A and B" should not be limited to devices consisting only of components A and B. It means that for the purposes of the present invention, the only relevant components of the device are A and B.
Ссылка на всем протяжении данного описания изобретения на «одно воплощение» или «воплощение» означает, что конкретный признак, структура или характеристика, описанные в связи с данным воплощением, включены в по меньшей мере одно воплощение настоящего изобретения. Таким образом, появления фраз «в одном воплощении» или «в воплощении» в разных местах по всему объему данного описания изобретения не обязательно все относятся к одному и тому же воплощению, но могут. Кроме того, конкретные признаки, структуры или характеристики могут быть объединены любым подходящим образом, как будет очевидно среднему специалисту в данной области из данного раскрытия, в одном или более воплощениях.Reference throughout this specification to “one embodiment” or “embodiment” means that the particular feature, structure, or characteristic described in connection with that embodiment is included in at least one embodiment of the present invention. Thus, appearances of the phrases “in one embodiment” or “in an embodiment” in different places throughout this specification do not necessarily all refer to the same embodiment, but may. Moreover, specific features, structures, or characteristics may be combined in any suitable manner, as will be apparent to one of ordinary skill in the art from this disclosure, in one or more embodiments.
Аналогично, следует понимать, что в описании иллюстративных воплощений изобретения разные признаки изобретения иногда сгруппированы вместе в одном единственном воплощении, фигуре или его описании в целях упрощения раскрытия и помощи в понимании одного или более из разных аспектов изобретения. Данный способ раскрытия, однако, не нужно считать отражающим мысль, что заявленное изобретение требует больше признаков, чем явным образом перечислены в каждом пункте. Скорее, как отражено в приведенной ниже формуле изобретения, аспекты изобретения заключаются меньше чем во всех признаках одного вышеизложенного раскрытого воплощения. Таким образом, формула изобретения после подробного описания явным образом включена тем самым в данное подробное описание, причем каждый пункт отдельно стоит в виде отдельного воплощения данного изобретения.Likewise, it should be understood that in the description of illustrative embodiments of the invention, various features of the invention are sometimes grouped together in one single embodiment, figure, or description thereof for the purpose of simplifying the disclosure and aiding in understanding one or more of the various aspects of the invention. This manner of disclosure, however, should not be taken to imply that the claimed invention requires more features than are expressly listed in each claim. Rather, as reflected in the claims below, aspects of the invention are comprised of less than all of the features of the one disclosed embodiment set forth above. Thus, the claims following the detailed description are hereby expressly incorporated into this detailed description, with each claim standing alone as a separate embodiment of the invention.
Кроме того, в то время как некоторые воплощения, описанные в данном документе, включают некоторые, но не все признаки, включенные в другие воплощения, подразумевается, что комбинации признаков разных воплощений находятся в объеме изобретения и образуют разные воплощения, как будет понятно специалистам в данной области. Например, в приведенной ниже формуле изобретения любое из заявленных воплощений можно использовать в любой комбинации.In addition, while some embodiments described herein include some, but not all, of the features included in other embodiments, it is understood that combinations of features of different embodiments are within the scope of the invention and form different embodiments, as will be appreciated by those skilled in the art. areas. For example, in the claims below, any of the claimed embodiments can be used in any combination.
Кроме того, некоторые из воплощений описаны в данном документе как способ или комбинация элементов способа, которые могут быть реализованы посредством процессора компьютерной системы или с помощью других средств выполнения функции. Таким образом, процессор с необходимыми инструкциями для осуществления такого способа или элемента способа образует средство осуществления способа или элемента способа. Кроме того, описанный в данном документе элемент воплощения аппарата представляет собой пример средства осуществления функции, выполняемой элементом, с целью осуществления изобретения.In addition, some of the embodiments are described herein as a method or combination of method elements that may be implemented by a computer system processor or other means of performing a function. Thus, a processor with the necessary instructions for implementing such method or method element constitutes means for implementing the method or method element. In addition, the apparatus embodiment described herein is an example of a means of implementing the function performed by the apparatus for the purpose of carrying out the invention.
В описании и графических материалах, предоставленных в данном документе, изложены многочисленные конкретные подробности. Однако понятно, что воплощения изобретения можно осуществлять на практике без данных конкретных подробностей. В других примерах хорошо известные способы, структуры и методики не были показаны подробно для того, чтобы не затруднять понимание данного описания. Теперь изобретение будет описано с помощью подробного описания нескольких воплощений изобретения. Ясно, что другие воплощения изобретения могут быть скомпонованы в соответствии со знаниями специалистов в данной области, не отклоняясь от истинной сущности или технической идеи изобретения, причем изобретение ограничено только условиями прилагаемой формулы изобретения.Numerous specific details are set forth in the descriptions and graphics provided herein. However, it will be understood that embodiments of the invention may be practiced without these specific details. In other examples, well-known methods, structures and techniques have not been shown in detail so as not to obscure the understanding of this description. The invention will now be described by way of detailed description of several embodiments of the invention. It is clear that other embodiments of the invention can be put together in accordance with the knowledge of those skilled in the art without deviating from the true spirit or technical idea of the invention, the invention being limited only by the terms of the appended claims.
ПРИМЕРЫEXAMPLES
Пример 1: Трансформация Bacillus subtilisExample 1: Transformation of Bacillus subtilis
Bacillus subtilis можно подвергать генетическим манипуляциям посредством разных методик. Для трансформации В, subtilis компетентные клетки готовили посредством модифицированного протокола двухстадийного способа (Anagnostopoulos, С.and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). Ночную культуру инокулировали в среде MG1 и встряхивали при 37°С. Среда MG1 представляет собой минимальную среду Спицайзена, которая дополнена 0,5% глюкозой, 5 мМ MgSO4 и 0,02% казаминовыми кислотами (возможно, дополнительно дополнена биотином и/или L-триптофаном). На следующее утро данную культуру разводили 1:20 в свежей среде MG1 и инкубировали при 37°С в течение приблизительно 6 ч. 1 мл культуры разводили в 8 мл среды MG2, которая отличается от среды MG1 по концентрации казаминовых кислот (0,01% вместо 0,02%). В укороченном протоколе ночную культуру непосредственно разводят в среде MG2. После инкубации в течение еще 90 мин порцию культуры, 1 мл, смешивали с 1-3 мкг мультимерной плазмидной ДНК или линейной ДНК и инкубировали при 37°С в течение 30-60 мин при встряхивании. Мультимерную плазмидную ДНК получали или посредством использования штамма Е. coli NM538 для размножения плазмидной ДНК или посредством линеаризации плазмиды в результате расщепления рестриктазой с одним разрезом, которая осуществляет расщепление в пределах каркаса с последующим повторным лигированием Т4 ДНК лигазой.Bacillus subtilis can be genetically manipulated through various techniques. For transformation of B, subtilis competent cells were prepared by a modified two-step protocol (Anagnostopoulos, C. and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). The overnight culture was inoculated in MG1 medium and shaken at 37°C. MG1 medium is Spitzeisen's minimal medium supplemented with 0.5% glucose, 5 mM MgSO 4 and 0.02% casamino acids (possibly additionally supplemented with biotin and/or L-tryptophan). The next morning, this culture was diluted 1:20 in fresh MG1 medium and incubated at 37°C for approximately 6 hours. 1 ml of culture was diluted in 8 ml of MG2 medium, which differs from MG1 medium in the concentration of casamino acids (0.01% instead of 0.02%). In the shortened protocol, the overnight culture is directly propagated in MG2 medium. After incubation for another 90 min, a 1 ml portion of the culture was mixed with 1-3 μg of multimeric plasmid DNA or linear DNA and incubated at 37°C for 30-60 min with shaking. Multimeric plasmid DNA was prepared either by using E. coli strain NM538 to propagate the plasmid DNA or by linearizing the plasmid by digestion with a single cut restriction enzyme that cleaves within the framework followed by re-ligation with T4 DNA ligase.
Затем, клетки распределяли по чашкам с 2xYT и агаром, содержащим соответствующий антибиотик. Антибиотики добавляли в соответствующих концентрациях: 5 мкг⋅мл-1 эритромицина, 5 мкг⋅мл-1 хлорамфеникола, 10 мкг⋅мл-1 канамицина,100 мкг⋅мл-1 пектиномицина.The cells were then plated with 2xYT and agar containing the appropriate antibiotic. Antibiotics were added in appropriate concentrations: 5 μg⋅ml -1 erythromycin, 5 μg⋅ml -1 chloramphenicol, 10 μg⋅ml -1 kanamycin, 100 μg⋅ml -1 pectinomycin.
В качестве альтернативы, для трансформации протопластов (Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559) клетки выращивали в 20 мл бульона Penassay (РАВ - от англ. Penassay broth) при 37°С до начала стационарной фазы роста (OD600 (от англ. optical density - оптическая фаза) равна 1,7-2). Затем клетки осаждали центрифугированием и ресуспендировали в 10 мл среды SMPP (0,3%-ный бычий сывороточный альбумин, 5%-ная 2 М сахароза, 25% 4×РАВ, 50% 2×SMM), состоящей из 2×SMM, представляющего собой 1 М сахарозу, 0,04 М гидрат двунатриевой соли малеиновой кислоты и 0,04 М MgCl2 (рН 6,5). После добавления лизоцима (10 мг мл-1) и мутанолизина (75 Ед мл-1) смесь инкубировали при 37°С при встряхивании с образованием протопластов. Образование протопластов проверяли посредством микроскопа. Затем протопласты аккуратно собирали посредством центрифугирования при 5200×g и 4°С в течение 5 мин, два раза промывали охлажденным льдом промывочным буфером для электротрансформации (1×SMM) и, в конечном итоге, суспендировали в данном растворе. Плазмидную ДНК (1-3 мкг) добавляли к 120 мкл суспензии протопластов, и смесь держали на льду в течение по меньшей мере 5 мин. Смесь для трансформации переносили в кювету, объемом 0,2 см, и один импульс для электропорации прикладывали на уровне 25 мкФ, 400 Ω и 0,7 кВ. Сразу после разряда электропорации 1 мл восстанавливающей среды (равные объемы 4×РАВ и 2×SMM, свежеприготовленные перед применением) добавляли в кювету. Затем реакционную смесь для трансформации переносили в 2 мл пробирку и инкубировали при 37°С при встряхивании в течение 12 ч. Для регенерации клеточную суспензию распределяли по чашкам с DM3 и агаром (Chang, S. and Cohen, S. (1979) MGG 168(1):111-115) и инкубировали при 37°C в течение 48 ч. Регенерирующая смесь DM3 содержала следующие стерильные растворы на литр: 200 мл 4%-ного агара, 100 мл 5%-ных казаминовых кислот, 50 мл 10%-ого дрожжевого экстракта, 100 мл 3,5%-ного K2HPO4 и 1,5%-ного KH2PO4, 25 мл 20%-ной глюкозы, 20 мл 1 М MgCl2, 500 мл 0,5 М сорбита и 5 мл простерилизованного посредством фильтрации 2%-ного бычьего сывороточного альбумина (добавляемые к смеси, когда температура ниже 55°С), и ее дополняли соответствующим антибиотиком.Alternatively, for protoplast transformation (Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559), cells were grown in 20 ml Penassay broth (PAB) at 37°C before stationary growth phase (OD 600 (from the English optical density - optical phase) is 1.7-2). Cells were then pelleted by centrifugation and resuspended in 10 ml SMPP medium (0.3% bovine serum albumin, 5% 2 M sucrose, 25% 4×PAB, 50% 2×SMM) consisting of 2×SMM representing consists of 1 M sucrose, 0.04 M disodium maleic acid hydrate and 0.04 M MgCl 2 (pH 6.5). After adding lysozyme (10 mg ml -1 ) and mutanolysin (75 U ml -1 ), the mixture was incubated at 37°C with shaking to form protoplasts. The formation of protoplasts was checked using a microscope. The protoplasts were then carefully collected by centrifugation at 5200 × g and 4°C for 5 min, washed twice with ice-cold electrotransformation wash buffer (1 × SMM), and finally suspended in this solution. Plasmid DNA (1-3 μg) was added to 120 μl of protoplast suspension, and the mixture was kept on ice for at least 5 minutes. The transformation mixture was transferred into a 0.2 cm cuvette, and one electroporation pulse was applied at 25 μF, 400 Ω, and 0.7 kV. Immediately after the electroporation discharge, 1 ml of reducing medium (equal volumes of 4×PAB and 2×SMM, freshly prepared before use) was added to the cuvette. The transformation reaction mixture was then transferred to a 2 ml tube and incubated at 37°C with shaking for 12 hours. For regeneration, the cell suspension was distributed onto DM3 and agar plates (Chang, S. and Cohen, S. (1979) MGG 168( 1):111-115) and incubated at 37°C for 48 hours. The regenerating mixture DM3 contained the following sterile solutions per liter: 200 ml of 4% agar, 100 ml of 5% casamino acids, 50 ml of 10% agar of yeast extract, 100 ml of 3.5% K 2 HPO 4 and 1.5% KH 2 PO 4 , 25 ml of 20% glucose, 20 ml of 1 M MgCl 2 , 500 ml of 0.5 M sorbitol and 5 ml of filter-sterilized 2% bovine serum albumin (added to the mixture when the temperature is below 55°C), and it was supplemented with the appropriate antibiotic.
Электропорацию В. subtilis проводили в соответствии с модифицированным протоколом от Zhang et al. (2011), предоставленным MoBiTec GmbH (Zhang, G., Bao, P., Zhang. Y., Deng, A. Chen. N. и Wen, T. (2011) Anal. Biochem., 409:130-137). Ночную культуру 2×YT разводили в 100 раз свежей средой 2×YT, и культуру выращивали до OD600 0,2 при 37°С на ротационной качалке. Затем культуру дополняли 1%-ным DL-треонином, 2%-ным глицином, 0,1%-ным триптофаном и 0,03% Tween 80. После культивирования в течение еще 60 мин, клеточную суспензию охлаждали на льду в течение 20 мин, центрифугировали при 5000×g в течение 10 мин при 4°С и два раза промывали буфером для электропорации (0,5 М трегалоза, 0,5 М сорбит, 0,5 М маннит, 0,5 мМ MgCl2, 0,5 мМ K2HPO4, 0,5 мМ KH2PO4, рН 7,4, стерилизовали посредством фильтрации и хранили в замороженном виде). Наконец, клетки ресуспендировали в буфере для электропорации в соотношении 1/100 исходного объема культуры, и 100 мкл клеточной суспензии смешивали с ДНК. Смесь для трансформации переносили в 0,1-см кювету, и электропорацию проводили при 1,8 кВ с помощью одного импульса, доставляемого посредством прибора MicroPulser™ (Bio-Rad). Сразу после переноса импульса, 1 мл бульона 2×YT, содержащего 0,5 М сорбит и 0,38 М маннит, добавляли в кювету. Суспензию для трансформации переносили в пробирку, объемом 2 мл, и инкубировали при 37°С в течение 3 ч на ротационной качалке. Клетки распределяли по чашке с 2×YT и агаром и инкубировали при 37°С в течение ночи.Electroporation of B. subtilis was performed according to a modified protocol from Zhang et al. (2011) provided by MoBiTec GmbH (Zhang, G., Bao, P., Zhang. Y., Deng, A. Chen. N. and Wen, T. (2011) Anal. Biochem., 409:130-137) . The overnight 2xYT culture was diluted 100-fold with fresh 2xYT medium and the culture was grown to an OD 600 of 0.2 at 37°C on a rotary shaker. The culture was then supplemented with 1% DL-threonine, 2% glycine, 0.1% tryptophan, and 0.03% Tween 80. After culturing for an additional 60 min, the cell suspension was cooled on ice for 20 min. centrifuged at 5000×g for 10 min at 4°C and washed twice with electroporation buffer (0.5 M trehalose, 0.5 M sorbitol, 0.5 M mannitol, 0.5 mM MgCl 2 , 0.5 mM K 2 HPO 4 , 0.5 mM KH 2 PO 4 , pH 7.4, filter sterilized and stored frozen). Finally, the cells were resuspended in electroporation buffer at a ratio of 1/100 of the original culture volume, and 100 μl of the cell suspension was mixed with DNA. The transformation mixture was transferred to a 0.1 cm cuvette and electroporation was performed at 1.8 kV with a single pulse delivered by a MicroPulser™ instrument (Bio-Rad). Immediately after pulse transfer, 1 ml of 2×YT broth containing 0.5 M sorbitol and 0.38 M mannitol was added to the cuvette. The transformation suspension was transferred into a 2 ml test tube and incubated at 37°C for 3 hours on a rotary shaker. Cells were spread on a 2×YT agar plate and incubated at 37°C overnight.
Используя альтернативный протокол электропорации (Xue, G. P., J. S. Johnson, и В. P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191), 5 мл LB, содержащей 0,5 M глюцит, инокулировали В. subtilis и инкубировали в течение ночи при 37°С. Далее, ночную культуру разводили (1:16) 75 мл LB, содержащей 0,5 М глюцит, и инкубировали до получения OD600 0,85 - 0,95. Затем клетки осаждали посредством центрифугирования в течение 10 мин при 4°С при 5,000×g и четыре раза промывали буфером для электропорации, охлажденным посредством льда (10% глицерин, 0,5 М глюцит, 0,5 М маннит). Наконец, клетки ресуспендировали в 1-2 мл буфера для электропорации. Электропорацию проводили, используя 60 мкл компетентных клеток с ДНК в охлажденной кювете для электропорации (расстояние между электродами 1 мм). Смесь клетки-ДНК подвергали воздействию одного электрического импульса на уровне 25 мкФ, 200 Ω и 21 кВ/см. Наконец, 1 мл бульона для восстановления (LB, содержащая 0,5 М глюцит и 0,38 М маннит) добавляли к электропермеабилизированным клеткам, и бактериальную культуру инкубировали в течение 3 ч при 37°С с последующим посевом на LB с агаром с добавлением антибиотика.Using an alternative electroporation protocol (Xue, G. P., J. S. Johnson, and B. P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191), 5 ml of LB containing 0.5 M glucite was inoculated with B. subtilis and incubated in overnight at 37°C. Next, the overnight culture was diluted (1:16) with 75 ml of LB containing 0.5 M glucite and incubated until an OD 600 of 0.85 - 0.95 was obtained. Cells were then pelleted by centrifugation for 10 min at 4°C at 5,000×g and washed four times with ice-cold electroporation buffer (10% glycerol, 0.5 M glucose, 0.5 M mannitol). Finally, the cells were resuspended in 1–2 ml of electroporation buffer. Electroporation was performed using 60 μl of competent cells with DNA in a chilled electroporation cuvette (distance between electrodes 1 mm). The cell-DNA mixture was exposed to a single electrical pulse at 25 μF, 200 Ω, and 21 kV/cm. Finally, 1 ml of recovery broth (LB containing 0.5 M glucite and 0.38 M mannitol) was added to the electropermeabilized cells, and the bacterial culture was incubated for 3 h at 37°C, followed by plating on LB agar supplemented with antibiotic. .
Использовали две разные обогащенные среды, а именно бульон Luria (LB) и 2×YT. Среда бульон Luria (LB) состояла из 1%-ного триптона, 0,5%-ого дрожжевого экстракта и 0,5% NaCl (рН 7,2).Two different enriched media were used, namely Luria broth (LB) and 2×YT. Luria broth (LB) medium consisted of 1% tryptone, 0.5% yeast extract, and 0.5% NaCl (pH 7.2).
Среда 2×YT состояла из 1,6%-ного триптона, 1%-ого дрожжевого экстракта и 0,5% NaCl (рН 7,5).2×YT medium consisted of 1.6% tryptone, 1% yeast extract, and 0.5% NaCl (pH 7.5).
Для получения чашек с обогащенной средой с агаром добавляли 15 г л-1 агара.To obtain plates with enriched agar medium, 15 g l -1 agar was added.
Для экспериментов с встряхиваемыми колбами использовали минимальную среду Спицайзена (Spizizen, J. 1958 Proc. Natl. Acad. Sci. U. S. A. 44(10):1072-1078).For shake flask experiments, Spizizen's minimal medium was used (Spizizen, J. 1958 Proc. Natl. Acad. Sci. U.S.A. 44(10):1072-1078).
Минимальная среда Спицайзена содержит следующие соли: 2 г/л (NH4)2SO4, 14 г/л K2HPO4, 6 г/л KH2PO4, 1 г/л цитрата Na3 × 2⋅H2O и 0,2 г/л MgSO4 × 7⋅H2O.Spitzeisen's minimal medium contains the following salts: 2 g/l (NH 4 ) 2 SO 4 , 14 g/l K 2 HPO 4 , 6 g/l KH 2 PO 4 , 1 g/l citrate Na 3 × 2⋅H 2 O and 0.2 g/l MgSO 4 × 7⋅H 2 O.
Предкультуральная среда, состоящая из минимальных солей Спицайзена, дополненная 2% D-глюкозой, 0,05% казаминовыми кислотами и MgSO4, до конечной концентрации 2 мМ (возможно дополнительно дополненная биотином и/или L-триптофаном).Preculture medium consisting of Spitzen salts supplemented with 2% D-glucose, 0.05% casamino acids and MgSO 4 to a final concentration of 2 mM (optionally supplemented with biotin and/or L-tryptophan).
Основная культуральная среда состояла из минимальных солей Спицайзена, дополненная 2%-ной D-глюкозой, 0,05%-ыми казаминовыми кислотами, MgSO4 до конечной концентрации 2 мМ и 0,5 мл⋅л-1 1000×раствора микроэлементов (возможно дополнительно дополненная биотином и/или L-триптофаном).The main culture medium consisted of minimal Spitzeisen salts, supplemented with 2% D-glucose, 0.05% casamino acids, MgSO 4 to a final concentration of 2 mM and 0.5 ml⋅l -1 1000× trace element solution (possibly additional supplemented with biotin and/or L-tryptophan).
Раствор микроэлементов (1000х) состоял из 100,6 г⋅л-1 C6H9NO6, 56,4 г⋅л-1 цитрата железа (III)-аммония, 9,8 гл-1 MnCl2 × 4⋅H2O, 1,6 г⋅л-1 CoCl2 × 6 H2O, 1 г⋅л-1 CuCl2 × 2⋅H2O, 1,9 г⋅л-1 Н3 ВО3, 9 г⋅л-1 ZnSO4 × 7⋅H2O, 1,1 г⋅л-1 Na2MoO4 × 2⋅H2O, 1,5 г⋅л-1 Na2SeO3, 1,5 г⋅л-1 NiSO4 × 6⋅H2O.The solution of trace elements (1000x) consisted of 100.6 g⋅l -1 C 6 H 9 NO 6 , 56.4 g⋅l -1 iron (III)-ammonium citrate, 9.8 g⋅l -1 MnCl 2 × 4⋅H 2 O, 1.6 g⋅l -1 CoCl 2 × 6 H 2 O, 1 g⋅l -1 CuCl 2 × 2⋅H 2 O, 1.9 g⋅l -1 H 3 VO 3 , 9 g ⋅l -1 ZnSO 4 × 7⋅H 2 O, 1.1 g⋅l -1 Na 2 MoO 4 × 2⋅H 2 O, 1.5 g⋅l -1 Na 2 SeO 3 , 1.5 g⋅ l -1 NiSO 4 × 6⋅H 2 O.
При необходимости, соответствующий(ие) антибиотик(и) добавляли к среде для того, чтобы сделать ее селективной.If necessary, appropriate antibiotic(s) were added to the medium in order to make it selective.
Штаммы В. subtilis исходно выращивали на чашках с обогащенными средами с агаром с получением одиночных колоний. Данные чашки выращивали в течение 1 суток при 30-37°С. В экспериментах со встряхиваемыми колбами 20 мл предварительной культуры инокулировали одиночной колонией и выращивали в течение ночи при 30-37°С на ротационной качалке. Следующие 20 мл основных культур инокулировали данной предварительной культурой до начальной OD600 примерно 0,1 и инкубировали при 30-37°С на ротационной качалке. Если требовалась индукция, 40-60 мл основной культуры разбивали на порции по 20 мл в момент времени индукции. Объем культуры не превышал 20% емкости встряхиваемой колбы.B. subtilis strains were initially grown on enriched agar plates to produce single colonies. These dishes were grown for 1 day at 30-37°C. For shake flask experiments, 20 mL of preculture was inoculated with a single colony and grown overnight at 30–37°C on a rotary shaker. The next 20 ml of main cultures were inoculated with this preculture to an initial OD 600 of approximately 0.1 and incubated at 30-37°C on a rotary shaker. If induction was required, 40–60 ml of the main culture was divided into 20 ml portions at the induction time point. The volume of the culture did not exceed 20% of the capacity of the shake flask.
Пример 2: Конструирование штамма-продуцента Bacillus subtilis для 2'-фукозиллактозыExample 2: Construction of a Bacillus subtilis producer strain for 2'-fucosyllactose
Модификации метаболизма штамма Bacillus subtilis с дефектом спорообразования (таблица 1) достигали посредством интеграции гетерологичных генов тапС Е. coli, тапВ Е. coli и тапА Е. coli и одновременного удаления эндогенного гена lacA посредством гомологичной рекомбинации. Ген дапА (yvfN, lacA) В. subtilis, который расположен в пределах галактозного оперона, кодирует бета-галактозидазу.Modification of the metabolism of a sporulation-defective Bacillus subtilis strain (Table 1) was achieved by integrating the heterologous E. coli tapC, E. coli tapB, and E. coli tapA genes and simultaneous removal of the endogenous lacA gene through homologous recombination. The dapA gene (yvfN, lacA) of B. subtilis, which is located within the galactose operon, encodes beta-galactosidase.
Для синтеза ГДФ-маннозы открытые рамки считывания тапС, тапВ и тапА функционально связаны с конститутивным промотором Р43 В, subtilis (часть репозитория iGem: ID последовательности: ВВа_K143013) в виде оперона. Ген тапС (номер доступа Gen Bank: NP_416553.1) кодирует ГДФ:маннозо-1-фосфатгуанилилтрансферазу из Е. coli. Ген тапВ (номер доступа Gen Bank: NP_416552.1) кодирует фосфоманномутазу Е. coli и ген тапА (номер доступа Gen Bank: NP_389084.1) кодирует фруктозо-6-фосфатизомеразу В. subtilis. Каждый из генов, упомянутых выше, сливали in silico с последовательностью RBS В. subtilis. Описанную в данном документе экспрессионную кассету <Р43-тапСВА> подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp. Далее, кассету полной интеграции собирали и клонировали в pBR322 (New England Biolabs GmbH, Франкфурт, Германия) с созданием суицидной плазмиды <pBR322 flank дапА up-lox71-erm-lox66-P43-manCBA-flank ganA down> (SEQ ID NO: 1). Затем, В. subtilis трансформировали данной плазмидой за счет ее природной компетентности. Клетки распределяли по чашкам с 2х YT и агаром, содержащим соответствующий антибиотик (5 мкг мл-1 эритромицина). Интеграцию экспрессионной кассеты <Р43-тапСВА> в локус ganA генома В. subtilis, с получением штамма А, проверяли посредством ПЦР (полимеразная цепная реакция) на колониях. Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.For the synthesis of GDP-mannose, the open reading frames tapC, tapB and tapA are functionally linked to the constitutive promoter P43 B, subtilis (part of the iGem repository: sequence ID: BBa_K143013) in the form of an operon. The tapC gene (Gen Bank accession number: NP_416553.1) encodes GDP:mannose-1-phosphate guanylyltransferase from E. coli. The tapB gene (Gen Bank accession number: NP_416552.1) encodes E. coli phosphomannomutase and the tapA gene (Gen Bank accession number: NP_389084.1) encodes B. subtilis fructose-6-phosphate isomerase. Each of the genes mentioned above was fused in silico to the RBS sequence of B. subtilis. The <P43-tapCBA> expression cassette described herein was codon optimized for expression in B. subtilis and produced synthetically through GenScript Corp. Next, the full integration cassette was assembled and cloned into pBR322 (New England Biolabs GmbH, Frankfurt, Germany) to create the suicide plasmid <pBR322 flank ganA up-lox71-erm-lox66-P43-manCBA-flank ganA down> (SEQ ID NO: 1 ). Then, B. subtilis was transformed with this plasmid due to its natural competence. The cells were spread on 2x YT and agar plates containing the appropriate antibiotic (5 μg ml -1 erythromycin). Integration of the <P43-tapCBA> expression cassette into the ganA locus of the B. subtilis genome, resulting in strain A, was verified by colony PCR (polymerase chain reaction). Gene expression was confirmed by targeted proteomics and/or real-time PCR.
Для продукции 2'-фукозиллактозы из лактозы и ГДФ-маннозы в полученном штамме для интеграции <Р43-тапСВА> конструировали экспрессионную плазмиду (SEQ ID NO: 2), которая содержит все необходимые гены под контролем индуцибельного промотора Pgrac100. Таким образом, экспрессионный вектор рНТ253 В. subtilis (MoBiTec GmbH, Геттинген, Германия) использовали в качестве каркаса. Открытую рамку считывания гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1) амплифицировали посредством ПЦР из хромосомной ДНК. Открытую рамку считывания гена wbgL, кодирующего α-1,2-фукозилтрансферазы O126 Е. coli, подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp. Кроме того, открытые рамки считывания генов gmd Е. coli (номер доступа Gen Bank: NP_416557.1; кодирующий ГДФ-маннозо-4,6-дегидратазу) и wcaG (номер доступа Gen Bank: NP_416556.1; кодирующий ГДФ-фукозосинтазу) подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp. Каждый ген, заключенный в индуцибельной экспрессионной кассете, был связан с последовательностью RBS В, subtilis. Кроме того, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) вводили в конечную экспрессионную плазмиду <рНТ253 Pgrac100-wbgL-gmd-wcaG-lacY-terminator> (SEQ ID NO: 2). Штамм интеграции <P43-manCBA> трансформировали данной экспрессионной плазмидой (SEQ ID NO: 2) за счет его природной компетентности. Экспрессию генов подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени. Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. Subtilis, для продукции 2'-фукозиллактозы в присутствии экзогенной лактозы.To produce 2'-fucosyllactose from lactose and GDP-mannose in the resulting strain for the integration of <P43-tapCBA>, an expression plasmid (SEQ ID NO: 2) was constructed, which contains all the necessary genes under the control of the inducible promoter P grac100 . Therefore, the B. subtilis expression vector pHT253 (MoBiTec GmbH, Göttingen, Germany) was used as a scaffold. The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1) was amplified by PCR from chromosomal DNA. The open reading frame of the wbgL gene encoding E. coli O126 α-1,2-fucosyltransferases was codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. In addition, the open reading frames of the E. coli genes gmd (Gen Bank accession number: NP_416557.1; encoding GDP-mannose-4,6-dehydratase) and wcaG (Gen Bank accession number: NP_416556.1; encoding GDP-fucose synthase) were subjected to codon optimization for expression in B. subtilis and produced synthetically by GenScript Corp. Each gene contained in the inducible expression cassette was associated with an RBS sequence B, subtilis. In addition, the appropriate B. subtilis termination sequence from part of the iGem repository (Sequence ID: BBa_B0015) was introduced into the final expression plasmid <pHT253 P grac100 -wbgL-gmd-wcaG-lacY-terminator> (SEQ ID NO: 2). The integration strain <P43-manCBA> was transformed with this expression plasmid (SEQ ID NO: 2) due to its natural competence. Gene expression was confirmed by targeted proteomics and/or real-time PCR. Transformants were cultured under conditions that are permissive for B. subtilis to produce 2'-fucosyllactose in the presence of exogenous lactose.
Пример 3: Конструирование штамма-продуцента Bacillus subtilis для 2'-фукозиллактозыExample 3: Construction of a Bacillus subtilis producer strain for 2'-fucosyllactose
Штамм А, который описан в примере 2, использовали в качестве родительского штамма. Для продукции 2'-фукозиллактозы из лактозы и ГДФ-маннозы, дополнительно, гены lacY, gmd, wcaG и wbgL Е. coli интегрировали в эндогенный локус атуЕ (атуА) штамма А (кодирующий альфа-амилазу).Strain A, which is described in example 2, was used as the parent strain. To produce 2'-fucosyllactose from lactose and GDP-mannose, additionally, the E. coli lacY, gmd, wcaG and wbgL genes were integrated into the endogenous atuE locus (atuA) of strain A (encoding alpha-amylase).
Открытую рамку считывания гена wbgL (кодирующего α-1,2-фукозилтрансферазу) подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp. Кроме того, открытые рамки считывания генов gmd (номер доступа Gen Bank: NP_416557.1; кодирующего ГДФ-маннозо-4,6-дегидратазу) и wcaG (номер доступа Gen Bank: NP_416556.1; кодирующего ГДФ-фукозосинтазу) подвергали оптимизации кодонов для экспрессии в В. subtilis (проводилось GenScript Corp), помещали под контроль сильного конститутивного промотора PlepA В. subtilis в виде оперона из двух генов и получали синтетически с помощью GenScript Corp. Открытую рамку считывания гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1), кодирующего лактозопермеазу, амплифицировали посредством ПЦР из хромосомной ДНК.The open reading frame of the wbgL gene (encoding α-1,2-fucosyltransferase) was codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. In addition, the open reading frames of the genes gmd (Gen Bank accession number: NP_416557.1; encoding GDP-mannose-4,6-dehydratase) and wcaG (Gen Bank accession number: NP_416556.1; encoding GDP-fucose synthase) were subjected to codon optimization for expression in B. subtilis (conducted by GenScript Corp), placed under the control of the strong constitutive B. subtilis P lepA promoter as a two-gene operon and produced synthetically by GenScript Corp. The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR from chromosomal DNA.
Все необходимые гены для продукции 2'-фукозиллактозы из лактозы и ГДФ-маннозы собирали в конститутивную экспрессионную кассету <P43-wbgL-lacY-PlepA-gmd-wcaG>, в которой каждый ген был связан с последовательностью RBS В. subtilis. Дополнительно, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) помещали ниже данной экспрессионной кассеты. Описанную выше конструкцию клонировали в pBR322 (New England Biolabs GmbH, Франкфурт, Германия) с получением <pBR322 flank amyE up-lox71-aacd9-lox66-P43-wbgL-lacY-PlepA-gmd wcaG-ferminator-flank amyE down> (SEQ ID NO: 3).All necessary genes for the production of 2'-fucosyllactose from lactose and GDP-mannose were assembled into a constitutive expression cassette <P43-wbgL-lacY-P lepA -gmd-wcaG>, in which each gene was linked to the RBS sequence of B. subtilis. Additionally, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was placed downstream of this expression cassette. The construct described above was cloned into pBR322 (New England Biolabs GmbH, Frankfurt, Germany) to produce <pBR322 flank amyE up-lox71-aacd9-lox66-P43-wbgL-lacY-P lepA -gmd wcaG-ferminator-flank amyE down> (SEQ ID NO: 3).
Полученный вектор для интеграции amyE (SEQ ID NO: 3) использовали для трансформации В. subtilis за счет ее природной компетентности. Проводили селекцию трансформантов посредством спектиномицина (100 мкг мл-1). Интеграцию экспрессионной кассеты <P43-wbgL-lacY-PlepA-gmd wcaG-terminator> в локус атуЕ генома В. subtilis проверяли посредством ПЦР на колониях. Экспрессию генов подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.The resulting amyE integration vector (SEQ ID NO: 3) was used to transform B. subtilis due to its natural competence. Selection of transformants was carried out using spectinomycin (100 μg ml -1 ). Integration of the expression cassette <P43-wbgL-lacY-P lepA -gmd wcaG-terminator> into the atuE locus of the B. subtilis genome was verified by colony PCR. Gene expression was confirmed by targeted proteomics and/or real-time PCR.
Пример 4: Конструирование штамма-продуцента Bacillus subtilis для 2'-фукозиллактозыExample 4: Construction of a Bacillus subtilis producer strain for 2'-fucosyllactose
Для получения 2'-фукозиллактозы из ГДФ-фукозы и экзогенной лактозы, исходно, ген lacY Е. coli интегрировали в эндогенный локус атуЕ (атуА) (кодирующий альфа-амилазу). Открытую рамку считывания гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1), кодирующего лактозопермеазу, амплифицировали посредством ПЦР из хромосомной ДНК. Кассету для интеграции <flank атуЕ up-lox71-aad9-lox66-P43-lacY-flank атуЕ down> (SEQ ID NO: 4) конструировали и клонировали в pBR322 (New England Biolabs GmbH, Франкфурт, Германия). В. subtilis трансформировали полученной плазмидой за счет ее природной компетентности. Интеграцию экспрессионной кассеты <Р43-lacY> в локус атуЕ генома В. Subtilis, приводящую к получению штамма В, проверяли посредством ПЦР на колониях. Экспрессию генов подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.To produce 2'-fucosyllactose from GDP-fucose and exogenous lactose, initially, the E. coli lacY gene was integrated into the endogenous atuE (atuA) locus (encoding alpha-amylase). The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR from chromosomal DNA. The <flank amyE up-lox71-aad9-lox66-P43-lacY-flank amyE down> integration cassette (SEQ ID NO: 4) was constructed and cloned into pBR322 (New England Biolabs GmbH, Frankfurt, Germany). B. subtilis was transformed with the resulting plasmid due to its natural competence. Integration of the <P43-lacY> expression cassette into the atyE locus of the B. subtilis genome, resulting in strain B, was verified by colony PCR. Gene expression was confirmed by targeted proteomics and/or real-time PCR.
Для синтеза ГДФ-фукозы из экзогенной L-фукозы конструировали экспрессионную плазмиду В. subtilis, содержащую все необходимые гены. Плазмиду pDW1 использовали в качестве каркаса. Данную плазмиду получали синтетически посредством GenScript Corp, и она содержит гены bla и erm для селекции в Е. coli и В. subtilis, соответственно. Дополнительно, она содержит репликон рМВ1 для размножения в Е. coli и репликон pUB110 для размножения в В. subtilis.To synthesize GDP-fucose from exogenous L-fucose, a B. subtilis expression plasmid containing all the necessary genes was constructed. Plasmid pDW1 was used as a scaffold. This plasmid was produced synthetically by GenScript Corp and contains the bla and erm genes for selection in E. coli and B. subtilis, respectively. Additionally, it contains the pMB1 replicon for propagation in E. coli and the pUB110 replicon for propagation in B. subtilis.
Ген fkp В. fragilis (номер доступа GenBank AY849806) кодирует бифункциональную фукозокиназу/L-фукозо-1-фосфатгуанилилтрансферазу, ген wbgL Е. coli кодирует α-1,2-фукозилтрансферазы и ген fucP Е. coli (номер доступа Gen Bank: NP_417281.1) кодирует L-фукозопермеазу. Каждую из открытых рамок считывания данных генов подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp. Конструировали экспрессионную кассету, которая содержит гены fkp, wbgL и fucP под контролем сильного конститутивного промотора Р436. subtilis.The B. fragilis fkp gene (GenBank accession number AY849806) encodes a bifunctional fucokinase/L-fucose-1-phosphate guanylyltransferase, the E. coli wbgL gene encodes α-1,2-fucosyltransferases, and the E. coli fucP gene (Gen Bank accession number: NP_417281. 1) encodes L-fucose permease. Each of the open reading frames of these genes was codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. An expression cassette was constructed that contains the fkp, wbgL and fucP genes under the control of the strong constitutive promoter P436. subtilis.
Каждый ген, заключенный в экспрессионную кассету, был связан с последовательностью RBS В. subtilis. Кроме того, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) вводили в конечную экспрессионную плазмиду <pDW1-P43-fkp-wbgL-fucP-terminator> (SEQ ID NO: 5). Штамм В трансформировали данной экспрессионной плазмидой (SEQ ID NO: 5) за счет его природной компетентности. Экспрессию генов подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени. Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. Subtilis, с получением 2'-фукозиллактозы в присутствии экзогенной лактозы и L-фукозы.Each gene contained in the expression cassette was linked to the RBS sequence of B. subtilis. In addition, the appropriate B. subtilis terminator sequence from part of the iGem repository (Sequence ID: BBa_B0015) was introduced into the final expression plasmid <pDW1-P43-fkp-wbgL-fucP-terminator> (SEQ ID NO: 5). Strain B was transformed with this expression plasmid (SEQ ID NO: 5) due to its natural competence. Gene expression was confirmed by targeted proteomics and/or real-time PCR. Transformants were cultured under conditions that are permissive for B. subtilis to produce 2'-fucosyllactose in the presence of exogenous lactose and L-fucose.
Пример 5: Получение 2'-фукозиллактозы с использованием штаммов Bacillus subtilis с модифицированным метаболизмомExample 5: Production of 2'-fucosyllactose using metabolically modified Bacillus subtilis strains
Предварительную культуру инокулировали штаммом Bacillus subtilis с модифицированным метаболизмом, подходящим для биосинтеза 2'-фукозиллактозы (как описано в примере 2, 3 и 4, соответственно).The preculture was inoculated with a metabolically modified Bacillus subtilis strain suitable for the biosynthesis of 2'-fucosyllactose (as described in Examples 2, 3 and 4, respectively).
Предварительную культуру инкубировали при 30-37°С в течение ночи и затем разводили до исходной OD600 примерно 0,1 в свежей основной культуральной среде. Когда основная культура достигала OD600 приблизительно 0,5, 2 мМ лактозу добавляли к среде для выращивания. Когда для экспрессии гена использовали индуцибельный промотор Pgrac100, индукцию осуществляли посредством лактозы (2 мМ) или как лактозы (2 мМ), так и IPTG (от англ. isopropylthiogalactoside - изопропилтиогалактозид) (1 мМ). Для утилизирующего биосинтеза ГДФ-фукозы, дополнительно, добавляли 2 мМ L-фукозу. Культивирование прекращали после 24 ч/48 ч, и внутриклеточную и внеклеточную 2'-фукозиллактозу анализировали посредством тонкослойной хроматографии и/или ВЭЖХ (высокоэффективной жидкостной хроматографии) и/или масс-спектрометрии (как описано в WO 2017/042382 А или WO 2019/008133 А). Выявляли биосинтез существенных количеств 2'-фукозиллактозы.The preculture was incubated at 30-37°C overnight and then diluted to an initial OD 600 of approximately 0.1 in fresh basal culture medium. When the main culture reached an OD 600 of approximately 0.5, 2 mM lactose was added to the growth medium. When the inducible P grac100 promoter was used for gene expression, induction was carried out by lactose (2 mM) or both lactose (2 mM) and IPTG (isopropylthiogalactoside) (1 mM). For utilization biosynthesis of GDP-fucose, 2 mM L-fucose was additionally added. Culture was stopped after 24 h/48 h and intracellular and extracellular 2'-fucosyllactose was analyzed by thin layer chromatography and/or HPLC and/or mass spectrometry (as described in WO 2017/042382 A or WO 2019/008133 A). The biosynthesis of significant amounts of 2'-fucosyllactose was detected.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ LIST OF SEQUENCES
<110> Jennewein Biotechnologie GmbH <110> Jennewein Biotechnologie GmbH
<120> ПРОДУКЦИЯ ФУКОЗИЛИРОВАННЫХ ОЛИГОСАХАРИДОВ В BACILLUS <120> PRODUCTION OF FUCOSYLATED OLIGOSACCHARIDES IN BACILLUS
<130> P 1903 WO<130>P 1903 WO
<160> 5 <160> 5
<170> PatentIn version 3.5 <170> Patent In version 3.5
<210> 1 <210> 1
<211> 11270 <211> 11270
<212> ДНК <212> DNA
<213> Искусственная последовательность <213> Artificial sequence
<220> <220>
<223> Суицидная плазмида <223> Suicide plasmid
<400> 1 <400> 1
ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa
60 60
ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg
120 120
caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt
180 180
gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata
240 240
tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg
300 300
ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac
360 360
cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac
420 420
aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca
480 480
cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg
540 540
actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct
600 600
caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat
660 660
gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt
720 720
cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct
780780
ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgctctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct
840840
tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaatgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa
900900
acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgtacgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt
960960
cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttccttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc
10201020
cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgaccacggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca
10801080
tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacctcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc
11401140
gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggatgctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat
12001200
tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccgtgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg
12601260
ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaagaggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga
13201320
attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaacattggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac
13801380
atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttgggatatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg
14401440
tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcggtcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg
15001500
ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgcggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc
15601560
tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcgtgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg
16201620
taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgcataaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca
16801680
ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattgaggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga
17401740
ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaaccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa
18001800
cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgtcgttccagta acggggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt
18601860
ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgaccttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc
19201920
aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgcttaaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt
19801980
ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcacctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac
20402040
gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaacgaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac
21002100
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagcctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc
21602160
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgaccagacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc
22202220
cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattgcagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg
22802280
tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactctactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc
23402340
tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggcctatatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta
24002400
tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgcttgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct
24602460
gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggggcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg
25202520
aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaaaatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa
25802580
tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaatacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa
26402640
gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaaccgattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc
27002700
gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtcgatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc
27602760
ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagtctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt
28202820
gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcatgaatgatgtc atggggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat
28802880
accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcaggaccggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg
29402940
cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgcacggaacgaag ggctaagaga acaagggagga gaatgtgatg tcaaagcttg aaaaaacgca
30003000
cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctggacgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga
30603060
tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtttcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt
31203120
ttctgtcggc accagtgaat tcgagctcgg tacctaccgt tcgtataatg tatgctatacttctgtcggc accagtgaat tcgagctcgg tacctaccgt tcgtataatg tatgctatac
31803180
gaagttatta cgcgttaacc cgggcccgcg gatgcatatg atcagatcct ttaactctgggaagttatta cgcgttaacc cgggcccgcg gatgcatatg atcagatcct ttaactctgg
32403240
caaccctcaa aattgaatga gacatgctac acctccggat aataaatata tataaacgtacaaccctcaa aattgaatga gacatgctac acctccggat aataaatata tataaacgta
33003300
tatagatttc ataaagtcta acacactaga cttatttact tcgtaattaa gtcgttaaactatagatttc ataaagtcta acacactaga cttatttact tcgtaattaa gtcgttaaac
33603360
cgtgtgctct acgaccaaaa ctataaaacc tttaagaact ttcttttttt acaagaaaaacgtgtgctct acgaccaaaa ctataaaacc tttaagaact ttcttttttt acaagaaaaa
34203420
agaaattaga taaatctctc atatctttta ttcaataatc gcatccgatt gcagtataaaagaaattaga taaatctctc atatctttta ttcaataatc gcatccgatt gcagtataaa
34803480
tttaacgatc actcatcatg ttcatattta tcagagctcg tgctataatt atactaattttttaacgatc actcatcatg ttcatattta tcagagctcg tgctataatt atactaattt
35403540
tataaggagg aaaaaatatg ggcattttta gtatttttgt aatcagcaca gttcattatctataaggagg aaaaaatatg ggcattttta gtatttttgt aatcagcaca gttcattatc
36003600
aaccaaacaa aaaataagtg gttataatga atcgttaata agcaaaattc atataaccaaaaccaaacaa aaaataagtg gttataatga atcgttaata agcaaaattc atataaccaa
36603660
attaaagagg gttataatga acgagaaaaa tataaaacac agtcaaaact ttattacttcattaaagagg gttataatga acgagaaaaa tataaaacac agtcaaaact ttattacttc
37203720
aaaacataat atagataaaa taatgacaaa tataagatta aatgaacatg ataatatcttaaaacataat atagataaaa taatgacaaa tataagatta aatgaacatg ataatatctt
37803780
tgaaatcggc tcaggaaaag gccattttac ccttgaatta gtaaagaggt gtaatttcgttgaaatcggc tcaggaaaag gccattttac ccttgaatta gtaaagaggt gtaatttcgt
38403840
aactgccatt gaaatagacc ataaattatg caaaactaca gaaaataaac ttgttgatcaaactgccatt gaaatagacc ataaattatg caaaactaca gaaaataaac ttgttgatca
39003900
cgataatttc caagttttaa acaaggatat attgcagttt aaatttccta aaaaccaatccgataatttc caagttttaa acaaggatat attgcagttt aaatttccta aaaaccaatc
39603960
ctataaaata tatggtaata taccttataa cataagtacg gatataatac gcaaaattgtctataaaata tatggtaata taccttataa cataagtacg gatataatac gcaaaattgt
40204020
ttttgatagt atagctaatg agatttattt aatcgtggaa tacgggtttg ctaaaagattttttgatagt atagctaatg agatttattt aatcgtggaa tacgggtttg ctaaaagatt
40804080
attaaataca aaacgctcat tggcattact tttaatggca gaagttgata tttctatattattaaataca aaacgctcat tggcattact tttaatggca gaagttgata tttctatatt
41404140
aagtatggtt ccaagagaat attttcatcc taaacctaaa gtgaatagct cacttatcagaagtatggtt ccaagagaat attttcatcc taaacctaaa gtgaatagct cacttatcag
42004200
attaagtaga aaaaaatcaa gaatatcaca caaagataaa caaaagtata attatttcgtattaagtaga aaaaaatcaa gaatatcaca caaagataaa caaaagtata attatttcgt
42604260
tatgaaatgg gttaacaaag aatacaagaa aatatttaca aaaaatcaat ttaacaattctatgaaatgg gttaacaaag aatacaagaa aatatttaca aaaaatcaat ttaacaattc
43204320
cttaaaacat gcaggaattg acgatttaaa caatattagc tttgaacaat tcttatctctcttaaaacat gcaggaattg acgatttaaa caatattagc tttgaacaat tcttatctct
43804380
tttcaatagc tataaattat ttaataagta agttaaggga tgcataaact gcatcccttatttcaatagc tataaattat ttaataagta agttaaggga tgcataaact gcatccctta
44404440
acttgttttt cgtgtgccta ttttttgtga atcgattata acttcgtata atgtatgctaacttgttttt cgtgtgccta ttttttgtga atcgattata acttcgtata atgtatgcta
45004500
tacgaacggt aggatcctct agagtcgacc tgcaggcatt ttacattttt agaaatgggctacgaacggt aggatcctct agagtcgacc tgcaggcatt ttacattttt agaaatgggc
45604560
gtgaaaaaaa gcgcgcgatt atgtaaaata taaagattaa ctaataagga ggacaaacatgtgaaaaaaa gcgcgcgatt atgtaaaata taaagattaa ctaataagga ggacaaacat
46204620
ggcacaatct aaactgtatc cggttgtgat ggcgggcgga tctggatcaa gactgtggccggcacaatct aaactgtatc cggttgtgat ggcgggcgga tctggatcaa gactgtggcc
46804680
gctttcacgc gttctttacc cgaaacaatt tctgtgtctg aaaggagatt taacaatgctgctttcacgc gttctttacc cgaaacaatt tctgtgtctg aaaggagatt taacaatgct
47404740
gcagacaaca atttgcagat taaatggcgt ggaatgtgaa tctccggtcg ttatttgcaagcagacaaca atttgcagat taaatggcgt ggaatgtgaa tctccggtcg ttatttgcaa
48004800
cgaacagcat agatttatcg tcgctgaaca acttcgccag ctgaacaaac tgacagaaaacgaacagcat agatttatcg tcgctgaaca acttcgccag ctgaacaaac tgacagaaaa
48604860
catcatcctg gaaccggccg gcagaaatac agcaccggcg attgctcttg cagcgttagccatcatcctg gaaccggccg gcagaaatac agcaccggcg attgctcttg cagcgttagc
49204920
tgccaaacgc cattcaccgg aaagcgatcc gcttatgtta gtgctggcag cggatcatgttgccaaacgc cattcaccgg aaagcgatcc gcttatgtta gtgctggcag cggatcatgt
49804980
cattgcggat gaagatgctt ttagagctgc cgttcgcaac gctatgccgt atgccgaagccattgcggat gaagatgctt ttagagctgc cgttcgcaac gctatgccgt atgccgaagc
50405040
aggcaaactt gtgacatttg gaattgtccc ggatttaccg gaaacaggct atggatatataggcaaactt gtgacatttg gaattgtccc ggatttaccg gaaacaggct atggatatat
51005100
cagacgcggc gaagtgtcag cgggagaaca agatatggtt gcctttgaag tggcacagttcagacgcggc gaagtgtcag cgggagaaca agatatggtt gcctttgaag tggcacagtt
51605160
tgtcgaaaaa ccgaatctgg aaacagcgca agcgtatgtt gcttcaggcg aatattattgtgtcgaaaaa ccgaatctgg aaacagcgca agcgtatgtt gcttcaggcg aatattattg
52205220
gaacagcgga atgtttcttt ttagagccgg ccgctatctg gaagaactta aaaaatacaggaacagcgga atgtttcttt ttagagccgg ccgctatctg gaagaactta aaaaatacag
52805280
accggatatt ttagatgcat gtgaaaaagc gatgtcagct gtcgatccgg atttaaacttaccggatatt ttagatgcat gtgaaaaagc gatgtcagct gtcgatccgg atttaaactt
53405340
tatcagagtt gatgaagaag cctttctggc atgcccggaa gaaagcgttg attatgcagttatcagagtt gatgaagaag cctttctggc atgcccggaa gaaagcgttg attatgcagt
54005400
gatggaacgc acagccgatg cagtggtcgt tccgatggat gcgggctggt ctgatgttgggatggaacgc acagccgatg cagtggtcgt tccgatggat gcgggctggt ctgatgttgg
54605460
atcatggtca agcctttggg aaattagcgc gcatacagct gaaggcaatg tttgtcatggatcatggtca agcctttggg aaattagcgc gcatacagct gaaggcaatg tttgtcatgg
55205520
agatgtgatc aaccataaaa cagaaaacag ctatgtttac gcggaatctg gcctggtgacagatgtgatc aaccataaaa cagaaaacag ctatgtttac gcggaatctg gcctggtgac
55805580
aacagtcgga gttaaagatt tagtggtcgt tcagacaaaa gatgcggtgt taattgctgaaacagtcgga gttaaagatt tagtggtcgt tcagacaaaa gatgcggtgt taattgctga
56405640
tagaaacgcc gtgcaagatg ttaagaaagt tgtcgaacag atcaaagcag atggaagacatagaaacgcc gtgcaagatg ttaagaaagt tgtcgaacag atcaaagcag atggaagaca
57005700
tgaacataga gtccatcgcg aagtttatcg cccgtgggga aaatatgata gcattgatgctgaacataga gtccatcgcg aagtttatcg cccgtgggga aaatatgata gcattgatgc
57605760
gggcgatcgc tatcaagtca aacgcatcac agttaaaccg ggcgaaggac tgtctgttcagggcgatcgc tatcaagtca aacgcatcac agttaaaccg ggcgaaggac tgtctgttca
58205820
gatgcatcat catcgcgcag aacattgggt tgtggtcgcc ggcacagcaa aagtgacaatgatgcatcat catcgcgcag aacattgggt tgtggtcgcc ggcacagcaa aagtgacaat
58805880
tgatggcgat attaaactgc ttggagaaaa cgaatctatt tatatcccgt taggagctactgatggcgat attaaactgc ttggagaaaa cgaatctatt tatatcccgt taggagctac
59405940
acattgcctg gaaaacccgg gcaaaattcc gcttgattta atcgaagtca gaagcggatcacattgcctg gaaaacccgg gcaaaattcc gcttgattta atcgaagtca gaagcggatc
60006000
ttatcttgaa gaagatgatg ttgtgcgctt tgccgataga tatggccgcg tttaagctctttatcttgaa gaagatgatg ttgtgcgctt tgccgataga tatggccgcg tttaagctct
60606060
taaggaggat tttagaatga aaaaacttac atgctttaaa gcgtatgata ttcgcggcaataaggaggat tttagaatga aaaaacttac atgctttaaa gcgtatgata ttcgcggcaa
61206120
acttggagaa gaattaaacg aagatattgc ttggagaatc ggccgcgcct atggagaattacttggagaa gaattaaacg aagatattgc ttggagaatc ggccgcgcct atggagaatt
61806180
tctgaaaccg aaaacaatcg tgctgggcgg agatgtcaga cttacatcag aaacacttaatctgaaaccg aaaacaatcg tgctgggcgg agatgtcaga cttacatcag aaacacttaa
62406240
actggctctg gccaaaggcc tgcaagatgc tggagttgat gtgcttgata ttggcatgagactggctctg gccaaaggcc tgcaagatgc tggagttgat gtgcttgata ttggcatgag
63006300
cggaacagaa gaaatctatt ttgccacatt tcatttagga gtcgatggcg gaatcgaagtcggaacagaa gaaatctatt ttgccacatt tcatttagga gtcgatggcg gaatcgaagt
63606360
tacagcaagc cataatccga tggattataa cggaatgaaa ctggttagag aaggcgcaagtacagcaagc cataatccga tggattataa cggaatgaaa ctggttagag aaggcgcaag
64206420
accgatttct ggcgatacag gattaagaga tgtgcagcgc ctggcagaag cgaacgatttaccgatttct ggcgatacag gattaagaga tgtgcagcgc ctggcagaag cgaacgattt
64806480
tccgccggtc gatgaaacaa aaagaggacg ctatcaacag attaatttac gcgatgcgtatccgccggtc gatgaaacaa aaagaggacg ctatcaacag attaatttac gcgatgcgta
65406540
tgttgatcat ctttttggct acatcaacgt taaaaacctg acaccgctta aactggtgattgttgatcat ctttttggct acatcaacgt taaaaacctg acaccgctta aactggtgat
66006600
caattctggc aacggagcag cgggaccggt tgtggatgct attgaagcca gatttaaagccaattctggc aacggagcag cgggaccggt tgtggatgct attgaagcca gatttaaagc
66606660
acttggcgca ccggttgaat taatcaaagt gcataataca ccggatggca attttccgaaacttggcgca ccggttgaat taatcaaagt gcataataca ccggatggca attttccgaa
67206720
cggcattccg aacccgctgc ttccggaatg cagagatgat acacgcaatg cggttattaacggcattccg aacccgctgc ttccggaatg cagagatgat acacgcaatg cggttattaa
67806780
acatggcgct gatatgggaa tcgcctttga tggagatttt gatcgctgtt ttctttttgaacatggcgct gatatgggaa tcgcctttga tggagattt gatcgctgtt ttctttttga
68406840
tgaaaaaggc caatttatcg aaggatacta catcgtgggc ttactggctg aagcatttcttgaaaaaggc caatttatcg aaggatacta catcgtgggc ttactggctg aagcatttct
69006900
ggagaaaaat ccgggagcga aaattatcca tgatccgaga ctttcttgga atacagtcgaggagaaaaat ccgggagcga aaattatcca tgatccgaga ctttcttgga atacagtcga
69606960
tgtcgttaca gctgccggcg gaacaccggt tatgtcaaaa acaggccatg cttttatcaatgtcgttaca gctgccggcg gaacaccggt tatgtcaaaa acaggccatg cttttatcaa
70207020
agaaagaatg cgcaaagaag atgcaatcta tggcggagaa atgagcgcgc atcattacttagaaagaatg cgcaaagaag atgcaatcta tggcggagaa atgagcgcgc atcattactt
70807080
tagagatttt gcttactgcg attctggcat gatcccgtgg cttttagtcg cggaactggttagagattt gcttactgcg attctggcat gatcccgtgg cttttagtcg cggaactggt
71407140
ttgtcttaaa gataaaacac tgggagaact ggtcagagat cgcatggcag cgtttccggcttgtcttaaa gataaaacac tgggagaact ggtcagagat cgcatggcag cgtttccggc
72007200
ttcaggcgaa attaatagca aactggcaca accggtggaa gcgatcaaca gagtcgaacattcaggcgaa attaatagca aactggcaca accggtggaa gcgatcaaca gagtcgaaca
72607260
gcatttttca cgcgaagcac tggcggttga tagaacagat ggaattagca tgacatttgcgcatttttca cgcgaagcac tggcggttga tagaacagat ggaattagca tgacatttgc
73207320
cgattggaga tttaatcttc gcacatctaa cacagaaccg gtggtcagac ttaacgttgacgattggaga tttaatcttc gcacatctaa cacagaaccg gtggtcagac ttaacgttga
73807380
atcacgcggc gatgtgccgt taatggaagc aagaacacgc acactgctta cattactgaaatcacgcggc gatgtgccgt taatggaagc aagaacacgc acactgctta cattactgaa
74407440
tgaataaaaa ggaggaacta ctatgacaac agaaccgctg tttttcaaac cggtctttaatgaataaaaa ggaggaacta ctatgacaac agaaccgctg tttttcaaac cggtctttaa
75007500
agaaagaatt tggggcggaa cagctctggc cgattttggc tatacaatcc cgtctcaacgagaaagaatt tggggcggaa cagctctggc cgattttggc tatacaatcc cgtctcaacg
75607560
cacaggagaa tgctgggctt ttgcagcgca tcaaaatggc cagagcgttg tgcagaacggcacaggagaa tgctgggctt ttgcagcgca tcaaaatggc cagagcgttg tgcagaacgg
76207620
catgtacaaa ggatttacac tgtctgaact gtgggaacat catagacatc tttttggccacatgtacaaa ggatttacac tgtctgaact gtgggaacat catagacatc tttttggcca
76807680
attagaagga gatcgctttc cgctgcttac aaaaatttta gatgctgatc aggatctgtcattagaagga gatcgctttc cgctgcttac aaaaatttta gatgctgatc aggatctgtc
77407740
agttcaggtt catccgaatg atgaatatgc caatatccat gaaaacggcg aacttggaaaagttcaggtt catccgaatg atgaatatgc caatatccat gaaaacggcg aacttggaaa
78007800
aacagaatgc tggtatatta tcgattgtca gaaagatgct gaaattatct atggccataaaacagaatgc tggtatatta tcgattgtca gaaagatgct gaaattatct atggccataa
78607860
cgccacaaca aaagaagaat taacaacaat gatcgaaaga ggagaatggg atgaattactcgccacaaca aaagaagaat taacaacaat gatcgaaaga ggagaatggg atgaattact
79207920
gagacgcgtg aaagtcaaac cgggcgattt cttttatgtc ccgtcaggaa cagttcatgcgagacgcgtg aaagtcaaac cgggcgattt cttttatgtc ccgtcaggaa cagttcatgc
79807980
aattggcaaa ggaatccttg cgttagaaac acaacagaat agcgatacaa catacagactaattggcaaa ggaatccttg cgttagaaac acaacagaat agcgatacaa catacagact
80408040
gtacgattac gatcgcaaag atgcagaagg caaacttaga gaactgcatc ttaaaaaatcgtacgattac gatcgcaaag atgcagaagg caaacttaga gaactgcatc ttaaaaaatc
81008100
aatcgaagtt atcgaagtgc cgagcattcc ggaacgccat acagttcatc atgaacaaataatcgaagtt atcgaagtgc cgagcattcc ggaacgccat acagttcatc atgaacaaat
81608160
cgaagattta ctgacaacaa cactgatcga atgcgcatat tttagcgtgg gcaaatggaacgaagattta ctgacaacaa cactgatcga atgcgcatat tttagcgtgg gcaaatggaa
82208220
cctttcagga agcgcgtctt taaaacaaca gaaaccgttt ctgcttattt ctgtgatcgacctttcagga agcgcgtctt taaaacaaca gaaaccgttt ctgcttattt ctgtgatcga
82808280
aggcgaagga cgcatgattt caggcgaata tgtctatccg tttaagaaag gcgatcacataggcgaagga cgcatgattt caggcgaata tgtctatccg tttaagaaag gcgatcacat
83408340
gttactgccg tatggcctgg gagaatttaa acttgaagga tatgcggaat gtatcgtttcgttactgccg tatggcctgg gagaatttaa acttgaagga tatgcggaat gtatcgtttc
84008400
tcatctttaa gcgaggcagg atcaggacaa tgattatatt tttgtcatga atttcacggatcatctttaa gcgaggcagg atcaggacaa tgattatatt tttgtcatga atttcacgga
84608460
agaaaaacag ctggtcacgt ttgatcagag tgtgaaggac ataatgacag gagacatattagaaaaacag ctggtcacgt ttgatcagag tgtgaaggac ataatgacag gagacatatt
85208520
gtcaggcgac ctgacgatgg aaaagtatga agtgagaatt gtcgtaaaca cacattaggcgtcaggcgac ctgacgatgg aaaagtatga agtgagaatt gtcgtaaaca cacattaggc
85808580
tgatgctccg ctcgatatgg gcggattctt ttttctatag aatgaaaacg cttgctaagttgatgctccg ctcgatatgg gcggattctt ttttctatag aatgaaaacg cttgctaagt
86408640
cttgggggga tgaaatcatg aaaagcaaag tgaaaatgtt ctttgcggct gccatcgtgtcttgggggga tgaaatcatg aaaagcaaag tgaaaatgtt ctttgcggct gccatcgtgt
87008700
ggagtgcatg tagttcaaca ggatatgccg ctgccattga gaaggagaag cacgtgtcagggagtgcatg tagttcaaca ggatatgccg ctgccattga gaaggagaag cacgtgtcag
87608760
agcttcgggc agaggatctt tttgttaaaa aagtagaggg gatgaacaag gattttatcaagcttcgggc agaggatctt tttgttaaaa aagtagaggg gatgaacaag gattttatca
88208820
aaggggcaga tgtatccagc gttattgctt tggaaaacag cggtgtcacc ttttacaataaaggggcaga tgtatccagc gttattgctt tggaaaacag cggtgtcacc ttttacaata
88808880
caaacggaaa acgccaggat atctttacaa ctttaaaaca ggctggggtc aactatgttccaaacggaaa acgccaggat atctttacaa ctttaaaaca ggctggggtc aactatgttc
89408940
gcgtccgcat ctggaatcac ccgtatgatt caaatggcaa cgggtatggc gggggaaacagcgtccgcat ctggaatcac ccgtatgatt caaatggcaa cgggtatggc gggggaaaca
90009000
atgatgttca aaaagccatc gaaatcggaa aaagagcgac agcgaacgga atgaaggtgcatgatgttca aaaagccatc gaaatcggaa aaagagcgac agcgaacgga atgaaggtgc
90609060
tggccgactt tcactactct gatttctggg ccgatccagc gaaacaaaag gtgcccaaagtggccgactt tcactactct gatttctggg ccgatccagc gaaacaaaag gtgcccaaag
91209120
cctgggcgaa tctcagcttt gaagcaaaaa aagcaaagct ctatgagtat acgaaacaaacctgggcgaa tctcagcttt gaagcaaaaa aagcaaagct ctatgagtat acgaaacaaa
91809180
gcctgcaaaa gatgatcaag gaaggcgtgc ggtgtgaaat accgcacaga tgcgtaaggagcctgcaaaa gatgatcaag gaaggcgtgc ggtgtgaaat accgcacaga tgcgtaagga
92409240
gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcggaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg
93009300
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaatttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat
93609360
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgtacaggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta
94209420
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaaaaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa
94809480
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttcatcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc
95409540
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgtcccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt
96009600
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctcaccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca
96609660
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccggttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg
97209720
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttataccgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat
97809780
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgctacgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta
98409840
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatctcagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct
99009900
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaacgcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac
99609960
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaaaaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa
1002010020
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaaaaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa
1008010080
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatcctttactcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt
1014010140
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgacataaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca
1020010200
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatccagttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca
1026010260
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcctagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc
1032010320
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataaccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa
1038010380
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatccaccagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc
1044010440
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgcaagtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca
1050010500
acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcatacgttgttgc cattgctgca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat
1056010560
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaagtcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag
1062010620
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcaccggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac
1068010680
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttttcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt
1074010740
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagttctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt
1080010800
gctcttgccc ggcgtcaaca cgggataata ccgcgccaca tagcagaact ttaaaagtgcgctcttgccc ggcgtcaaca cgggataata ccgcgccaca tagcagaact ttaaaagtgc
1086010860
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagattcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat
1092010920
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcaccaccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca
1098010980
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcgagcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga
1104011040
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcaggcacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg
1110011100
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggggttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg
1116011160
ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatgattccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga
1122011220
cattaaccta taaaaatagg cgtatcacga ggccctttcg tcttcaagaacattaaccta taaaaatagg cgtatcacga ggccctttcg tcttcaagaa
1127011270
<210> 2<210> 2
<211> 12427<211> 12427
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> экспрессионная плазмида<223> expression plasmid
<400> 2<400> 2
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaattaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa
6060
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaatgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa
120120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgatgccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat
180180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattaccttaaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt
240240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatattattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat
300300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcagttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag
360360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggtgtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt
420420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgtttaaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt
480480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctctagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc
540540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaagacgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga
600600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaaaaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa
660660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatcttatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct
720720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaacttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa
780780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcctttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc
840840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttatttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat
900900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaaccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa
960960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttctaatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct
10201020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcacttatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact
10801080
atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcgatggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg
11401140
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgattagtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta
12001200
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattcagttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc
12601260
gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcgggagagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga
13201320
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgtaacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt
13801380
attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgcccttattgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt
14401440
caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcgcaccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg
15001500
aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtcaaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc
15601560
gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcatgtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat
16201620
tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatttgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt
16801680
cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgccagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc
17401740
tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgctatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc
18001800
cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccagcgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag
18601860
atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgtatgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt
19201920
ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaatctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat
19801980
ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaagggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag
20402040
attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccacattgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac
21002100
gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtggctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg
21602160
cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttgcaggggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg
22202220
tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgttgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt
22802280
tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacctttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc
23402340
ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgtttggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt
24002400
gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatggaatatttga ttgatcgtaa cgatgaag cactctttcc actatcccta cagtgttatg
24602460
gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatcagcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca
25202520
aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgttttaatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt
25802580
ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaagttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag
26402640
gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataagatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa
27002700
gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaagaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa
27602760
acatgggttc tatcatcaga cttcagggtg gtttaggcaa tcaactgttt caatttagctacatgggttc tatcatcaga cttcagggtg gtttaggcaa tcaactgttt caatttagct
28202820
ttggttatgc tctttcaaaa atcaatggca caccgctgta ctttgatatt tcacattacgttggttatgc tctttcaaaa atcaatggca caccgctgta ctttgatatt tcacattacg
28802880
cagaaaacga tgatcatggc ggatatagac tgaataacct tcaaatcccg gaagaatatccagaaaacga tgatcatggc ggatatagac tgaataacct tcaaatcccg gaagaatatc
29402940
ttcagtacta cacaccgaaa atcaacaaca tctacaaact gcttgtcaga ggcagccgctttcagtacta cacaccgaaa atcaacaaca tctacaaact gcttgtcaga ggcagccgct
30003000
tatatccgga tatttttctg tttcttggct tttgcaacga atttcatgcg tatggctatgtatatccgga tatttttctg tttcttggct tttgcaacga atttcatgcg tatggctatg
30603060
attttgaata catcgcgcaa aaatggaaaa gcaaaaaata catcggatac tggcagtctgattttgaata catcgcgcaa aaatggaaaa gcaaaaaata catcggatac tggcagtctg
31203120
aacatttctt tcataaacat attctggatc tgaaagaatt tttcatcccg aaaaacgttaaacatttctt tcataaacat attctggatc tgaaagaatt tttcatcccg aaaaacgtta
31803180
gcgaacaagc taacttactg gcagcgaaaa tcttagaatc tcagtcaagc ctgtcaattcgcgaacaagc taacttactg gcagcgaaaa tcttagaatc tcagtcaagc ctgtcaattc
32403240
atatcagacg cggcgattac atcaaaaaca aaacagccac actgacacat ggagtttgctatatcagacg cggcgattac atcaaaaaca aaacagccac actgacacat ggagtttgct
33003300
ctcttgaata ctacaagaaa gcactgaaca aaatcagaga tttagccatg attcgcgatgctcttgaata ctacaagaaa gcactgaaca aaatcagaga tttagccatg attcgcgatg
33603360
tgtttatctt ttctgatgat attttctggt gtaaagaaaa catcgaaaca cttctgagcatgtttatctt ttctgatgat attttctggt gtaaagaaaa catcgaaaca cttctgagca
34203420
aaaaatacaa catctactac tcagaagatt taagccaaga agaagattta tggctgatgtaaaaatacaa catctactac tcagaagatt taagccaaga agaagattta tggctgatgt
34803480
ctctggctaa tcatcatatt atcgccaact cttcattttc atggtggggc gcatatcttgctctggctaa tcatcatatt atcgccaact cttcattttc atggtggggc gcatatcttg
35403540
gaagctctgc gagccagatt gttatctatc cgacaccgtg gtatgatatt acaccgaaaagaagctctgc gagccagatt gttatctatc cgacaccgtg gtatgatatt acaccgaaaa
36003600
acacatacat tcctatcgtg aaccattgga tcaacgtgga caaacattcc tcctgctaagacacatacat tcctatcgtg aaccattgga tcaacgtgga caaacattcc tcctgctaag
36603660
gagaaaagct agcgattaac taataaggag gaactgaaat gtcaaaagtg gcgcttattagagaaaagct agcgattaac taataaggag gaactgaaat gtcaaaagtg gcgcttatta
37203720
caggcgtcac aggacaagat ggcagctatt tagctgaatt tctgcttgaa aaaggatatgcaggcgtcac aggacaagat ggcagctatt tagctgaatt tctgcttgaa aaaggatatg
37803780
aagtgcatgg cattaaaaga cgcgcatcat catttaacac agaaagagtc gatcatatctaagtgcatgg cattaaaaga cgcgcatcat catttaacac agaaagagtc gatcatatct
38403840
atcaagatcc gcatacatgc aacccgaaat ttcatctgca ttatggcgat ctgagcgataatcaagatcc gcatacatgc aacccgaaat ttcatctgca ttatggcgat ctgagcgata
39003900
catctaacct gacaagaatt ttacgcgaag tccagccgga tgaagtttat aacctgggcgcatctaacct gacaagaatt ttacgcgaag tccagccgga tgaagtttat aacctgggcg
39603960
cgatgtctca tgtcgctgtt tcatttgaaa gcccggaata tacagccgat gtcgatgcaacgatgtctca tgtcgctgtt tcatttgaaa gcccggaata tacagccgat gtcgatgcaa
40204020
tgggaacact tagattactg gaagccattc gctttttagg cctggaaaag aaaacacgcttgggaacact tagattactg gaagccattc gctttttagg cctggaaaag aaaacacgct
40804080
tttatcaggc atctacatca gaactgtatg gacttgttca agaaatcccg cagaaagaaatttatcaggc atctacatca gaactgtatg gacttgttca agaaatcccg cagaaagaaa
41404140
caacaccgtt ttatccgaga agcccgtatg cggtcgctaa actttacgcg tactggatcacaacaccgtt ttatccgaga agcccgtatg cggtcgctaa actttacgcg tactggatca
42004200
cagttaatta tcgcgaatct tatggaatgt atgcttgcaa tggcatctta tttaaccatgcagttaatta tcgcgaatct tatggaatgt atgcttgcaa tggcatctta tttaaccatg
42604260
aatcaccgag acgcggagaa acatttgtta caagaaaaat cacacgcgcc attgcaaataaatcaccgag acgcggagaa acatttgtta caagaaaaat cacacgcgcc attgcaaata
43204320
tcgcccaagg actggaaagc tgtctttatt taggcaacat ggattctctt agagattgggtcgcccaagg actggaaagc tgtctttatt taggcaacat ggattctctt agagattggg
43804380
gccatgcaaa agattacgtt aaaatgcaat ggatgatgtt acaacaggaa cagccggaaggccatgcaaa agattacgtt aaaatgcaat ggatgatgtt acaacaggaa cagccggaag
44404440
attttgtgat cgccacagga gtgcaatatt cagtcagaca gtttgttgaa atggcagcggattttgtgat cgccacagga gtgcaatatt cagtcagaca gtttgttgaa atggcagcgg
45004500
ctcagcttgg cattaaactg cgctttgaag gcacaggagt ggaagaaaaa ggaatcgttgctcagcttgg cattaaactg cgctttgaag gcacaggagt ggaagaaaaa ggaatcgttg
45604560
tgagcgttac aggccatgat gcgccgggag tgaaaccggg cgatgtgatt atcgccgtcgtgagcgttac aggccatgat gcgccgggag tgaaaccggg cgatgtgatt atcgccgtcg
46204620
atccgagata ttttcgcccg gcagaagtcg aaacactttt aggagatccg acaaaagcgcatccgagata ttttcgcccg gcagaagtcg aaacactttt aggagatccg acaaaagcgc
46804680
atgaaaaact gggctggaaa ccggaaatta cactgagaga aatggttagc gaaatggtggatgaaaaact gggctggaaa ccggaaatta cactgagaga aatggttagc gaaatggtgg
47404740
ctaacgattt agaagccgcg aaaaaacatt ctctgcttaa atcacatggc tatgatgtggctaacgattt agaagccgcg aaaaaacatt ctctgcttaa atcacatggc tatgatgtgg
48004800
cgatcgctct ggaatcttaa aaaggaggaa ctactatgag caaacaaaga gtttttatcgcgatcgctct ggaatcttaa aaaggaggaa ctactatgag caaacaaaga gtttttatcg
48604860
ctggccatcg cggaatggtg ggctctgcca ttagacgcca attagaacag agaggagatgctggccatcg cggaatggtg ggctctgcca ttagacgcca attagaacag agaggagatg
49204920
tggaacttgt cttaagaaca cgcgatgaac tgaatctgct tgattcaaga gctgtccatgtggaacttgt cttaagaaca cgcgatgaac tgaatctgct tgattcaaga gctgtccatg
49804980
atttctttgc cagcgaacgc atcgatcagg tttatcttgc agcggctaaa gttggcggaaatttctttgc cagcgaacgc atcgatcagg tttatcttgc agcggctaaa gttggcggaa
50405040
ttgtggcaaa taacacatat ccggcggatt ttatctacca aaacatgatg atcgaatctattgtggcaaa taacacatat ccggcggatt ttatctacca aaacatgatg atcgaatcta
51005100
acattatcca tgccgcacat cagaatgatg ttaacaaact gctgtttctg ggatcaagctacattatcca tgccgcacat cagaatgatg ttaacaaact gctgtttctg ggatcaagct
51605160
gcatctatcc gaaacttgca aaacaaccga tggcggaatc agaactttta cagggcacacgcatctatcc gaaacttgca aaacaaccga tggcggaatc agaactttta cagggcacac
52205220
tggaaccgac aaatgaaccg tatgcaattg cgaaaatcgc gggaatcaaa ctttgtgaattggaaccgac aaatgaaccg tatgcaattg cgaaaatcgc gggaatcaaa ctttgtgaat
52805280
cttacaacag acaatacggc agagattatc gctcagtgat gccgacaaac ttatatggaccttacaacag acaatacggc agagattatc gctcagtgat gccgacaaac ttatatggac
53405340
cgcatgataa ttttcatccg tctaactcac atgtcattcc ggcactgctt agacgctttccgcatgataa ttttcatccg tctaactcac atgtcattcc ggcactgctt agacgctttc
54005400
atgaagctac agcccagaac gcgccggatg ttgtggtctg gggctcagga acaccgatgcatgaagctac agcccagaac gcgccggatg ttgtggtctg gggctcagga acaccgatgc
54605460
gcgaatttct gcatgttgat gatatggcgg ctgccagcat ccatgtgatg gaacttgctcgcgaatttct gcatgttgat gatatggcgg ctgccagcat ccatgtgatg gaacttgctc
55205520
atgaagtctg gttagaaaat acacaaccga tgcttagcca tattaacgtc ggcacaggagatgaagtctg gttagaaaat acacaaccga tgcttagcca tattaacgtc ggcacaggag
55805580
ttgattgcac aatcagagaa ttagctcaga caattgccaa agttgtggga tataaaggccttgattgcac aatcagagaa ttagctcaga caattgccaa agttgtggga tataaaggcc
56405640
gcgtcgtttt tgatgcctct aaaccggatg gcacaccgag aaaattactg gatgtgacacgcgtcgtttt tgatgcctct aaaccggatg gcacaccgag aaaattactg gatgtgacac
57005700
gcctgcatca acttggatgg tatcatgaaa ttagcttaga agcaggcctg gcgtctacatgcctgcatca acttggatgg tatcatgaaa ttagcttaga agcaggcctg gcgtctacat
57605760
accaatggtt tttagaaaac caggatagat ttcgcggcgg atcataaagt gatagcggtaaccaatggtt tttagaaaac caggatagat ttcgcggcgg atcataaagt gatagcggta
58205820
ccattatagg taagagagga atgtacacat gtactattta aaaaacacaa acttttggatccattatagg taagagagga atgtacacat gtactattta aaaaacacaa acttttggat
58805880
gttcggttta ttctttttct tttacttttt tatcatggga gcctacttcc cgtttttcccgttcggttta ttctttttct tttacttttt tatcatggga gcctacttcc cgtttttccc
59405940
gatttggcta catgacatca accatatcag caaaagtgat acgggtatta tttttgccgcgatttggcta catgacatca accatatcag caaaagtgat acgggtatta tttttgccgc
60006000
tatttctctg ttctcgctat tattccaacc gctgtttggt ctgctttctg acaaactcggtatttctctg ttctcgctat tattccaacc gctgtttggt ctgctttctg acaaactcgg
60606060
gctgcgcaaa tacctgctgt ggattattac cggcatgtta gtgatgtttg cgccgttcttgctgcgcaaa tacctgctgt ggattattac cggcatgtta gtgatgtttg cgccgttctt
61206120
tatttttatc ttcgggccac tgttacaata caacatttta gtaggatcga ttgttggtggtatttttatc ttcggggccac tgttacaata caacatttta gtaggatcga ttgttggtgg
61806180
tatttatcta ggcttttgtt ttaacgccgg tgcgccagca gtagaggcat ttattgagaatatttatcta ggcttttgtt ttaacgccgg tgcgccagca gtagaggcat ttattgagaa
62406240
agtcagccgt cgcagtaatt tcgaatttgg tcgcgcgcgg atgtttggct gtgttggctgagtcagccgt cgcagtaatt tcgaatttgg tcgcgcgcgg atgtttggct gtgttggctg
63006300
ggcgctgtgt gcctcgattg tcggcatcat gttcaccatc aataatcagt ttgttttctgggcgctgtgt gcctcgattg tcggcatcat gttcaccatc aataatcagt ttgttttctg
63606360
gctgggctct ggctgtgcac tcatcctcgc cgttttactc tttttcgcca aaacggatgcgctgggctct ggctgtgcac tcatcctcgc cgttttactc tttttcgcca aaacggatgc
64206420
gccctcttct gccacggttg ccaatgcggt aggtgccaac cattcggcat ttagccttaagccctcttct gccacggttg ccaatgcggt aggtgccaac cattcggcat ttagccttaa
64806480
gctggcactg gaactgttca gacagccaaa actgtggttt ttgtcactgt atgttattgggctggcactg gaactgttca gacagccaaa actgtggttt ttgtcactgt atgttattgg
65406540
cgtttcctgc acctacgatg tttttgacca acagtttgct aatttcttta cttcgttcttcgtttcctgc acctacgatg tttttgacca acagtttgct aatttcttta cttcgttctt
66006600
tgctaccggt gaacagggta cgcgggtatt tggctacgta acgacaatgg gcgaattacttgctaccggt gaacagggta cgcgggtatt tggctacgta acgacaatgg gcgaattact
66606660
taacgcctcg attatgttct ttgcgccact gatcattaat cgcatcggtg ggaaaaacgctaacgcctcg attatgttct ttgcgccact gatcattaat cgcatcggtg ggaaaaacgc
67206720
cctgctgctg gctggcacta ttatgtctgt acgtattatt ggctcatcgt tcgccacctccctgctgctg gctggcacta ttatgtctgt acgtattatt ggctcatcgt tcgccacctc
67806780
agcgctggaa gtggttattc tgaaaacgct gcatatgttt gaagtaccgt tcctgctggtagcgctggaa gtggttattc tgaaaacgct gcatatgttt gaagtaccgt tcctgctggt
68406840
gggctgcttt aaatatatta ccagccagtt tgaagtgcgt ttttcagcga cgatttatctgggctgcttt aaatatatta ccagccagtt tgaagtgcgt ttttcagcga cgatttatct
69006900
ggtctgtttc tgcttcttta agcaactggc gatgattttt atgtctgtac tggcgggcaaggtctgtttc tgcttcttta agcaactggc gatgattttt atgtctgtac tggcgggcaa
69606960
tatgtatgaa agcatcggtt tccagggcgc ttatctggtg ctgggtctgg tggcgctgggtatgtatgaa agcatcggtt tccagggcgc ttatctggtg ctgggtctgg tggcgctggg
70207020
cttcacctta atttccgtgt tcacgcttag cggccccggc ccgctttccc tgctgcgtcgcttcacctta atttccgtgt tcacgcttag cggccccggc ccgctttccc tgctgcgtcg
70807080
tcaggtgaat gaagtcgctt aaggatccat gtctagagtc gacgtccccg gggcagcccgtcaggtgaat gaagtcgctt aaggatccat gtctagagtc gacgtccccg gggcagcccg
71407140
cctaatgagc gggctttttt cacgtcccag gcatcaaata aaacgaaagg ctcagtcgaacctaatgagc gggctttttt cacgtcccag gcatcaaata aaacgaaagg ctcagtcgaa
72007200
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacacagactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac
72607260
tggctcacct tcgggtgggc ctttctgcgt ttatacccgg ggcagcccgc ctaatgagcgtggctcacct tcgggtgggc ctttctgcgt ttatacccgg ggcagcccgc ctaatgagcg
73207320
ggcttttttc acgtcacgcg tccatggaga tctttgtctg caactgaaaa gtttatacctggcttttttc acgtcacgcg tccatggaga tctttgtctg caactgaaaa gtttatacct
73807380
tacctggaac aaatggttga aacatacgag gctaatatcg gcttattagg aatagtcccttacctggaac aaatggttga aacatacgag gctaatatcg gcttattagg aatagtccct
74407440
gtactaataa aatcaggtgg atcagttgat cagtatattt tggacgaagc tcggaaagaagtactaataa aatcaggtgg atcagttgat cagtatattt tggacgaagc tcggaaagaa
75007500
tttggagatg acttgcttaa ttccacaatt aaattaaggg aaagaataaa gcgatttgattttggagatg acttgcttaa ttccacaatt aaattaaggg aaagaataaa gcgatttgat
75607560
gttcaaggaa tcacggaaga agatactcat gataaagaag ctctaaaact attcaataacgttcaaggaa tcacggaaga agatactcat gataaagaag ctctaaaact attcaataac
76207620
cttacaatgg aattgatcga aagggtggaa ggttaatggt acgaaaatta ggggatctaccttacaatgg aattgatcga aagggtggaa ggttaatggt acgaaaatta ggggatctac
76807680
ctagaaagcc acaaggcgat aggtcaagct taaagaaccc ttacatggat cttacagattctagaaagcc acaaggcgat aggtcaagct taaagaaccc ttacatggat cttacagatt
77407740
ctgaaagtaa agaaacaaca gaggttaaac aaacagaacc aaaaagaaaa aaagcattgtctgaaagtaa agaaacaaca gaggttaaac aaacagaacc aaaaagaaaa aaagcattgt
78007800
tgaaaacaat gaaagttgat gtttcaatcc ataataagat taaatcgctg cacgaaattctgaaaacaat gaaagttgat gtttcaatcc ataataagat taaatcgctg cacgaaattc
78607860
tggcagcatc cgaagggaat tcatattact tagaggatac tattgagaga gctattgatatggcagcatc cgaagggaat tcatattact tagaggatac tattgagaga gctattgata
79207920
agatggttga gacattacct gagagccaaa aaacttttta tgaatatgaa ttaaaaaaaaagatggttga gacattacct gagagccaaa aaacttttta tgaatatgaa ttaaaaaaaa
79807980
gaaccaacaa aggctgagac agactccaaa cgagtctgtt tttttaaaaa aaatattagggaaccaacaa aggctgagac agactccaaa cgagtctgtt tttttaaaaa aaatattagg
80408040
agcattgaat atatattaga gaattaagaa agacatggga ataaaaatat tttaaatccaagcattgaat atatattaga gaattaagaa agacatggga ataaaaatat tttaaatcca
81008100
gtaaaaatat gataagatta tttcagaata tgaagaactc tgtttgtttt tgatgaaaaagtaaaaatat gataagatta tttcagaata tgaagaactc tgtttgtttt tgatgaaaaa
81608160
acaaacaaaa aaaatccacc taacggaatc tcaatttaac taacagcggc caaactgagaacaaacaaaa aaaatccacc taacggaatc tcaatttaac taacagcggc caaactgaga
82208220
agttaaattt gagaagggga aaaggcggat ttatacttgt atttaactat ctccattttaagttaaattt gagaagggga aaaggcggat ttatacttgt atttaactat ctccatttta
82808280
acattttatt aaaccccata caagtgaaaa tcctctttta cactgttcct ttaggtgatcacattttatt aaaccccata caagtgaaaa tcctctttta cactgttcct ttaggtgatc
83408340
gcggagggac attatgagtg aagtaaacct aaaaggaaat acagatgaat tagtgtattagcggagggac attatgagtg aagtaaacct aaaaggaaat acagatgaat tagtgtatta
84008400
tcgacagcaa accactggaa ataaaatcgc caggaagaga atcaaaaaag ggaaagaagatcgacagcaa accactggaa ataaaatcgc caggaagaga atcaaaaaag ggaaagaaga
84608460
agtttattat gttgctgaaa cggaagagaa gatatggaca gaagagcaaa taaaaaacttagtttattat gttgctgaaa cggaagagaa gatatggaca gaagagcaaa taaaaaactt
85208520
ttctttagac aaatttggta cgcatatacc ttacatagaa ggtcattata caatcttaaattctttagac aaatttggta cgcatatacc ttacatagaa ggtcattata caatcttaaa
85808580
taattacttc tttgattttt ggggctattt tttaggtgct gaaggaattg cgctctatgctaattacttc tttgattttt ggggctattt tttaggtgct gaaggaattg cgctctatgc
86408640
tcacctaact cgttatgcat acggcagcaa agacttttgc tttcctagtc tacaaacaattcacctaact cgttatgcat acggcagcaa agacttttgc tttcctagtc tacaaacaat
87008700
cgctaaaaaa atggacaaga ctcctgttac agttagaggc tacttgaaac tgcttgaaagcgctaaaaaa atggacaaga ctcctgttac agttagaggc tacttgaaac tgcttgaaag
87608760
gtacggtttt atttggaagg taaacgtccg taataaaacc aaggataaca cagaggaatcgtacggtttt atttggaagg taaacgtccg taataaaacc aaggataaca cagaggaatc
88208820
cccgattttt aagattagac gtaaggttcc tttgctttca gaagaacttt taaatggaaacccgattttt aagattagac gtaaggttcc tttgctttca gaagaacttt taaatggaaa
88808880
ccctaatatt gaaattccag atgacgagga agcacatgta aagaaggctt taaaaaaggaccctaatatt gaaattccag atgacgagga agcacatgta aagaaggctt taaaaaagga
89408940
aaaagagggt cttccaaagg ttttgaaaaa agagcacgat gaatttgtta aaaaaatgataaaagaggt cttccaaagg ttttgaaaaa agagcacgat gaatttgtta aaaaaatgat
90009000
ggatgagtca gaaacaatta atattccaga ggccttacaa tatgacacaa tgtatgaagaggatgagtca gaaacaatta atattccaga ggccttacaa tatgacacaa tgtatgaaga
90609060
tatactcagt aaaggagaaa ttcgaaaaga aatcaaaaaa caaataccta atcctacaactatactcagt aaaggagaaa ttcgaaaaga aatcaaaaaa caaataccta atcctacaac
91209120
atcttttgag agtatatcaa tgacaactga agaggaaaaa gtcgacagta ctttaaaaagatcttttgag agtatatcaa tgacaactga agaggaaaaa gtcgacagta ctttaaaaag
91809180
cgaaatgcaa aatcgtgtct ctaagccttc ttttgatacc tggtttaaaa acactaagatcgaaatgcaa aatcgtgtct ctaagccttc ttttgatacc tggtttaaaa acactaagat
92409240
caaaattgaa aataaaaatt gtttattact tgtaccgagt gaatttgcat ttgaatggatcaaaattgaa aataaaaatt gtttattact tgtaccgagt gaatttgcat ttgaatggat
93009300
taagaaaaga tatttagaaa caattaaaac agtccttgaa gaagctggat atgttttcgataagaaaaga tatttagaaa caattaaaac agtccttgaa gaagctggat atgttttcga
93609360
aaaaatcgaa ctaagaaaag tgcaataaac tgctgaagta tttcagcagt tttttttattaaaaatcgaa ctaagaaaag tgcaataaac tgctgaagta tttcagcagt ttttttttatt
94209420
tagaaatagt gaaaaaaata taatcaggga ggtatcaata tttaatgagt actgatttaatagaaatagt gaaaaaaata taatcaggga ggtatcaata tttaatgagt actgatttaa
94809480
atttatttag actggaatta ataattaaca cgtagactaa ttaaaattta atgagggataatttatttag actggaatta ataattaaca cgtagactaa ttaaaattta atgagggata
95409540
aagaggatac aaaaatatta atttcaatcc ctattaaatt ttaacaaggg ggggattaaaaagaggatac aaaaatatta atttcaatcc ctattaaatt ttaacaaggg ggggattaaa
96009600
atttaattag aggtttatcc acaagaaaag accctaataa aatttttact agggttataaatttaattag aggtttatcc acaagaaaag accctaataa aatttttact agggttataa
96609660
cactgattaa tttcttaatg ggggagggat taaaatttaa tgacaaagaa aacaatctttcactgattaa tttcttaatg ggggagggat taaaatttaa tgacaaagaa aacaatcttt
97209720
taagaaaagc ttttaaaaga taataataaa aagagctttg cgattaagca aaactctttataagaaaagc ttttaaaaga taataataaa aagagctttg cgattaagca aaactcttta
97809780
ctttttcatt gacattatca aattcatcga tttcaaattg ttgttgtatc ataaagttaactttttcatt gacattatca aattcatcga tttcaaattg ttgttgtatc ataaagttaa
98409840
ttctgttttg cacaaccttt tcaggaatat aaaacacatc tgaggcttgt tttataaactttctgttttg cacaaccttt tcaggaatat aaaacacatc tgaggcttgt tttataaact
99009900
cagggtcgct aaagtcaatg taacgtagca tatgatatgg tatagcttcc acccaagttacagggtcgct aaagtcaatg taacgtagca tatgatatgg tatagcttcc acccaagtta
99609960
gcctttctgc ttcttctgaa tgtttttcat atacttccat gggtatctct aaatgattttgcctttctgc ttcttctgaa tgtttttcat atacttccat gggtatctct aaatgatttt
1002010020
cctcatgtag caaggtatga gcaaaaagtt tatggaattg atagttcctc tctttttcttcctcatgtag caaggtatga gcaaaaagtt tatggaattg atagttcctc tctttttctt
1008010080
caactttttt atctaaaaca aacactttaa catctgagtc aatgtaagca taagatgtttcaactttttt atctaaaaca aacactttaa catctgagtc aatgtaagca taagatgttt
1014010140
ttccagtcat aatttcaatc ccaaatcttt tagacagaaa ttctggacgt aaatcttttgttccagtcat aatttcaatc ccaaatcttt tagacagaaa ttctggacgt aaatcttttg
1020010200
gtgaaagaat ttttttatgt agcaatatat ccgatacagc accttctaaa agcgttggtggtgaaagaat ttttttatgt agcaatatat ccgatacagc accttctaaa agcgttggtg
1026010260
aatagggcat tttacctatc tcctctcatt ttgtggaata aaaatagtca tattcgtccaaatagggcat tttacctatc tcctctcatt ttgtggaata aaaatagtca tattcgtcca
1032010320
tctacctatc ctattatcga acagttgaac tttttaatca aggatcagtc ctttttttcatctacctatc ctattatcga acagttgaac tttttaatca aggatcagtc ctttttttca
1038010380
ttattcttaa actgtgctct taactttaac aactcgattt gtttttccag atctcgagggttattcttaa actgtgctct taactttaac aactcgattt gtttttccag atctcgaggg
1044010440
taactagcct cgccgatccc gcaagaggcc cggcagtcag gtggcacttt tcggggaaattaactagcct cgccgatccc gcaagaggcc cggcagtcag gtggcacttt tcggggaaat
1050010500
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatggtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
1056010560
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaaagacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
1062010620
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcaccatttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
1068010680
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttacccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
1074010740
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgttttatcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
1080010800
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgccccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
1086010860
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactcagggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
1092010920
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgccccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
1098010980
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaagataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
1104011040
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaagagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
1110011100
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatgccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
1116011160
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaagcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
1122011220
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccgttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
1128011280
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcattgctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
1134011340
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagtgcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
1140011400
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaagcaggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
1146011460
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcatcattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
1152011520
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccctttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
1158011580
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttcttaacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
1164011640
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctaccatgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
1170011700
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttcgcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
1176011760
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttcagcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
1182011820
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgctaagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
1188011880
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataaggccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
1194011940
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgaccgcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
1200012000
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaagggtacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg
1206012060
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggagagaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
1212012120
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgacttcttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
1218012180
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaacgagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
1224012240
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcggcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
1230012300
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgcttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
1236012360
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaatacgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata
1242012420
cgcatgccgcatgc
1242712427
<210> 3<210> 3
<211> 12330<211> 12330
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> интеграционный вектор<223> integration vector
<400> 3<400> 3
ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaattctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa
6060
ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcggttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg
120120
caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctcttcaccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt
180180
gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctatagcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata
240240
tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccgtgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg
300300
ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgacccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac
360360
cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccaccacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac
420420
aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgccaaggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca
480480
cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccgggggcttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg
540540
actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcctactgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct
600600
caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgatcaacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat
660660
gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgtgcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt
720720
cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgctcgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct
780780
ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgctctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct
840840
tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaatgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa
900900
acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgtacgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt
960960
cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttccttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc
10201020
cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgaccacggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca
10801080
tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacctcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc
11401140
gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggatgctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat
12001200
tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccgtgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg
12601260
ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaagaggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga
13201320
attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaacattggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac
13801380
atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttgggatatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg
14401440
tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcggtcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg
15001500
ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgcggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc
15601560
tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcgtgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg
16201620
taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgcataaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca
16801680
ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattgaggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga
17401740
ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaaccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa
18001800
cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgtcgttccagta acggggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt
18601860
ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgaccttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc
19201920
aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgcttaaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt
19801980
ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcacctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac
20402040
gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaacgaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac
21002100
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagcctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc
21602160
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgaccagacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc
22202220
cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattgcagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg
22802280
tactgagagt gcaccatatg acccgacatc cggcgttctc atggcggtgc ttgccgccagtactgagagt gcaccatatg acccgacatc cggcgttctc atggcggtgc ttgccgccag
23402340
cggtattccg tatgtcaagt ggctgcggtt tatggtgccg cttgctctga tttggttcttcggtattccg tatgtcaagt ggctgcggtt tatggtgccg cttgctctga tttggttctt
24002400
gatcgggctt gtctttatcg tgatcggagt catgatcaat tgggggccgt tttaacgattgatcgggctt gtctttatcg tgatcggagt catgatcaat tgggggccgt tttaacgatt
24602460
gctgcccgcc ggcttgtacg gcgggctttt gagttattca ttgcagaagc gcaggctgttgctgcccgcc ggcttgtacg gcgggctttt gagttattca ttgcagaagc gcaggctgtt
25202520
attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc atgaataatcattgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc atgaataatc
25802580
tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa aaagaacaaatgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa aaagaacaaa
26402640
aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat gtgatcatccaaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat gtgatcatcc
27002700
gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg tttttgttcagcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg tttttgttca
27602760
tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg ccgagaatagtcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg ccgagaatag
28202820
acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca attgcggtcgacaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca attgcggtcg
28802880
cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca ttcttcgcttcctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca ttcttcgctt
29402940
ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg cttcggtatgggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg cttcggtatg
30003000
tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag aaatcatctttgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag aaatcatctt
30603060
ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt ataggaacatttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt ataggaacat
31203120
tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat tttaaatgtatgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat tttaaatgta
31803180
agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg gaagaatgaaagcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg gaagaatgaa
32403240
gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaagagtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaaga
33003300
ccagtgaatt cgagctcggt acctaccgtt cgtataatgt atgctatacg aagttatgatccagtgaatt cgagctcggt acctaccgtt cgtataatgt atgctatacg aagttatgat
33603360
aaaaaattta gaagccaatg aaatctataa ataaactaaa ttaagtttat ttaattaacaaaaaaattta gaagccaatg aaatctataa ataaactaaa ttaagtttat ttaattaaca
34203420
actatggata taaaataggt actaatcaaa atagtgagga ggatatattt gaatacatacactatggata taaaataggt actaatcaaa atagtgagga ggatatattt gaatacatac
34803480
gaacaaatta ataaagtgaa aaaaatactt cggaaacatt taaaaaataa ccttattggtgaacaaatta ataaagtgaa aaaaatactt cggaaacatt taaaaaataa ccttattggt
35403540
acttacatgt ttggatcagg agttgagagt ggactaaaac caaatagtga tcttgactttacttacatgt ttggatcagg agttgagagt ggactaaaac caaatagtga tcttgacttt
36003600
ttagtcgtcg tatctgaacc attgacagat caaagtaaag aaatacttat acaaaaaattttagtcgtcg tatctgaacc attgacagat caaagtaaag aaatacttat acaaaaaatt
36603660
agacctattt caaaaaaaat aggagataaa agcaacttac gatatattga attaacaattagacctattt caaaaaaaat aggagataaa agcaacttac gatatattga attaacaatt
37203720
attattcagc aagaaatggt accgtggaat catcctccca aacaagaatt tatttatggaattattcagc aagaaatggt accgtggaat catcctccca aacaagaatt tatttatgga
37803780
gaatggttac aagagcttta tgaacaagga tacattcctc agaaggaatt aaattcagatgaatggttac aagagcttta tgaacaagga tacattcctc agaaggaatt aaattcagat
38403840
ttaaccataa tgctttacca agcaaaacga aaaaataaaa gaatatacgg aaattatgacttaaccataa tgctttacca agcaaaacga aaaaataaaa gaatatacgg aaattatgac
39003900
ttagaggaat tactacctga tattccattt tctgatgtga gaagagccat tatggattcgttagaggaat tactacctga tattccatt tctgatgtga gaagagccat tatggattcg
39603960
tcagaggaat taatagataa ttatcaggat gatgaaacca actctatatt aactttatgctcagaggaat taatagataa ttatcaggat gatgaaacca actctatatt aactttatgc
40204020
cgtatgattt taactatgga cacgggtaaa atcataccaa aagatattgc gggaaatgcacgtatgattt taactatgga cacgggtaaa atcataccaa aagatattgc gggaaatgca
40804080
gtggctgaat cttctccatt agaacatagg gagagaattt tgttagcagt tcgtagttatgtggctgaat cttctccatt agaacatagg gagagaattt tgttagcagt tcgtagttat
41404140
cttggagaga atattgaatg gactaatgaa aatgtaaatt taactataaa ctatttaaatcttggagaga atattgaatg gactaatgaa aatgtaaatt taactataaa ctatttaaat
42004200
aacagattaa aaaaattata aaaaaattga aaaaatggtg gaaacacttt tttcaattttaacagattaa aaaaattata aaaaaattga aaaaatggtg gaaacacttt tttcaatttt
42604260
tttgttttat tatttaatat ttgggaaata ttcattctaa tataacttcg tataatgtattttgttttat tatttaatat ttgggaaata ttcattctaa tataacttcg tataatgtat
43204320
gctatacgaa cggtaggatc ctctagagtc gacctgcagg cattttacat ttttagaaatgctatacgaa cggtaggatc ctctagagtc gacctgcagg cattttacat ttttagaaat
43804380
gggcgtgaaa aaaagcgcgc gattatgtaa aatataaaga ttaactaata aggaggacaagggcgtgaaa aaaagcgcgc gattatgtaa aatataaaga ttaactaata aggaggacaa
44404440
acatgggttc tatcatcaga cttcagggtg gtttaggcaa tcaactgttt caatttagctacatgggttc tatcatcaga cttcagggtg gtttaggcaa tcaactgttt caatttagct
45004500
ttggttatgc tctttcaaaa atcaatggca caccgctgta ctttgatatt tcacattacgttggttatgc tctttcaaaa atcaatggca caccgctgta ctttgatatt tcacattacg
45604560
cagaaaacga tgatcatggc ggatatagac tgaataacct tcaaatcccg gaagaatatccagaaaacga tgatcatggc ggatatagac tgaataacct tcaaatcccg gaagaatatc
46204620
ttcagtacta cacaccgaaa atcaacaaca tctacaaact gcttgtcaga ggcagccgctttcagtacta cacaccgaaa atcaacaaca tctacaaact gcttgtcaga ggcagccgct
46804680
tatatccgga tatttttctg tttcttggct tttgcaacga atttcatgcg tatggctatgtatatccgga tatttttctg tttcttggct tttgcaacga atttcatgcg tatggctatg
47404740
attttgaata catcgcgcaa aaatggaaaa gcaaaaaata catcggatac tggcagtctgattttgaata catcgcgcaa aaatggaaaa gcaaaaaata catcggatac tggcagtctg
48004800
aacatttctt tcataaacat attctggatc tgaaagaatt tttcatcccg aaaaacgttaaacatttctt tcataaacat attctggatc tgaaagaatt tttcatcccg aaaaacgtta
48604860
gcgaacaagc taacttactg gcagcgaaaa tcttagaatc tcagtcaagc ctgtcaattcgcgaacaagc taacttactg gcagcgaaaa tcttagaatc tcagtcaagc ctgtcaattc
49204920
atatcagacg cggcgattac atcaaaaaca aaacagccac actgacacat ggagtttgctatatcagacg cggcgattac atcaaaaaca aaacagccac actgacacat ggagtttgct
49804980
ctcttgaata ctacaagaaa gcactgaaca aaatcagaga tttagccatg attcgcgatgctcttgaata ctacaagaaa gcactgaaca aaatcagaga tttagccatg attcgcgatg
50405040
tgtttatctt ttctgatgat attttctggt gtaaagaaaa catcgaaaca cttctgagcatgtttatctt ttctgatgat attttctggt gtaaagaaaa catcgaaaca cttctgagca
51005100
aaaaatacaa catctactac tcagaagatt taagccaaga agaagattta tggctgatgtaaaaatacaa catctactac tcagaagatt taagccaaga agaagattta tggctgatgt
51605160
ctctggctaa tcatcatatt atcgccaact cttcattttc atggtggggc gcatatcttgctctggctaa tcatcatatt atcgccaact cttcattttc atggtggggc gcatatcttg
52205220
gaagctctgc gagccagatt gttatctatc cgacaccgtg gtatgatatt acaccgaaaagaagctctgc gagccagatt gttatctatc cgacaccgtg gtatgatatt acaccgaaaa
52805280
acacatacat tcctatcgtg aaccattgga tcaacgtgga caaacattcc tcctgctaaaacacatacat tcctatcgtg aaccattgga tcaacgtgga caaacattcc tcctgctaaa
53405340
gtgatagcgg taccattata ggtaagagag gaatgtacac atgtactatt taaaaaacacgtgatagcgg taccattata ggtaagagag gaatgtacac atgtactatt taaaaaacac
54005400
aaacttttgg atgttcggtt tattcttttt cttttacttt tttatcatgg gagcctacttaaacttttgg atgttcggtt tattcttttt cttttacttt tttatcatgg gagcctactt
54605460
cccgtttttc ccgatttggc tacatgacat caaccatatc agcaaaagtg atacgggtatcccgtttttc ccgatttggc tacatgacat caaccatatc agcaaaagtg atacgggtat
55205520
tatttttgcc gctatttctc tgttctcgct attattccaa ccgctgtttg gtctgctttctatttttgcc gctatttctc tgttctcgct attattccaa ccgctgtttg gtctgctttc
55805580
tgacaaactc gggctgcgca aatacctgct gtggattatt accggcatgt tagtgatgtttgacaaactc gggctgcgca aatacctgct gtggattatt accggcatgt tagtgatgtt
56405640
tgcgccgttc tttattttta tcttcgggcc actgttacaa tacaacattt tagtaggatctgcgccgttc tttattttta tcttcgggcc actgttacaa tacaacattt tagtaggatc
57005700
gattgttggt ggtatttatc taggcttttg ttttaacgcc ggtgcgccag cagtagaggcgattgttggt ggtatttatc taggcttttg ttttaacgcc ggtgcgccag cagtagaggc
57605760
atttattgag aaagtcagcc gtcgcagtaa tttcgaattt ggtcgcgcgc ggatgtttggatttattgag aaagtcagcc gtcgcagtaa tttcgaattt ggtcgcgcgc ggatgtttgg
58205820
ctgtgttggc tgggcgctgt gtgcctcgat tgtcggcatc atgttcacca tcaataatcactgtgttggc tgggcgctgt gtgcctcgat tgtcggcatc atgttcacca tcaataatca
58805880
gtttgttttc tggctgggct ctggctgtgc actcatcctc gccgttttac tctttttcgcgtttgttttc tggctgggct ctggctgtgc actcatcctc gccgttttac tctttttcgc
59405940
caaaacggat gcgccctctt ctgccacggt tgccaatgcg gtaggtgcca accattcggccaaaacggat gcgccctctt ctgccacggt tgccaatgcg gtaggtgcca accattcggc
60006000
atttagcctt aagctggcac tggaactgtt cagacagcca aaactgtggt ttttgtcactatttagcctt aagctggcac tggaactgtt cagacagcca aaactgtggt ttttgtcact
60606060
gtatgttatt ggcgtttcct gcacctacga tgtttttgac caacagtttg ctaatttcttgtatgttatt ggcgtttcct gcacctacga tgtttttgac caacagtttg ctaatttctt
61206120
tacttcgttc tttgctaccg gtgaacaggg tacgcgggta tttggctacg taacgacaattacttcgttc tttgctaccg gtgaacaggg tacgcgggta tttggctacg taacgacaat
61806180
gggcgaatta cttaacgcct cgattatgtt ctttgcgcca ctgatcatta atcgcatcgggggcgaatta cttaacgcct cgattatgtt ctttgcgcca ctgatcatta atcgcatcgg
62406240
tgggaaaaac gccctgctgc tggctggcac tattatgtct gtacgtatta ttggctcatctgggaaaaac gccctgctgc tggctggcac tattatgtct gtacgtatta ttggctcatc
63006300
gttcgccacc tcagcgctgg aagtggttat tctgaaaacg ctgcatatgt ttgaagtaccgttcgccacc tcagcgctgg aagtggttat tctgaaaacg ctgcatatgt ttgaagtacc
63606360
gttcctgctg gtgggctgct ttaaatatat taccagccag tttgaagtgc gtttttcagcgttcctgctg gtgggctgct ttaaatatat taccagccag tttgaagtgc gtttttcagc
64206420
gacgatttat ctggtctgtt tctgcttctt taagcaactg gcgatgattt ttatgtctgtgacgatttat ctggtctgtt tctgcttctt taagcaactg gcgatgattt ttatgtctgt
64806480
actggcgggc aatatgtatg aaagcatcgg tttccagggc gcttatctgg tgctgggtctactggcgggc aatatgtatg aaagcatcgg tttccagggc gcttatctgg tgctgggtct
65406540
ggtggcgctg ggcttcacct taatttccgt gttcacgctt agcggccccg gcccgctttcggtggcgctg ggcttcacct taatttccgt gttcacgctt agcggccccg gcccgctttc
66006600
cctgctgcgt cgtcaggtga atgaagtcgc ttaaagtcaa tgtatgaatg gatacgggatcctgctgcgt cgtcaggtga atgaagtcgc ttaaagtcaa tgtatgaatg gatacgggat
66606660
atgaatcaat aagtacgtga aagagaaaag caacccagat atgataggga acttttctctatgaatcaat aagtacgtga aagagaaaag caacccagat atgataggga acttttctct
67206720
ttcttgtttt acattgaatc tttacaatcc tattgatata atctaagcta gtgtattttgttcttgtttt acattgaatc tttacaatcc tattgatata atctaagcta gtgtattttg
67806780
cgtttaatag tggagaaaag ctagcgatta actaataagg aggaactgaa atgtcaaaagcgtttaatag tggagaaaag ctagcgatta actaataagg aggaactgaa atgtcaaaag
68406840
tggcgcttat tacaggcgtc acaggacaag atggcagcta tttagctgaa tttctgcttgtggcgcttat tacaggcgtc acaggacaag atggcagcta tttagctgaa tttctgcttg
69006900
aaaaaggata tgaagtgcat ggcattaaaa gacgcgcatc atcatttaac acagaaagagaaaaaggata tgaagtgcat ggcattaaaa gacgcgcatc atcatttaac acagaaagag
69606960
tcgatcatat ctatcaagat ccgcatacat gcaacccgaa atttcatctg cattatggcgtcgatcatat ctatcaagat ccgcatacat gcaacccgaa atttcatctg cattatggcg
70207020
atctgagcga tacatctaac ctgacaagaa ttttacgcga agtccagccg gatgaagtttatctgagcga tacatctaac ctgacaagaa ttttacgcga agtccagccg gatgaagttt
70807080
ataacctggg cgcgatgtct catgtcgctg tttcatttga aagcccggaa tatacagccgataacctggg cgcgatgtct catgtcgctg tttcatttga aagcccggaa tatacagccg
71407140
atgtcgatgc aatgggaaca cttagattac tggaagccat tcgcttttta ggcctggaaaatgtcgatgc aatgggaaca cttagattac tggaagccat tcgcttttta ggcctggaaa
72007200
agaaaacacg cttttatcag gcatctacat cagaactgta tggacttgtt caagaaatccagaaaacacg cttttatcag gcatctacat cagaactgta tggacttgtt caagaaatcc
72607260
cgcagaaaga aacaacaccg ttttatccga gaagcccgta tgcggtcgct aaactttacgcgcagaaaga aacaacaccg ttttatccga gaagcccgta tgcggtcgct aaactttacg
73207320
cgtactggat cacagttaat tatcgcgaat cttatggaat gtatgcttgc aatggcatctcgtactggat cacagttaat tatcgcgaat cttatggaat gtatgcttgc aatggcatct
73807380
tatttaacca tgaatcaccg agacgcggag aaacatttgt tacaagaaaa atcacacgcgtatttaacca tgaatcaccg agacgcggag aaacatttgt tacaagaaaa atcacacgcg
74407440
ccattgcaaa tatcgcccaa ggactggaaa gctgtcttta tttaggcaac atggattctcccattgcaaa tatcgcccaa ggactggaaa gctgtcttta tttaggcaac atggattctc
75007500
ttagagattg gggccatgca aaagattacg ttaaaatgca atggatgatg ttacaacaggttagagattg gggccatgca aaagattacg ttaaaatgca atggatgatg ttacaacagg
75607560
aacagccgga agattttgtg atcgccacag gagtgcaata ttcagtcaga cagtttgttgaacagccgga agattttgtg atcgccacag gagtgcaata ttcagtcaga cagtttgttg
76207620
aaatggcagc ggctcagctt ggcattaaac tgcgctttga aggcacagga gtggaagaaaaaatggcagc ggctcagctt ggcattaaac tgcgctttga aggcacagga gtggaagaaa
76807680
aaggaatcgt tgtgagcgtt acaggccatg atgcgccggg agtgaaaccg ggcgatgtgaaaggaatcgt tgtgagcgtt acaggccatg atgcgccggg agtgaaaccg ggcgatgtga
77407740
ttatcgccgt cgatccgaga tattttcgcc cggcagaagt cgaaacactt ttaggagatcttatcgccgt cgatccgaga tattttcgcc cggcagaagt cgaaacactt ttaggagatc
78007800
cgacaaaagc gcatgaaaaa ctgggctgga aaccggaaat tacactgaga gaaatggttacgacaaaagc gcatgaaaaa ctgggctgga aaccggaaat tacactgaga gaaatggtta
78607860
gcgaaatggt ggctaacgat ttagaagccg cgaaaaaaca ttctctgctt aaatcacatggcgaaatggt ggctaacgat ttagaagccg cgaaaaaaca ttctctgctt aaatcacatg
79207920
gctatgatgt ggcgatcgct ctggaatctt aaaaaggagg aactactatg agcaaacaaagctatgatgt ggcgatcgct ctggaatctt aaaaaggagg aactactatg agcaaacaaa
79807980
gagtttttat cgctggccat cgcggaatgg tgggctctgc cattagacgc caattagaacgagtttttat cgctggccat cgcggaatgg tgggctctgc cattagacgc caattagaac
80408040
agagaggaga tgtggaactt gtcttaagaa cacgcgatga actgaatctg cttgattcaaagagaggaga tgtggaactt gtcttaagaa cacgcgatga actgaatctg cttgattcaa
81008100
gagctgtcca tgatttcttt gccagcgaac gcatcgatca ggtttatctt gcagcggctagagctgtcca tgatttcttt gccagcgaac gcatcgatca ggtttatctt gcagcggcta
81608160
aagttggcgg aattgtggca aataacacat atccggcgga ttttatctac caaaacatgaaagttggcgg aattgtggca aataacacat atccggcgga ttttatctac caaaacatga
82208220
tgatcgaatc taacattatc catgccgcac atcagaatga tgttaacaaa ctgctgtttctgatcgaatc taacattatc catgccgcac atcagaatga tgttaacaaa ctgctgtttc
82808280
tgggatcaag ctgcatctat ccgaaacttg caaaacaacc gatggcggaa tcagaacttttgggatcaag ctgcatctat ccgaaacttg caaaacaacc gatggcggaa tcagaacttt
83408340
tacagggcac actggaaccg acaaatgaac cgtatgcaat tgcgaaaatc gcgggaatcatacagggcac actggaaccg acaaatgaac cgtatgcaat tgcgaaaatc gcgggaatca
84008400
aactttgtga atcttacaac agacaatacg gcagagatta tcgctcagtg atgccgacaaaactttgtga atcttacaac agacaatacg gcagagatta tcgctcagtg atgccgacaa
84608460
acttatatgg accgcatgat aattttcatc cgtctaactc acatgtcatt ccggcactgcacttatatgg accgcatgat aattttcatc cgtctaactc acatgtcatt ccggcactgc
85208520
ttagacgctt tcatgaagct acagcccaga acgcgccgga tgttgtggtc tggggctcagttagacgctt tcatgaagct acagcccaga acgcgccgga tgttgtggtc tggggctcag
85808580
gaacaccgat gcgcgaattt ctgcatgttg atgatatggc ggctgccagc atccatgtgagaacaccgat gcgcgaattt ctgcatgttg atgatatggc ggctgccagc atccatgtga
86408640
tggaacttgc tcatgaagtc tggttagaaa atacacaacc gatgcttagc catattaacgtggaacttgc tcatgaagtc tggttagaaa atacacaacc gatgcttagc catattaacg
87008700
tcggcacagg agttgattgc acaatcagag aattagctca gacaattgcc aaagttgtggtcggcacagg agttgattgc acaatcagag aattagctca gacaattgcc aaagttgtgg
87608760
gatataaagg ccgcgtcgtt tttgatgcct ctaaaccgga tggcacaccg agaaaattacgatataaagg ccgcgtcgtt tttgatgcct ctaaaccgga tggcacaccg agaaaattac
88208820
tggatgtgac acgcctgcat caacttggat ggtatcatga aattagctta gaagcaggcctggatgtgac acgcctgcat caacttggat ggtatcatga aattagctta gaagcaggcc
88808880
tggcgtctac ataccaatgg tttttagaaa accaggatag atttcgcggc ggatcataagtggcgtctac ataccaatgg tttttagaaa accaggatag atttcgcggc ggatcataag
89408940
gatccatgtc tagagtcgac gtccccgggg cagcccgcct aatgagcggg cttttttcacgatccatgtc tagagtcgac gtccccgggg cagcccgcct aatgagcggg cttttttcac
90009000
gtcccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatctgtcccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct
90609060
gttgtttgtc ggtgaacgct ctctactaga gtcacactgg ctcaccttcg ggtgggccttgttgtttgtc ggtgaacgct ctctactaga gtcacactgg ctcaccttcg ggtgggcctt
91209120
tctgcgttta tagaattcat attacttaga ggatactatt gagagagcta ttgataagattctgcgttta tagaattcat attacttaga ggatactatt gagagagcta ttgataagat
91809180
ggttgagaca ttacctgaga gccaaaaaac tttttatgaa tatgaattaa aaaaaagaacggttgagaca ttacctgaga gccaaaaaac tttttatgaa tatgaattaa aaaaaagaac
92409240
caacaaaggc tgagacagac tccgggcaag gctagacggg acttaccgaa agaaaccatccaacaaaggc tgagacagac tccgggcaag gctagacggg acttaccgaa agaaaccatc
93009300
aatgatggtt tcttttttgt tcataaatca gacaaaactt ttctcttgca aaagtttgtgaatgatggtt tcttttttgt tcataaatca gacaaaactt ttctcttgca aaagtttgtg
93609360
aagtgttgca caatataaat gtgaaatact tcacaaacaa aaagacatca aagagaaacaaagtgttgca caatataaat gtgaaatact tcacaaacaa aaagacatca aagagaaaca
94209420
taccctggaa ggatgattaa tgatgaacaa acatgtaaat aaagtagctt taatcggagctaccctggaa ggatgattaa tgatgaacaa acatgtaaat aaagtagctt taatcggagc
94809480
gggttttgtt ggaagcagtt atgcatttgc gttaattaac caaggaatca cagatgagctgggttttgtt ggaagcagtt atgcatttgc gttaattaac caaggaatca cagatgagct
95409540
tgtggtcatt gatgtaaata aagaaaaagc aatgggcgat gtgatggatt taaaccacggtgtggtcatt gatgtaaata aagaaaaagc aatgggcgat gtgatggatt taaaccacgg
96009600
aaaggcgttt gcgccacaac cggtcaaaac atcttacgga acatatgaag actgcaaggaaaaggcgttt gcgccacaac cggtcaaaac atcttacgga acatatgaag actgcaagga
96609660
tgctgatatt gtctgcattt gcgccggagc aaaccaaaaa cctggtgaga cacgccttgatgctgatatt gtctgcattt gcgccggagc aaaccaaaaa cctggtgaga cacgccttga
97209720
attagtagaa aagaacttga agattttcaa aggcatcgtt agtgaagtca tggcgagcggattagtagaa aagaacttga agattttcaa aggcatcgtt agtgaagtca tggcgagcgg
97809780
atttgacggc attttcttag tcgcgacaaa tccggttgat atcctgactt acgcaacatgatttgacggc attttcttag tcgcgacaaa tccggttgat atcctgactt acgcaacatg
98409840
gaaattcagc ggcctgccaa aagagcgggt gattggaagc ggcacaacac ttgattctgcgaaattcagc ggcctgccaa aagagcgggt gattggaagc ggcacaacac ttgattctgc
99009900
gagattccgt ttcatgctga gcgaatactt tggcgcagcg cctcaaaacg tacacgcgcagagattccgt ttcatgctga gcgaatactt tggcgcagcg cctcaaaacg tacacgcgca
99609960
tattatcgga gagcacggcg acacagagct tcctgtttgg agccacgcga atgtcggcggtattatcgga gagcacggcg acacagagct tcctgtttgg agccacgcga atgtcggcgg
1002010020
tgtgccggtc agtgaactcg ttgagaaaaa cgatgcgtac aaacaagagg agctggaccatgtgccggtc agtgaactcg ttgagaaaaa cgatgcgtac aaacaagagg agctggacca
1008010080
aattgtagat gatgtgaaaa acgcagctta ccatatcatt gagaaaaaag gcgcgacttaaattgtagat gatgtgaaaa acgcagctta ccatatcatt gagaaaaaag gcgcgactta
1014010140
ttatggggtt gcgatgagtc ttgctcgcat tacaaaagcc attcttcata atgaaaacagttatggggtt gcgatgagtc ttgctcgcat tacaaaagcc attcttcata atgaaaacag
1020010200
catattaact gtcagcacat atttggacgg gcaatacggt gcagatgacg tgtacatcggcatattaact gtcagcacat atttggacgg gcaatacggt gcagatgacg tgtacatcgg
1026010260
tgtcatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgctgtcatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc
1032010320
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggtatcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta
1038010380
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaagtcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag
1044010440
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcgaacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg
1050010500
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagaggtttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg
1056010560
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtgtggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg
1062010620
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcgggacgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga
1068010680
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgcagcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc
1074010740
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggttccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt
1080010800
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccactaactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact
1086010860
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtggggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg
1092010920
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagttcctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt
1098010980
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggtaccttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt
1104011040
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcctggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct
1110011100
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttgttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg
1116011160
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagttttgtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt
1122011220
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagtaaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt
1128011280
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtcgaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc
1134011340
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccggtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg
1140011400
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcccgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc
1146011460
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgggagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg
1152011520
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgcagaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca
1158011580
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacgaggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga
1164011640
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtccttcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct
1170011700
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactgccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg
1176011760
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactcacataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca
1182011820
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaacaaccaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca
1188011880
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttctcgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct
1194011940
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccacttcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact
1200012000
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaacgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa
1206012060
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactcacaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc
1212012120
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcggaatactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga
1218012180
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccgatacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga
1224012240
aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaataggaaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg
1230012300
cgtatcacga ggccctttcg tcttcaagaacgtatcacga ggccctttcg tcttcaagaa
1233012330
<210> 4<210> 4
<211> 4254<211> 4254
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> интеграционная кассета<223> integration cassette
<400> 4<400> 4
gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtcgcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc
6060
atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaaatgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa
120120
aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgataaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat
180180
gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtggtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg
240240
tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatgtttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg
300300
ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatcaccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca
360360
attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccatacaattgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca
420420
ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctgttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg
480480
cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaagcttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag
540540
aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agctttttttaaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt
600600
ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataatataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat
660660
tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcgtttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg
720720
gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagggaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg
780780
agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggattagtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt
840840
tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaatttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa
900900
caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcccaaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc
960960
agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataaagtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa
10201020
aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaacaaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac
10801080
tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacgatatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga
11401140
acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtacacaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac
12001200
ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgactttttttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt
12601260
agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattagagtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag
13201320
acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattatacctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat
13801380
tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggagatattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga
14401440
atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagatttatggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt
15001500
aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgacttaaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt
15601560
agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtcagaggaatta ctacctgata ttccatttc tgatgtgaga agagccatta tggattcgtc
16201620
agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccgagaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg
16801680
tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagttatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt
17401740
ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatctggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct
18001800
tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataatggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa
18601860
cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaattttttcagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt
19201920
tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgctgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc
19801980
tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatggtatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg
20402040
gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggtagcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta
21002100
agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttattagagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt
21602160
ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctacactttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca
22202220
tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtttgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt
22802280
ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaatactcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata
23402340
cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatcttcctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt
24002400
cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctaggcgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg
24602460
cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcgcttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg
25202520
cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgccagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc
25802580
ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctggctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg
26402640
ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgcctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc
27002700
cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactggacacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga
27602760
actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcacactgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac
28202820
ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtgactacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga
28802880
acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgatacagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat
29402940
tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggctatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc
30003000
tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagttggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt
30603060
ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaaggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa
31203120
atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctgatatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg
31803180
cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaagcttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag
32403240
catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaatcatcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat
33003300
ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatgattccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga
33603360
agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggtttagtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt
34203420
atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggactatataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact
34803480
taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttctaccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc
35403540
tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaatcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa
36003600
gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaagacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa
36603660
gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaagtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa
37203720
ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtgggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg
37803780
atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaacaatggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca
38403840
tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaaccttatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct
39003900
ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagtggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt
39603960
gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatcgaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc
40204020
ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggcctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc
40804080
acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcctacaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct
41404140
caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagccaaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc
42004200
cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcgcacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg
42544254
<210> 5<210> 5
<211> 10340<211> 10340
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> экспрессионная плазмида<223> expression plasmid
<400> 5<400> 5
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtcatcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca
6060
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtgcagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg
120120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgcttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc
180180
accatatgcc ttcaatcctt ttaataacaa ttatagcatc taatcttcaa caaactggccaccatatgcc ttcaatcctt ttaataacaa ttatagcatc taatcttcaa caaactggcc
240240
cgtttgttga actactcttt aataaaataa tttttccgtt cccaattcca cattgcaatacgtttgttga actactcttt aataaaataa tttttccgtt cccaattcca cattgcaata
300300
atagaaaatc catcttcatc ggctttttcg tcatcatctg tatgaatcaa atcgccttctatagaaaatc catcttcatc ggctttttcg tcatcatctg tatgaatcaa atcgccttct
360360
tctgtgtcat caaggtttaa ttttttatgt atttctttta acaaaccacc ataggagatttctgtgtcat caaggtttaa ttttttatgt atttctttta acaaaccacc ataggagatt
420420
aaccttttac ggtgtaaacc ttcctccaaa tcagacaaac gtttcaaatt cttttcttcaaaccttttac ggtgtaaacc ttcctccaaa tcagacaaac gtttcaaatt cttttcttca
480480
tcatcggtca taaaatccgt atcctttaca ggatattttg cagtttcgtc aattgccgattcatcggtca taaaatccgt atcctttaca ggatattttg cagtttcgtc aattgccgat
540540
tgtatatccg atttatattt atttttcggt cgaatcattt gaacttttac atttggatcatgtatatccg atttatattt atttttcggt cgaatcattt gaacttttac atttggatca
600600
tagtctaatt tcattgcctt tttccaaaat tgaatccatt gtttttgatt cacgtagttttagtctaatt tcattgcctt tttccaaaat tgaatccatt gtttttgatt cacgtagttt
660660
tctgtattct taaaataagt tggttccaca cataccaata catgcatgtg ctgattataatctgtattct taaaataagt tggttccaca cataccaata catgcatgtg ctgattataa
720720
gaattatctt tattatttat tgtcacttcc gttgcacgca taaaaccaac aagatttttagaattatctt tattatttat tgtcacttcc gttgcacgca taaaaccaac aagattttta
780780
ttaatttttt tatattgcat cattcggcga aatccttgag ccatatctga caaactcttattaatttttt tatattgcat cattcggcga aatccttgag ccatatctga caaactctta
840840
tttaattctt cgccatcata aacattttta actgttaatg tgagaaacaa ccaacgaacttttaattctt cgccatcata aacattttta actgttaatg tgagaaacaa ccaacgaact
900900
gttggctttt gtttaataac ttcagcaaca accttttgtg actgaatgcc atgtttcattgttggctttt gtttaataac ttcagcaaca accttttgtg actgaatgcc atgtttcatt
960960
gctctcctcc agttgcacat tggacaaagc ctggatttac aaaaccacac tcgatacaacgctctcctcc agttgcacat tggacaaagc ctggatttac aaaaccacac tcgatacaac
10201020
tttctttcgc ctgtttcacg attttgttta tactctaata tttcagcaca atcttttacttttctttcgc ctgtttcacg attttgttta tactctaata tttcagcaca atctttttact
10801080
ctttcagcct ttttaaattc aagaatatgc agaagttcaa agtaatcaac attagcgattctttcagcct ttttaaattc aagaatatgc agaagttcaa agtaatcaac attagcgatt
11401140
ttcttttctc tccatggtct cacttttcca ctttttgtct tgtccactaa aacccttgatttcttttctc tccatggtct cacttttcca ctttttgtct tgtccactaa aacccttgat
12001200
ttttcatctg aataaatgct actattagga cacataatat taaaagaaac ccccatctatttttcatctg aataaatgct actattagga cacataatat taaaagaaac ccccatctat
12601260
ttagttattt gtttagtcac ttataacttt aacagatggg gtttttctgt gcaaccaattttagttattt gtttagtcac ttataacttt aacagatggg gtttttctgt gcaaccaatt
13201320
ttaagggttt tcaatacttt aaaacacata cataccaaca cttcaacgca cctttcagcattaagggttt tcaatacttt aaaacacata cataccaaca cttcaacgca cctttcagca
13801380
actaaaataa aaatgacgtt atttctatat gtatcaagat aagaaagaac aagttcaaaaactaaaataa aaatgacgtt atttctatat gtatcaagat aagaaagaac aagttcaaaa
14401440
ccatcaaaaa aagacacctt ttcaggtgct ttttttattt tataaactca ttccctgatcccatcaaaaa aagacacctt ttcaggtgct ttttttattt tataaactca ttccctgatc
15001500
tcgacttcgt tcttttttta cctctcggtt atgagttagt tcaaattcgt tctttttaggtcgacttcgt tcttttttta cctctcggtt atgagttagt tcaaattcgt tctttttagg
15601560
ttctaaatcg tgtttttctt ggaattgtgc tgttttatcc tttaccttgt ctacaaacccttctaaatcg tgtttttctt ggaattgtgc tgttttatcc tttaccttgt ctacaaaccc
16201620
cttaaaaacg tttttaaagg cttttaagcc gtctgtacgt tccttaagat tttacattttcttaaaaacg tttttaaagg cttttaagcc gtctgtacgt tccttaagat tttacatttt
16801680
tagaaatggg cgtgaaaaaa agcgcgcgat tatgtaaaat ataaagatta actaataaggtagaaatggg cgtgaaaaaa agcgcgcgat tatgtaaaat ataaagatta actaataagg
17401740
aggacaaaca tgcaaaaact gctttctctg ccgtcaaatc ttgtccagtc ttttcatgaaaggacaaaca tgcaaaaact gctttctctg ccgtcaaatc ttgtccagtc ttttcatgaa
18001800
cttgaaagag ttaaccgcac agattggttt tgcacatcag atccggttgg caaaaaactgcttgaaagag ttaaccgcac agattggttt tgcacatcag atccggttgg caaaaaactg
18601860
ggctcaggcg gaggcacaag ctggttactg gaagaatgtt acaacgaata cagcgatggaggctcaggcg gaggcacaag ctggttactg gaagaatgtt acaacgaata cagcgatgga
19201920
gcgacatttg gcgaatggct ggaaaaagaa aaacgcattc tgttacatgc tggaggccaagcgacatttg gcgaatggct ggaaaaagaa aaacgcattc tgttacatgc tggaggccaa
19801980
agcagacgcc ttccgggata tgccccgtct ggcaaaatct taacaccggt cccggtttttagcagacgcc ttccgggata tgccccgtct ggcaaaatct taacaccggt cccggttttt
20402040
agatgggaaa gaggacaaca tttaggccag aacctgctta gcttacaact gccgctttatagatgggaaa gaggacaaca tttaggccag aacctgctta gcttacaact gccgctttat
21002100
gaaaaaatta tgtctctggc tccggataaa ctgcatacac tgattgcctc tggcgatgtggaaaaaatta tgtctctggc tccggataaa ctgcatacac tgattgcctc tggcgatgtg
21602160
tatatccgca gcgaaaaacc gcttcagtct atcccggaag ctgatgttgt gtgctatggatatatccgca gcgaaaaacc gcttcagtct atcccggaag ctgatgttgt gtgctatgga
22202220
ttatgggtcg atccgtctct ggcaacacat catggcgttt ttgcgtcaga tagaaaacatttatgggtcg atccgtctct ggcaacacat catggcgttt ttgcgtcaga tagaaaacat
22802280
ccggaacaac tggattttat gctgcagaaa ccgtcacttg cagaattaga aagcctgtctccggaacaac tggattttat gctgcagaaa ccgtcacttg cagaattaga aagcctgtct
23402340
aaaacacatt tatttctgat ggatattggc atctggttac tgtcagatag agcggtcgaaaaaacacatt tatttctgat ggatattggc atctggttac tgtcagatag agcggtcgaa
24002400
attctgatga aacgcagcca taaagaatca agcgaagaac ttaaatacta cgatctgtacattctgatga aacgcagcca taaagaatca agcgaagaac ttaaatacta cgatctgtac
24602460
tcagattttg gacttgcttt aggcacacat ccgcgcattg aagatgaaga agtgaatacatcagattttg gacttgcttt aggcacacat ccgcgcattg aagatgaaga agtgaataca
25202520
cttagcgtcg caatcctgcc tcttccggga ggcgaatttt accattacgg aacatcaaaacttagcgtcg caatcctgcc tcttccggga ggcgaatttt accattacgg aacatcaaaa
25802580
gaactgattt cttcaacact tagcgttcaa aacaaagtgt atgatcagag acgcatcatggaactgattt cttcaacact tagcgttcaa aacaaagtgt atgatcagag acgcatcatg
26402640
catagaaaag tgaaaccgaa tccggcaatg tttgtccaaa acgcggtcgt tcgcattccgcatagaaaag tgaaaccgaa tccggcaatg tttgtccaaa acgcggtcgt tcgcattccg
27002700
ctttgcgctg aaaatgccga tttatggatt gaaaacagcc atatcggacc gaaatggaaactttgcgctg aaaatgccga tttatggatt gaaaacagcc atatcggacc gaaatggaaa
27602760
atcgcatcaa gacatattat cacaggcgtg ccggaaaatg attggtcact tgcagtcccgatcgcatcaa gacatattat cacaggcgtg ccggaaaatg attggtcact tgcagtcccg
28202820
gcgggagtgt gtgtcgatgt ggtcccgatg ggagataaag gctttgttgc gagaccgtatgcgggagtgt gtgtcgatgt ggtcccgatg ggagataaag gctttgttgc gagaccgtat
28802880
ggattagatg atgtgtttaa aggcgatctg cgcgatagca aaacaacact tacaggcattggattagatg atgtgtttaa aggcgatctg cgcgatagca aaacaacact tacaggcatt
29402940
ccgtttggcg aatggatgtc taaaagagga ttatcataca cagatttaaa aggccgcacaccgtttggcg aatggatgtc taaaagagga ttatcataca cagatttaaa aggccgcaca
30003000
gatgatctgc aggctgtttc agtgtttccg atggtgaaca gcgtcgaaga attaggcctggatgatctgc aggctgtttc agtgtttccg atggtgaaca gcgtcgaaga attaggcctg
30603060
gtccttagat ggatgctttc tgaaccggaa ttagaagaag gaaaaaatat ttggctgcgcgtccttagat ggatgctttc tgaaccggaa ttagaagaag gaaaaaatat ttggctgcgc
31203120
tctgaacatt tttcagcaga tgaaatctca gctggcgcca accttaaaag actgtacgcgtctgaacatt tttcagcaga tgaaatctca gctggcgcca accttaaaag actgtacgcg
31803180
caaagagaag aatttcgcaa aggaaattgg aaagcacttg cggttaacca tgaaaaatcacaaagagaag aatttcgcaa aggaaattgg aaagcacttg cggttaacca tgaaaaatca
32403240
gtgttttatc agctggatct ggcagatgca gcggaagatt ttgttcgcct tggcttagatgtgttttatc agctggatct ggcagatgca gcggaagatt ttgttcgcct tggcttagat
33003300
atgccggaac ttttaccgga agatgctctg caaatgtcac gcattcataa tcgcatgcttatgccggaac ttttaccgga agatgctctg caaatgtcac gcattcataa tcgcatgctt
33603360
agagcccgca tcctgaaact tgatggaaaa gattatagac cggaagaaca ggctgcctttagagcccgca tcctgaaact tgatggaaaa gattatagac cggaagaaca ggctgccttt
34203420
gatctgctta gagatggatt actggatggc attagcaacc gcaaatctac accgaaactggatctgctta gagatggatt actggatggc attagcaacc gcaaatctac accgaaactg
34803480
gatgtctatt ctgatcaaat tgtttggggc agatcaccgg tgcgcatcga tatggcaggcgatgtctatt ctgatcaaat tgtttggggc agatcaccgg tgcgcatcga tatggcaggc
35403540
ggctggacag atacaccgcc gtatagcctt tattctggag gcaatgttgt gaaccttgcgggctggacag atacaccgcc gtatagcctt tattctggag gcaatgttgt gaaccttgcg
36003600
attgaattaa atggccaacc gccgcttcag gtctacgtta aaccgtgcaa agattttcatattgaattaa atggccaacc gccgcttcag gtctacgtta aaccgtgcaa agattttcat
36603660
atcgttctga gatcaatcga tatgggagct atggaaatcg tgagcacatt tgatgaactgatcgttctga gatcaatcga tatgggagct atggaaatcg tgagcacatt tgatgaactg
37203720
caagattaca agaaaattgg ctcaccgttt agcatcccga aagcagcgtt aagcctggcccaagattaca agaaaattgg ctcaccgttt agcatcccga aagcagcgtt aagcctggcc
37803780
ggatttgctc cggccttttc tgctgtcagc tatgcatcac tggaagaaca gcttaaagatggatttgctc cggccttttc tgctgtcagc tatgcatcac tggaagaaca gcttaaagat
38403840
tttggcgcag gaattgaagt tacactttta gctgccatcc cggcgggctc tggattaggctttggcgcag gaattgaagt tacactttta gctgccatcc cggcgggctc tggattaggc
39003900
acaagctcta ttctggcttc aacagtgctt ggagccatca atgatttttg cggcctggcaacaagctcta ttctggcttc aacagtgctt ggagccatca atgatttttg cggcctggca
39603960
tgggataaaa acgaaatttg tcaaagaaca cttgtcttag aacagctgct tacaacaggctgggataaaa acgaaatttg tcaaagaaca cttgtcttag aacagctgct tacaacaggc
40204020
ggcggctggc aagatcagta tggcggagtc ctgcaaggag ttaaactgct gcagacagaaggcggctggc aagatcagta tggcggagtc ctgcaaggag ttaaactgct gcagacagaa
40804080
gctggctttg cccagtcacc gttagttcgc tggctgccgg atcatctttt tacacatccggctggctttg cccagtcacc gttagttcgc tggctgccgg atcatctttt tacacatccg
41404140
gaatacaaag attgtcatct tttatactac acaggaatta caagaacagc aaaaggcattgaatacaaag attgtcatct tttatactac acaggaatta caagaacagc aaaaggcatt
42004200
ttagcggaaa tcgtgtcaag catgtttctg aatagctcac tgcatcttaa cctgcttagcttagcggaaa tcgtgtcaag catgtttctg aatagctcac tgcatcttaa cctgcttagc
42604260
gaaatgaaag cacatgcgct tgatatgaat gaagctattc aaagaggctc ttttgtcgaagaaatgaaag cacatgcgct tgatatgaat gaagctattc aaagaggctc ttttgtcgaa
43204320
tttggacgct tagttggcaa aacatgggaa cagaataaag ccctggatag cggaacaaactttggacgct tagttggcaa aacatgggaa cagaataaag ccctggatag cggaacaaac
43804380
ccgccggcag tggaagcgat catcgatctg atcaaagatt acacactggg atacaaactgccgccggcag tggaagcgat catcgatctg atcaaagatt acacactggg atacaaactg
44404440
cctggagcag gcggcggcgg ctatctgtat atggttgcga aagatccgca agcagctgtgcctggagcag gcggcggcgg ctatctgtat atggttgcga aagatccgca agcagctgtg
45004500
agaattagaa aaatcctgac agaaaatgct ccgaacccga gagcccgctt tgtggaaatgagaattagaa aaatcctgac agaaaatgct ccgaacccga gagcccgctt tgtggaaatg
45604560
acactttcag ataaaggatt tcaggtctca agaagctaag ctcttaagga ggattttagaacactttcag ataaaggatt tcaggtctca agaagctaag ctcttaagga ggattttaga
46204620
atgggttcta tcatcagact tcagggtggt ttaggcaatc aactgtttca atttagctttatgggttcta tcatcagact tcagggtggt ttaggcaatc aactgtttca atttagcttt
46804680
ggttatgctc tttcaaaaat caatggcaca ccgctgtact ttgatatttc acattacgcaggttatgctc tttcaaaaat caatggcaca ccgctgtact ttgatatttc acattacgca
47404740
gaaaacgatg atcatggcgg atatagactg aataaccttc aaatcccgga agaatatcttgaaaacgatg atcatggcgg atatagactg aataaccttc aaatcccgga agaatatctt
48004800
cagtactaca caccgaaaat caacaacatc tacaaactgc ttgtcagagg cagccgcttacagtactaca caccgaaaat caacaacatc tacaaactgc ttgtcagagg cagccgctta
48604860
tatccggata tttttctgtt tcttggcttt tgcaacgaat ttcatgcgta tggctatgattatccggata tttttctgtt tcttggcttt tgcaacgaat ttcatgcgta tggctatgat
49204920
tttgaataca tcgcgcaaaa atggaaaagc aaaaaataca tcggatactg gcagtctgaatttgaataca tcgcgcaaaa atggaaaagc aaaaaataca tcggatactg gcagtctgaa
49804980
catttctttc ataaacatat tctggatctg aaagaatttt tcatcccgaa aaacgttagccatttctttc ataaacatat tctggatctg aaagaatttt tcatcccgaa aaacgttagc
50405040
gaacaagcta acttactggc agcgaaaatc ttagaatctc agtcaagcct gtcaattcatgaacaagcta acttactggc agcgaaaatc ttagaatctc agtcaagcct gtcaattcat
51005100
atcagacgcg gcgattacat caaaaacaaa acagccacac tgacacatgg agtttgctctatcagacgcg gcgattacat caaaaacaaa acagccacac tgacacatgg agtttgctct
51605160
cttgaatact acaagaaagc actgaacaaa atcagagatt tagccatgat tcgcgatgtgcttgaatact acaagaaagc actgaacaaa atcagagatt tagccatgat tcgcgatgtg
52205220
tttatctttt ctgatgatat tttctggtgt aaagaaaaca tcgaaacact tctgagcaaatttatctttt ctgatgatat tttctggtgt aaagaaaaca tcgaaacact tctgagcaaa
52805280
aaatacaaca tctactactc agaagattta agccaagaag aagatttatg gctgatgtctaaatacaaca tctactactc agaagatta agccaagaag aagatttatg gctgatgtct
53405340
ctggctaatc atcatattat cgccaactct tcattttcat ggtggggcgc atatcttggactggctaatc atcatattat cgccaactct tcattttcat ggtggggcgc atatcttgga
54005400
agctctgcga gccagattgt tatctatccg acaccgtggt atgatattac accgaaaaacagctctgcga gccagattgt tatctatccg acaccgtggt atgatattac accgaaaaac
54605460
acatacattc ctatcgtgaa ccattggatc aacgtggaca aacattcctc ctgctaaaaaacatacattc ctatcgtgaa ccattggatc aacgtggaca aacattcctc ctgctaaaaa
55205520
ggaggaacta ctatgggcaa tacatcaatt caaacacaga gctatagagc agttgataaaggaggaacta ctatgggcaa tacatcaatt caaacacaga gctatagagc agttgataaa
55805580
gatgcgggac aaagccgctc ttatattatc ccgtttgcac tgctttgctc tctgtttttcgatgcgggac aaagccgctc ttatattatc ccgtttgcac tgctttgctc tctgtttttc
56405640
ctgtgggctg tggccaataa cctgaatgat attttactgc cgcagtttca acaggcgtttctgtgggctg tggccaataa cctgaatgat attttactgc cgcagtttca acaggcgttt
57005700
acacttacaa actttcaagc tggattaatt cagagcgcct tttactttgg ctactttatcacacttacaa actttcaagc tggattaatt cagagcgcct tttactttgg ctactttatc
57605760
atcccgatcc cggctggaat ccttatgaaa aaactgtctt acaaagctgg aattatcacaatcccgatcc cggctggaat ccttatgaaa aaactgtctt acaaagctgg aattatcaca
58205820
ggcttatttc tgtatgcact gggagcagct ctgttttggc ctgctgccga aatcatgaatggcttatttc tgtatgcact gggagcagct ctgttttggc ctgctgccga aatcatgaat
58805880
tatacactgt ttctggtcgg actgtttatt atcgcagcgg gactgggctg tcttgaaacatatacactgt ttctggtcgg actgtttatt atcgcagcgg gactgggctg tcttgaaaca
59405940
gctgccaacc cgtttgtcac agttcttgga ccggaatcaa gcggccattt tagactgaacgctgccaacc cgtttgtcac agttcttgga ccggaatcaa gcggccattt tagactgaac
60006000
cttgcacaaa catttaactc atttggagca atcatcgcgg ttgtgtttgg ccagagcttacttgcacaaa catttaactc atttggagca atcatcgcgg ttgtgtttgg ccagagctta
60606060
attctgtcta atgtcccgca tcaaagccag gatgttctgg ataaaatgtc tccggaacaaattctgtcta atgtcccgca tcaaagccag gatgttctgg ataaaatgtc tccggaacaa
61206120
ctttcagcgt ataaacattc acttgtgtta agcgtccaga caccgtatat gattatcgttctttcagcgt ataaacattc acttgtgtta agcgtccaga caccgtatat gattatcgtt
61806180
gcaatcgtgc ttttagtcgc gctgcttatt atgttaacaa aatttccggc actgcaatctgcaatcgtgc ttttagtcgc gctgcttatt atgttaacaa aatttccggc actgcaatct
62406240
gataaccatt cagatgcgaa acagggctca tttagcgctt ctttatcaag actggccagagataaccatt cagatgcgaa acagggctca tttagcgctt ctttatcaag actggccaga
63006300
attagacatt ggcgctgggc tgtgttagcc caattttgct atgtcggagc acagacagcgattagacatt ggcgctgggc tgtgttagcc caattttgct atgtcggagc acagacagcg
63606360
tgttggtcat atctgatccg ctatgctgtc gaagaaattc cgggaatgac agccggcttttgttggtcat atctgatccg ctatgctgtc gaagaaattc cgggaatgac agccggcttt
64206420
gcagcgaatt atcttacagg cacaatggtt tgctttttca tcggaagatt tacaggcacagcagcgaatt atcttacagg cacaatggtt tgctttttca tcggaagatt tacaggcaca
64806480
tggttaattt ctcgctttgc accgcataaa gtgcttgctg cctatgcgtt aatcgcaatgtggttaattt ctcgctttgc accgcataaa gtgcttgctg cctatgcgtt aatcgcaatg
65406540
gcgctgtgcc ttatttcagc ttttgccggc ggacatgtcg gccttattgc attaacactggcgctgtgcc ttatttcagc ttttgccggc ggacatgtcg gccttattgc attaacactg
66006600
tgtagcgcgt ttatgtctat ccaatacccg acaatcttta gcctgggaat taaaaacctttgtagcgcgt ttatgtctat ccaatacccg acaatcttta gcctgggaat taaaaacctt
66606660
ggccaggata caaaatacgg atcttcattt atcgttatga caattatcgg cggaggcattggccaggata caaaatacgg atcttcattt atcgttatga caattatcgg cggaggcatt
67206720
gttacaccgg tgatgggatt tgtgagcgat gcagcgggca atatcccgac agctgaattagttacaccgg tgatgggatt tgtgagcgat gcagcgggca atatcccgac agctgaatta
67806780
attccggctc tgtgttttgc cgttatcttt atctttgcta gatttcgctc tcaaacagccattccggctc tgtgttttgc cgttatcttt atctttgcta gatttcgctc tcaaacagcc
68406840
acaaactaat ctagagtcga cgtccaggca tcaaataaaa cgaaaggctc agtcgaaagaacaaactaat ctagagtcga cgtccaggca tcaaataaaa cgaaaggctc agtcgaaaga
69006900
ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga gtcacactggctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctctactaga gtcacactgg
69606960
ctcaccttcg ggtgggcctt tctgcgttta tatacgcgtt aacccgggcc cgcggatggactcaccttcg ggtgggcctt tctgcgttta tatacgcgtt aacccgggcc cgcggatgga
70207020
tatgatcaga tcctttaact ctggcaaccc tcaaaattga atgagacatg ctacacctcctatgatcaga tcctttaact ctggcaaccc tcaaaattga atgagacatg ctacacctcc
70807080
ggataataaa tatatataaa cgtatataga tttcataaag tctaacacac tagacttattggataataaa tatatataaa cgtatataga tttcataaag tctaacacac tagacttatt
71407140
tacttcgtaa ttaagtcgtt aaaccgtgtg ctctacgacc aaaactataa aacctttaagtacttcgtaa ttaagtcgtt aaaccgtgtg ctctacgacc aaaactataa aacctttaag
72007200
aactttcttt ttttacaaga aaaaagaaat tagataaatc tctcatatct tttattcaataactttcttt ttttacaaga aaaaagaaat tagataaatc tctcatatct tttattcaat
72607260
aatcgcatcc gattgcagta taaatttaac gatcactcat catgttcata tttatcagagaatcgcatcc gattgcagta taaatttaac gatcactcat catgttcata tttatcagag
73207320
ctcgtgctat aattatacta attttataag gaggaaaaaa tatgggcatt tttagtatttctcgtgctat aattatacta attttataag gaggaaaaaa tatgggcatt tttagtattt
73807380
ttgtaatcag cacagttcat tatcaaccaa acaaaaaata agtggttata atgaatcgttttgtaatcag cacagttcat tatcaaccaa acaaaaaata agtggttata atgaatcgtt
74407440
aataagcaaa attcatataa ccaaattaaa gagggttata atgaacgaga aaaatataaaaataagcaaa attcatataa ccaaattaaa gagggttata atgaacgaga aaaatataaa
75007500
acacagtcaa aactttatta cttcaaaaca taatatagat aaaataatga caaatataagacacagtcaa aactttatta cttcaaaaca taatatagat aaaataatga caaatataag
75607560
attaaatgaa catgataata tctttgaaat cggctcagga aaaggccatt ttacccttgaattaaatgaa catgataata tctttgaaat cggctcagga aaaggccatt ttacccttga
76207620
attagtaaag aggtgtaatt tcgtaactgc cattgaaata gaccataaat tatgcaaaacattagtaaag aggtgtaatt tcgtaactgc cattgaaata gaccataaat tatgcaaaac
76807680
tacagaaaat aaacttgttg atcacgataa tttccaagtt ttaaacaagg atatattgcatacagaaaat aaacttgttg atcacgataa tttccaagtt ttaaacaagg atatattgca
77407740
gtttaaattt cctaaaaacc aatcctataa aatatatggt aatatacctt ataacataaggtttaaattt cctaaaaacc aatcctataa aatatatggt aatatacctt ataacataag
78007800
tacggatata atacgcaaaa ttgtttttga tagtatagct aatgagattt atttaatcgttacggatata atacgcaaaa ttgtttttga tagtatagct aatgagattt atttaatcgt
78607860
ggaatacggg tttgctaaaa gattattaaa tacaaaacgc tcattggcat tacttttaatggaatacggg tttgctaaaa gattattaaa tacaaaacgc tcattggcat tacttttaat
79207920
ggcagaagtt gatatttcta tattaagtat ggttccaaga gaatattttc atcctaaaccggcagaagtt gatatttcta tattaagtat ggttccaaga gaatattttc atcctaaacc
79807980
taaagtgaat agctcactta tcagattaag tagaaaaaaa tcaagaatat cacacaaagataaagtgaat agctcactta tcagattaag tagaaaaaaa tcaagaatat cacacaaaga
80408040
taaacaaaag tataattatt tcgttatgaa atgggttaac aaagaataca agaaaatatttaaacaaaag tataattatt tcgttatgaa atgggttaac aaagaataca agaaaatatt
81008100
tacaaaaaat caatttaaca attccttaaa acatgcagga attgacgatt taaacaatattacaaaaaat caatttaaca attccttaaa acatgcagga attgacgatt taaacaatat
81608160
tagctttgaa caattcttat ctcttttcaa tagctataaa ttatttaata agtaagttaatagctttgaa caattcttat ctcttttcaa tagctataaa ttatttaata agtaagttaa
82208220
gggatgcata aactgcatcc cttaacttgt ttttcgtgtg cctatttttt gtgaatcgatgggatgcata aactgcatcc cttaacttgt ttttcgtgtg cctatttttt gtgaatcgat
82808280
tcagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctctcagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc
83408340
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatcttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc
84008400
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaaagctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa
84608460
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgttcatgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt
85208520
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtgtttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg
85808580
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcggcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg
86408640
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaagctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag
87008700
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctccgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc
87608760
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaacaagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa
88208820
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactggctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg
88808880
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcctaacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc
89408940
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttactaactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac
90009000
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtggcttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg
90609060
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttttttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt
91209120
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggtgatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt
91809180
catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaacatgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa
92409240
atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtgaatcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga
93009300
ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgtggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt
93609360
gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcggtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg
94209420
agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccgaagacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga
94809480
gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccgggagcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga
95409540
agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacaggagctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg
96009600
catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatccatcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc
96609660
aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctccaaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc
97209720
gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgcagatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca
97809780
taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaactaattctctt actngtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac
98409840
caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacgcaagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg
99009900
ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttcggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc
99609960
ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcgggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg
1002010020
tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaactgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac
1008010080
aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcataggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat
1014010140
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggataactcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata
1020010200
catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaacatatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa
1026010260
agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcgagtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg
1032010320
tatcacgagg ccctttcgtctatcacgagg ccctttcgtc
1034010340
<---<---
Claims (7)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP19179803.2 | 2019-06-12 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021137548A RU2021137548A (en) | 2023-07-12 |
| RU2810729C2 true RU2810729C2 (en) | 2023-12-28 |
Family
ID=
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003040352A1 (en) * | 2001-11-06 | 2003-05-15 | Ipsat Therapies Oy | Non-sporulating bacillus subtilis having parts of the gene encoding sigma g deleted |
| RU2584599C2 (en) * | 2008-12-19 | 2016-05-20 | Дженневейн Биотехнологие Гмбх | Synthesis of fucosylated compounds |
| US20170081353A1 (en) * | 2014-05-15 | 2017-03-23 | Glycosyn LLC | Alpha (1,2) Fucosyltransferase Syngenes For Use in the Production of Fucosylated Oligosaccharides |
| CN109735479A (en) * | 2019-01-30 | 2019-05-10 | 光明乳业股份有限公司 | A kind of recombined bacillus subtilis synthesizing 2'-Fucosyl lactose and its construction method and application |
| RU2742510C2 (en) * | 2016-09-07 | 2021-02-08 | Сосьете Де Продюи Нестле С.А. | Nutritional composition for infants and/or young children containing oligosaccharides |
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003040352A1 (en) * | 2001-11-06 | 2003-05-15 | Ipsat Therapies Oy | Non-sporulating bacillus subtilis having parts of the gene encoding sigma g deleted |
| RU2584599C2 (en) * | 2008-12-19 | 2016-05-20 | Дженневейн Биотехнологие Гмбх | Synthesis of fucosylated compounds |
| US20170081353A1 (en) * | 2014-05-15 | 2017-03-23 | Glycosyn LLC | Alpha (1,2) Fucosyltransferase Syngenes For Use in the Production of Fucosylated Oligosaccharides |
| RU2742510C2 (en) * | 2016-09-07 | 2021-02-08 | Сосьете Де Продюи Нестле С.А. | Nutritional composition for infants and/or young children containing oligosaccharides |
| CN109735479A (en) * | 2019-01-30 | 2019-05-10 | 光明乳业股份有限公司 | A kind of recombined bacillus subtilis synthesizing 2'-Fucosyl lactose and its construction method and application |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20220020826A (en) | Production of Fucosylated Oligosaccharides in Bacillus | |
| KR102424721B1 (en) | Peptide-mediated delivery of rna-guided endonuclease into cells | |
| KR101926286B1 (en) | Chimeric spider silk and uses thereof | |
| CN114901816B (en) | Lipase modified strains | |
| CN108289933B (en) | Secreted splice variants of mammalian Klotho as drugs for cognitive and behavioral disorders | |
| CN106659805B (en) | Method for inhibiting Ebola virus through miRNA | |
| CN116438297A (en) | In Situ Two-Phase Extraction System | |
| CN109890970B (en) | Method for producing target substance | |
| CN116391044A (en) | Fermentative production of isoprenoids | |
| KR20230113685A (en) | Production of sialylated oligosaccharides in Bacillus cells | |
| KR20130132416A (en) | Thermostable trichoderma cellulase | |
| KR20200098578A (en) | CAS9 variants and how to use them | |
| CN110923183A (en) | Construction method of lanosterol-producing Escherichia coli strain | |
| RU2810729C2 (en) | Production of fucosylated oligosaccharides in bacillus | |
| CN114891649B (en) | Complex bacteria and application thereof in degradation of long-chain alkane | |
| CN112226451A (en) | Bacillus subtilis expression system and method for producing alpha-L-AFs by using same | |
| CN1910276A (en) | Chimeric empty capsids of the infectious bursal disease virus (IBDV), obtainment process and applications | |
| CN113278061B (en) | Method for preparing cable Ma Lutai by biochemical method | |
| HK40062111A (en) | Production of fucosylated oligosaccharides in bacillus | |
| CN106755031B (en) | Rhamnolipid production plasmid, construction method thereof, escherichia coli engineering bacteria and application | |
| CN113015796A (en) | Transgenic microalgae for producing plant cell wall degrading enzymes with thermostable cellulolytic activity | |
| CN115247173B (en) | Gene editing system for constructing TMPRSS6 gene mutation iron deficiency anemia pig nuclear transfer donor cells and application thereof | |
| CN115247153B (en) | Gene editing system for constructing HNF1A gene mutation diabetic model pig nuclear transfer donor cells and its application | |
| NL2028346B1 (en) | gRAMP protein for modulating a target mRNA | |
| CN113980883A (en) | A kind of recombinant Escherichia coli with high yield of hydroxylated steroid bulk drug and its application |