BRPI0913671B1 - Método para produzir alfa-santaleno - Google Patents
Método para produzir alfa-santaleno Download PDFInfo
- Publication number
- BRPI0913671B1 BRPI0913671B1 BRPI0913671-1A BRPI0913671A BRPI0913671B1 BR PI0913671 B1 BRPI0913671 B1 BR PI0913671B1 BR PI0913671 A BRPI0913671 A BR PI0913671A BR PI0913671 B1 BRPI0913671 B1 BR PI0913671B1
- Authority
- BR
- Brazil
- Prior art keywords
- santalene
- polypeptide
- nucleic acid
- seq
- fpp
- Prior art date
Links
- KWFJIXPIFLVMPM-KHMAMNHCSA-N (+)-alpha-santalene Chemical compound CC(C)=CCC[C@]1(C)[C@@H]2C[C@H]3[C@@H](C2)[C@@]13C KWFJIXPIFLVMPM-KHMAMNHCSA-N 0.000 title claims abstract description 35
- KWFJIXPIFLVMPM-BSMMKNRVSA-N alpha-santalene Natural products C(=C\CC[C@]1(C)C2(C)[C@H]3[C@@H]2CC1C3)(\C)/C KWFJIXPIFLVMPM-BSMMKNRVSA-N 0.000 title claims abstract description 35
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 28
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 162
- 229920001184 polypeptide Polymers 0.000 claims abstract description 153
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 153
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 72
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 67
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 67
- 238000000034 method Methods 0.000 claims abstract description 64
- VWFJDQUYCIWHTN-UHFFFAOYSA-N Farnesyl pyrophosphate Natural products CC(C)=CCCC(C)=CCCC(C)=CCOP(O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-UHFFFAOYSA-N 0.000 claims abstract description 43
- VWFJDQUYCIWHTN-YFVJMOTDSA-N 2-trans,6-trans-farnesyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O VWFJDQUYCIWHTN-YFVJMOTDSA-N 0.000 claims abstract description 42
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 34
- 239000013604 expression vector Substances 0.000 claims abstract description 12
- 210000004027 cell Anatomy 0.000 claims description 65
- 230000000694 effects Effects 0.000 claims description 43
- 229930004725 sesquiterpene Natural products 0.000 claims description 35
- 150000004354 sesquiterpene derivatives Chemical class 0.000 claims description 31
- 239000000203 mixture Substances 0.000 claims description 17
- 108030003464 Alpha-santalene synthases Proteins 0.000 claims description 16
- 241000894006 Bacteria Species 0.000 claims description 11
- 244000005700 microbiome Species 0.000 claims description 11
- 230000001131 transforming effect Effects 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 9
- 241000233866 Fungi Species 0.000 claims description 7
- 230000009261 transgenic effect Effects 0.000 claims description 6
- 230000002538 fungal effect Effects 0.000 claims description 5
- 210000005260 human cell Anatomy 0.000 claims description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims 1
- 238000001727 in vivo Methods 0.000 abstract description 15
- 150000001875 compounds Chemical class 0.000 abstract description 7
- 238000000338 in vitro Methods 0.000 abstract description 7
- KWFJIXPIFLVMPM-UHFFFAOYSA-N α-santalene Chemical compound C1C2C3(C)C2CC1C3(C)CCC=C(C)C KWFJIXPIFLVMPM-UHFFFAOYSA-N 0.000 description 42
- 241000196324 Embryophyta Species 0.000 description 34
- 108090000623 proteins and genes Proteins 0.000 description 30
- 101710093888 Pentalenene synthase Proteins 0.000 description 25
- 101710115850 Sesquiterpene synthase Proteins 0.000 description 25
- 102000004169 proteins and genes Human genes 0.000 description 24
- 239000000047 product Substances 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 17
- 108090000790 Enzymes Proteins 0.000 description 17
- 239000002299 complementary DNA Substances 0.000 description 17
- 125000003729 nucleotide group Chemical group 0.000 description 17
- 244000089795 Clausena lansium Species 0.000 description 16
- 239000012634 fragment Substances 0.000 description 16
- 230000014509 gene expression Effects 0.000 description 16
- 239000002773 nucleotide Substances 0.000 description 16
- 235000007586 terpenes Nutrition 0.000 description 15
- 230000004927 fusion Effects 0.000 description 14
- 150000003505 terpenes Chemical class 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 230000035772 mutation Effects 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 241000588724 Escherichia coli Species 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 10
- 230000002255 enzymatic effect Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 235000008738 Clausena lansium Nutrition 0.000 description 9
- 108020004635 Complementary DNA Proteins 0.000 description 9
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 9
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 230000003321 amplification Effects 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- -1 sesquiterpene hydrocarbons Chemical class 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- CBIDRCWHNCKSTO-UHFFFAOYSA-N prenyl diphosphate Chemical compound CC(C)=CCO[P@](O)(=O)OP(O)(O)=O CBIDRCWHNCKSTO-UHFFFAOYSA-N 0.000 description 6
- KJTLQQUUPVSXIM-ZCFIWIBFSA-M (R)-mevalonate Chemical compound OCC[C@](O)(C)CC([O-])=O KJTLQQUUPVSXIM-ZCFIWIBFSA-M 0.000 description 5
- KJTLQQUUPVSXIM-UHFFFAOYSA-N DL-mevalonic acid Natural products OCCC(O)(C)CC(O)=O KJTLQQUUPVSXIM-UHFFFAOYSA-N 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- PGBNIHXXFQBCPU-ZNMIVQPWSA-N (-)-beta-santalene Natural products C1C[C@@H]2C(=C)[C@@](CCC=C(C)C)(C)[C@H]1C2 PGBNIHXXFQBCPU-ZNMIVQPWSA-N 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- NUFBIAUZAMHTSP-UHFFFAOYSA-N 3-(n-morpholino)-2-hydroxypropanesulfonic acid Chemical compound OS(=O)(=O)CC(O)CN1CCOCC1 NUFBIAUZAMHTSP-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 241000207199 Citrus Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 241000219146 Gossypium Species 0.000 description 4
- 241000219823 Medicago Species 0.000 description 4
- OFBQJSOFQDEBGM-UHFFFAOYSA-N Pentane Chemical compound CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 4
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 4
- 241000221035 Santalaceae Species 0.000 description 4
- 235000008632 Santalum album Nutrition 0.000 description 4
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 4
- 238000001819 mass spectrum Methods 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 108010087432 terpene synthase Proteins 0.000 description 4
- 238000005382 thermal cycling Methods 0.000 description 4
- 101710165761 (2E,6E)-farnesyl diphosphate synthase Proteins 0.000 description 3
- 239000001306 (7E,9E,11E,13E)-pentadeca-7,9,11,13-tetraen-1-ol Substances 0.000 description 3
- 102000057412 Diphosphomevalonate decarboxylases Human genes 0.000 description 3
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 3
- 101710156207 Farnesyl diphosphate synthase Proteins 0.000 description 3
- 101710125754 Farnesyl pyrophosphate synthase Proteins 0.000 description 3
- 101710089428 Farnesyl pyrophosphate synthase erg20 Proteins 0.000 description 3
- 101000958922 Homo sapiens Diphosphomevalonate decarboxylase Proteins 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 101000958925 Panax ginseng Diphosphomevalonate decarboxylase 1 Proteins 0.000 description 3
- 101710150389 Probable farnesyl diphosphate synthase Proteins 0.000 description 3
- 241001496113 Santalum Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 229930195733 hydrocarbon Natural products 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 230000017854 proteolysis Effects 0.000 description 3
- 230000002797 proteolythic effect Effects 0.000 description 3
- 230000006337 proteolytic cleavage Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 239000010671 sandalwood oil Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- PGBNIHXXFQBCPU-QLFBSQMISA-N (1r,3s,4s)-3-methyl-2-methylidene-3-(4-methylpent-3-enyl)bicyclo[2.2.1]heptane Chemical compound C1C[C@H]2C(=C)[C@](CCC=C(C)C)(C)[C@@H]1C2 PGBNIHXXFQBCPU-QLFBSQMISA-N 0.000 description 2
- JSNRRGGBADWTMC-UHFFFAOYSA-N (6E)-7,11-dimethyl-3-methylene-1,6,10-dodecatriene Chemical compound CC(C)=CCCC(C)=CCCC(=C)C=C JSNRRGGBADWTMC-UHFFFAOYSA-N 0.000 description 2
- 238000001644 13C nuclear magnetic resonance spectroscopy Methods 0.000 description 2
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 235000003826 Artemisia Nutrition 0.000 description 2
- 235000003261 Artemisia vulgaris Nutrition 0.000 description 2
- 241000208838 Asteraceae Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 2
- 241000219193 Brassicaceae Species 0.000 description 2
- 241000951471 Citrus junos Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 241000220485 Fabaceae Species 0.000 description 2
- 102100035111 Farnesyl pyrophosphate synthase Human genes 0.000 description 2
- 235000009438 Gossypium Nutrition 0.000 description 2
- 241000207923 Lamiaceae Species 0.000 description 2
- 241000219071 Malvaceae Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 241001072983 Mentha Species 0.000 description 2
- 235000014435 Mentha Nutrition 0.000 description 2
- 108700040132 Mevalonate kinases Proteins 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 241001093501 Rutaceae Species 0.000 description 2
- 235000017276 Salvia Nutrition 0.000 description 2
- 240000007164 Salvia officinalis Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000208292 Solanaceae Species 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 235000002634 Solanum Nutrition 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 238000012197 amplification kit Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 244000030166 artemisia Species 0.000 description 2
- 235000009052 artemisia Nutrition 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- OJYKYCDSGQGTRJ-GQYWAMEOSA-N beta-santalol Chemical compound C1C[C@H]2C(=C)[C@@](CC/C=C(CO)/C)(C)[C@@H]1C2 OJYKYCDSGQGTRJ-GQYWAMEOSA-N 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 235000020971 citrus fruits Nutrition 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- DIOQZVSQGTUSAI-UHFFFAOYSA-N decane Chemical compound CCCCCCCCCC DIOQZVSQGTUSAI-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- OJYKYCDSGQGTRJ-UHFFFAOYSA-N epi-cis-beta-santalol Natural products C1CC2C(=C)C(CCC=C(CO)C)(C)C1C2 OJYKYCDSGQGTRJ-UHFFFAOYSA-N 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 102000002678 mevalonate kinase Human genes 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000000419 plant extract Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 244000045561 useful plants Species 0.000 description 2
- JYVXNLLUYHCIIH-UHFFFAOYSA-N (+/-)-mevalonolactone Natural products CC1(O)CCOC(=O)C1 JYVXNLLUYHCIIH-UHFFFAOYSA-N 0.000 description 1
- PGBNIHXXFQBCPU-ILXRZTDVSA-N (-)-beta-santalene Chemical compound C1C[C@H]2C(=C)[C@@](CCC=C(C)C)(C)[C@@H]1C2 PGBNIHXXFQBCPU-ILXRZTDVSA-N 0.000 description 1
- JSNRRGGBADWTMC-QINSGFPZSA-N (E)-beta-Farnesene Natural products CC(C)=CCC\C(C)=C/CCC(=C)C=C JSNRRGGBADWTMC-QINSGFPZSA-N 0.000 description 1
- 101710100916 (E)-beta-farnesene synthase Proteins 0.000 description 1
- SIGQQUBJQXSAMW-ZCFIWIBFSA-N (R)-5-diphosphomevalonic acid Chemical compound OC(=O)C[C@@](O)(C)CCOP(O)(=O)OP(O)(O)=O SIGQQUBJQXSAMW-ZCFIWIBFSA-N 0.000 description 1
- QNGIKNUNNYQTHX-UHFFFAOYSA-N 2-methyl-2-(4-methylpentyl)tetracyclo[3.2.0.01,6.03,7]heptane Chemical group CC(C)CCCC1(C)C2CC3C11C2C13 QNGIKNUNNYQTHX-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- YAHZABJORDUQGO-NQXXGFSBSA-N D-ribulose 1,5-bisphosphate Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)C(=O)COP(O)(O)=O YAHZABJORDUQGO-NQXXGFSBSA-N 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- PDEQKAVEYSOLJX-UHFFFAOYSA-N Hexahydronerolidol Natural products C1C2C3(C)C2CC1C3(C)CCC=C(CO)C PDEQKAVEYSOLJX-UHFFFAOYSA-N 0.000 description 1
- 101000779608 Homo sapiens Homeobox protein aristaless-like 4 Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- RRHGJUQNOFWUDK-UHFFFAOYSA-N Isoprene Chemical group CC(=C)C=C RRHGJUQNOFWUDK-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 102100024279 Phosphomevalonate kinase Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- JYVXNLLUYHCIIH-ZCFIWIBFSA-N R-mevalonolactone, (-)- Chemical compound C[C@@]1(O)CCOC(=O)C1 JYVXNLLUYHCIIH-ZCFIWIBFSA-N 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000193998 Streptococcus pneumoniae Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- PDEQKAVEYSOLJX-BKKZDLJQSA-N alpha-santalol Chemical compound C1C2[C@]3(C)C2C[C@H]1[C@@]3(C)CC/C=C(CO)/C PDEQKAVEYSOLJX-BKKZDLJQSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- OJYKYCDSGQGTRJ-INLOORNJSA-N beta-Santalol Natural products C1C[C@H]2C(=C)[C@](CC\C=C(CO)/C)(C)[C@@H]1C2 OJYKYCDSGQGTRJ-INLOORNJSA-N 0.000 description 1
- 108010080115 beta-farnesene synthase Proteins 0.000 description 1
- 125000002616 bicyclic sesquiterpene group Chemical group 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 229940112502 concerta Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 229930004069 diterpene Natural products 0.000 description 1
- 125000000567 diterpene group Chemical group 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229950008696 farnesil Drugs 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000002803 fossil fuel Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 230000028744 lysogeny Effects 0.000 description 1
- 238000010841 mRNA extraction Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- JUMYIBMBTDDLNG-UHFFFAOYSA-N methylphenidate hydrochloride Chemical compound [Cl-].C=1C=CC=CC=1C(C(=O)OC)C1CCCC[NH2+]1 JUMYIBMBTDDLNG-UHFFFAOYSA-N 0.000 description 1
- 229940057061 mevalonolactone Drugs 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229930003658 monoterpene Natural products 0.000 description 1
- 150000002773 monoterpene derivatives Chemical class 0.000 description 1
- 235000002577 monoterpenes Nutrition 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- LCCNCVORNKJIRZ-UHFFFAOYSA-N parathion Chemical compound CCOP(=S)(OCC)OC1=CC=C([N+]([O-])=O)C=C1 LCCNCVORNKJIRZ-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 108091000116 phosphomevalonate kinase Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000000711 polarimetry Methods 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229930013258 santalene Natural products 0.000 description 1
- 150000000116 santalene derivatives Chemical class 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000001256 steam distillation Methods 0.000 description 1
- 229940031000 streptococcus pneumoniae Drugs 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- OJYKYCDSGQGTRJ-BFONTGBQSA-N trans-β-santalol Chemical compound C1C[C@H]2C(=C)[C@@](CC\C=C(CO)/C)(C)[C@@H]1C2 OJYKYCDSGQGTRJ-BFONTGBQSA-N 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- PDEQKAVEYSOLJX-YHYXMXQVSA-N α-santal-10-en-12-ol Chemical compound C1C2C3(C)C2CC1C3(C)CC/C=C(CO)/C PDEQKAVEYSOLJX-YHYXMXQVSA-N 0.000 description 1
- PGBNIHXXFQBCPU-UHFFFAOYSA-N β-santalene Chemical compound C1CC2C(=C)C(CCC=C(C)C)(C)C1C2 PGBNIHXXFQBCPU-UHFFFAOYSA-N 0.000 description 1
Abstract
MÉTODO PARA PRODUZIR ALFA-SANTALENO. A presente invenção fornece um método para produzir (alfa)-santaleno, o dito método compreendendo colocar em contato pelo menos um polipeptídeo com farnesil pirofosfato (FPP). Em particular, o dito método pode ser executado in vitro ou in vivo para produzir (alfa)-santaleno, um composto muito útil nos campos da perfumaria e aromatizantes. A presente invenção também fornece uma sequência de aminoácidos de um polipeptídeo útil no método da invenção. Um ácido nucleico codificando o polipeptídeo da invenção e um vetor de expressão contendo o dito ácido nucleico também são parte da presente invenção. Um organismo hospedeiro não-humano ou uma célula transformada para ser usado no método de produzir (alfa)-santaleno também é um objeto da presente invenção.
Description
A presente invenção fornece um método de produzir a-santaleno, o dito método compreendendo colocar em contato pelo menos um polipeptídeo com farnesil pirofosfato (FPP). Em particular, o dito método pode ser realizado in vitro ou in vivo para produzir α-santaleno, um composto muito útil nos campos da perfumaria e aromatizantes. A presente invenção também fornece a sequência de aminoácidos de um polipeptídeo útil no método da invenção. Um ácido nucleico codificando o polipeptídeo da invenção e um vetor de expressão contendo o dito ácido nucleico também é parte da presente invenção. Um organismo hospedeiro não-humano ou uma célula transformada para ser usada no método de produzir a-santaleno também é um objeto da presente invenção;
Os terpenos são encontrados na maioria dos organismos (microorganismos, animais e vegetais). Estes compostos são formados de cinco unidades de carbono chamadas de unidades de isopreno e são classificados pelo número destas unidades presentes em suas estruturas. Assim, monoterpenos, sesquiterpenos e diterpenos são terpenos contendo 10, 15 e 20 átomos de carbono, respectivamente. Os sesquiterpenos, por exemplo, são amplamente encontrados no reino vegetal. Muitas moléculas de sesquiterpeno são conhecidas por suas propriedades aromáticas e de fragrância e seus efeitos cosméticos, medicinais e antimicrobianos. Mais de 300 hidrocarbonetos de sesquiterpeno e 3000 sesquiterpenóides foram identificados e muitas novas estruturas são identificadas a cada ano. Extratos vegetais obtidos através de diferentes maneiras, tais como destilação a vapor ou extração de solvente, são usados como fonte de terpenos. As moléculas de terpeno são frequentemente usadas como tais, mas, em alguns casos, reações químicas são usadas para transformar os terpenos em outras moléculas de alto valor.
A produção biossintética de terpenos envolve enzimas chamadas de terpeno sintases. Há, virtualmente, uma infinidade de sesquiterpeno sintases presentes no reino vegetal, todas usando o mesmo substrato (farnesil pirofosfato, FPP), mas tendo diferentes perfis de produto. Genes e cDNAs codificando sesquiterpeno sintases foram clonados e as enzimas recombinantes correspondentes caracterizadas. A biossíntese dos terpenos nas plantas e outros organismos tem sido extensivamente estudada, e não é detalhada além aqui, mas referência é feita a Dewick, Nat. Prod. Rep., 2002, 19, 181-222, o qual revê o estado da arte das trajetórias biossintéticas do terpeno.
O a-santaleno é uma molécula de sesquiterpeno que ocorre naturalmente. O (+)-isômero pode ser usado como material de partida para a síntese química ou a biossíntese de (Z)-(+)-a-santalol, o qual é um importante constituinte do óleo de sândalo. O óleo de sândalo é um importante ingrediente de perfumaria obtido pela destilação do cerne das espécies de Santalum. O sândalo também é amplamente usado para incensos e medicina tradicional. O óleo contém 90% de álcoois de sesquiterpeno. (Z)-(+)-α-santalol e (Z)-(-)-β-santalol representam os principais constituintes (respectivamente, 45-47% e 20-30%) e são principalmente responsáveis pelo odor doce-amadeirado e balsâmico do óleo de sândalo. Outros constituintes, tais como epi-β-santalol e trans-a-bergamotol, também estão presentes e podem contribuir para a nota do sândalo.
Geralmente, o preço e disponibilidade dos extratos naturais da planta são dependentes da abundância, produção de óleo e origem geográfica das plantas. Além disso, a disponibilidade e qualidade dos extratos naturais são muito dependentes do clima e outras condições locais que levam à variabilidade de ano para ano, tornando o uso de tais ingredientes na perfumaria de alta qualidade muito difícil ou, mesmo, impossível em alguns anos. Devido à superexploração das fontes naturais, dificuldades de cultivo, crescimento lento das plantas de Santalum, as disponibilidades de matéria-prima de sândalo têm diminuído dramaticamente durante as últimas décadas. Portanto, seria uma vantagem fornecer uma fonte de (Z)-(+)-a-santalol, o qual é menos sujeito a flutuações na disponibilidade e qualidade. Uma síntese química dos constituintes de sesquiterpeno do sândalo até agora não está disponível. Uma trajetória bioquímica levando à síntese de (+)-a- santaleno, o qual poderia, então, ser usado para produzir (Z)-(+)-a-santalol, seria, portanto, de grande interesse. Dada a dificuldade de controlar a produção de sesquiterpeno nas espécies de Santalum, fontes vegetais alternativas foram observadas.
O sesquiterpeno do tipo santalano, e particularmente sesquiterpenos com o esqueleto do a-santalano, foram identificados em várias espécies vegetais. Relatou- se que a Clausena lansium, uma planta da família Rutaceae contém grandes quantidades de sesquiterpenos de santalano nas folhas. Zhao e colaboradores (Zhao et al, Z. Naturforsch, 2004, 59c, 153-156) analisaram as folhas de C. Lansium da China e detectaram a presença de a-santalol e β-santalol. A análise das folhas de C. Lansium de Cuba revelou a presença de (Z)-α-santalol, epi-β-santalol, (Z)-β- santalol e (E)-β-santalol (Pino et al., J. Essent. Oil Res., 2006, 18, 139-141). Surpreendentemente, a análise de diferentes partes da C. Lansium de origem tailandesa não mostrou a presença de sesquiterpenos com esqueletos de santalano (Chokeprasert et al, Journal of Food Composition and Analysis, 2007, 20(1), 52-56).
Uma sesquiterpeno sintase capaz de sintetizar pelo menos um sesquiterpeno bicíclico e/ou sesquiterpeno cíclico tendo um esqueleto de carbono do santalano, o ácido nucleico correspondente e um método para produzir tais compostos tendo um esqueleto de carbono do santalano são revelados na aplicação de patente internacional WO 2006/134523. (+)-epi-β-santaleno, (-)-β-santaleno, (+)-β- santaleno, (+)-α-santaleno e (-)-α-santaleno são citados como exemplos de compostos tendo um esqueleto de carbono do santaleno. Não obstante, a sesquiterpeno sintase fornecida nos exemplos não produz a-santaleno. Somente epi-β-santaleno é produzido. As propriedades deste composto são muito diferentes daquelas do a-santaleno. Em particular, o epi-β-santaleno não é de nenhum interesse na síntese de (Z)-(+)-a-santalol. Além disso, a sesquiterpeno sintase revelada na WO 2006/134523 compartilha somente 37% da identidade com a sequência da invenção.
As terpeno sintases que têm uma certa porcentagem de identidade da sequência com a sequência da a-santaleno sintase da presente invenção, também têm sido encontrada nos bancos de dados de sequências. Não obstante, a porcentagem de identidade entre as sesquiterpeno sintases conhecidas e o polipeptídeo da invenção é muito baixa. A sequência de proteínas mais próxima da (+)-a-santaleno sintase da invenção é uma (E)-β-farneseno sintase do Citrus junos (NCBI access No. AAK54279; Maruyama et al, Biol. Pharm. Buli., 2001, 24(10), 1171-1175) a qual compartilha 67 a 68% de identidade da sequência de aminoácidos com a a-santaleno sintase da invenção.
Além da diferença entre as próprias sequências, deve-se também salientar que a estrutura e as propriedades dos produtos sintetizados pela enzima acima mencionada são muito diferentes daquelas do a-santaleno. Em particular, o (E)-β- farneseno não é adequado como um material de partida para a síntese do (Z)-(+)-a- santalol, o qual é um ingrediente muito útil no campo da perfumaria.
Uma a-santaleno sintase é revelada na WO 2008/142318. Este documento não foi publicado na data de prioridade da presente aplicação. Ele descreve uma enzima capaz de catalisar a transformação do Z,Z-farnesil pirofosfato em a- santaleno. Portanto, a reação catalisada pela enzima da arte anterior é diferente daquela catalisada pela sintase da presente invenção, a qual inicia a partir do E,E- farnsesil pirofosfato. Além do mais, a a-santaleno sintase da invenção compartilha somente 23,8% de identidade da sequência com aquela descrita na WO 2008/142318.
Apesar de estudos extensivos da ciclização do terpeno, o isolamento e caracterização das terpeno sintases ainda é difícil, particularmente em plantas, devido a sua baixa abundância, seus padrões de expressão frequentemente transitórios e a complexidade de purificá-las a partir de misturas de resinas e compostos fenólicos nos tecidos onde elas são expressas.
Um objetivo da presente invenção é fornecer métodos para fabricar (+)-a- santaleno de uma maneira econômica, conforme indicado acima. Concordantemente, a presente invenção tem o objetivo de produzir (+)-a-santaleno embora tendo pouco desperdício, um processo mais eficiente em termos de energia e recursos, enquanto se reduz a dependência de combustíveis fósseis. É um objetivo adicional fornecer enzimas capazes de sintetizar a-santaleno, o qual é útil como ingrediente de perfumaria e/ou aromatizantes. Abreviações Usadas bp par de bases kb quilobase BSA albumina do soro bovino DMAPP dimetilalil difosfato DNA ácido desoxirribonucleico cDNA DNA complementar dT desoxitimina 5 dNTP desoxinucleotídeo trifosfato DTT ditiotreitol FPP farnesil pirofosfato GC cromatografia gasosa idi isopentenil difosfato isomerase 10 IPP isopentenil difosfato IPTG isopropil-D-tiogalacto-piranosídeo LB caldo de lisogenia MOPSO ácido 3-(N-morfolino)-2-hidroxipropanossulfônico MS espectrômetro de massa 15 mvaK1 mevalonato quinase mvaK2 mevalonato difosfato quinase NMR ressonância magnética nuclear PCR reação de cadeia polimerase RMCE Troca de cassete mediada por recombinase 20 3’-/5’-RACE amplificação rápida das extremidades de cDNA 3’ e 5’ RNA ácido ribonucleico mRNA ácido ribonucleico mensageiro
A presente invenção fornece um método para produzir biossinteticamente o 25 a-santaleno, de uma maneira econômica, confiável e reproduzível.
Uma “sesquiterpeno sintase” ou um “polipeptídeo apresentando uma atividade sesquiterpeno sintase”, é pretendido aqui como um polipeptídeo capaz de catalisar a síntese de uma molécula de sesquiterpeno ou de uma mistura de moléculas de sesquiterpeno a partir do percursor de terpeno acíclico FPP.
Como uma “a-santaleno sintase” ou como um “polipeptídeo apresentando uma atividade a-santaleno sintase”, queremos dizer aqui, um polipeptídeo capaz de catalisar a síntese do a-santaleno, na forma de qualquer um de seus estereoisômeros ou uma mistura deles, partindo do FPP. O a-santaleno pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos.
Como uma “(+)a-santaleno sintase” ou como um “polipeptídeo apresentando uma atividade (+)a-santaleno sintase”, queremos dizer aqui, um polipeptídeo capaz de catalisar a síntese de (+)-α-santaleno a partir do FPP. O (+)-a-santaleno pode ser o único produto ou pode ser parte de uma mistura de sesquiterpenos. A (+)-a- santaleno sintase é um exemplo particular de a-santaleno sintase.
A capacidade de um polipeptídeo catalisar a sínstese de um sesquiterpeno em particular (por exemplo, (+)-a-santaleno) pode ser simplesmente confirmada realizando o ensaio de enzima conforme detalhado no Exemplo 4.
De acordo com uma materialização preferida da invenção, o FPP está na forma de (2E,6E)-FPP.
De acordo com a presente invenção, significa que os polipeptídeos também incluem polipeptídeos truncados contanto que mantenham sua atividade sesquiterpeno sintase conforme definida em qualquer das materializações acima e que compartilhem pelo menos a porcentagem definida de identidade com o fragmento correspondente da SEQ ID NO:1.
Conforme pretendido abaixo, “uma sequência de nucleotídeos obtida pela modificação da SEQ ID NO:2” abrange qualquer sequência que tenha sido obtida pela mudança da SEQ ID NO:2 usando qualquer método conhecido na arte, por exemplo introduzindo qualquer tipo de mutações tais como mutações por deleção, inserção ou substituição. Exemplos de tais métodos são citados na parte da descrição relativa às variantes de polipeptídeo e aos métodos para prepará-las.
A porcentagem de identidade entre duas sequências peptídicas ou nucleotídicas é uma função do número de aminoácidos ou resíduos de nucleotídeo que são idênticos nas duas sequências quando um alinhamento destas duas sequências é gerado. Resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma dada posição de alinhamento. A porcentagem de identidade da sequência, conforme usada neste, é calculada a partir do alinhamento ótimo, tomando o número de resíduos idênticos entre duas sequências, dividindo-o pelo número total de resíduos na sequência mais curta e multiplicando por 100. O alinhamento ótimo é o alinhamento no qual a porcentagem de identidade é a mais alta possível. Lacunas podem ser introduzidas em uma ou ambas as sequências, em uma ou mais posições de alinhamento, para obter o alinhamento ótimo. Estas lacunas são então levadas em conta como resíduos não- idênticos para o cálculo da porcentagem de identidade da sequência.
O alinhamento para o propósito de determinar a porcentagem de identidade da sequência de aminoácidos ou ácidos nucleicos pode ser alcançado de várias maneiras usando programas de computador e, por exemplo, programas de computador disponíveis na rede mundial. Preferivelmente, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) ajustado aos parâmetros predefinidos, disponível no National Center for Biotechnology Information (NCBI) no site http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, pode ser usado para obter o alinhamento ótimo das sequências peptídicas ou nucleotídicas e calcular a porcentagem de identidade da sequência.
Um objeto da presente invenção é, portanto, um método para produzir a- santaleno, compreendendo a) colocando o FPP em contato com pelo menos um polipeptídeo apresentando uma atividade de a-santaleno sintase e compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID NO:1; b) opcionalmente, isolando o a-santaleno produzido na etapa a).
De acordo com uma materialização preferida, o método é um método para produzir a-santaleno como um produto principal. De acordo com uma materialização até mais preferida, o a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% do produto produzido pelo método da invenção.
De acordo com uma materialização mais preferida, o método é um método para produzir (+)-a-santaleno e o polipeptídeo apresentando uma atividade a- santaleno sintase apresenta uma atividade (+)-a-santaleno sintase.
De acordo com uma materialização mais preferida, o método é um método para produzir (+)-a-santaleno como um produto principal. De acordo com uma materialização mais preferida, o (+)-a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos produtos produzidos pelo método da invenção.
O método pode ser executado in vitro bem como in vivo, conforme será explicado em detalhes mais adiante.
O polipeptídeo a entrar em contato com FPP in vitro pode ser obtido pela extração a partir de um organismo que o expresse, usando tecnologias padrão de extração de proteína ou enzima. Se o organismo hospedeiro for um organismo unicelular ou célula que libere o polipeptídeo da invenção no meio de cultura, o polipeptídeo pode simplesmente ser coletado a partir do meio de cultura, por exemplo, por centrifugação, opcionalmente seguida pelas etapas de lavagem e ressuspensão em soluções tampões adequadas. Se o organismo ou célula acumula o polipeptídeo dentro de suas células, o polipeptídeo pode ser obtido pela ruptura ou lise das células e extração adicional do polipeptídeo a partir do lisado celular.
O polipeptídeo apresentando uma atividade a-santaleno sintase, em uma forma isolada ou junto com outras proteínas, por exemplo, em um extrato de proteína cru obtido de células cultivadas ou microorganismos, pode então ser suspenso em uma solução tampão em um pH ótimo. Se adequado, sais BSA e outros tipos de cofatores enzimáticos podem ser adicionados de modo a otimizar a atividade enzimática. Condições apropriadas são descritas, em mais detalhes, nos Exemplos mais adiante.
O FPP precursor pode, então, ser adicionado à suspensão ou solução, a qual é, então, incubada a uma temperatura ótima, por exemplo, entre 15 e 40°C, preferivelmente entre 25 e 35°C, mais preferivelmente a 30°C. Após a incubação, o a-santaleno produzido pode ser isolado da solução incubada pelos procedimentos de isolamento padrão, tais como extração de solvente e destilação, opcionalmente após remoção dos polipeptídeos da solução.
De acordo com outra materialização preferida, o método de qualquer das materializações descritas acima é executado in vivo. Neste caso, a etapa a) compreende cultivar um organismo hospedeiro não-humano ou célula capaz de produzir FPP e transformado para expressar pelo menos um polipeptídeo compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID N0:1 e apresentando uma atividade α-santaleno sintase, sob condições úteis para a produção de a-santaleno.
De acordo com uma materialização mais preferida, o método ainda compreende, antes da etapa a), transformar um organismo não-humano ou célula capaz de produzir FPP com pelo menos um ácido nucleico codificando um polipeptídeo compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID NO:1 e apresentando uma atividade a-santaleno sintase, de modo que o dito organismo expresse o dito polipeptídeo.
Estas materializações da invenção são particularmente vantajosas, desde que seja possível realizar o método in vivo sem previamente isolar o polipeptídeo. A reação ocorre diretamente dentro do organismo ou célula transformada para expressar o dito polipeptídeo.
De acordo com uma materialização particular da invenção, o pelo menos um ácido nucleico codificando a a-santaleno sintase compreende uma sequência de nucleotídeos pelo menos 50%, preferivelmente pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, preferivelmente pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:2 ou o complemento disto. De acordo com uma materialização mais preferida, o dito ácido nucleico compreende a sequência de nucleotídeos SEQ ID NO:2 ou o complemento desta. Em uma materialização até mais preferida, o dito ácido nucleico consiste de SEQ ID NO:2 ou o complemento desta.
De acordo com uma materialização mais preferida, o pelo menos um ácido nucleico usado em qualquer uma das materializações acima compreende uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2. De acordo com uma materialização até mais preferida, o dito pelo menos um ácido nucleico consiste de uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.
De acordo com outra materialização, o pelo menos um ácido nucleico é isolado da Clausena lansium.
Significa que o organismo ou célula “expressa” um polipeptídeo, desde que o organismo ou célula seja transformado para ancorar um ácido nucleico dito polipeptídeo, este ácido nucleico seja transcrito para o mRNA e o polipeptídeo seja encontrado no organismo hospedeiro ou célula. O termo “expressa” abrange “heterologamente expressa” e “superexpressa”, a última referindo-se a níveis de mRNA, polipeptídeo e/ou atividade enzimática até e acima do que é medido em um organismo ou célula não-transformada. Uma descrição mais detalhada dos métodos adequados para transformar um organismo não-humano ou célula será descrito mais tarde na parte da especificação que é dedicada para tais organismos hospedeiros não-humanos transformados ou células como objetos específicos da presente invenção e nos exemplos.
Significa que um organismo em particular é “capaz de produzir FPP” quando ele produz FPP naturalmente ou quando ele não produz FPP naturalmente, mas é transformado para produzir FPP, antes da transformação com um ácido conforme descrito neste, ou junto com o dito ácido nucleico. Organismos ou células transformados para produzir uma quantidade mais alta de FPP do que naturalmente ocorre no organismo ou células também são abrangidos pelos “organismos ou células capazes de produzir FPP”. Os métodos para transformar organismos, por exemplo, microorganismos, de modo que eles produzam FPP já são conhecidos na arte. Tais métodos podem, por exemplo, ser encontrados na literatura, por exemplo, nas seguintes publicações Martin, V.J., Pitera, D.J., Withers, S.T., Newman, J.D., and Keasling, J.D. Nat Biotechnol., 2003, 21(7), 796-802 (transformation of E. coli); Wu, S., Schalk, M., Clark, A., Miles, R.B., Coates, R., and Chappell, J., Nat Biotechnol., 2006, 24(11), 1441-1447 (transformation of plants); Takahashi, S., Yeo, Y., Greenhagen, B. T., McMullin, T., Song, L., Maurina-Brunker, J., Rosson, R., Noel, J., Chappell, J, Biotechnology and Bioengineering, 2007, 97(1), 170-181 (transformation of yeast).
Para realizar a invenção in vivo, o organismo hospedeiro ou célula é cultivado sob condições úteis para a produção de a-santaleno. Concordantemente, se o hospedeiro for uma planta transgênica, condições de crescimento ótimas são fornecidas, tais como condições ótimas de luz, água e de nutrientes, por exemplo. Se o hospedeiro for um organismo unicelular, as condições úteis para a produção do a-santaleno podem compreender a adição de cofatores adequados ao meio de cultura do hospedeiro. Além disso, um meio de cultura pode ser selecionado de modo que maximize a síntese de a-santaleno. Condições ótimas de cultura são descritas de uma maneira mais detalhada nos Exemplos seguintes.
Organismos hospedeiros não-humanos adequados para executar o método da invenção in vivo, pode ser qualquer organismo multicelular não-humano ou organismos unicelulares. Em uma materialização preferida, o organismo hospedeiro não-humano usado para realizar a invenção in vivo é uma planta, um procariota, ou um fungo. Qualquer planta, procariota ou fungo pode ser usado. Particularmente, plantas úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma materialização mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (nabo), Medicago (alfafa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence à espécie do Nicotiana tabacum.
Em uma materialização mais preferida, o organismo hospedeiro não-humano usado para executar o método da invenção in vivo é um microorganismo. Qualquer microorganismo pode ser usado, mas, de acordo com uma materialização até mais preferida, o dito microorganismo é uma bactéria ou levedura. Mais preferivelmente, a dita bactéria é E. coli e a dita levedura é Saccharomyces cerevisiae.
Alguns destes organismos não produzem FPP naturalmente. Para ser adequado executar o método da invenção, estes organismos têm de ser transformados para produzir o dito precursor. Eles podem ser assim transformados antes da modificação com o ácido nucleico descrito de acordo com qualquer uma das materializações acima ou simultaneamente, conforme explicado acima.
Células eucarióticas superiores isoladas também podem ser usadas, em vez de organismos completos, como hospedeiros para executar o método da invenção in vivo. Células eucarióticas adequadas pode ser qualquer célula não-humana, mas são preferencialmente células vegetais ou fúngicas.
De acordo com uma materialização preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usado em qualquer das materializações acima descritas ou codificado pelo ácido nucleico usado em qualquer das materializações acima descritas compreende uma sequência de aminoácidos pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, preferivelmente pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:1. De acordo com uma materialização mais preferida, o dito polipeptídeo compreende a sequência de aminoácidos SEQ ID NO:1. Em uma materialização até mais preferida, o dito polipeptídeo consiste da SEQ ID NO:1.
De acordo com outra materialização preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usado em qualquer das materializações descritas acima ou codificadas pelo ácido nucleico usado em qualquer das materializações acima descritas compreende uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida pela engenharia genética. Em outros termos, o dito polipeptídeo compreende uma sequência de aminoácido codificada por uma sequência de nucleotídeos que foi obtida pela modificação da SEQ ID NO:2. De acordo com uma materialização mais preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usada em qualquer uma das materializações acima descritas ou codificadas pelo ácido nucleico usado em qualquer das materializações acima descritas consiste de uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida por engenharia genética, isto é, uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.
Conforme usado neste, o polipeptídeo é pretendido como um polipeptídeo ou fragmento de peptídeo que abrange as sequências de aminoácidos identificadas neste, bem como polipeptídeos truncados ou variantes de polipeptídieos, desde que mantenham sua atividade conforme definido acima, e que compartilhem pelo menos a porcentagem definida de identidade com o fragmento correspondente da SEQ ID
Exemplos de variantes de polipeptídeos são proteínas ocorrendo naturalmente que resultam de eventos de junção alternadas de mRNA ou formam clivagem proteolítica dos polipeptídeos descritos neste. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N- ou C- na expressão em diferentes tipos de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos da invenção. Os polipeptídeos codificados por um ácido nucleico obtidos pela mutação natural ou artificial de um ácido nucleico da invenção, conforme descrito daqui em adiante, também são englobados pela invenção.
As variantes de polipeptídeos resultantes de uma fusão de sequências adicionais nas extremidades terminais amina e carboxila também são abrangidas pelos polipeptídeos da invenção. Em particular, tal fusão pode ampliar a expressão dos polipeptídeos, ser útil na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências adicionais de peptídeos podem ser peptídeos sinais, por exemplo. Concordantemente, a presente invenção engloba variantes dos polipeptídeos da invenção, tais como aquelas obtidas pela fusão com outros oligo- ou polipeptídeos e/ou aquelas que estão ligadas a peptídeos sinais. Os polipeptídeos resultantes de uma fusão com outra proteína funcional, tal como outra proteína a partir da trajetória da biossíntese do terpeno, também podem ser vantajosamente usados nos métodos da invenção.
De acordo com outra materialização, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase usado em qualquer das materializações acima descritas, ou codificado pelo ácido nucleico usado em qualquer das materializações acima descritas é isolado da Clausena lansium.
Uma importante ferramenta para executar o método da invenção é o próprio polipeptídeo. Um polipeptídeo apresentando uma atividade a-santaleno sintase e compreendendo uma sequência de aminoácidos pelo menos 50% idêntica à SEQ ID NO:1 é, portanto, outro objeto da presente invenção.
De acordo com uma materialização preferida, o polipeptídeo é capaz de produzir a-santaleno como um produto principal. De acordo com uma materialização até mais preferida, ele é capaz de produzir uma mistura de sesquiterpenos onde a- santaleno representa pelo menos 60%, preferencialmente pelo menos 80%, preferencialmente pelo menos 90%, preferencialmente pelo menos 92% dos sesquiterpenos produzidos.
De acordo com uma materialização mais preferida, o polipeptídeo apresenta uma atividade (+)-a-santaleno sintase.
De acordo com uma materialização até mais preferida, o polipeptídeo é capaz de produzir (+)-a-santaleno como um produto principal. De acordo com uma materialização ainda mais preferida, ele é capaz de produzir uma mistura de sesquiterpenos onde (+)-a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos sesquiterpenos produzidos.
De acordo com uma materialização preferida, o polipeptídeo compreende uma sequência de aminoácidos pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, preferivelmente pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:1 De acordo com uma materialização mais preferida, o polipeptídeo compreende a sequência de aminoácido SEQ ID NO:1. De acordo com uma materialização até mais preferida, o polipeptídeo consiste da SEQ ID NO:1.
De acordo com outra materialização preferida, o pelo menos um polipeptídeo compreende uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida por engenharia genética. Em outros termos, o dito polipeptídeo compreende uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2. De acordo com uma materialização mais preferida, o pelo menos um polipeptídeo apresentando uma atividade a-santaleno consiste de uma sequência de aminoácidos que é uma variante da SEQ ID NO:1 obtida pela engenharia genética, isto é, uma sequência de aminoácidos codificada por uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.
De acordo com outra materialização, o polipeptídeo é isolado da Clausena lansium.
Conforme usado neste, o polipeptídeo é pretendido como um fragmento de polipeptídeo ou peptídeo que engloba as sequências de aminoácidos identificadas neste, assim como polipeptídeos truncados ou variantes de polipeptídeos, desde que eles mantenham suas atividades conforme definido acima e que compartilhem pelo menos a porcentagem definida de identidade com o fragmento correspondente daSEQIDNO:1.
Exemplos de variantes de polipeptídeos são proteínas que ocorrem naturalmente que resultam de eventos de junção de mRNA alternados ou formam divagem proteolítica dos polipeptídeos descritos nesta. As variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N- ou C- na expressão nos diferentes tipos de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos da invenção. Os polipeptídeos codificados por um ácido nucleico obtido pela mutação natural ou artificial de um ácido nucleico da invenção, conforme descrito daqui em diante, também estão englobados pela invenção.
As variantes de polipeptídeos resultantes de uma fusão de sequências adicionais de peptídeos nas extremidades terminais amina e carboxila também são abrangidas pelos polipeptídeos da invenção. Em particular, tal fusão pode ampliar a expressão dos polipeptídeos, ser útil na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências adicionais de peptídeos podem ser peptídeos sinais, por exemplo. Concordantemente, a presente invenção engloba variantes de polipeptídeos da invenção, tais como aquelas obtidas pela fusão com outros oligo- ou polipeptídeos e/ou aquelas que estão ligadas aos peptídeos sinais. Os polipeptídeos resultantes de uma fusão com outra proteína funcional, tal como outra proteína a partir da trajetória da biossíntese do terpeno, também são englobados pelos polipeptídeos da invenção.
Conforme mencionado acima, o ácido nucleico codificando o polipeptídeo da invenção é uma ferramenta útil para modificar organismos hospedeiros não- humanos ou células, pretendidos para serem usados quando o método for realizado in vivo.
Um ácido nucléíco codificando um polipeptídeo de acordo com qualquer uma das materializações é, portanto, também um objeto da presente invenção.
De acordo com uma materialização preferida, o ácido nucleico compreende uma sequência de nucleotídeos pelo menos 50%, preferivelmente pelo menos 55%, preferivelmente pelo menos 60%, preferivelmente pelo menos 65%, preferivelmente pelo menos 70%, preferivelmente pelo menos 75%, preferivelmente pelo menos 80%, preferivelmente pelo menos 85%, pelo menos 90%, mais preferivelmente pelo menos 95% e até mais preferivelmente pelo menos 98% idêntica à SEQ ID NO:2 ou o complemento desta. De acordo com uma materialização mais preferida, o ácido nucleico compreende a sequência de nucleotídeos SEQ ID NO:2 ou o complemento desta. De acordo com uma materialização até mais preferida, o ácido nucleico consiste da SEQ ID NO:2 ou o complemento desta.
De acordo com outra materialização, o ácido nucleico é isolado da Clausena lansium.
O ácido nucleico da invenção pode ser definido como incluindo polímeros desoxirribonucleotídeos e ribonucleotídeos na forma de fita simples ou dupla (DNA e/ou RNA). Os termos “sequência de nucleotídeos” também deveriam ser entendidos como compreendendo uma molécula polinucleotídea ou uma molécula oligononucleotídea na forma de um fragmento separado ou como um componente de um ácido nucleico maior. Os ácidos nucleicos da invenção também podem englobar certas sequências de nucleotídeos isoladas, incluindo aquelas que são substancialmente livres de material endógeno contaminante. O ácido nucleico da invenção pode ser truncado, desde que ele codifique um polipeptídeo englobado pela presente invenção, conforme descrito acima.
De acordo com uma materialização mais preferida, o pelo menos um ácido nucleico de acordo com qualquer uma das materializações acima compreende uma sequência de nucleotídeos que foi obtida pela modificação da SEQ ID NO:2. Preferivelmente, o dito ácido nucleico consiste de uma sequência de nucleotídeos que foi obtida modificando a SEQ ID NO:2.
Os ácidos nucleicos compreendendo uma sequência obtida pela mutação da SEQ ID NO:2 ou complemento desta estão englobados pela invenção, desde que as sequências que eles compreendem compartilhem pelo menos a porcentagem definida de identidade com os fragmentos correspondentes da SEQ ID NO:2 ou com o complemento desta e desde que eles codifiquem um polipeptídeo apresentando uma atividade a-santaleno sintase, conforme definido em qualquer das materializações acima. As mutações podem ser qualquer tipo de mutação destes ácidos nucleicos, tais como mutações pontuais, mutações por deleção, mutações por inserção e/ou mutações frameshift [que interferem no quadro de leitura], Uma variante de ácido nucleico pode ser preparada com o objetivo de adaptar sua sequência de nucleotídeos a um sistema de expressão específico. Por exemplo, sabe-se que sistemas de expressão bacteriana expressam mais eficientemente polipeptídeos se os aminoácidos forem codificados por um códon preferido. Devido à degeneração do código genético, onde mais de um códon pode codificar o mesmo aminoácido, sequências múltiplas de DNA podem codificar para o mesmo polipeptídeo, todas estas sequências de DNA sendo englobadas pela invenção.
Outra importante ferramenta para transformar organismos hospedeiros ou células adequada para executar o método da invenção in vivo é um vetor de expressão compreendendo um ácido nucleico de acordo com qualquer materialização da invenção. Tal vetor é, portanto, também um objeto da presente invenção.
Um “vetor de expressão” conforme usado neste inclui qualquer vetor recombinante linear ou circular, incluindo, mas não se limitando a vetores virais, bacteriófagos e plasmídeos. A pessoa habilitada é capaz de selecionar um vetor adequado de acordo com o sistema de expressão. Em uma materialização, o vetor de expressão inclui o ácido nucleico da invenção operacionalmente ligado com pelo menos uma sequência regulatória, a qual controla transcrição, translação, iniciação e término, tal como um promotor, operador ou amplificador transcricional, ou um local de ligação ribossômica de mRNA e, opcionalmente, incluindo pelo menos um marcador de seleção. As sequências de nucleotídeos estão “operacionalmente ligadas” quando a sequência regulatória se relaciona funcionalmente com o ácido nucleico da invenção.
Os vetores de expressão da presente invenção podem ser usados nos métodos para preparar um organismo hospedeiro geneticamente transformado e/ou célula, em organismos hospedeiros e/ou células ancorando os ácidos nucleicos da invenção e nos métodos para produzir ou fabricar polipeptídeos que apresentam uma atividade a-santaleno sintase, conforme revelado mais abaixo.
Organismos hospedeiros não-humanos recombinantes e células transformadas para ancorarem pelo menos um ácido nucleico da invenção de modo que ele expresse heterologamente ou superexpresse em pelo menos um polipeptídeo da invenção também são muito úteis para executar o método da invenção. Tais organismos hospedeiros não-humanos ou células são, portanto, outro objeto da presente invenção.
Um ácido nucleico de acordo com qualquer das materializações acima descritas pode ser usado para transformar os organismos hospedeiros não- humanos e células, e os polipeptídeos expressos podem ser qualquer dos polipeptídeos acima descritos.
Organismos hospedeiros não-humanos da invenção pode ser qualquer organismo não-humano multicelular ou unicelular. Em uma materialização preferida, o organismo hospedeiro não-humano é uma planta, um procariota ou um fungo. Qualquer planta, procariota ou fungo é adequado para ser transformado de acordo com a presente invenção. Plantas, particularmente úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma materialização mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (nabo), Medicago (alfafa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence a espécies de Nicotiana tabacum.
Em uma materialização mais preferida, o organismo hospedeiro não-humano é um microorganismo. Qualquer microorganismo é adequado para a presente invenção, mas, de acordo com uma materialização até mais preferida, o dito microorganismo é uma bactéria ou levedura. Mais preferivelmente, a dita bactéria é E. colie a dita levedura é Saccharomyces cerevisiae.
Células eucarióticas superiores isoladas também podem ser transformadas, em vez de organismos completos. Como células eucarióticas superiores, queremos dizer aqui qualquer célula eucariótica não-humana, exceto células de leveduras. As células eucarióticas superiores preferidas são células vegetais ou fúngicas.
O termo “transformado” refere-se ao fato de que o hospedeiro foi sujeitado a engenharia genética para compreender uma, duas ou mais cópias de cada um dos ácidos nucleicos necessários em qualquer uma das materializações acima descritas. Preferivelmente, o termo “transformado” se relaciona com os hospedeiros que heterologamente expressam os polipeptídeos codificados pelo ácido nucleico com os quais eles são transformados, bem como superexpressam os ditos polipeptídeos. Concordantemente, em uma materialização, a presente invenção fornece um organismo transformado, no qual os polipeptídeos são expressos em quantidade maior que no mesmo organismo não transformado assim.
Há vários métodos conhecidos na arte para a criação dos organismos hospedeiros transgênicos ou células tais como plantas, fungos, procariotas ou culturas de células eucarióticas superiores. Vetores apropriados de clonagem e expressão para uso com hospedeiros celulares bacterianos, fúngicos, de leveduras, vegetais e de mamíferos são descritos, por exemplo, em Pouwels et al., Cloning Vectors: A Laboratory Manual, 1985, Elsevier, New York and Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd edition, 1989, Cold Spring Harbor Laboratory Press. Vetores de clonagem e expressão para vegetais superiores e/ou células vegetais em particular estão disponíveis para a pessoa habilitada. Consultar para exemplo, Schardl et al. Gene 61:1-11, 1987.
Métodos para transformar organismos hospedeiros ou células para ancorar ácidos nucleicos transgênicos são familiares para a pessoa habilitada. Para a criação de plantas transgênicas, por exemplo, os métodos atuais incluem: eletroporação dos protoplastos da planta, transformação mediada por lipossomos, transformação mediada por Agrobacterium, transformação mediada por polietilenoglicol, bombardeamento de partículas, microinjeção de células de plantas e transformação usando vírus.
Em uma materialização, o DNA transformado é integrado em um cromossomo de um organismo hospedeiro não-humano e/ou célula de modo que resulte um sistema recombinante estável. Qualquer método de integração cromossômica conhecido na arte pode ser usado na prática da invenção, incluindo, mas não se limitando à troca de cassette mediada por recombinase (RMCE), inserção cromossômica virai específica do local, adenovirus e injeção pronuclear.
Com o objetivo de executar o método para produzir α-santaleno in vitro, conforme exposto neste acima, é muito vantajoso fornecer um método de fabricar pelo menos um polipeptídeo apresentando uma atividade a-santaleno sintase conforme descrito em qualquer materialização da invenção. Portanto, a invenção fornece um método para produzir pelo menos um polipeptídeo de acordo com qualquer materialização da invenção compreendendo a) cultivar um organismo hospedeiro não-humano ou célula transformada com o vetor de expressão da invenção, de modo que ancore um ácido nucleico de acordo com a invenção e expresse ou superexpresse um polipeptídeo da invenção; b) isolar o polipeptídeo de um organismo hospedeiro não-humano ou célula cultivada na etapa a).
De acordo com uma materialização preferida, o dito método ainda compreende, antes da etapa a), transformar um organismo não-humano hospedeiro ou célula com o vetor de expressão da invenção, de modo que ancore um ácido nucleico de acordo com a invenção e expresse ou superexpresse o polipeptídeo da invenção.
Um ácido nucleico de acordo com qualquer das materializações acima descritas pode ser usado.
A transformação e o cultivo do organismo hospedeiro não-humano ou célula podem ser realizados conforme descrito para o método de produzir α-santaleno in vivo. A etapa b) pode ser realizada usando qualquer técnica bem conhecida na arte para isolar um polipeptídeo particular de um organismo ou célula.
Uma “variante de polipeptídeo” conforme referido neste significa um polipeptídeo apresentando uma atividade a-santaleno sintase e sendo substancialmente homólogo ao polipeptídeo de acordo com qualquer das materializações acima, mas apresentando uma sequência de aminoácidos diferente daquele codificada por qualquer das sequências de ácidos nucleicos da invenção, devido a uma ou mais deleções, inserções ou substituições.
As variantes podem compreender sequências conservativamente substituídas, significando que um dado resíduo de aminoácido é substituído por um resíduo apresentando características fisioquímicas similares. Exemplos de substituições conservatives incluem a substituição de um resíduo alifático por outro, tal como lie, Vai, Leu ou Ala por outro, ou substituições de um resíduo polar por outro, tal como entre Lys e Arg; Glu e Asp; ou Gin e Asn. Consultar Zubay, Biochemistry, 1983, Addison-Wesley Pub. Co. Os efeitos de tais substituições podem ser calculados usando matrizes de pontuação de substituição tais como uma PAM-120, PAM-200, e PAM-250 conforme discutido no Altschul, J. Mol. Biol., 1991, 219, 555-565. Outras tais substituições conservatives, por exemplo, substituições de regiões inteiras, apresentado características de hidrofobicidade, são bem conhecidas.
Variantes de peptídios ocorrendo naturalmente também são englobadas pela invenção. Exemplos de tais variantes são proteínas que resultam de eventos de junção alternada do mRNA ou de divagem proteolítica dos polipeptídeos descrita neste. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N- ou C- na expressão em diferentes tipos de células hospedeiras devido à remoção proteolítica de um ou mais aminoácidos terminais de polipeptídeos codificados pelas sequências da invenção.
Variantes dos polipeptídeos da invenção podem ser usadas para alcançar, por exemplo, atividade enzimática desejada ampliada ou reduzida, regioquímica ou estereoquímica modificada, ou utilização de substrato ou distribuição de produto alteradas, afinidade aumentada para o substrato, especificidade melhorada para a produção de um ou mais compostos desejados, velocidade aumentada da reação enzimática, atividade ou estabilidade mais alta em um ambiente específico (pH, temperatura, solvente etc.), ou nível de expressão melhorado em um sistema de expressão desejado. Uma variante ou mutante dirigido pelo local pode ser fabricado por qualquer método conhecido na arte. As variantes e derivados de polipeptídeos nativos podem ser obtidos isolando variantes que ocorrem naturalmente, ou a sequência de nucleotídeos das variantes, de outras ou das mesmas linhagens ou espécies de plantas, ou artificialmente programando mutações de sequências de nucleotídeos codificando para os polipeptídeos da invenção. Alterações da sequência de aminoácidos nativa podem ser realizadas através de qualquer de diversos métodos convencionais.
Variantes de polipeptídeos resultantes de uma fusão de sequências adicionais de peptídeos nas extremidades terminais amina e carboxila dos polipeptídeos da invenção podem ser usadas para ampliar a expressão dos polipeptídeos, serem úteis na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Tais sequências adicionais de peptídeos podem ser peptídeos sinal, por exemplo. Concordantemente, a presente invenção engloba variantes dos polipeptídeos da invenção, tais como aqueles obtidos pela fusão com oligo- ou polipeptídeos e/ou aqueles que estão ligados aos peptídeos sinal. O polipeptídeo de fusão abrangido pela invenção também compreende polipeptídeos de fusão resultantes de uma fusão de outras proteínas funcionais, tais como outras proteínas a partir da trajetória da biossíntese do terpeno.
Portanto, em uma materialização, a presente invenção fornece um método para preparar uma variante de polipeptídeo apresentando uma atividade a- santaleno sintase, conforme descrito em qualquer das materializações acima, e compreende as etapas de: (a) selecionar um ácido nucleico de acordo com qualquer das materializações expostas acima; (b) modificar o ácido nucleico selecionado para obter pelo menos um ácido nucleico mutante: (c) transformar células hospedeiras ou organismos unicelulares com a sequência de ácidos nucleicos mutantes para expressar um polipeptídeo codificado pela sequência de ácidos nucleicos mutantes; (d) selecionar o polipeptídeo quanto a pelo menos uma propriedade modificada; e, (e) opcionalmente, se o polipeptídeo não apresentar nenhuma variante desejada de atividade a-santaleno sintase, repetindo as etapas do processo (a) até (d) até um polipeptídeo com uma variante desejada de atividade a-santaleno sintase ser obtido; (f) opcionalmente, se um polipeptídeo apresentando uma variante desejada de atividade a-santaleno sintase foi identificado na etapa d), isolar o ácido nucleico mutante correspondente obtido na etapa (c)
De acordo com uma materialização preferida, a variante de polipeptídeo preparada é capaz de produzir a-santaleno como um produto principal. De acordo com uma materialização até mais preferida, ela é capaz de produzir uma mistura de sesquiterpenos onde o a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos sesquiterpenos produzidos.
De acordo com uma materialização mais preferida, a variante de polipeptídeo preparada apresenta uma atividade (+)-a-santaleno sintase.
De acordo com uma materialização até mais preferida, a variante de polipeptídeo preparada é capaz de produzir (+)-a-santaleno sintase como um produto principal. De acordo com uma materialização até mais preferida, ela é capaz de produzir uma mistura de sesquiterpenos onde o (+)-a-santaleno representa pelo menos 60%, preferivelmente pelo menos 80%, preferivelmente pelo menos 90%, preferivelmente pelo menos 92% dos sesquiterpenos produzidos.
Na etapa (b), um grande número de sequências de ácidos nucleicos mutantes pode ser criado, por exemplo, através de mutagênese randômica, mutagênese específica do local, ou embaralhamento de DNA. Os procedimentos detalhados de embaralhamento do gene são encontrados em Stemmer, DNA shuffling by random fragmentation and reassembly: in vitro recombination for molecular evolution. Proc Natl Acad Sci U S A., 1994, 91(22): 10747-1075. Brevemente, embaralhamento de DNA refere-se a um processo de recombinação randômica de sequências conhecidas in vitro, envolvendo pelo menos dois ácidos nucleicos selecionados para recombinação. Por exemplo, mutações podem ser introduzidas em loci particulares sintetizando oligonucleotídeos contendo uma sequência mutante, flanqueados por locais de restrição permitindo a ligação com fragmentos da sequência nativa. Em seguida à ligação, a sequência reconstruída resultante codifica um análogo apresentando a inserção, substituição ou deleção de aminoácidos desejada. Alternativamente, procedimentos de mutagênese específica do local dirigida por oligonucleotídeo podem ser empregados para fornecer um gene alterado onde códons predeterminados podem ser alterados por substituição, deleção ou inserção.
Concordantemente, o polipeptídeo compreendendo a SEQ ID NO:1 pode ser recombinado com outra sesquiterpeno sintase codificando ácidos nucleicos, por exemplo, isolados de um organismo outro que não seja Clausena lansium. Assim, os ácidos nucleicos mutantes podem ser obtidos e separados, os quais podem ser usados para transformar uma célula hospedeira de acordo com procedimentos padrão, por exemplo, tal como revelado nos exemplos presentes.
Na etapa (d), o polipeptídeo obtido na etapa (c) é selecionado quanto a pelo menos uma propriedade modificada, por exemplo, uma atividade enzimática modificada desejada. Exemplos de atividades enzimáticas desejadas, para as quais um polipeptídeo expresso pode ser selecionado, incluem atividade enzimática ampliada ou reduzida, conforme medido pelo valor KM ou Vmax, regioquímica ou estereoquímica modificada e utilização de substrato ou distribuição de produto alterada. A seleção da atividade enzimática pode ser realizada de acordo com procedimentos familiares à pessoa habilitada e aqueles revelados nos exemplos presentes.
A etapa (e) fornece a repetição das etapas de processo (a)-(d), as quais podem preferivelmente ser realizadas em paralelo. Concordantemente, criando um número significativo de ácidos nucleicos mutantes, muitas células hospedeiras podem ser transformadas com diferentes ácidos nucleicos mutantes ao mesmo tempo, permitindo a seleção subsequente de um número elevado de polipeptídeos. As chances de obter uma variante desejada de polipeptídeo podem assim ser aumentadas a critério da pessoa habilitada.
Todas as publicações mencionadas nesta aplicação estão incorporadas através de referência para revelar e descrever os métodos e/ou materiais em conexão com os quais as publicações são citadas.
Figura 1: Sequências de aminoácidos deduzidas dos fragmentos de sesquiterpeno sintase obtidos do sequenciamento da biblioteca de C. lansium e alinhadas com a sequência de aminoácidos de sesquiterpeno sintase com o NCBI acess No. AAK54279.
Figura 2: Comparação dos perfis de produto obtidos a partir do E.E-FPP com as proteínas recombinantes Cont2-1, Cont2B_22, Cont2B_26 e Cont2B_29. As análises foram realizadas através de GC-MS e os cromatogramas iônicos totais são apresentados.
Figura 3: Identificação do a-santaleno pela comparação do espectro de massa a partir do pico no tempo de retenção de 12,63 minutos com o espectro de massa de um padrão autêntico de a-santaleno.
A invenção será agora descrita em mais detalhes por meio dos Exemplos a seguir.
Sementes de Clausena lansium (vampi) foram obtidas de fazendeiros localizados na província de Hainan na China e, particularmente, na cidade de FuShan (Município de ChengMai) e na cidade de Yongxing (Cidade de Haikou). As sementes foram germinadas e as plantas cultivadas em uma estufa.
Folhas jovens (1 a 2 cm de comprimento) foram coletadas e usadas para a construção de uma biblioteca de cDNA. O RNA total foi extraído das folhas usando o Reagente de RNA Vegetal Concerta da Invitrogen (Carlsbad, CA) e o mRNA foi purificado através de cromatografia de afinidade com oligodT-celulose usando o Kit de isolamento de mRNA FastTrack0 2.0 (Invitrogen, Carlsbad, CA) de acordo com as instruções do fabricante. Uma biblioteca de cDNA foi construída a partir deste mRNA e usando o Kit de Amplificação de cDNA Marathon□ (Clontech, Mountain View, CA).
Usamos a tecnologia do sequenciamento paralelo massivo de pequenos fragmentos de DNA desenvolvida pela Illumina (San Diego, California) para obter informações da sequência de toda a biblioteca de cDNA feita a partir de folhas pequenas de vampi. Esta técnica de sequenciamento usa uma química de sequenciamento baseada em terminador reversível e os aparelhos Cluster Station e Genome Sequencer desenvolvidos por Solexa e Illumina (www.illumina.com).
A biblioteca de cDNA (1 üg) foi primeiramente carregada em um gel agarose e as faixas correspondentes a um tamanho entre 1,5 e 3 Kb foram extirpadas, diluídas e usadas para o sequenciamento. Este enriquecimento do tamanho evita a diluição da biblioteca por alguns cDNAs que codificam para proteínas envolvidas no metabolismo primário (tais como, por exemplo, a ribulose-1,5-bifosfato carboxilase) que estão frequentemente presentes em elevada proporção na biblioteca feita a partir de tecidos vegetais e, especialmente, tecidos verdes. Os cDNAs alvos, que codificam para sesquiterpeno sintases, tipicamente têm tamanho entre 1,8 e 2,5 Kb e são, portanto, incluídos na biblioteca de tamanho enriquecido.
A tecnologia e equipamentos da Ilumina foram preparados na Fastens SA (Genebra, Suíça) e a preparação da amostra de DNA e o sequenciamento foram realizados pela Fastens SA. A biblioteca de cDNA foi tratada usando-se o Genomic Sample Prep Kit (Illumina). Resumidamente, o DNA é fragmentado por nebulização, as extremidades são reparadas para gerar extremidades embotadas, adaptadores são ligados às extremidades dos fragmentos de DNA e os fragmentos de DNA modificados pelos adaptadores são amplificados por PCR. Após controlar a qualidade da biblioteca através de eletroforese em gel, a geração dos clusters de DNA na célula de fluxo e a reação de sequenciamento são realizadas nos equipamentos Cluster Station e Genome Sequencer. Usando esta tecnologia, 1,9 milhões de sequências curtas (reads) de pelo menos 35 bases foram obtidas.
O software Edena (Dr David Hernandez, Genomic Research Laboratory [Laboratório de Pesquisa Genômica], University of Geneva Hospitals, Genebra, Suíça, resultado não publicado) foi usado para re-montar sequências contíguas. As cinco últimas bases foram primeiramente removidas de cada read por causa de possíveis más incorporações devido à fidelidade mais baixa nos últimos ciclos do procedimento de sequenciamento. Diversos conjuntos de contigs (sequências contíguas) foram gerados. Para cada conjunto, os contigs de comprimento mínimo de 50 bases foram retidos. Primeiro, os parâmetros do software foram ajustados para permitir a montagem com sobreposição mínima de 25 bases e identidade estrita (100%) ou não-estrita (falta de combinação de 2 bases). Dois conjuntos de 3634 e 3756 contigs, respectivamente, foram assim gerados. Outro conjunto de 4540 contigs foi gerado permitindo a montagem com uma sobreposição mínima de 18 bases e não-estrita. As sequências dos contigs foram usadas para buscar homologia com as terpeno sintases em bancos de dados de proteínas disponíveis publicamente usando o algoritmo Blastx (Altschul et al, J. Mol. Biol. 215, 403-410, 1990; http://www.ncbi.nlm.nih.gov/blast/Blast.cgi). Dos três conjuntos de contigs, 14, 15 e 14 contigs foram selecionados. Através da análise das sequências obtidas da biblioteca de cDNA de Clausena lansium, uma forte homologia de sequência foi observada com sequências de espécies cítricas, uma observação consistente com a relação filogenética de Clausena lansium e das espécies de Citrus (ambas pertencentes à família Rutaceae). Assim, o software Eland (Illumina) foi usado para buscar as reads para identidade da sequência de DNA com as sesquiterpeno sintases a partir de cítricos (NCBI Accession No. CQ813507, CQ813505, CQ813508, CQ813506). Desta análise, 117 reads foram selecionadas.
Os contigs e reads selecionados foram, depois, processados usando o programa CAP (Huang, Genomics 14(1), 18-25, 1992) e novos contigs foram gerados. Após a confirmação da homologia da sequência com as sesquiterpeno sintases, 17 contigs de comprimento 30 a 436 bases foram retidos (ver SEQ ID NO:3 a 19). As sequências deduzidas foram alinhadas com uma sequência de sesquiterpeno sintase de cítrico (a beta-farneseno sintase de C. junos, NCBI access No. AAK54279) de modo a mapear sua posição relativa ao longo de uma sequência de comprimento total de sesquiterpeno sintase e avaliar o número de cDNAs de sesquiterpeno diferentes presente (Figura 1). Um conjunto de oligonucleotídeos específico foi desenhado a partir de 6 dos 19 contigs supostamente surgindo de cDNAs de sesquiterpeno sintases distintos.
Os primers específicos de sesquiterpeno sintases deduzidos a partir do sequenciamento massivamente paralelo (Exemplo 2) foram usados em combinação com os primers de adaptador de cDNA em amplificações PCR do tipo 375’RACE. As amplificações foram realizadas usando a biblioteca de cDNA de C. lansium, preparada conforme descrito acima no Exemplo 1, e o Advantage® 2 Polymerase Mix (Clontech) em seguida ao protocolo do Kit de Amplificação de cDNA Marathon□ (Clontech, Mountain View, CA). As condições térmicas de Ciclagem foram conforme segue: 1 min a 94°C, 32 ciclos de 1 min a 94°C e 3 min a 68°C, e 3 min a 68°C.
Usando o primer FS2_cont2_F1 (SEQ ID NQ:20), uma sequência de DNA de 1049 bp foi obtida. A análise das sequências de diversos clones obtidos a partir desta amplificação mostrou que duas variantes de sequência estavam presentes (Cont2_RACE_F1 (SEQ ID NO:23) e Cont2_RACE_F2 (SEQ ID NO:25)) com 96% são identidade da sequência. Cada uma das duas sequências correspondia à extremidade 3’de um cDNA de sesquiterpeno sintase e continha uma região de codificação de 735 bp. As duas sequências de aminoácidos deduzidas (SEQ ID NO:24 e 26) apresentavam 92% de identidade da sequência uma da outra. Com o primer FS2_cont2_R1 (SEQ ID NO:21), um fragmento de 1101 bp (Cont2_RACE_R, SEQ ID NO:27)) foi amplificado contendo o códon de partida e codificando para os 349 aminoácidos N-terminais do sesquiterpeno correspondentes ao contig2. O alinhamento das duas sequências a partir da 3’RACE (Cont2_RACE_F1 e Cont2_RACE_F2, SEQ ID NO:23 e 25) com a sequência a partir da 5’RACE (cont2_RACE_R, SEQ ID NO:27) apresentava uma sobreposição de 132 bases. Nesta região de sobreposição, uma vez que as sequências Cont2_RACE_F2 e Cont2_RACE_R (SEQ ID NO:25 e 27) eram aproximadamente idênticas (diferença de uma única base) enquanto que diferenças de 9 bases foram observadas entre as sequências Cont2_RACE_F1 e Cont2_RACE_R (SEQ ID NO:23 e 27). Assim, as sequências Cont2_RACE_F2 (SEQ ID NO:25) e Cont2_RACE_R (SEQ ID NO:27) foram usadas para reconstituir uma sequência de cDNA de comprimento total (Cont2_RACE_1, SEQ ID NO:28) codificando para uma proteína de 551 aminoácidos (SEQ ID NO:29).
Com o primer FS2_Cont10_F (SEQ ID NO:22) duas sequências de 1342 bp (Cont10_RACE_Fa e Cont10_RACE_Fb, SEQ ID NO: 30 e 31) foram obtidas apresentando diferenças significativas (67 bp, representando 95% de identidade da sequência de DNA) e sugerindo a presença de dois cDNAs de sesquiterpeno sintase intimamente relacionados. As duas sequências continham uma região de codificação de 1135 bp. É interessante que a sequência de Cont10_RACE_Fa (SEQ ID NO:30) era 99,9% idêntica à sequência de Cont2_RACE_F2 (SEQ ID NO:25, diferença de apenas 1 base no alinhamento de 1 Kb) e a sequência de Cont10_RACE_Fb (SEQ ID NO:31) era 99% idêntica à sequência de Cont2_RACE_F1 (SEQ ID NO:23, diferença de apenas 8 bases no alinhamento de 1 Kb), assim sugerindo que os fragmentos de DNA amplificados com os primers Cont2 e ContIO permitiram amplificações a partir de duas sequências relacionadas sem nenhuma discriminação real. Dois primers (Cont2_start (SEQ ID NO:32) e Cont2_stop (SEQ ID NO:33)), os quais são específicos das regiões dos códons de partida e de parada das sequências a partir da 5’RACE e da 3’RACE dos fragmentos cont2 e contIO, foram desenhados de modo a amplificar simultaneamente os dois ou mais cDNAs de comprimento total correspondentes. O primer Cont2_start (SEQ ID NO:32) foi estendido com a sequência CACC para permitira inserção direta no plasmídeo pET101/D-TQPO (Invitrogen). A amplificação foi primeiramente realizada usando o Advantage 2 Polymerase Mix (Clontech). Cada mistura PCR continha, em um volume total de 50 DL, 5 DL de Advantage 2 PCR Buffer, 200 üM de dNTPs, 200 nM de cada primer oligonucleotídeo, 5 üL de cDNA diluído 100 vezes e 1 üL de Advantage 2 Polymerase Mix. As condições térmicas de ciclagem eram conforme segue: 2 min a 95°C; 35 ciclos de 30 seg a 95°C, 30 seg a 60°C e 4 min a 72°C; e 10 min a 72°C. Uma segunda rodada de amplificação foi realizada usando 5 Dl do produto de PCR purificado a partir da primeira rodada de amplificação e usando a DNA polimerase Pfu (Promega), em um volume final de 50 □! contendo 5ül de tampão 10X de DNA polimerase Pfu, 200 üM de cada dNTP, 0,4 üM de cada primer forward e reverse, 2,9 unidades de DNA polimerase Pfu. As condições térmicas de ciclagem eram idênticas às condições usadas na primeira rodada. Os produtos de PCR purificados eram ligados no vetor pET1001/D-TOPO seguindo as instruções do fabricante (Invitrogen). Diversos clones foram selecionados e após o sequenciamento do inserto, algumas variações nas sequências foram observadas. Os seguintes clones foram selecionados: Cont2- 1 (SEQ ID NO:2), Cont2B_22 (SEQ ID NO:38), Cont2B_26 (SEQ ID NO:39) e Cont2B_29 (SEQ ID NO:40). As sequências das proteínas codificadas por estes clones são fornecidas na SEQ ID NO:1 e 41 a 43, respectivamente.
Os plasmídeos pET101 com Cont2_1 (SEQ ID NO:2), Cont2B_22 (SEQ ID NO:38), Cont2B_26 (SEQ ID NO:39) e Cont2B_29 (SEQ ID NO:40) preparados conforme descrito no Exemplo 3 foram transformados em células de E. Coli BI21(DE3). Colônias isoladas de células transformadas foram usadas para inocular 5 ml de meio LB. Após 5 a 6 horas de incubação a 37°C, a cultura foi transferida para uma incubadora a 20°C e deixada 1 hora para equilibar. A expressão da proteína foi, então, induzida através da adição de 1 mM de IPTG e a cultura foi incubada durante toda a noite a 20°C. No dia seguinte, as células foram coletadas por centrifugação, ressuspendidas em 0,1 volume de 50 mM de MOPSO pH 7, 10% de glicerol, 1 mM de DTT e lisadas por sonicação. O extrato foi clarificado por centrifugação (30 min a 20.000 g), e o sobrenadante contendo a proteína solúvel foi usado para experimentos posteriores.
O extrato de proteína cru foi usado para avaliar a atividade enzimática. O ensaio enzimático foi realizado em um tubo de vidro selado com Teflon usando 50 a 10Oμl de extrato de proteína em um volume final de 1 ml_ de 50 mM de MOPSO pH 7, 10% de glicerol suplementado com 1 mM de DTT, 20 mM de MgCI2 e 50 a 200 DM de difosfato de E,E-farnesila purificado (FPP) (preparado conforme descrito por Keller e Thompson, J. Chromatogr 645(1), 161-167, 1993). O tubo foi incubado 18 a 24 horas a 30°C e os produtos enzimáticos foram extraídos duas vezes com um volume de pentano. Após concentração sob fluxo de nitrogênio, o extrato foi analisado através de GC e a identidade dos produtos foi confirmada por GC-MS com base na concordância dos índices de retenção e espectros de massa de padrões autênticos. A análise de GC-MS foi realizada em um sistema de GC Hewlett-Packard 6890 Series equipado com detector de ionização de chama usando uma coluna capilar com diâmetro interno de 0,25 mm por 30 m SPB-1 (Supelco, Bellefonte, PA). O gás transportador era He a um fluxo constante de 1,5 mL/min. A temperatura inicial da estufa era 80°C seguida por um gradiente de 10°C/min até 280°C. Os espectros foram registrados a 70eV com uma voltagem multiplicadora de elétrons de 2200V.
O ensaio revelou a formação de (+)-a-santaleno como um produto principal (92,7% dos sesquiterpenos totais produzidos) e quantidades traços de cinco sesquiterpenos adicionais respondendo por 4,8 a 0,95% dos produtos enzimáticos. O (+)-a-santaleno foi identificado com análise de GC-MS através de coincidência do espectro de massa e do índice de retenção com valores publicados (Joulain, D., e Kõnig, W.A. The Atlas of Spectral Data of Sesquiterpene Hydrocarbons, EB Verlag, Hamburg, 1998). A identificação do (+)-α-santaleno foi ainda confirmada através de 1H NMR, 13C NMR e pela medição da rotação ótica. Para produzir quantidades suficientes para estas medições, o ensaio enzimático descrito acima foi escalonado até 1 L. Os produtos enzimáticos foram extraídos com volume igual de pentano, concentrados e a fração de hidrocarbonetos de sesquiterpeno (5,5 mg) purificada através de filtração em uma coluna curta de sílica. Os dados espectrais obtidos com Cont2_1 são fornecidos na Figura 2.
O espectro de NMR foi registrado em um espectrômetro Bruker-Avance-500. Os dados de NMR são os seguintes : 1H NMR (500,13 MHz, CDCI3): 0,82 (s, 2H), 0,83 (s, 3H), 0,99 (s, 3H), 1,00-1,08 (m, 2H), 1,08-1,26 (m, 2H), 1,57-1,63 (m, 6H), 1,68 (s, 3H), 5,12 (t x q, J= 7,2, 1,4 Hz, 1H) 13C NMR (125,76 MHz, CDCI3): 10,7 (q), 17,5 (q), 19,6 (d), 23,3 (t), 25,7 (q), 27,4 (s), 31,0 (t), 31,5 (t), 34,6 (t), 38,2 (d), 45,9 (s), 125,5 (d), 130,8 (s); O fato de que o estereoisômero (+)-a-santaleno fora produzido foi evidenciado medindo a rotação ótica (conforme medido em um polarímetro Perkin- r ,20 elmer241): MD = +12,0 (C = 0,3, CHCI3).
O uso da santaleno sintase de C. lansium para a produção in vivo de sesquiterpenos em células de E. coli foi avaliado co-exprimindo a sesquiterpeno sintase com uma FPP sintase e as enzimas de uma trajetória biossintética de quatro etapas que permite a conversão de mevalonato em FPP. Os genes da trajetória de mevalonato foram organizados em um único operon e codificados para uma mevalonato kinase (mvaK1), uma fosfomevalonato kinase (mvaK2), uma mevalonato difosfato decarboxilase (MvaD) e uma isopentenil difosfato isomerase (idi), todas as enzimas que convertem mevalonato exógeno em isopentenil difosfato (IPP) e dimetilalil difosfato (DMAPP), os dois substratos da FPP sintase. A co- expressão da trajetória parcial do mevalonato foi usada para aumentar a quantidade de FPP intracelular disponível para a sesquiterpeno sintase e, portanto, as quantidades de sesquiterpeno produzidas.
O gene de levedura FPP sintase (Accession number J05091) foi amplificado a partir de DNA genômico de S. cerevisiae usando os primers FPPy_Ncol (SEQ ID NO:34) e FPPy-Eco (SEQ ID NO:35). O DNA genômico foi isolado a partir de S. cerevisiae usando o Qiagen RNA/DNA Maxi Kit (Qiagen AG, Basel, Suiça). A PCR foi realizada com a DNA polimerase Pfu (Promega AG, Dubendorf, Suiça) em urn volume final de 50 μl contendo 0,4 μl de cada primer, 200 μM de dNTPs, 0,5 μl de DNA polimerase 5 μl de DNA genômico de S. cerevisiae. A condição de ciclagem da PCR foi conforme segue: 90 seg a 95°C; 28 ciclos de 45 seg a 95°C, 30 seg a 54°C e 4 min a 72°C; 10 min a 72°C. O DNA amplificado foi ligado como fragmento de Ndel-EcoRI no primeiro local de multiclonagem (MCS1) do plasmídeo pACYCDuet-1 (Novagen, Madison, Wl) fazendo o plasmídeo pACYCDuet-FPPs ancorar o gene de FPPs sob o controle de um promotor de T7.
Um operon contendo os genes que codificam para mvaK1, mvaK2, MvaD e idi foi amplificado a partir do DNA genômico de Streptococcus pneumoniae (ATCC BAA-334, LGC Standards, Molsheim, France) com os primers MVA-up1-start (SEQ ID NO:36) e MVA-up2-stop (SEQ ID NO:37). A PCR foi realizada usando a DNA polimerase PfuUltra™ II Fusion HS (Stratagene, Agilent Technologies Inc., Santa Clara, CA, USA). A composição da mescla da PCR foi de acordo com as instruções do fabricante. As condições térmicas da ciclagem foram 2 min a 95°C; 30 ciclos de 20 seg a 95°C, 20 seg a 58°C e 90 seg a 72°C; e 3 min a 72°C. O fragmento de 3,8 Kb foi purificado em gel agarose e ligado usando o In-Fusion™ Dry-Down PCR Cloning Kit (Clontech Laboratories) para o segundo MCS do pACYCDuet-FPPs plasmídeo digerido com Nde\ e Xho\ fornecendo o plasmídeo pACYCDuet-4506. As sequências dos dois insertos foram completamente sequenciadas para excluir qualquer mutação.
Células de E. coli BL21 Star™(DE3) (Invitrogen, Carlsbad, CA) foram transformadas com os plasmídeos pET101-cont2_1 (SEQ ID NO:2) preparados conforme descrito no Exemplo 3 e com o plasmídeo pACYCDuet-4506. As células transformadas foram selecionadas em placas de LB-agarose de carbenicilina (50 μg/ml) e cloranfenicol (34 μg/ml). Colônias isoladas foram usadas para inocular 5 ml_ de meio LB líquido suplementado com os mesmos antibióticos. A cultura foi incubada durante toda a noite a 37°C. No dia seguinte, 2 ml_ de meio TB suplementado com os mesmos antibióticos foram inoculados com 0,2 ml_ da cultura feita durante a noite. Após 6 horas de incubação a 37°C, a cultura foi resfriada até 28°C e 1 mM de IPTG, 2 mg/mL de mevalonato (preparado dissolvendo mevalonolactona (Sigma) em 0,5N de NaOH em uma concentração de 1 g/mL e incubando a solução por 30 min a 37°C) e 0,2 ml de decano foram adicionados a cada tubo. As culturas foram incubadas por 48 horas a 28°C. As culturas foram, depois, extraídas duas vezes com 2 volumes de acetato de etila, a fase orgânica foi concentrada para 500 μL e analisada através de GC-MS conforme descrito acima no Exemplo 4. Nestas condições, as células produziram (+)-cr-santaleno na cultura de 250 mg/L em 48 horas.
Este exemplo mostra que uma célula de E. coli transformada com uma a- santaleno sintase, conforme definido na presente invenção, é capaz de produzir a- santaleno. As outras enzimas com as quais a célula de E. coli é transformada não são essenciais para a produção de a-santaleno. Na verdade, o a-santaleno também é produzido quando uma célula de E. coli é transformada com a a-santaleno sintase somente, mas em menores quantidades. As outras enzimas com as quais a célula de E. coli é transformada são adicionadas com o único propósito de aumentar a quantidade de precursor disponível para a a-santaleno sintase.
Claims (13)
1. MÉTODO PARA PRODUZIR α-SANTALENO ISOLADO, CARACTERIZADO por compreender: a) contatar pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio expresso de forma heteróloga possuindo uma atividade de α-santaleno sintase e compreendendo uma sequência de aminoácidos; b) recuperar o α-santaleno produzido no passo a).
2. MÉTODO PARA PRODUZIR α-SANTALENO ISOLADO, CARACTERIZADO por compreender: a) cultivar um organismo hospedeiro não humano ou célula capaz de produzir pirofosfato de farnesilo (FPP) e transformada para expressar pelo menos um polipeptídio compreendendo uma sequência de aminoácido e tendo uma atividade de α-santaleno sintase, sob condições conducentes à produção de α-santaleno, e contatar o pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio para produzir α-santaleno; e b) recuperar o α-santaleno produzido no passo a).
3. MÉTODO, de acordo com a reivindicação 2, CARACTERIZADO pelo método compreender ainda, antes do passo a), transformar um organismo hospedeiro ou célula não-humana capaz de produzir pirofosfato de farnesilo (FPP) com pelo menos um ácido nucleico codificando um polipeptídio compreendendo uma sequência de aminoácidos e tendo uma atividade de α-santaleno sintase, de modo a que o referido organismo expresse o referido polipeptídio.
4. MÉTODO PARA PRODUZIR α-SANTALENO ISOLADO, CARACTERIZADO por compreender: a) contatar pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio possuindo uma atividade de α-santaleno sintase e compreendendo uma sequência de aminoácidos compreendendo a cultura de um organismo hospedeiro não humano ou célula capaz de produzir FPP e transformado para expressar o dito pelo menos um polipeptídio, sob condições conducentes à produção de α-santaleno, e b) recuperar o α-santaleno produzido no passo a), em que o método compreende ainda, antes do passo a), transformar um organismo hospedeiro não humano ou célula capaz de produzir pirofosfato de farnesilo (FPP) com pelo menos um ácido nucleico codificando o referido pelo menos um polipeptídio, de modo que o referido organismo expressa o referido pelo menos um polipeptídio.
5. MÉTODO, de acordo com a reivindicação 2, CARACTERIZADO pelo organismo hospedeiro não humano ser uma planta, um procariota ou um fungo e em que a célula hospedeira não humana é uma planta ou uma célula fúngica.
6. MÉTODO PARA PRODUZIR A-SANTALENO ISOLADO OU UMA MISTURA DE SESQUITERPENOS, CARACTERIZADO por compreender: a) contatar o pirofosfato de farnesilo (FPP) com pelo menos um polipeptídio expresso heterologamente possuindo uma atividade de α-santaleno sintase e compreendendo uma sequência de aminoácidos; e b) recuperar o α-santaleno produzido no passo a); em que α-santaleno ou (+)-α- santaleno é o produto principal ou em que α-santaleno ou (+)-α-santaleno representa pelo menos 60%, pelo menos 80%, ou pelo menos 90%, dos sesquiterpenos obtido.
7. MÉTODO, de acordo com a reivindicação 1, CARACTERIZADO por pelo menos um polipeptídio consistir em SEQ ID NO: 1.
8. MÉTODO, de acordo com a reivindicação 1, CARACTERIZADO pelo polipeptídio compreender a sequencia de aminoácidos SEQ ID NO: 1.
9. MICROORGANISMO TRANSGENICO PARA ABRIGAR PELO MENOS UM ÁCIDO NUCLEICO, CARACTERIZADO por expressar ou superexpressar heterologamente pelo menos um polipeptídio tendo uma atividade de α-santaleno sintase ou uma atividade de (+)-α-santaleno sintase e compreendendo uma sequência de aminoácidos.
10. MICROORGANISMO TRANSGENICO, de acordo com a reivindicação 9, CARACTERIZADO pelo organismo hospedeiro não humano ser uma planta, um procariota ou um fungo e em que a célula hospedeira não humana é uma planta ou uma célula fúngica.
11. MÉTODO PARA PRODUZIR PELO MENOS UM POLIPEPTÍDIO, CARACTERIZADO por compreender: a) cultivar um organismo hospedeiro não humano ou célula transformada com um vetor de expressão compreendendo um ácido nucleico codificando um polipeptídio possuindo uma atividade de α-santaleno sintase ou uma atividade de (+) - α- santaleno sintase e compreendendo uma sequência de aminoácidos, de modo que abriga o referido ido nucleico e expressa ou sobreexpressa o referido polipeptídio; e b) isolar o polipeptídio do organismo hospedeiro não humano ou célula cultivada no passo a).
12. MÉTODO, de acordo com a reivindicação 11, CARACTERIZADO por adicionalmente, antes do passo a), transformar um organismo hospedeiro não- humano ou célula com o vetor de expressão, de modo a albergar o ácido nucleico e expressar ou sobreexpressar o polipeptídio.
13. MÉTODO, de acordo com a reivindicação 4, CARACTERIZADO por pelo menos um ácido nucleico consistir na SEQ ID NO:2 ou no seu complemento.
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP08102357.4 | 2008-03-06 | ||
| EP08102357 | 2008-03-06 | ||
| EP08103362.3 | 2008-04-03 | ||
| EP08103362 | 2008-04-03 | ||
| PCT/EP2009/052546 WO2009109597A1 (en) | 2008-03-06 | 2009-03-04 | Method for producing alpha- santalene |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| BRPI0913671A2 BRPI0913671A2 (pt) | 2015-08-04 |
| BRPI0913671B1 true BRPI0913671B1 (pt) | 2023-08-22 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9969999B2 (en) | Method for producing alpha-santalene | |
| CN104846020B (zh) | 生产香紫苏醇的方法 | |
| US10253335B2 (en) | Method for producing beta-santalene | |
| US8703454B2 (en) | Method for producing (+)-zizaene | |
| US9714440B2 (en) | Method for producing patchoulol and 7-epi-α-selinene | |
| BRPI0913671B1 (pt) | Método para produzir alfa-santaleno | |
| AU2017202313B2 (en) | Method for producing beta-santalene | |
| BRPI1015444B1 (pt) | Método para produzir (+)-zizaeno | |
| ES2792041T3 (es) | Procedimiento de producción de sesquiterpenos | |
| BRPI0906468B1 (pt) | Método para produzir esclareol | |
| BRPI0906166B1 (pt) | Método para produzir esclareol |