BRPI0616979A2 - molécula de ácido nucléico isolada do café (coffea spp), moléculas de mrna e cdna, oligonucleotìdeo, vetor, célula hospedeira, planta fértil e método de modular sabor ou aroma de grãos de café - Google Patents
molécula de ácido nucléico isolada do café (coffea spp), moléculas de mrna e cdna, oligonucleotìdeo, vetor, célula hospedeira, planta fértil e método de modular sabor ou aroma de grãos de café Download PDFInfo
- Publication number
- BRPI0616979A2 BRPI0616979A2 BRPI0616979-1A BRPI0616979A BRPI0616979A2 BR PI0616979 A2 BRPI0616979 A2 BR PI0616979A2 BR PI0616979 A BRPI0616979 A BR PI0616979A BR PI0616979 A2 BRPI0616979 A2 BR PI0616979A2
- Authority
- BR
- Brazil
- Prior art keywords
- leu
- seq
- gly
- wing
- pro
- Prior art date
Links
- 241000196324 Embryophyta Species 0.000 title claims abstract description 131
- 235000013353 coffee beverage Nutrition 0.000 title claims abstract description 107
- 235000016213 coffee Nutrition 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 100
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 83
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 76
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 76
- 239000013598 vector Substances 0.000 title claims abstract description 48
- 241000723377 Coffea Species 0.000 title claims abstract description 31
- 239000000796 flavoring agent Substances 0.000 title claims abstract description 29
- 235000019634 flavors Nutrition 0.000 title claims abstract description 29
- 241000533293 Sesbania emerus Species 0.000 title claims abstract description 27
- 108091034117 Oligonucleotide Proteins 0.000 title claims abstract description 15
- 108020004999 messenger RNA Proteins 0.000 title claims description 14
- 108090000623 proteins and genes Proteins 0.000 claims description 366
- 230000014509 gene expression Effects 0.000 claims description 104
- 210000004027 cell Anatomy 0.000 claims description 101
- 108700026244 Open Reading Frames Proteins 0.000 claims description 85
- 230000037361 pathway Effects 0.000 claims description 83
- 229930015704 phenylpropanoid Natural products 0.000 claims description 77
- 150000002995 phenylpropanoid derivatives Chemical class 0.000 claims description 76
- 150000001413 amino acids Chemical group 0.000 claims description 54
- 108091026890 Coding region Proteins 0.000 claims description 52
- 108090000790 Enzymes Proteins 0.000 claims description 43
- 102000004190 Enzymes Human genes 0.000 claims description 42
- 239000013612 plasmid Substances 0.000 claims description 32
- 238000013518 transcription Methods 0.000 claims description 29
- 230000035897 transcription Effects 0.000 claims description 29
- 244000061176 Nicotiana tabacum Species 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 24
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 22
- 238000004519 manufacturing process Methods 0.000 claims description 20
- 241000219194 Arabidopsis Species 0.000 claims description 19
- 240000004658 Medicago sativa Species 0.000 claims description 14
- 108700019146 Transgenes Proteins 0.000 claims description 13
- JXOHGGNKMLTUBP-HSUXUTPPSA-N shikimic acid Chemical compound O[C@@H]1CC(C(O)=O)=C[C@@H](O)[C@H]1O JXOHGGNKMLTUBP-HSUXUTPPSA-N 0.000 claims description 13
- JXOHGGNKMLTUBP-JKUQZMGJSA-N shikimic acid Natural products O[C@@H]1CC(C(O)=O)=C[C@H](O)[C@@H]1O JXOHGGNKMLTUBP-JKUQZMGJSA-N 0.000 claims description 13
- 108010023642 hydroxycinnamoyl-CoA-quinate transferase Proteins 0.000 claims description 12
- 230000001965 increasing effect Effects 0.000 claims description 12
- QHRGJMIMHCLHRG-FUEUKBNZSA-N caffeoyl-CoA Chemical compound O=C([C@H](O)C(C)(COP(O)(=O)OP(O)(=O)OC[C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C2=NC=NC(N)=C2N=C1)OP(O)(O)=O)C)NCCC(=O)NCCSC(=O)C=CC1=CC=C(O)C(O)=C1 QHRGJMIMHCLHRG-FUEUKBNZSA-N 0.000 claims description 9
- UZMZQIZIJQTHDK-VXAHOBLNSA-N S-[2-[3-[[(2R)-4-[[[(2R,3S,4R,5R)-5-(6-aminopurin-9-yl)-4-hydroxy-3-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl]oxy-2-hydroxy-3,3-dimethylbutanoyl]amino]propanoylamino]ethyl] 2-hydroxy-3-phenylprop-2-enethioate Chemical compound O=C([C@H](O)C(C)(COP(O)(=O)OP(O)(=O)OC[C@@H]1[C@H]([C@@H](O)[C@@H](O1)N1C2=NC=NC(N)=C2N=C1)OP(O)(O)=O)C)NCCC(=O)NCCSC(=O)C(O)=CC1=CC=CC=C1 UZMZQIZIJQTHDK-VXAHOBLNSA-N 0.000 claims description 8
- 244000061456 Solanum tuberosum Species 0.000 claims description 8
- 240000008042 Zea mays Species 0.000 claims description 8
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 8
- 230000001580 bacterial effect Effects 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 8
- 239000013604 expression vector Substances 0.000 claims description 8
- FMBALSGATPXMMT-QIUSXKNJSA-N C1[C@H](C([C@@H](CC1(C(=O)O)O)O)O)O.OC(C(=O)SCCNC(CCNC([C@@H](C(COP(OP(OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(N)=NC=NC12)O)OP(=O)(O)O)(=O)O)(=O)O)(C)C)O)=O)=O)=CC1=CC=CC=C1 Chemical compound C1[C@H](C([C@@H](CC1(C(=O)O)O)O)O)O.OC(C(=O)SCCNC(CCNC([C@@H](C(COP(OP(OC[C@@H]1[C@H]([C@H]([C@@H](O1)N1C=NC=2C(N)=NC=NC12)O)OP(=O)(O)O)(=O)O)(=O)O)(C)C)O)=O)=O)=CC1=CC=CC=C1 FMBALSGATPXMMT-QIUSXKNJSA-N 0.000 claims description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 7
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 7
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 6
- 240000007594 Oryza sativa Species 0.000 claims description 6
- 235000007164 Oryza sativa Nutrition 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 235000010469 Glycine max Nutrition 0.000 claims description 5
- 244000068988 Glycine max Species 0.000 claims description 5
- 241000238631 Hexapoda Species 0.000 claims description 5
- 235000002597 Solanum melongena Nutrition 0.000 claims description 4
- 244000061458 Solanum melongena Species 0.000 claims description 4
- 235000021307 Triticum Nutrition 0.000 claims description 4
- 244000098338 Triticum aestivum Species 0.000 claims description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 4
- 230000002538 fungal effect Effects 0.000 claims description 4
- 235000009973 maize Nutrition 0.000 claims description 4
- 210000004962 mammalian cell Anatomy 0.000 claims description 4
- 241000701447 unidentified baculovirus Species 0.000 claims description 4
- 235000017060 Arachis glabrata Nutrition 0.000 claims description 3
- 244000105624 Arachis hypogaea Species 0.000 claims description 3
- 235000010777 Arachis hypogaea Nutrition 0.000 claims description 3
- 235000018262 Arachis monticola Nutrition 0.000 claims description 3
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 244000075850 Avena orientalis Species 0.000 claims description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 claims description 3
- 244000020518 Carthamus tinctorius Species 0.000 claims description 3
- 235000007516 Chrysanthemum Nutrition 0.000 claims description 3
- 244000189548 Chrysanthemum x morifolium Species 0.000 claims description 3
- 240000008067 Cucumis sativus Species 0.000 claims description 3
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 3
- 244000193629 Cyphomandra crassifolia Species 0.000 claims description 3
- 235000000298 Cyphomandra crassifolia Nutrition 0.000 claims description 3
- 235000002767 Daucus carota Nutrition 0.000 claims description 3
- 244000000626 Daucus carota Species 0.000 claims description 3
- 241000202296 Delphinium Species 0.000 claims description 3
- 244000020551 Helianthus annuus Species 0.000 claims description 3
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 3
- 240000005979 Hordeum vulgare Species 0.000 claims description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 3
- 235000003228 Lactuca sativa Nutrition 0.000 claims description 3
- 240000008415 Lactuca sativa Species 0.000 claims description 3
- 240000004713 Pisum sativum Species 0.000 claims description 3
- 235000010582 Pisum sativum Nutrition 0.000 claims description 3
- 241000209056 Secale Species 0.000 claims description 3
- 235000007238 Secale cereale Nutrition 0.000 claims description 3
- 240000003829 Sorghum propinquum Species 0.000 claims description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 3
- 235000009470 Theobroma cacao Nutrition 0.000 claims description 3
- 244000299461 Theobroma cacao Species 0.000 claims description 3
- 241000219793 Trifolium Species 0.000 claims description 3
- 240000003307 Zinnia violacea Species 0.000 claims description 3
- 235000019519 canola oil Nutrition 0.000 claims description 3
- 239000000828 canola oil Substances 0.000 claims description 3
- 235000020232 peanut Nutrition 0.000 claims description 3
- 239000013603 viral vector Substances 0.000 claims description 3
- 241000218993 Begonia Species 0.000 claims description 2
- 235000002566 Capsicum Nutrition 0.000 claims description 2
- 241000490229 Eucephalus Species 0.000 claims description 2
- 239000006002 Pepper Substances 0.000 claims description 2
- 235000016761 Piper aduncum Nutrition 0.000 claims description 2
- 240000003889 Piper guineense Species 0.000 claims description 2
- 235000017804 Piper guineense Nutrition 0.000 claims description 2
- 235000008184 Piper nigrum Nutrition 0.000 claims description 2
- 238000010839 reverse transcription Methods 0.000 claims description 2
- 235000000346 sugar Nutrition 0.000 claims description 2
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 97
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 91
- 235000001368 chlorogenic acid Nutrition 0.000 abstract description 87
- 229920001184 polypeptide Polymers 0.000 abstract description 87
- 102000040430 polynucleotide Human genes 0.000 abstract description 36
- 108091033319 polynucleotide Proteins 0.000 abstract description 36
- 239000002157 polynucleotide Substances 0.000 abstract description 35
- 235000019640 taste Nutrition 0.000 abstract description 14
- 201000010099 disease Diseases 0.000 abstract description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 7
- 230000036542 oxidative stress Effects 0.000 abstract description 7
- 230000006696 biosynthetic metabolic pathway Effects 0.000 abstract description 6
- 230000004224 protection Effects 0.000 abstract description 4
- 102000004169 proteins and genes Human genes 0.000 description 208
- 235000018102 proteins Nutrition 0.000 description 201
- 240000007154 Coffea arabica Species 0.000 description 160
- 108020004414 DNA Proteins 0.000 description 123
- 239000002299 complementary DNA Substances 0.000 description 105
- 244000016593 Coffea robusta Species 0.000 description 58
- 235000001014 amino acid Nutrition 0.000 description 48
- 239000000047 product Substances 0.000 description 48
- 239000000523 sample Substances 0.000 description 48
- 229940024606 amino acid Drugs 0.000 description 47
- 238000006243 chemical reaction Methods 0.000 description 47
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 44
- 235000002187 Coffea robusta Nutrition 0.000 description 38
- 235000013339 cereals Nutrition 0.000 description 36
- 210000001519 tissue Anatomy 0.000 description 36
- 239000012634 fragment Substances 0.000 description 34
- 230000001105 regulatory effect Effects 0.000 description 30
- 108010035812 caffeoyl-CoA O-methyltransferase Proteins 0.000 description 29
- 239000003999 initiator Substances 0.000 description 29
- 235000007460 Coffea arabica Nutrition 0.000 description 26
- 239000003550 marker Substances 0.000 description 25
- 101710093406 p-coumarate 3-hydroxylase Proteins 0.000 description 25
- 230000015572 biosynthetic process Effects 0.000 description 24
- 239000000872 buffer Substances 0.000 description 23
- 238000002474 experimental method Methods 0.000 description 22
- 238000002955 isolation Methods 0.000 description 22
- 238000000746 purification Methods 0.000 description 22
- CWVRJTMFETXNAD-JUHZACGLSA-N chlorogenic acid Chemical compound O[C@@H]1[C@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-JUHZACGLSA-N 0.000 description 20
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 238000004128 high performance liquid chromatography Methods 0.000 description 19
- 238000009396 hybridization Methods 0.000 description 19
- 230000036961 partial effect Effects 0.000 description 19
- QAIPRVGONGVQAS-DUXPYHPUSA-N trans-caffeic acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-DUXPYHPUSA-N 0.000 description 18
- 240000003768 Solanum lycopersicum Species 0.000 description 17
- 239000000203 mixture Substances 0.000 description 17
- 108020004705 Codon Proteins 0.000 description 16
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 16
- 230000003321 amplification Effects 0.000 description 16
- 108010057821 leucylproline Proteins 0.000 description 16
- 238000003199 nucleic acid amplification method Methods 0.000 description 16
- 239000002773 nucleotide Substances 0.000 description 16
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 125000003275 alpha amino acid group Chemical group 0.000 description 15
- 125000003729 nucleotide group Chemical group 0.000 description 15
- 230000009261 transgenic effect Effects 0.000 description 15
- CWVRJTMFETXNAD-FWCWNIRPSA-N 3-O-Caffeoylquinic acid Natural products O[C@H]1[C@@H](O)C[C@@](O)(C(O)=O)C[C@H]1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 CWVRJTMFETXNAD-FWCWNIRPSA-N 0.000 description 14
- PZIRUHCJZBGLDY-UHFFFAOYSA-N Caffeoylquinic acid Natural products CC(CCC(=O)C(C)C1C(=O)CC2C3CC(O)C4CC(O)CCC4(C)C3CCC12C)C(=O)O PZIRUHCJZBGLDY-UHFFFAOYSA-N 0.000 description 14
- CWVRJTMFETXNAD-KLZCAUPSSA-N Neochlorogenin-saeure Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O CWVRJTMFETXNAD-KLZCAUPSSA-N 0.000 description 14
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 14
- 229940074393 chlorogenic acid Drugs 0.000 description 14
- FFQSDFBBSXGVKF-KHSQJDLVSA-N chlorogenic acid Natural products O[C@@H]1C[C@](O)(C[C@@H](CC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O FFQSDFBBSXGVKF-KHSQJDLVSA-N 0.000 description 14
- BMRSEYFENKXDIS-KLZCAUPSSA-N cis-3-O-p-coumaroylquinic acid Natural products O[C@H]1C[C@@](O)(C[C@@H](OC(=O)C=Cc2ccc(O)cc2)[C@@H]1O)C(=O)O BMRSEYFENKXDIS-KLZCAUPSSA-N 0.000 description 14
- KSEBMYQBYZTDHS-HWKANZROSA-M (E)-Ferulic acid Natural products COC1=CC(\C=C\C([O-])=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-M 0.000 description 13
- 238000012512 characterization method Methods 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 13
- 238000011161 development Methods 0.000 description 13
- 230000018109 developmental process Effects 0.000 description 13
- KSEBMYQBYZTDHS-HWKANZROSA-N ferulic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-N 0.000 description 13
- 235000001785 ferulic acid Nutrition 0.000 description 13
- 229940114124 ferulic acid Drugs 0.000 description 13
- KSEBMYQBYZTDHS-UHFFFAOYSA-N ferulic acid Natural products COC1=CC(C=CC(O)=O)=CC=C1O KSEBMYQBYZTDHS-UHFFFAOYSA-N 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- QURCVMIEKCOAJU-UHFFFAOYSA-N trans-isoferulic acid Natural products COC1=CC=C(C=CC(O)=O)C=C1O QURCVMIEKCOAJU-UHFFFAOYSA-N 0.000 description 13
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 12
- 238000000137 annealing Methods 0.000 description 12
- 238000010367 cloning Methods 0.000 description 12
- 239000000126 substance Substances 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 11
- 108010090461 DFG peptide Proteins 0.000 description 10
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 239000002253 acid Substances 0.000 description 10
- 230000000692 anti-sense effect Effects 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- 102000037865 fusion proteins Human genes 0.000 description 10
- 108020001507 fusion proteins Proteins 0.000 description 10
- 108010092114 histidylphenylalanine Proteins 0.000 description 10
- 108010034529 leucyl-lysine Proteins 0.000 description 10
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 241000894007 species Species 0.000 description 10
- ACEAELOMUCBPJP-UHFFFAOYSA-N (E)-3,4,5-trihydroxycinnamic acid Natural products OC(=O)C=CC1=CC(O)=C(O)C(O)=C1 ACEAELOMUCBPJP-UHFFFAOYSA-N 0.000 description 9
- 244000046052 Phaseolus vulgaris Species 0.000 description 9
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 9
- 235000004883 caffeic acid Nutrition 0.000 description 9
- 229940074360 caffeic acid Drugs 0.000 description 9
- QAIPRVGONGVQAS-UHFFFAOYSA-N cis-caffeic acid Natural products OC(=O)C=CC1=CC=C(O)C(O)=C1 QAIPRVGONGVQAS-UHFFFAOYSA-N 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 238000010828 elution Methods 0.000 description 9
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 8
- 101710089884 Caffeoyl-CoA O-methyltransferase 1 Proteins 0.000 description 8
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 8
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 8
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 8
- 238000012300 Sequence Analysis Methods 0.000 description 8
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 8
- 108010009298 lysylglutamic acid Proteins 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 239000002243 precursor Substances 0.000 description 8
- 238000002360 preparation method Methods 0.000 description 8
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 7
- QJHOOKBAHRJPPX-QWRGUYRKSA-N Asp-Phe-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 QJHOOKBAHRJPPX-QWRGUYRKSA-N 0.000 description 7
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 7
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 7
- 108010006785 Taq Polymerase Proteins 0.000 description 7
- 150000007513 acids Chemical class 0.000 description 7
- 239000003963 antioxidant agent Substances 0.000 description 7
- 235000006708 antioxidants Nutrition 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 108010060035 arginylproline Proteins 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 238000009395 breeding Methods 0.000 description 7
- 230000001488 breeding effect Effects 0.000 description 7
- 235000013399 edible fruits Nutrition 0.000 description 7
- 239000012149 elution buffer Substances 0.000 description 7
- 108010015792 glycyllysine Proteins 0.000 description 7
- 230000036541 health Effects 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 208000015181 infectious disease Diseases 0.000 description 7
- 108010077112 prolyl-proline Proteins 0.000 description 7
- 238000003757 reverse transcription PCR Methods 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- CWVRJTMFETXNAD-GMZLATJGSA-N 5-Caffeoyl quinic acid Natural products O[C@H]1C[C@](O)(C[C@H](OC(=O)C=Cc2ccc(O)c(O)c2)[C@@H]1O)C(=O)O CWVRJTMFETXNAD-GMZLATJGSA-N 0.000 description 6
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 6
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 6
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 6
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 6
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 6
- HOZNVKDCKZPRER-XUXIUFHCSA-N Met-Lys-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HOZNVKDCKZPRER-XUXIUFHCSA-N 0.000 description 6
- 240000007926 Ocimum gratissimum Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- 108010036937 Trans-cinnamate 4-monooxygenase Proteins 0.000 description 6
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- -1 chlorogenic acid lactones Chemical class 0.000 description 6
- 238000004587 chromatography analysis Methods 0.000 description 6
- 239000008373 coffee flavor Substances 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000004043 dyeing Methods 0.000 description 6
- 230000002708 enhancing effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000005755 formation reaction Methods 0.000 description 6
- 108010077515 glycylproline Proteins 0.000 description 6
- 108010037850 glycylvaline Proteins 0.000 description 6
- 239000006166 lysate Substances 0.000 description 6
- 230000002018 overexpression Effects 0.000 description 6
- 244000052769 pathogen Species 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 5
- NGSWKAQJJWESNS-UHFFFAOYSA-N 4-coumaric acid Chemical compound OC(=O)C=CC1=CC=C(O)C=C1 NGSWKAQJJWESNS-UHFFFAOYSA-N 0.000 description 5
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 5
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 5
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 5
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 5
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 5
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 5
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 5
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 5
- 235000010624 Medicago sativa Nutrition 0.000 description 5
- 108010074633 Mixed Function Oxygenases Proteins 0.000 description 5
- 102000008109 Mixed Function Oxygenases Human genes 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 5
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 5
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 229920002494 Zein Polymers 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 238000000246 agarose gel electrophoresis Methods 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 108091036078 conserved sequence Proteins 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 5
- 229960005542 ethidium bromide Drugs 0.000 description 5
- 235000019253 formic acid Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 239000008103 glucose Substances 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 108010005942 methionylglycine Proteins 0.000 description 5
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 5
- 229960005190 phenylalanine Drugs 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 108010070643 prolylglutamic acid Proteins 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- 229940093612 zein Drugs 0.000 description 5
- 239000005019 zein Substances 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 4
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 4
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 4
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 4
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 4
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 4
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 4
- PTSDPWIHOYMRGR-UGYAYLCHSA-N Asn-Ile-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O PTSDPWIHOYMRGR-UGYAYLCHSA-N 0.000 description 4
- FTNRWCPWDWRPAV-BZSNNMDCSA-N Asn-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTNRWCPWDWRPAV-BZSNNMDCSA-N 0.000 description 4
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 4
- DYDKXJWQCIVTMR-WDSKDSINSA-N Asp-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O DYDKXJWQCIVTMR-WDSKDSINSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- AAWZDTNXLSGCEK-UHFFFAOYSA-N Cordycepinsaeure Natural products OC1CC(O)(C(O)=O)CC(O)C1O AAWZDTNXLSGCEK-UHFFFAOYSA-N 0.000 description 4
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 4
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 4
- YDJOULGWHQRPEV-SRVKXCTJSA-N Glu-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N YDJOULGWHQRPEV-SRVKXCTJSA-N 0.000 description 4
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 4
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 4
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 4
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 4
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 4
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 4
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 4
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 4
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 4
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 4
- 229930010555 Inosine Natural products 0.000 description 4
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 4
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 4
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 4
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 4
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 4
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 4
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 4
- MVBZBRKNZVJEKK-DTWKUNHWSA-N Met-Gly-Pro Chemical compound CSCC[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N MVBZBRKNZVJEKK-DTWKUNHWSA-N 0.000 description 4
- IMTUWVJPCQPJEE-IUCAKERBSA-N Met-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN IMTUWVJPCQPJEE-IUCAKERBSA-N 0.000 description 4
- QYIGOFGUOVTAHK-ZJDVBMNYSA-N Met-Thr-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QYIGOFGUOVTAHK-ZJDVBMNYSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- SJRQWEDYTKYHHL-SLFFLAALSA-N Phe-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O SJRQWEDYTKYHHL-SLFFLAALSA-N 0.000 description 4
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 4
- HOTVCUAVDQHUDB-UFYCRDLUSA-N Pro-Phe-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 HOTVCUAVDQHUDB-UFYCRDLUSA-N 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- AAWZDTNXLSGCEK-ZHQZDSKASA-N Quinic acid Natural products O[C@H]1CC(O)(C(O)=O)C[C@H](O)C1O AAWZDTNXLSGCEK-ZHQZDSKASA-N 0.000 description 4
- 108700008625 Reporter Genes Proteins 0.000 description 4
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 108010022394 Threonine synthase Proteins 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 4
- HQJOVVWAPQPYDS-ZFWWWQNUSA-N Trp-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQJOVVWAPQPYDS-ZFWWWQNUSA-N 0.000 description 4
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 4
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 4
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 230000009418 agronomic effect Effects 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- 229960000723 ampicillin Drugs 0.000 description 4
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 4
- 230000003078 antioxidant effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 230000001351 cycling effect Effects 0.000 description 4
- 239000007857 degradation product Substances 0.000 description 4
- 102000004419 dihydrofolate reductase Human genes 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 230000009368 gene silencing by RNA Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 108010028295 histidylhistidine Proteins 0.000 description 4
- 229960003786 inosine Drugs 0.000 description 4
- 229920005610 lignin Polymers 0.000 description 4
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 235000012015 potatoes Nutrition 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 238000001273 protein sequence alignment Methods 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 239000011535 reaction buffer Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- 108010051110 tyrosyl-lysine Proteins 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 3
- AAWZDTNXLSGCEK-LNVDRNJUSA-N (3r,5r)-1,3,4,5-tetrahydroxycyclohexane-1-carboxylic acid Chemical compound O[C@@H]1CC(O)(C(O)=O)C[C@@H](O)C1O AAWZDTNXLSGCEK-LNVDRNJUSA-N 0.000 description 3
- 108700016155 Acyl transferases Proteins 0.000 description 3
- 102000057234 Acyl transferases Human genes 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 3
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- 101100382207 Arabidopsis thaliana CYP98A3 gene Proteins 0.000 description 3
- 101000762164 Arabidopsis thaliana Cytochrome P450 84A1 Proteins 0.000 description 3
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 3
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 3
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 3
- AFNHFVVOJZBIJD-GUBZILKMSA-N Arg-Met-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O AFNHFVVOJZBIJD-GUBZILKMSA-N 0.000 description 3
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N Arginine Chemical compound OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- NSTBNYOKCZKOMI-AVGNSLFASA-N Asn-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O NSTBNYOKCZKOMI-AVGNSLFASA-N 0.000 description 3
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 3
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 3
- ZRAOLTNMSCSCLN-ZLUOBGJFSA-N Asp-Cys-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)O ZRAOLTNMSCSCLN-ZLUOBGJFSA-N 0.000 description 3
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 3
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 3
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 3
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 3
- NWAHPBGBDIFUFD-KKUMJFAQSA-N Asp-Tyr-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O NWAHPBGBDIFUFD-KKUMJFAQSA-N 0.000 description 3
- 241000701489 Cauliflower mosaic virus Species 0.000 description 3
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 description 3
- 101710116650 FAD-dependent monooxygenase Proteins 0.000 description 3
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 3
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 3
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 3
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 3
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 3
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 3
- YVYVMJNUENBOOL-KBIXCLLPSA-N Glu-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N YVYVMJNUENBOOL-KBIXCLLPSA-N 0.000 description 3
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 3
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 3
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 3
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 3
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 3
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 3
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 3
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 3
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 3
- IFHJOBKVXBESRE-YUMQZZPRSA-N Gly-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN IFHJOBKVXBESRE-YUMQZZPRSA-N 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- MDCTVRUPVLZSPG-BQBZGAKWSA-N His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 MDCTVRUPVLZSPG-BQBZGAKWSA-N 0.000 description 3
- WZBLRQQCDYYRTD-SIXJUCDHSA-N His-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N WZBLRQQCDYYRTD-SIXJUCDHSA-N 0.000 description 3
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 3
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 3
- ALPXXNRQBMRCPZ-MEYUZBJRSA-N His-Thr-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ALPXXNRQBMRCPZ-MEYUZBJRSA-N 0.000 description 3
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 3
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 3
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- DRCKHKZYDLJYFQ-YWIQKCBGSA-N Ile-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRCKHKZYDLJYFQ-YWIQKCBGSA-N 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 3
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 3
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 3
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 3
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 3
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 3
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 3
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000856 Lyases Proteins 0.000 description 3
- 102000004317 Lyases Human genes 0.000 description 3
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 3
- NCTDKZKNBDZDOL-GARJFASQSA-N Lys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O NCTDKZKNBDZDOL-GARJFASQSA-N 0.000 description 3
- UGTZHPSKYRIGRJ-YUMQZZPRSA-N Lys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UGTZHPSKYRIGRJ-YUMQZZPRSA-N 0.000 description 3
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 3
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 3
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 3
- QTZXSYBVOSXBEJ-WDSKDSINSA-N Met-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O QTZXSYBVOSXBEJ-WDSKDSINSA-N 0.000 description 3
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 3
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 3
- 101710128228 O-methyltransferase Proteins 0.000 description 3
- 206010034133 Pathogen resistance Diseases 0.000 description 3
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 3
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 3
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 3
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 3
- PULPZRAHVFBVTO-DCAQKATOSA-N Pro-Glu-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PULPZRAHVFBVTO-DCAQKATOSA-N 0.000 description 3
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 3
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 3
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 3
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 3
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 3
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 238000002123 RNA extraction Methods 0.000 description 3
- 101150027262 Rpl39 gene Proteins 0.000 description 3
- 101150086611 Ste gene Proteins 0.000 description 3
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 3
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 3
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 3
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 3
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 3
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 3
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 3
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 3
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 235000013985 cinnamic acid Nutrition 0.000 description 3
- 239000005516 coenzyme A Substances 0.000 description 3
- 229940093530 coenzyme a Drugs 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000006353 environmental stress Effects 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 3
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 3
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 3
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 230000002363 herbicidal effect Effects 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000033444 hydroxylation Effects 0.000 description 3
- 238000005805 hydroxylation reaction Methods 0.000 description 3
- 238000000126 in silico method Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 3
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000002207 metabolite Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 108010085203 methionylmethionine Proteins 0.000 description 3
- WBYWAXJHAXSJNI-UHFFFAOYSA-N methyl p-hydroxycinnamate Natural products OC(=O)C=CC1=CC=CC=C1 WBYWAXJHAXSJNI-UHFFFAOYSA-N 0.000 description 3
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 230000001323 posttranslational effect Effects 0.000 description 3
- 230000002028 premature Effects 0.000 description 3
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 3
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 3
- 108010090894 prolylleucine Proteins 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 108010000998 wheylin-2 peptide Proteins 0.000 description 3
- UFCLZKMFXSILNL-BBLPPJRLSA-N (-) 4,5-dicaffeoylquinic acid Natural products OC=1C=C(C=CC=1O)C=CC(=O)O[C@@H]1C[C@@](C[C@H]([C@H]1OC(C=CC1=CC(=C(C=C1)O)O)=O)O)(C(=O)O)O UFCLZKMFXSILNL-BBLPPJRLSA-N 0.000 description 2
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 2
- OOCCDEMITAIZTP-QPJJXVBHSA-N (E)-cinnamyl alcohol Chemical compound OC\C=C\C1=CC=CC=C1 OOCCDEMITAIZTP-QPJJXVBHSA-N 0.000 description 2
- WBYWAXJHAXSJNI-VOTSOKGWSA-M .beta-Phenylacrylic acid Natural products [O-]C(=O)\C=C\C1=CC=CC=C1 WBYWAXJHAXSJNI-VOTSOKGWSA-M 0.000 description 2
- UFCLZKMFXSILNL-GCBRTHAASA-N 102851-07-0 Natural products OC=1C=C(C=CC=1O)C=CC(=O)O[C@@H]1C[C@](C[C@H]([C@@H]1OC(C=CC1=CC(=C(C=C1)O)O)=O)O)(C(=O)O)O UFCLZKMFXSILNL-GCBRTHAASA-N 0.000 description 2
- YOMSJEATGXXYPX-UHFFFAOYSA-N 2-methoxy-4-vinylphenol Chemical compound COC1=CC(C=C)=CC=C1O YOMSJEATGXXYPX-UHFFFAOYSA-N 0.000 description 2
- GYDPOKGOQFTYGW-UHFFFAOYSA-N 3-Methyl-2-butene-1-thiol Chemical compound CC(C)=CCS GYDPOKGOQFTYGW-UHFFFAOYSA-N 0.000 description 2
- NGSWKAQJJWESNS-ZZXKWVIFSA-M 4-Hydroxycinnamate Natural products OC1=CC=C(\C=C\C([O-])=O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-M 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 2
- 101710191936 70 kDa protein Proteins 0.000 description 2
- DFYRUELUNQRZTB-UHFFFAOYSA-N Acetovanillone Natural products COC1=CC(C(C)=O)=CC=C1O DFYRUELUNQRZTB-UHFFFAOYSA-N 0.000 description 2
- 102000055025 Adenosine deaminases Human genes 0.000 description 2
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 2
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 2
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 102100024321 Alkaline phosphatase, placental type Human genes 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 101100018408 Arabidopsis thaliana IDN2 gene Proteins 0.000 description 2
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 2
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 2
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 2
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 2
- OKKMBOSPBDASEP-CYDGBPFRSA-N Arg-Ile-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O OKKMBOSPBDASEP-CYDGBPFRSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 2
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 2
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 2
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 2
- BKZFBJYIVSBXCO-KKUMJFAQSA-N Asn-Phe-His Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O BKZFBJYIVSBXCO-KKUMJFAQSA-N 0.000 description 2
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 2
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 2
- XCBKBPRFACFFOO-AQZXSJQPSA-N Asn-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O XCBKBPRFACFFOO-AQZXSJQPSA-N 0.000 description 2
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 2
- JZLFYAAGGYMRIK-BYULHYEWSA-N Asn-Val-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O JZLFYAAGGYMRIK-BYULHYEWSA-N 0.000 description 2
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 2
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 2
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 2
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 2
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 2
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- QNMKWNONJGKJJC-NHCYSSNCSA-N Asp-Leu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O QNMKWNONJGKJJC-NHCYSSNCSA-N 0.000 description 2
- BPTFNDRZKBFMTH-DCAQKATOSA-N Asp-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N BPTFNDRZKBFMTH-DCAQKATOSA-N 0.000 description 2
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 2
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 2
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 2
- 101000984031 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) Cytochrome P450 monooxygenase lnaD Proteins 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 108010000755 Bromoxynil nitrilase Proteins 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- WBYWAXJHAXSJNI-SREVYHEPSA-N Cinnamic acid Chemical compound OC(=O)\C=C/C1=CC=CC=C1 WBYWAXJHAXSJNI-SREVYHEPSA-N 0.000 description 2
- 108010074879 Cinnamoyl-CoA reductase Proteins 0.000 description 2
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 2
- 241000228031 Coffea liberica Species 0.000 description 2
- 241001572170 Coffea liberica var. dewevrei Species 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 2
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 2
- NXTYATMDWQYLGJ-BQBZGAKWSA-N Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CS NXTYATMDWQYLGJ-BQBZGAKWSA-N 0.000 description 2
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 2
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 2
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- ARPVSMCNIDAQBO-YUMQZZPRSA-N Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ARPVSMCNIDAQBO-YUMQZZPRSA-N 0.000 description 2
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 2
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 2
- CLSDNFWKGFJIBZ-YUMQZZPRSA-N Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O CLSDNFWKGFJIBZ-YUMQZZPRSA-N 0.000 description 2
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 2
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- WDTAKCUOIKHCTB-NKIYYHGXSA-N Glu-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N)O WDTAKCUOIKHCTB-NKIYYHGXSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- ZKONLKQGTNVAPR-DCAQKATOSA-N Glu-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N ZKONLKQGTNVAPR-DCAQKATOSA-N 0.000 description 2
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 2
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- KTSZUNRRYXPZTK-BQBZGAKWSA-N Gly-Gln-Glu Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KTSZUNRRYXPZTK-BQBZGAKWSA-N 0.000 description 2
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 2
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 2
- KHUFDBQXGLEIHC-BZSNNMDCSA-N His-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 KHUFDBQXGLEIHC-BZSNNMDCSA-N 0.000 description 2
- YIGCZZKZFMNSIU-RWMBFGLXSA-N His-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YIGCZZKZFMNSIU-RWMBFGLXSA-N 0.000 description 2
- YXXKBPJEIYFGOD-MGHWNKPDSA-N His-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N YXXKBPJEIYFGOD-MGHWNKPDSA-N 0.000 description 2
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 2
- WRPDZHJNLYNFFT-GEVIPFJHSA-N His-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O WRPDZHJNLYNFFT-GEVIPFJHSA-N 0.000 description 2
- UPJODPVSKKWGDQ-KLHWPWHYSA-N His-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O UPJODPVSKKWGDQ-KLHWPWHYSA-N 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 2
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 2
- AKQFLPNANHNTLP-VKOGCVSHSA-N Ile-Pro-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N AKQFLPNANHNTLP-VKOGCVSHSA-N 0.000 description 2
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 2
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- 101710203526 Integrase Proteins 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- TYYLDKGBCJGJGW-UHFFFAOYSA-N L-tryptophan-L-tyrosine Natural products C=1NC2=CC=CC=C2C=1CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 TYYLDKGBCJGJGW-UHFFFAOYSA-N 0.000 description 2
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- XYUBOFCTGPZFSA-WDSOQIARSA-N Leu-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 XYUBOFCTGPZFSA-WDSOQIARSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- JYOAXOMPIXKMKK-YUMQZZPRSA-N Leu-Gln Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCC(N)=O JYOAXOMPIXKMKK-YUMQZZPRSA-N 0.000 description 2
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 2
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 2
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 2
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 2
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 2
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 2
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 2
- 241000219823 Medicago Species 0.000 description 2
- JMEWFDUAFKVAAT-WDSKDSINSA-N Met-Asn Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O JMEWFDUAFKVAAT-WDSKDSINSA-N 0.000 description 2
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 2
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 2
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 2
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 2
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 2
- 101100359706 Methanopyrus kandleri (strain AV19 / DSM 6324 / JCM 9639 / NBRC 100938) rpl39e gene Proteins 0.000 description 2
- 101100084404 Mus musculus Prodh gene Proteins 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 2
- 108010066427 N-valyltryptophan Proteins 0.000 description 2
- UFCLZKMFXSILNL-UHFFFAOYSA-N NSC 649410 Natural products C=1C=C(O)C(O)=CC=1C=CC(=O)OC1C(O)CC(O)(C(O)=O)CC1OC(=O)C=CC1=CC=C(O)C(O)=C1 UFCLZKMFXSILNL-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- 235000010676 Ocimum basilicum Nutrition 0.000 description 2
- YMORXCKTSSGYIG-IHRRRGAJSA-N Phe-Arg-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N YMORXCKTSSGYIG-IHRRRGAJSA-N 0.000 description 2
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 2
- HTTYNOXBBOWZTB-SRVKXCTJSA-N Phe-Asn-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HTTYNOXBBOWZTB-SRVKXCTJSA-N 0.000 description 2
- GYEPCBNTTRORKW-PCBIJLKTSA-N Phe-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O GYEPCBNTTRORKW-PCBIJLKTSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 2
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 2
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 2
- ABSSTGUCBCDKMU-UWVGGRQHSA-N Pro-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 ABSSTGUCBCDKMU-UWVGGRQHSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 2
- 102000055026 Protein O-Methyltransferase Human genes 0.000 description 2
- 238000001190 Q-PCR Methods 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 2
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 229940100389 Sulfonylurea Drugs 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 2
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 2
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 2
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 2
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 2
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 2
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 2
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 2
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- IJKNKFJZOJCKRR-GBALPHGKSA-N Thr-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 IJKNKFJZOJCKRR-GBALPHGKSA-N 0.000 description 2
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 2
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- XEEHBQOUZBQVAJ-BPUTZDHNSA-N Trp-Arg-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N XEEHBQOUZBQVAJ-BPUTZDHNSA-N 0.000 description 2
- LAIUAVGWZYTBKN-VHWLVUOQSA-N Trp-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O LAIUAVGWZYTBKN-VHWLVUOQSA-N 0.000 description 2
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 2
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 2
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 2
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 2
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 2
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 2
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 2
- STTVVMWQKDOKAM-YESZJQIVSA-N Tyr-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O STTVVMWQKDOKAM-YESZJQIVSA-N 0.000 description 2
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 2
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 2
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 2
- PHKQVWWHRYUCJL-HJOGWXRNSA-N Tyr-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PHKQVWWHRYUCJL-HJOGWXRNSA-N 0.000 description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 2
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 2
- GVRKWABULJAONN-VQVTYTSYSA-N Val-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVRKWABULJAONN-VQVTYTSYSA-N 0.000 description 2
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 229940027138 cambia Drugs 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 229930016911 cinnamic acid Natural products 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 2
- WBCMGDNFDRNGGZ-ACNVUDSMSA-N coumarate Natural products COC(=O)C1=CO[C@H](O[C@H]2O[C@H](CO)[C@@H](O)[C@H](O)[C@H]2O)[C@H]3[C@@H]1C=C[C@]34OC(=O)C(=C4)[C@H](C)OC(=O)C=Cc5ccc(O)cc5 WBCMGDNFDRNGGZ-ACNVUDSMSA-N 0.000 description 2
- 238000004132 cross linking Methods 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- DCOPUUMXTXDBNB-UHFFFAOYSA-N diclofenac Chemical compound OC(=O)CC1=CC=CC=C1NC1=C(Cl)C=CC=C1Cl DCOPUUMXTXDBNB-UHFFFAOYSA-N 0.000 description 2
- 235000005911 diet Nutrition 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 239000003337 fertilizer Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 235000002532 grape seed extract Nutrition 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 239000000049 pigment Substances 0.000 description 2
- 108010031345 placental alkaline phosphatase Proteins 0.000 description 2
- 230000037039 plant physiology Effects 0.000 description 2
- 235000013824 polyphenols Nutrition 0.000 description 2
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 2
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 230000009145 protein modification Effects 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- ZHNFLHYOFXQIOW-LPYZJUEESA-N quinine sulfate dihydrate Chemical compound [H+].[H+].O.O.[O-]S([O-])(=O)=O.C([C@H]([C@H](C1)C=C)C2)C[N@@]1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OC)C=C21.C([C@H]([C@H](C1)C=C)C2)C[N@@]1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OC)C=C21 ZHNFLHYOFXQIOW-LPYZJUEESA-N 0.000 description 2
- 150000003254 radicals Chemical class 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 239000008223 sterile water Substances 0.000 description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 238000010189 synthetic method Methods 0.000 description 2
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010038745 tryptophylglycine Proteins 0.000 description 2
- 108010044292 tryptophyltyrosine Proteins 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- 230000036642 wellbeing Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- KRZBCHWVBQOTNZ-UHFFFAOYSA-N (-) 3,5-dicaffeoyl-muco-quinic acid Natural products OC1C(OC(=O)C=CC=2C=C(O)C(O)=CC=2)CC(O)(C(O)=O)CC1OC(=O)C=CC1=CC=C(O)C(O)=C1 KRZBCHWVBQOTNZ-UHFFFAOYSA-N 0.000 description 1
- GLCIENYSYGDNIL-UHFFFAOYSA-N (2,3-dichlorophenyl) ethaneperoxoate Chemical compound CC(=O)OOC1=CC=CC(Cl)=C1Cl GLCIENYSYGDNIL-UHFFFAOYSA-N 0.000 description 1
- IMXSCCDUAFEIOE-WDSKDSINSA-N (2s)-2-[[(1s)-1-carboxylatoethyl]azaniumyl]-5-(diaminomethylideneazaniumyl)pentanoate Chemical compound OC(=O)[C@H](C)N[C@H](C(O)=O)CCCN=C(N)N IMXSCCDUAFEIOE-WDSKDSINSA-N 0.000 description 1
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- KRZBCHWVBQOTNZ-RDJMKVHDSA-N (3r,5r)-3,5-bis[[(e)-3-(3,4-dihydroxyphenyl)prop-2-enoyl]oxy]-1,4-dihydroxycyclohexane-1-carboxylic acid Chemical compound O([C@@H]1CC(O)(C[C@H](C1O)OC(=O)\C=C\C=1C=C(O)C(O)=CC=1)C(O)=O)C(=O)\C=C\C1=CC=C(O)C(O)=C1 KRZBCHWVBQOTNZ-RDJMKVHDSA-N 0.000 description 1
- GYFFKZTYYAFCTR-AVXJPILUSA-N (3r,5r)-4-[(e)-3-(3,4-dihydroxyphenyl)prop-2-enoyl]oxy-1,3,5-trihydroxycyclohexane-1-carboxylic acid Chemical compound O[C@@H]1CC(O)(C(O)=O)C[C@@H](O)C1OC(=O)\C=C\C1=CC=C(O)C(O)=C1 GYFFKZTYYAFCTR-AVXJPILUSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- ZFFTZDQKIXPDAF-UHFFFAOYSA-N 2-Furanmethanethiol Chemical compound SCC1=CC=CO1 ZFFTZDQKIXPDAF-UHFFFAOYSA-N 0.000 description 1
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- COCMHKNAGZHBDZ-UHFFFAOYSA-N 4-carboxy-3-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]benzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC(C([O-])=O)=CC=C1C(O)=O COCMHKNAGZHBDZ-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 1
- 108010036211 5-HT-moduline Proteins 0.000 description 1
- GYFFKZTYYAFCTR-UHFFFAOYSA-N 5-O-(6'-O-galloyl)-beta-D-glucopyranosylgentisic acid Natural products OC1CC(O)(C(O)=O)CC(O)C1OC(=O)C=CC1=CC=C(O)C(O)=C1 GYFFKZTYYAFCTR-UHFFFAOYSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- 102100035988 60S ribosomal protein L39 Human genes 0.000 description 1
- 101710103719 Acetolactate synthase large subunit Proteins 0.000 description 1
- 101710182467 Acetolactate synthase large subunit IlvB1 Proteins 0.000 description 1
- 101710171176 Acetolactate synthase large subunit IlvG Proteins 0.000 description 1
- 101710176702 Acetolactate synthase small subunit Proteins 0.000 description 1
- 101710147947 Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 1
- 101710095712 Acetolactate synthase, mitochondrial Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- QDRGPQWIVZNJQD-CIUDSAMLSA-N Ala-Arg-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O QDRGPQWIVZNJQD-CIUDSAMLSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- YEVZMOUUZINZCK-LKTVYLICSA-N Ala-Glu-Trp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YEVZMOUUZINZCK-LKTVYLICSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- FSHURBQASBLAPO-WDSKDSINSA-N Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)N FSHURBQASBLAPO-WDSKDSINSA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 108010037365 Arabidopsis Proteins Proteins 0.000 description 1
- 101100132917 Arabidopsis thaliana ATR1 gene Proteins 0.000 description 1
- 101100438168 Arabidopsis thaliana CAD9 gene Proteins 0.000 description 1
- 101100152598 Arabidopsis thaliana CYP73A5 gene Proteins 0.000 description 1
- 101000760742 Arabidopsis thaliana Caffeoyl-CoA O-methyltransferase 1 Proteins 0.000 description 1
- 101001080625 Arabidopsis thaliana Shikimate O-hydroxycinnamoyltransferase Proteins 0.000 description 1
- 241000490494 Arabis Species 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- QQJSJIBESHAJPM-IHRRRGAJSA-N Arg-Cys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QQJSJIBESHAJPM-IHRRRGAJSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- QAXCZGMLVICQKS-SRVKXCTJSA-N Arg-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N QAXCZGMLVICQKS-SRVKXCTJSA-N 0.000 description 1
- BNODVYXZAAXSHW-IUCAKERBSA-N Arg-His Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BNODVYXZAAXSHW-IUCAKERBSA-N 0.000 description 1
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 1
- NIUDXSFNLBIWOB-DCAQKATOSA-N Arg-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NIUDXSFNLBIWOB-DCAQKATOSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- ROWCTNFEMKOIFQ-YUMQZZPRSA-N Arg-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N ROWCTNFEMKOIFQ-YUMQZZPRSA-N 0.000 description 1
- FIQKRDXFTANIEJ-ULQDDVLXSA-N Arg-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FIQKRDXFTANIEJ-ULQDDVLXSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 1
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- HRCIIMCTUIAKQB-XGEHTFHBSA-N Arg-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O HRCIIMCTUIAKQB-XGEHTFHBSA-N 0.000 description 1
- BXLDDWZOTGGNOJ-SZMVWBNQSA-N Arg-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N BXLDDWZOTGGNOJ-SZMVWBNQSA-N 0.000 description 1
- CNBIWSCSSCAINS-UFYCRDLUSA-N Arg-Tyr-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNBIWSCSSCAINS-UFYCRDLUSA-N 0.000 description 1
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- CUQUEHYSSFETRD-ACZMJKKPSA-N Asn-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N CUQUEHYSSFETRD-ACZMJKKPSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- PBSQFBAJKPLRJY-BYULHYEWSA-N Asn-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N PBSQFBAJKPLRJY-BYULHYEWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- KSGAFDTYQPKUAP-GMOBBJLQSA-N Asn-Met-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KSGAFDTYQPKUAP-GMOBBJLQSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- WUQXMTITJLFXAU-JIOCBJNQSA-N Asn-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N)O WUQXMTITJLFXAU-JIOCBJNQSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- DATSKXOXPUAOLK-KKUMJFAQSA-N Asn-Tyr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DATSKXOXPUAOLK-KKUMJFAQSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 1
- QXNGSPZMGFEZNO-QRTARXTBSA-N Asn-Val-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QXNGSPZMGFEZNO-QRTARXTBSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 1
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 1
- WLKVEEODTPQPLI-ACZMJKKPSA-N Asp-Gln-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O WLKVEEODTPQPLI-ACZMJKKPSA-N 0.000 description 1
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 1
- SPKRHJOVRVDJGG-CIUDSAMLSA-N Asp-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SPKRHJOVRVDJGG-CIUDSAMLSA-N 0.000 description 1
- CSEJMKNZDCJYGJ-XHNCKOQMSA-N Asp-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O CSEJMKNZDCJYGJ-XHNCKOQMSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 1
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 1
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- ODNWIBOCFGMRTP-SRVKXCTJSA-N Asp-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CN=CN1 ODNWIBOCFGMRTP-SRVKXCTJSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- XLILXFRAKOYEJX-GUBZILKMSA-N Asp-Leu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLILXFRAKOYEJX-GUBZILKMSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- NZWDWXSWUQCNMG-GARJFASQSA-N Asp-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N)C(=O)O NZWDWXSWUQCNMG-GARJFASQSA-N 0.000 description 1
- SAKCBXNPWDRWPE-BQBZGAKWSA-N Asp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)O)N SAKCBXNPWDRWPE-BQBZGAKWSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- PDIYGFYAMZZFCW-JIOCBJNQSA-N Asp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N)O PDIYGFYAMZZFCW-JIOCBJNQSA-N 0.000 description 1
- 108010070255 Aspartate-ammonia ligase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241001184073 Basilicum Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000167854 Bourreria succulenta Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 101100394003 Butyrivibrio fibrisolvens end1 gene Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 101150032921 C3H gene Proteins 0.000 description 1
- 101100380241 Caenorhabditis elegans arx-2 gene Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 101710089812 Caffeoyl-CoA O-methyltransferase 2 Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000769888 Canephora <angiosperm> Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108020002739 Catechol O-methyltransferase Proteins 0.000 description 1
- 102100040999 Catechol O-methyltransferase Human genes 0.000 description 1
- 241000238366 Cephalopoda Species 0.000 description 1
- 241001157784 Cercospora nicotianae Species 0.000 description 1
- 241000178548 Cerianthus Species 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 108010061190 Cinnamyl-alcohol dehydrogenase Proteins 0.000 description 1
- 241001572168 Coffea abeokutae Species 0.000 description 1
- 241001572165 Coffea benghalensis Species 0.000 description 1
- 241000228000 Coffea congensis Species 0.000 description 1
- 241000228025 Coffea eugenioides Species 0.000 description 1
- 241000415345 Coffea heterocalyx Species 0.000 description 1
- 241000228030 Coffea kapakata Species 0.000 description 1
- 241001572169 Coffea khasiana Species 0.000 description 1
- 241000228048 Coffea salvatrix Species 0.000 description 1
- 241000228050 Coffea stenophylla Species 0.000 description 1
- 241001572166 Coffea zanguebariae Species 0.000 description 1
- 241000407098 Colletotrichum coffeanum Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- 244000262301 Crotalaria wightiana Species 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241001440267 Cyclodes Species 0.000 description 1
- RGTVXXNMOGHRAY-WDSKDSINSA-N Cys-Arg Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RGTVXXNMOGHRAY-WDSKDSINSA-N 0.000 description 1
- GMXSSZUVDNPRMA-FXQIFTODSA-N Cys-Arg-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GMXSSZUVDNPRMA-FXQIFTODSA-N 0.000 description 1
- IIGHQOPGMGKDMT-SRVKXCTJSA-N Cys-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N IIGHQOPGMGKDMT-SRVKXCTJSA-N 0.000 description 1
- BUXAPSQPMALTOY-WHFBIAKZSA-N Cys-Glu Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BUXAPSQPMALTOY-WHFBIAKZSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 1
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 1
- DGQJGBDBFVGLGL-ZKWXMUAHSA-N Cys-Val-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DGQJGBDBFVGLGL-ZKWXMUAHSA-N 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 102000003849 Cytochrome P450 Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- IMXSCCDUAFEIOE-UHFFFAOYSA-N D-Octopin Natural products OC(=O)C(C)NC(C(O)=O)CCCN=C(N)N IMXSCCDUAFEIOE-UHFFFAOYSA-N 0.000 description 1
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 206010012239 Delusion Diseases 0.000 description 1
- 101100494469 Dictyostelium discoideum cadA gene Proteins 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 239000004097 EU approved flavor enhancer Substances 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 102100036816 Eukaryotic peptide chain release factor GTP-binding subunit ERF3A Human genes 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 101000906005 Fasciola hepatica Glutathione S-transferase class-mu 26 kDa isozyme 1 Proteins 0.000 description 1
- 206010017533 Fungal infection Diseases 0.000 description 1
- 108700042658 GAP-43 Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- DQPOBSRQNWOBNA-GUBZILKMSA-N Gln-His-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O DQPOBSRQNWOBNA-GUBZILKMSA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 1
- UTOQQOMEJDPDMX-ACZMJKKPSA-N Gln-Ser-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O UTOQQOMEJDPDMX-ACZMJKKPSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- DUGYCMAIAKAQPB-GLLZPBPUSA-N Gln-Thr-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DUGYCMAIAKAQPB-GLLZPBPUSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- OACQOWPRWGNKTP-AVGNSLFASA-N Gln-Tyr-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O OACQOWPRWGNKTP-AVGNSLFASA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 1
- LSTFYPOGBGFIPP-FXQIFTODSA-N Glu-Cys-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O LSTFYPOGBGFIPP-FXQIFTODSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- LKOAAMXDJGEYMS-ZPFDUUQYSA-N Glu-Met-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKOAAMXDJGEYMS-ZPFDUUQYSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- YBTCBQBIJKGSJP-BQBZGAKWSA-N Glu-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O YBTCBQBIJKGSJP-BQBZGAKWSA-N 0.000 description 1
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- BDISFWMLMNBTGP-NUMRIWBASA-N Glu-Thr-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O BDISFWMLMNBTGP-NUMRIWBASA-N 0.000 description 1
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102100036263 Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Human genes 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 1
- 101150088008 HCT gene Proteins 0.000 description 1
- 241001181532 Hemileia vastatrix Species 0.000 description 1
- NIKBMHGRNAPJFW-IUCAKERBSA-N His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 NIKBMHGRNAPJFW-IUCAKERBSA-N 0.000 description 1
- AAXMRLWFJFDYQO-GUBZILKMSA-N His-Asp-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O AAXMRLWFJFDYQO-GUBZILKMSA-N 0.000 description 1
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 1
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 1
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 1
- NDKSHNQINMRKHT-PEXQALLHSA-N His-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N NDKSHNQINMRKHT-PEXQALLHSA-N 0.000 description 1
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- YYOCMTFVGKDNQP-IHRRRGAJSA-N His-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YYOCMTFVGKDNQP-IHRRRGAJSA-N 0.000 description 1
- AVQNTYBAFBKMDL-WDSOQIARSA-N His-Pro-Trp Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O AVQNTYBAFBKMDL-WDSOQIARSA-N 0.000 description 1
- DEMIXZCKUXVEBO-BWAGICSOSA-N His-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O DEMIXZCKUXVEBO-BWAGICSOSA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- GYXDQXPCPASCNR-NHCYSSNCSA-N His-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N GYXDQXPCPASCNR-NHCYSSNCSA-N 0.000 description 1
- 108091006054 His-tagged proteins Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000716179 Homo sapiens 60S ribosomal protein L39 Proteins 0.000 description 1
- 101000851788 Homo sapiens Eukaryotic peptide chain release factor GTP-binding subunit ERF3A Proteins 0.000 description 1
- 101001001786 Homo sapiens Glutamyl-tRNA(Gln) amidotransferase subunit C, mitochondrial Proteins 0.000 description 1
- 101001071694 Homo sapiens Glutathione S-transferase Mu 1 Proteins 0.000 description 1
- 241001299819 Hordeum vulgare subsp. spontaneum Species 0.000 description 1
- 101710194716 Hydroxycinnamoyltransferase Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 1
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- XLDYDEDTGMHUCZ-GHCJXIJMSA-N Ile-Asp-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N XLDYDEDTGMHUCZ-GHCJXIJMSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- HGNUKGZQASSBKQ-PCBIJLKTSA-N Ile-Asp-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HGNUKGZQASSBKQ-PCBIJLKTSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- HTDRTKMNJRRYOJ-SIUGBPQLSA-N Ile-Gln-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HTDRTKMNJRRYOJ-SIUGBPQLSA-N 0.000 description 1
- QRTVJGKXFSYJGW-KBIXCLLPSA-N Ile-Glu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N QRTVJGKXFSYJGW-KBIXCLLPSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- TVSPLSZTKTUYLV-ZPFDUUQYSA-N Ile-Glu-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O TVSPLSZTKTUYLV-ZPFDUUQYSA-N 0.000 description 1
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- VUEXLJFLDONGKQ-PYJNHQTQSA-N Ile-His-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N VUEXLJFLDONGKQ-PYJNHQTQSA-N 0.000 description 1
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 1
- BCVIOZZGJNOEQS-XKNYDFJKSA-N Ile-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)[C@@H](C)CC BCVIOZZGJNOEQS-XKNYDFJKSA-N 0.000 description 1
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- WVUDHMBJNBWZBU-XUXIUFHCSA-N Ile-Lys-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N WVUDHMBJNBWZBU-XUXIUFHCSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- WMDZARSFSMZOQO-DRZSPHRISA-N Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WMDZARSFSMZOQO-DRZSPHRISA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 1
- RENBRDSDKPSRIH-HJWJTTGWSA-N Ile-Phe-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O RENBRDSDKPSRIH-HJWJTTGWSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 1
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 1
- JTBFQNHKNRZJDS-SYWGBEHUSA-N Ile-Trp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C)C(=O)O)N JTBFQNHKNRZJDS-SYWGBEHUSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- MITYXXNZSZLHGG-OBAATPRFSA-N Ile-Trp-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N MITYXXNZSZLHGG-OBAATPRFSA-N 0.000 description 1
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 1
- REXAUQBGSGDEJY-IGISWZIWSA-N Ile-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N REXAUQBGSGDEJY-IGISWZIWSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 235000021506 Ipomoea Nutrition 0.000 description 1
- 241000207783 Ipomoea Species 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- UFCLZKMFXSILNL-PSEXTPKNSA-N Isochlorogenic acid b Chemical compound O([C@@H]1C[C@@](O)(C[C@H]([C@H]1OC(=O)\C=C\C=1C=C(O)C(O)=CC=1)O)C(O)=O)C(=O)\C=C\C1=CC=C(O)C(O)=C1 UFCLZKMFXSILNL-PSEXTPKNSA-N 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- RRHGJUQNOFWUDK-UHFFFAOYSA-N Isoprene Chemical class CC(=C)C=C RRHGJUQNOFWUDK-UHFFFAOYSA-N 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 1
- HPBCTWSUJOGJSH-MNXVOIDGSA-N Leu-Glu-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HPBCTWSUJOGJSH-MNXVOIDGSA-N 0.000 description 1
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- LSLUTXRANSUGFY-XIRDDKMYSA-N Leu-Trp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O LSLUTXRANSUGFY-XIRDDKMYSA-N 0.000 description 1
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- JEVVKJMRZMXFBT-XWDZUXABSA-N Lycophyll Natural products OC/C(=C/CC/C(=C\C=C\C(=C/C=C/C(=C\C=C\C=C(/C=C/C=C(\C=C\C=C(/CC/C=C(/CO)\C)\C)/C)\C)/C)\C)/C)/C JEVVKJMRZMXFBT-XWDZUXABSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- HIIZIQUUHIXUJY-GUBZILKMSA-N Lys-Asp-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HIIZIQUUHIXUJY-GUBZILKMSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- IGRMTQMIDNDFAA-UWVGGRQHSA-N Lys-His Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IGRMTQMIDNDFAA-UWVGGRQHSA-N 0.000 description 1
- SQJSXOQXJYAVRV-SRVKXCTJSA-N Lys-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N SQJSXOQXJYAVRV-SRVKXCTJSA-N 0.000 description 1
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 1
- KKFVKBWCXXLKIK-AVGNSLFASA-N Lys-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCCN)N KKFVKBWCXXLKIK-AVGNSLFASA-N 0.000 description 1
- VLMNBMFYRMGEMB-QWRGUYRKSA-N Lys-His-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CNC=N1 VLMNBMFYRMGEMB-QWRGUYRKSA-N 0.000 description 1
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 1
- CBNMHRCLYBJIIZ-XUXIUFHCSA-N Lys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N CBNMHRCLYBJIIZ-XUXIUFHCSA-N 0.000 description 1
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- XBZOQGHZGQLEQO-IUCAKERBSA-N Lys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN XBZOQGHZGQLEQO-IUCAKERBSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 244000246386 Mentha pulegium Species 0.000 description 1
- 235000016257 Mentha pulegium Nutrition 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- OLWAOWXIADGIJG-AVGNSLFASA-N Met-Arg-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(O)=O OLWAOWXIADGIJG-AVGNSLFASA-N 0.000 description 1
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 1
- ZMYHJISLFYTQGK-FXQIFTODSA-N Met-Asp-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMYHJISLFYTQGK-FXQIFTODSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- CRGKLOXHKICQOL-GARJFASQSA-N Met-Gln-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N CRGKLOXHKICQOL-GARJFASQSA-N 0.000 description 1
- CHQWUYSNAOABIP-ZPFDUUQYSA-N Met-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCSC)N CHQWUYSNAOABIP-ZPFDUUQYSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- HWROAFGWPQUPTE-OSUNSFLBSA-N Met-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCSC)N HWROAFGWPQUPTE-OSUNSFLBSA-N 0.000 description 1
- OSZTUONKUMCWEP-XUXIUFHCSA-N Met-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC OSZTUONKUMCWEP-XUXIUFHCSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 1
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 1
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 1
- MNGBICITWAPGAS-BPUTZDHNSA-N Met-Ser-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MNGBICITWAPGAS-BPUTZDHNSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108700005084 Multigene Family Proteins 0.000 description 1
- 101000574441 Mus musculus Alkaline phosphatase, germ cell type Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- 229930192296 Myomycin Natural products 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 241001460678 Napo <wasp> Species 0.000 description 1
- 101000760731 Nicotiana tabacum Caffeoyl-CoA O-methyltransferase 3 Proteins 0.000 description 1
- 101000760741 Nicotiana tabacum Caffeoyl-CoA O-methyltransferase 4 Proteins 0.000 description 1
- 101000760746 Nicotiana tabacum Caffeoyl-CoA O-methyltransferase 5 Proteins 0.000 description 1
- 101000760744 Nicotiana tabacum Caffeoyl-CoA O-methyltransferase 6 Proteins 0.000 description 1
- 101100285916 Nicotiana tabacum HST gene Proteins 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101710089395 Oleosin Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 description 1
- 101150072055 PAL1 gene Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 101150102573 PCR1 gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000002193 Pain Diseases 0.000 description 1
- 101150009729 Pal2 gene Proteins 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- XMPUYNHKEPFERE-IHRRRGAJSA-N Phe-Asp-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 XMPUYNHKEPFERE-IHRRRGAJSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 1
- KLAONOISLHWJEE-QWRGUYRKSA-N Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KLAONOISLHWJEE-QWRGUYRKSA-N 0.000 description 1
- KOUUGTKGEQZRHV-KKUMJFAQSA-N Phe-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KOUUGTKGEQZRHV-KKUMJFAQSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 1
- OHUXOEXBXPZKPT-STQMWFEESA-N Phe-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=CC=C1 OHUXOEXBXPZKPT-STQMWFEESA-N 0.000 description 1
- NAOVYENZCWFBDG-BZSNNMDCSA-N Phe-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 NAOVYENZCWFBDG-BZSNNMDCSA-N 0.000 description 1
- BEEVXUYVEHXWRQ-YESZJQIVSA-N Phe-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CC=CC=C3)N)C(=O)O BEEVXUYVEHXWRQ-YESZJQIVSA-N 0.000 description 1
- BVHFFNYBKRTSIU-MEYUZBJRSA-N Phe-His-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BVHFFNYBKRTSIU-MEYUZBJRSA-N 0.000 description 1
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 1
- BWTKUQPNOMMKMA-FIRPJDEBSA-N Phe-Ile-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BWTKUQPNOMMKMA-FIRPJDEBSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- UXQFHEKRGHYJRA-STQMWFEESA-N Phe-Met-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O UXQFHEKRGHYJRA-STQMWFEESA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 108020005089 Plant RNA Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 1
- GRIRJQGZZJVANI-CYDGBPFRSA-N Pro-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 GRIRJQGZZJVANI-CYDGBPFRSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 1
- IWIANZLCJVYEFX-RYUDHWBXSA-N Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 IWIANZLCJVYEFX-RYUDHWBXSA-N 0.000 description 1
- GNADVDLLGVSXLS-ULQDDVLXSA-N Pro-Phe-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O GNADVDLLGVSXLS-ULQDDVLXSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- CWZUFLWPEFHWEI-IHRRRGAJSA-N Pro-Tyr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O CWZUFLWPEFHWEI-IHRRRGAJSA-N 0.000 description 1
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- 101710196435 Probable acetolactate synthase large subunit Proteins 0.000 description 1
- 101710181764 Probable acetolactate synthase small subunit Proteins 0.000 description 1
- 108700040119 Protein O-Methyltransferase Proteins 0.000 description 1
- 101000736922 Prunus dulcis Prunin 1 Pru du 6 Proteins 0.000 description 1
- 101000736893 Prunus dulcis Prunin 1 Pru du 6.0101 Proteins 0.000 description 1
- 241000589615 Pseudomonas syringae Species 0.000 description 1
- 241000287531 Psittacidae Species 0.000 description 1
- 101710104000 Putative acetolactate synthase small subunit Proteins 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 101150051586 RIM21 gene Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 230000002292 Radical scavenging effect Effects 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 1
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 1
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 101100393821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GSP2 gene Proteins 0.000 description 1
- 101100192827 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PXA1 gene Proteins 0.000 description 1
- 101100178218 Schizosaccharomyces pombe (strain 972 / ATCC 24843) hmt2 gene Proteins 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- LTFSLKWFMWZEBD-IMJSIDKUSA-N Ser-Asn Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O LTFSLKWFMWZEBD-IMJSIDKUSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- NIOYDASGXWLHEZ-CIUDSAMLSA-N Ser-Met-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOYDASGXWLHEZ-CIUDSAMLSA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- OUUQCZGPVNCOIJ-UHFFFAOYSA-M Superoxide Chemical compound [O-][O] OUUQCZGPVNCOIJ-UHFFFAOYSA-M 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 102000002933 Thioredoxin Human genes 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- NRBUKAHTWRCUEQ-XGEHTFHBSA-N Thr-Cys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(O)=O NRBUKAHTWRCUEQ-XGEHTFHBSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 1
- UDNVOQMPQBEITB-MEYUZBJRSA-N Thr-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UDNVOQMPQBEITB-MEYUZBJRSA-N 0.000 description 1
- LUMXICQAOKVQOB-YWIQKCBGSA-N Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O LUMXICQAOKVQOB-YWIQKCBGSA-N 0.000 description 1
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- YKRQRPFODDJQTC-CSMHCCOUSA-N Thr-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN YKRQRPFODDJQTC-CSMHCCOUSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 1
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- KZTLZZQTJMCGIP-ZJDVBMNYSA-N Thr-Val-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KZTLZZQTJMCGIP-ZJDVBMNYSA-N 0.000 description 1
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- WFZYXGSAPWKTHR-XEGUGMAKSA-N Trp-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WFZYXGSAPWKTHR-XEGUGMAKSA-N 0.000 description 1
- LCPVBXOHXMBLFW-JSGCOSHPSA-N Trp-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)=CNC2=C1 LCPVBXOHXMBLFW-JSGCOSHPSA-N 0.000 description 1
- GRQCSEWEPIHLBI-JQWIXIFHSA-N Trp-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-JQWIXIFHSA-N 0.000 description 1
- KIMOCKLJBXHFIN-YLVFBTJISA-N Trp-Ile-Gly Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O)=CNC2=C1 KIMOCKLJBXHFIN-YLVFBTJISA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- KRCPXGSWDOGHAM-XIRDDKMYSA-N Trp-Lys-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O KRCPXGSWDOGHAM-XIRDDKMYSA-N 0.000 description 1
- BOMYCJXTWRMKJA-RNXOBYDBSA-N Trp-Phe-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N BOMYCJXTWRMKJA-RNXOBYDBSA-N 0.000 description 1
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- NLKUJNGEGZDXGO-XVKPBYJWSA-N Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLKUJNGEGZDXGO-XVKPBYJWSA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 1
- DANHCMVVXDXOHN-SRVKXCTJSA-N Tyr-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DANHCMVVXDXOHN-SRVKXCTJSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- WPVGRKLNHJJCEN-BZSNNMDCSA-N Tyr-Asp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WPVGRKLNHJJCEN-BZSNNMDCSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 1
- NZFCWALTLNFHHC-JYJNAYRXSA-N Tyr-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NZFCWALTLNFHHC-JYJNAYRXSA-N 0.000 description 1
- OSMTVLSRTQDWHJ-JBACZVJFSA-N Tyr-Glu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=C(O)C=C1 OSMTVLSRTQDWHJ-JBACZVJFSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- ADECJAKCRKPSOR-ULQDDVLXSA-N Tyr-His-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ADECJAKCRKPSOR-ULQDDVLXSA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 1
- HVPPEXXUDXAPOM-MGHWNKPDSA-N Tyr-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HVPPEXXUDXAPOM-MGHWNKPDSA-N 0.000 description 1
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 1
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 1
- NKMFRGPKTIEXSK-ULQDDVLXSA-N Tyr-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NKMFRGPKTIEXSK-ULQDDVLXSA-N 0.000 description 1
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 1
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 1
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 1
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 1
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 1
- WKWJJQZZZBBWKV-JYJNAYRXSA-N Val-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WKWJJQZZZBBWKV-JYJNAYRXSA-N 0.000 description 1
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- WPSXZFTVLIAPCN-WDSKDSINSA-N Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(O)=O WPSXZFTVLIAPCN-WDSKDSINSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- DLYOEFGPYTZVSP-AEJSXWLSSA-N Val-Cys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N DLYOEFGPYTZVSP-AEJSXWLSSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- PMXBARDFIAPBGK-DZKIICNBSA-N Val-Glu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PMXBARDFIAPBGK-DZKIICNBSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 1
- RHYOAUJXSRWVJT-GVXVVHGQSA-N Val-His-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RHYOAUJXSRWVJT-GVXVVHGQSA-N 0.000 description 1
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- LZRWTJSPTJSWDN-FKBYEOEOSA-N Val-Trp-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LZRWTJSPTJSWDN-FKBYEOEOSA-N 0.000 description 1
- OEVFFOBAXHBXKM-HSHDSVGOSA-N Val-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N)O OEVFFOBAXHBXKM-HSHDSVGOSA-N 0.000 description 1
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- FPIPGXGPPPQFEQ-BOOMUCAASA-N Vitamin A Natural products OC/C=C(/C)\C=C\C=C(\C)/C=C/C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-BOOMUCAASA-N 0.000 description 1
- 101000984136 Vitis vinifera Caffeoyl-CoA O-methyltransferase Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- ZTOJFFHGPLIVKC-CLFAGFIQSA-N abts Chemical compound S/1C2=CC(S(O)(=O)=O)=CC=C2N(CC)C\1=N\N=C1/SC2=CC(S(O)(=O)=O)=CC=C2N1CC ZTOJFFHGPLIVKC-CLFAGFIQSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 101150092805 actc1 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 108700014220 acyltransferase activity proteins Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 description 1
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 description 1
- OOCCDEMITAIZTP-UHFFFAOYSA-N allylic benzylic alcohol Natural products OCC=CC1=CC=CC=C1 OOCCDEMITAIZTP-UHFFFAOYSA-N 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 1
- 235000010208 anthocyanin Nutrition 0.000 description 1
- 239000004410 anthocyanin Substances 0.000 description 1
- 229930002877 anthocyanin Natural products 0.000 description 1
- 150000004636 anthocyanins Chemical class 0.000 description 1
- 230000003217 anti-cancerogenic effect Effects 0.000 description 1
- 230000002790 anti-mutagenic effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 230000010516 arginylation Effects 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000013734 beta-carotene Nutrition 0.000 description 1
- 239000011648 beta-carotene Substances 0.000 description 1
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 229960002747 betacarotene Drugs 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 235000019658 bitter taste Nutrition 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 101150018983 cad1 gene Proteins 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 230000036996 cardiovascular health Effects 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 108010040093 cellulose synthase Proteins 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 230000001767 chemoprotection Effects 0.000 description 1
- 230000000973 chemotherapeutic effect Effects 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 229930002868 chlorophyll a Natural products 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 229930002869 chlorophyll b Natural products 0.000 description 1
- NSMUHPMZFPKNMZ-VBYMZDBQSA-M chlorophyll b Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C=O)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 NSMUHPMZFPKNMZ-VBYMZDBQSA-M 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- GYFFKZTYYAFCTR-LMRQPLJMSA-N cryptochlorogenic acid Natural products O[C@H]1C[C@@](O)(C[C@H](O)[C@H]1OC(=O)C=Cc2ccc(O)c(O)c2)C(=O)O GYFFKZTYYAFCTR-LMRQPLJMSA-N 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 229960003067 cystine Drugs 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 238000005202 decontamination Methods 0.000 description 1
- 230000003588 decontaminative effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000018823 dietary intake Nutrition 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 244000013123 dwarf bean Species 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000021759 endosperm development Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- PHTXVQQRWJXYPP-UHFFFAOYSA-N ethyltrifluoromethylaminoindane Chemical compound C1=C(C(F)(F)F)C=C2CC(NCC)CC2=C1 PHTXVQQRWJXYPP-UHFFFAOYSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 229930003935 flavonoid Natural products 0.000 description 1
- 150000002215 flavonoids Chemical class 0.000 description 1
- 235000017173 flavonoids Nutrition 0.000 description 1
- 230000008124 floral development Effects 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 235000019264 food flavour enhancer Nutrition 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 230000037440 gene silencing effect Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 101150054900 gus gene Proteins 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 230000007407 health benefit Effects 0.000 description 1
- 230000008821 health effect Effects 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 108010009253 histidyl-asparaginyl-glutamyl-leucine Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 235000001050 hortel pimenta Nutrition 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000000640 hydroxylating effect Effects 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011419 induction treatment Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 229960004999 lycopene Drugs 0.000 description 1
- 235000012661 lycopene Nutrition 0.000 description 1
- 239000001751 lycopene Substances 0.000 description 1
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011785 micronutrient Substances 0.000 description 1
- 235000013369 micronutrients Nutrition 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- ZAHQPTJLOCWVPG-UHFFFAOYSA-N mitoxantrone dihydrochloride Chemical compound Cl.Cl.O=C1C2=C(O)C=CC(O)=C2C(=O)C2=C1C(NCCNCCO)=CC=C2NCCNCCO ZAHQPTJLOCWVPG-UHFFFAOYSA-N 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- FWIWJTXEUZDJRI-WVLIOWMCSA-N myomycin Chemical compound NC(=O)O[C@H]1[C@@H](OC(=O)CC(N)CCCNC(=O)CC(N)CCCN)[C@@H](OC(N)=O)[C@H](O)[C@@H](O)[C@@H]1O[C@@H]1[C@@H](O)[C@@H](N=C(N)N)[C@H](O)[C@@H](CO)O1 FWIWJTXEUZDJRI-WVLIOWMCSA-N 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 101150077062 pal gene Proteins 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 210000003516 pericardium Anatomy 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol group Chemical group C1(=CC=CC=C1)O ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 125000001474 phenylpropanoid group Chemical group 0.000 description 1
- 229930015698 phenylpropene Natural products 0.000 description 1
- QROGIFZRVHSFLM-UHFFFAOYSA-N phenylpropene group Chemical class C1(=CC=CC=C1)C=CC QROGIFZRVHSFLM-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical group [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000021715 photosynthesis, light harvesting Effects 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 235000017807 phytochemicals Nutrition 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 229930000223 plant secondary metabolite Natural products 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 229940043131 pyroglutamate Drugs 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 150000005839 radical cations Chemical class 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000024053 secondary metabolic process Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000013606 secretion vector Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 239000012899 standard injection Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 150000003505 terpenes Chemical class 0.000 description 1
- 235000007586 terpenes Nutrition 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- ZCIHMQAPACOQHT-ZGMPDRQDSA-N trans-isorenieratene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/c1c(C)ccc(C)c1C)C=CC=C(/C)C=Cc2c(C)ccc(C)c2C ZCIHMQAPACOQHT-ZGMPDRQDSA-N 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 108010029599 tyrosyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 235000019155 vitamin A Nutrition 0.000 description 1
- 239000011719 vitamin A Substances 0.000 description 1
- 229940045997 vitamin a Drugs 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Nutrition Science (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Tea And Coffee (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
MOLéCULA DE áCIDO NUCLéICO ISOLADA DO CAFé (COFFEA SPP), MOLéCULAS DE mRNA E cDNA, OLIGONUCLEOTìDEO, VETOR, CéLULA HOSPEDEIRA, PLANTA FéRTIL E MéTODO DE MODULAR SABOR OU AROMA DE GRãOS DE CAFé. A presente invenção refere-se a polinucleotídeos e polipeptídeos envolvidos na via biossintética de ácidos clorogónicos na planta de café são revelados. Também revelados são métodos para usar estes polinucleotídeos e polipeptídeos para a manipulação de sabor, aroma, e outras características de feijões de café, como também para a proteção de plantas de café contra doenças ou tensão oxidativa.
Description
Relatório Descritivo da Patente de Invenção para "MOLÉCULADE ÁCIDO NUCLÉICO ISOLADA DO CAFÉ (COFFEA SPP), MOLÉCULASDE mRNA E cDNA, OLIGONUCLEOTÍDEO, VETOR, CÉLULA HOSPE-DEIRA, PLANTA FÉRTIL E MÉTODO DE MODULAR SABOR OU AROMADE GRÃOS DE CAFÉ".
Campo da Invenção
A presente invenção refere-se ao campo de biotecnologia agrí-cola. Em particular, a invenção caracteriza polinucleotídeos de plantas decafé que codificam enzimas envolvidas na via de fenilpropanóide, conduzin-do à síntese de ácido clorogênico, como também métodos para usar estespolinucleotídeos para regulação de gene e manipulação de sabor, aroma eoutras características dos feijões de café, e na proteção do pé de café dedoença e tensão oxidativa.
Antecedentes da Invenção
Várias publicações, incluindo patentes, pedidos de patente pu-blicados e artigos escolares, são citados ao longo do relatório descritivo. Ca-da uma destas publicações é aqui incorporada por referência, em sua totali-dade. Citações não completamente expostas dentro do relatório descritivopodem ser encontradas no término do relatório descritivo.
Aroma e sabor de café são componentes fundamentais na pre-ferência de consumidor para variedades e marcas de café. Caules de aromae sabor característicos de café de uma série complexa de reações químicasque envolvem precursores de sabor (reações de Maillard) que ocorrem du-rante a torrefação do feijão. Precursores de sabor incluem compostos quími-cos e biomoléculas presentes no feijão de café verde. Até agora, mais de800 químicas e biomoléculas foram identificadas como contribuindo para osabor e aroma do café (Flament, I. 2002 Coffee Flavor Chemistry J. Wiley, U.K.).
Porque os consumidores de café estão ficando cada vez maissofisticados, é desejável produzir café com aroma e sabor melhorados parasatisfazer as preferências do consumidor. Tanto aroma como sabor podemser artificialmente conferidos em produtos de café através de meios quími-cos. Vide, por exemplo, Patente U. S. N9 4.072.761 (aroma) e Patente U. S.Nq 3.962.321 (sabor). Porém, até agora, há pouca informação com relação àinfluência dos componentes do grão de café natural como polissacarídeos,proteínas, pigmentos, e lipídios. Em aroma e sabor de café. Um método é selecionar variedades do germplasma existente tendo características de sa-bor superiores. Uma desvantagem para este método é que, freqüentemente,as variedades de qualidade mais alta também possuem traços agronômicosnegativos significativos, como rendimento fraco e resistência baixa a doen-ças e tensões ambientais. É também possível selecionar variedades novasde ensaios de criação em que variedades com traços industriais e agronômi-cos diferentes são cruzadas e sua progênie é triada para qualidade alta edesempenho agronômico bom. Porém, este último método é muito duradou-ro, com um experimento de cruzamento e seleção em três estações de cres-cimento tomando um mínimo de 7-8 anos. Desse modo, um método alterna- tivo para intensificar a qualidade do café seria usar técnicas de biologia mo-lecular para intensificar aqueles elementos responsáveis pelo sabor e aromaque são encontrados naturalmente no feijão de café, ou adicionar elementosintensificadores de aroma e sabor que não ocorrem naturalmente nos feijõesde café. Engenharia genética é particularmente adaptada para alcançar es- tes fins. Por exemplo, proteínas de café de espécies de café diferentes po-dem ser trocadas. Na alternativa, a expressão de genes que codifica proteí-nas de café de ocorrência natural que positivamente contribuem para o sa-bor do café pode ser intensificada. Inversamente, a expressão de genes quecodifica proteínas de café de ocorrência natural que negativamente contribu- em para o sabor do café pode ser suprimida.
Cafés de variedades e origens diferentes exibem variações dequalidade de sabor e aroma significativos e quando as amostras de grãosverdes são assadas e processadas da mesma maneira. As diferenças dequalidade são uma manifestação nas variações químicas e físicas dentro das amostras de grãos que resultam principalmente das diferenças das con-dições de crescimento e processamento, e também das diferenças no fundogenético tanto da planta materna como do grão. No nível de composiçãoquímica, pelo menos parte da qualidade do sabor pode ser associada àsvariações nos níveis de metabólitos pequenos, como açúcares, ácidos, fenó-licos, e cafeína encontrados associados ao grão de variedades diferentes. Éaceito que haja outras moléculas de sabor e precursor de sabor menos ca-racterizado. Além disso, é provável que variações estruturais dentro do grãotambém contribuam para as diferenças na qualidade do café. Um métodopara encontrar novos componentes no grão de café ligados à qualidade docafé é estudar os genes e proteínas diferencialmente expressos durante amaturação das amostras de grãos em variedades diferentes que possuemcaracterísticas de qualidade diferentes. Similarmente, genes e proteínas queparticipam na biossíntese de moléculas de sabor e de precursor de saborpodem ser estudados.
Ácidos clorogênicos são exemplos de moléculas de sabor e deprecursor de sabor candidatos. Ácidos clorogênicos (CGA) é um grupo im-portante de compostos não-voláteis encontrados em grão de café verde.CGA são compostos de uma família de ésteres entre certos ácidos trans-cinâmicos (caféicos e ferúlicos) e ácido quínico (Clifford et al., 2000). No fei-jão de café, a maioria do CGA pode ser categorizada como pertencendo auma das três classificações: ácidos cafeoilquínicos (CQA; 3-CQA, 4-CQA, e5-CQA); ácidos dicafeoilquínicos (diCQA; 3,4-diCQA, 3,5-diCQA, e 4,5-diCQA); e ácidos feruloilquínicos (FQA). No grão de café verde maduro, osníveis de CGA são variáveis, variando de aproximadamente 7,88% a 14,4%em uma base de substância seca (DMB) para Coffea canephora (robusta), eaproximadamente 3,4% a 4,8% em uma DMB para Coffea arabica (Ky et al.,2001). Clifford sugeriu que o teor de CGA em Coffea canephora varia de 7%a 10% em uma DMB enquanto que Coffea arabica varia de 5 a 7,5% emuma DMB. (Clifford et al., 1985). Em C. canephora, CQA é estimado com-preender 67% do teor de CGA total, e diCQA compreende aproximadamente20%, e FQA compreende aproximadamente 13%. Em C. arabica, CQA,diCQA e FQA corresponderam em média a 80, 15, e 5% do teor de CGAtotal, respectivamente (Ky et al., 2001).
Muito é conhecido a cerca da via de fenilpropanóide prematuraque conduz à síntese de CGA em plantas. (Dixon, R., e Paiva1 N., 1995Plant Cell 7, 1085-1097; Douglas, C.J. 1996 Trends Plant Sci., 1 171-178).
Uma visão geral desta via biossintética é resumida graficamente na Figura 1(Hoffmann et al. 2004). A primeira etapa envolve a conversão de fenilalaninaem ácido cinâmico através de amônia de fenilalanina Iiase (PAL). Quatrogenes de PAL diferentes Foram caracterizados em Arabidopsis, e aquelesgenes parecem entrar em dois grupos diferentes (Raes, J et al. 2003, PlantPhysiology 133, 1051-1071). A expressão e atividades das isoformas de PALdiferentes representam um ponto de ramificação principal entre metabolismoprimário e secundário em plantas, e como tal, as isoformas de PAL diferen-tes estão sob controle regulador complexo. (Dixon, R., e Paiva, N., 1995Plant Cell 7, 1085-1097; Rohde, A., et al. 2004 Plant Cell, 16 p2749-2771). Apróxima enzima na via é trans-cinamato-4-hidroxilase (C4H) (número de a-cesso BAA24355; CYP73A5 Arabidopsis thaliana) que converte ácido cinâ-mico em ácido p-cumárico. Até agora, apenas um gene foi encontrado paraesta monooxigenase dependente de P450 em Arabidopsis, enquanto queem algumas outras plantas, dois ou mais genes de C4H foram encontradosque entram em duas classes distintas (Reas et al., 2003). A próxima etapana via é realizada através de 4-cumarato:Co Iigase (4CL). Pelo menos qua-tro genes de 4CL e nove genes semelhantes a 4CL foram identificados nogenoma de Arabidopsis (Raes et al. 2003). 4CL forma ésteres entre os CoAe compostos fenólicos como ácido p-cumárico, ácido caféico, ácido ferúlico,ácido 5-hidroxiferúlico, e ácido sinápico (Hu et al. 1998).
Embora as enzimas envolvidas com a parte prematura da via defenilpropanóide fossem conhecidas por vários anos, as acil transferases ne-cessárias para a próxima etapa, hidroxicinamoil-CoA transferase (HCT) (ta-baco) e hidroxicinamoil-CoA: quinato hidroxicinamoil transferase (HQT) (detomate e tabaco) foram purificadas apenas recentemente, e suas seqüênciasde DNA correspondentes clonadas e estudadas (Hoffmann et al. 2003 J. BiolChem 278, 95-103; Niggeweg et al. 2004 Nature Biotechnology, 22, 746-754). Estas enzimas catalisam formação de éster entre p-cumaroil-CoA oucafeoil-CoA e chiquimato ou quinato para gerar CGA. HCT foi também mos-5trado catalisar a reação reversa, isto é, degradação de CGA (Hoffmann etai., 2003). Apenas um gene que codifica uma enzima para esta etapa, umHCT, foi identificada em Arabidopsis (Raes, et al. 2003). A próxima etapa davia de fenilpropanóide, a hidroxilação da posição 3 de cumarato, foi elucida- da apenas recentemente. Schoch et al. descobriram que uma proteína deP450 de Arabidopsis (CYP98A3) foi capaz de hidroxilar a posição 3 de cu-marato, mas apenas quando foi estereficada com chiquimato ou quinato.(2001 J. Biol Chem 276, 36566-36574). Três genes que codificam esta en-zima, que é chamada p-cumarato 3-hidroxilase (C3H), foram identificados no genoma de Arabidopsis. Porém, Raes et al. (2003) descobriu que apenasum destes genes (C3H1) é expressado em todos os tecidos examinados,enquanto que os outros dois genes são expressados apenas em um númerolimitado de tecidos e em tempos particulares durante o desenvolvimento.
O modelo atual da via de fenilpropanóide (Figura 1) sugere que as atividades diretas e reversas de HCT/HQT representem um papel na mo-dulação dos níveis de precursor de lignina, e desse modo influencia as quan-tidades e tipos de lignina sendo formada nas plantas. Após a hidroxilaçãomediada por C3H, cafeoil-CoA pode ser liberada de qualquer ácido quínicode cafeoil ou ácido chiquímico de cafeoil por HCT/HQT e é depois submetida à atividade de cafeoil-CoA 3-0 metitransferase (CCoAOMT) resultando naformação de feruloil CoA (Zhang e Chinnappa 1997 J. Biosci. 22, 161-175 ;Zhong et al. 1998. Plant Cell 10, 2033-2046). CCoAOMT pode também meti-lar 5-hidroxiferuloil-CoA para sinapoil-CoA (Zhong et al. 1998). Há sete ge-nes de CCoAOMT putativos em Arabidopsis, e como em outras plantas, pa- recem ser duas classes de genes de CCoAOMT (Zhong et al. 1998; Raes etal. 2003). Três classes de CCoAOMT distintas foram agora caracterizadasem tabaco (Maury et al, 1999). Genes 1 de CCoAOMT da classe incluem oúnico gene de CCoAOMT de Arabidopsis recém caracterizado, CCoAOMT-1, e a maior parte dos genes de CCoAOMT caracterizados em outras plan-tas. Os genes de CCoAOMT putativos restantes entram na classe 2 (Raes etal. 2003). CCoAOMT-1 de Arabidopsis é o gene mais altamente expresso,com expressão detectada em todos os tecidos examinados; expressão infe-rior de CCoAOMT-5 e CCoAOMT-7 de Arabidopsis pode também ser detec-tada em todos os tecidos, e expressão baixa de CCoAOMT-2, -3, -4, e -6pode ser detectada em tecidos específicos (Raes et al. 2003). Devido suaexpressão ubíqua relativamente alta, acredita-se que CCoAOMT-1 de Arabi-dopsis, e provavelmente ortólogos em outras plantas, representem um papelfundamental na lignificação que é associado ao desenvolvimento das células(Raes et al. 2003).
Inicialmente, muitos estudos da via de fenilpropanóide focaliza-ram em entender o fluxo geral de precursores para a síntese de flavonóides,antocianinas,-as formas diferentes de lignina, e como a via foi regulada. Po-rém, devido à evidência crescente que dietas ricas em antioxidantes podereduzir o risco de câncer e doença degenerativa protegendo contra tensõesoxidativas (Bazzano, L., et al. 2002; Astley, S., 2003) estudos mais recentesavaliaram metabólitos intermediários da via de fenilpropanóide que estãopresentes em níveis altos e foi descoberto possuir atividade antioxidante alta(Hoffmann et al. 2004, Niggeweg et al. 2004). Por exemplo, os ácidos cloro-gênicos constituem um grupo importante de antioxidantes em fertilizantescomo maçãs, pêras, tomate, batata, e berinjela, como também grão de caféverde e assado (feijões). Além do fato que o aporte dietético de CGA é me-Ihor alcançado mediante consumo de fertilizantes, esta classe de moléculastambém mostre biodisponibilidade significativa (Nardini et al. 2002, J. AgricFood Chem. 50, 57355741; Couteau1 et al., 2001, J. Applied Microbiol. 90,873-881; Clifford, M., 2004, Planta Med 70, 1103-1114.). O envolvimento deCGA na redução de tensões oxidativas foi demonstrado mais diretamenteem plantas. Por exemplo, Shadle et al. (2003) demonstraram que sobreex-pressão da enzima PAL em tabaco, que é responsável pela primeira etapana biossíntese de CGA, resultou em um aumento de aproximadamente cincovezes no teor de CGA com relação às plantas do tipo selvagem, e demons-trou resistência ao patógeno fúngico Cercospora nicotianae. Evidência adi-cional foi gerada por Niggeweg et al. (2004), da superprodução de HQT notomate usando um promotor constitutivo (2x promotor de 35S). Foi demons-trado que níveis mais altos de HQT, uma enzima diretamente envolvida nasíntese de CGA, resultou em níveis mais altos de CGA, resistência melhora-da à tensão oxidativa, e resistência aumentada da planta a um patógenomicrobiano. Há uma realização crescente do potencial para CGA dietéticofazer contribuições importantes ao fundo geral de antioxidante no plasma, eé possível que uma ou mais moléculas do tipo CGA poderiam ser transfor-madas em metabólitos novos ou adicionais possuindo atividades promotorasde saúde (vide, por exemplo, Clifford 2004). Além disso, é evidente que CGApode representar um papel na resistência das plantas às doenças. Dessemodo, há uma necessidade para melhor entender, como também facilitar asíntese e acumulação destes compostos nas plantas.
Ácidos clorogênicos são abundantes em café. Apesar do fatoque tais moléculas representam um papel importante na saúde das plantas ede humanos, e em sabor de café geral, aroma, e qualidade, poucos estudosanalisaram a via de fenilpropanóide de café, e dados como tais, disponíveissobre CGA em café são limitados. Campa et al. identificaram uma seqüênciade CCoAOMT putativa parcial (número de acesso AF534905) (Campa et al.,2003), e mapearam esta seqüência no genoma de café. Além disso, um dosdois alelos identificados para este gene foi descoberto ser associado ao ní-vel geral de ácidos clorogênicos. Bauman et al., isolaram duas seqüênciasde cDNA parciais que codificam de PAL de café (números de acesso A-AF27655 e AAF27654), e Campa et al., isolaram duas seqüências de cDNAque codificam PAL1 (número de acesso AAN32866) e PAL2 (número de a-cesso AAN32867) de café. Alinhamento de seqüência das regiões que so-brepõem as quatro proteínas correspondentes foi feito com Clustal W, e es-tas quatro seqüências foram descobertas estar altamente relacionadas, com94 a 99,5% de identidade prognosticado no nível de proteína, e maior que97,1% de identidade no nível de ácido nucléico. Este nível de identidade su-gere que estas quatro seqüências provavelmente representam um PAL decafé simples.
Ácidos clorogênicos são degradados progressivamente durantea torrefação de café (De Maria et al., 1995). De fato, estas alterações repre-sentam uma das alterações composicionais importantes que ocorrem duran-te este processo (Bicchi et al. 1995). Foi relatado que 8-10% do teor de CGAsão perdidos com cada 1% de perda de substância seca. (Clifford et al.1985, 1998). Durante a torrefação, CGA é transformado em uma série decompostos voláteis e não-voláteis (S. Homma, 2001). Por exemplo, isomeri-zação e hidrólise podem levar à geração de vários ácidos quínicos e quini-das, como também ácidos cinâmicos (Homma, 2001), com o último gruposendo também degradado por meio de descarboxilação em uma faixa decompostos fenólicos, incluindo compostos voláteis como 4-vinilguaiacol, queestá associado a um aroma de café típico (Homma 2001, Farah et al., 2005;e Rizzi1G., et al., 1993 "Flavor chemistry based on the thermally-induced de-carboxilação of p-hydroxycinnamic acids. In Food Flavors, Ingredients andComposition (ed. Charalambous) páginas 663-670 Elsevier Science Publi-shers, Amsterdã, Países Baixos).
Os produtos de degradação de CGA, particularmente a forma-ção de Iactonas de ácido clorogênico e Iactonas de ácido quínico, estão as-sociados à percepção de amargura em café preparado, e um aumento emacidez encontrado no café após preparo ter sido associado à geração deácidos quínicos livres (Homma, 2001, Leloup et al, 1995; e Buffo et al,2004). Mais recentemente, Muller e Hofmann descobriram que ácidos cloro-gênicos e seus produtos de degradação térmica agem como sítios de liga-ção de tiol (2005, J. Agric e Biol Chem 53, 2623-2629). Porque compostoscontendo tiol, como 2-furfuriltiol e 3-metil-2-buteno-1-tiol, são componentesimportantes de um aroma de café, foi proposto que os ácidos clorogênicos ecompostos relacionados reagem com os compostos de aroma em uma bebi-da de café, reduzindo o aroma de café eficazmente após preparo. (Muller eHofmann, 2005).
Embora esteja claro que os ácidos clorogênicos influenciam nosabor do café, ainda está obscuro se todos os ácidos clorogênicos tiveramum efeito equivalente. Portanto, há uma necessidade para gerar variedadesde café definidas com diferenças claras em seus perfis de CGA. Há duasrotas diferentes para a seleção de variedades de café com perfis diferentes.
A primeira é usar procriação e seleção clássicas, e este método pode sersignificativamente auxiliado pela informação genética acerca da via biossin-tética de CGA. Tal informação permitirá alelos dos genes fundamentais se-rem identificados e seguidos no material de procriação e progênie. O segun-do método global é diretamente alterar genes fundamentais específicos en-volvidos na síntese de CGA. Tal pode ser realizado por meio de mutagênesee seleção (TILLING), ou por meio da geração de alterações da expressão degene específica usando clonagem de gene e transformação de café. Grãodestas novos não-GMO, ou variedades de GMO1 que alteraram os perfis deCGA podem depois ser subseqüentemente avaliados por seu teor de produ-tos de degradação de ácido clorogênico e perfis de sabor após torrefação.Aqueles observados ser superiores em sabor e outras características podemdepois ser selecionados para estudos adicionais.
Teor de ácido clorogênico crescente em grão de café poderia le-var a um aumento em derivados de CGA voláteis implicados em aroma du-rante o processo de torrefação. Desse modo, modulando o teor de CGA nofeijão de café mediante modulação da produção das proteínas geneticamen-te responsáveis pela biossíntese de CGA é um meio novo para intensificar oaroma e sabor de bebidas de café e produtos de café produzidos de tais fei-jões de café geneticamente modificados. Teor de CGA intensificado no grãode café pode também positivamente contribuir para a saúde geral e bem-estar dos consumidores de bebidas de café e produtos produzidos de taisfeijões de café. Além disso, modulando o teor de CGA na planta de café temimplicações para saúde geral e resistência à doença na planta de café. Paracada uma destas razões, há uma necessidade de isolar polinucleotídeos epolipeptídeos da via biossintética de CGA em café e desenvolver métodosde utilizar aquelas moléculas para um ou mais dos propósitos acima men-cionados.
Sumário da Invenção
A invenção descrita aqui caracteriza genes que codificam enzi-mas na via de fenilpropanóide que leva à biossíntese de ácido clorogênicoem plantas de café, seus polipeptídeos codificados, e métodos para usarestes polinucleotídeos e polipeptídeos para regulação de gene e manipula-ção de sabor, aroma e outras características dos feijões de café.
Um aspecto da invenção caracteriza uma molécula de ácido nu-cléico isolada de café (Coffea spp.), tendo uma seqüência de codificaçãoque codifica uma enzima da via de fenilpropanóide. Em uma modalidade, aenzima é uma hidroxicinamoil-CoA chiquimato/quinato hidroxicinamoiltrans-ferase que é pelo menos 86,9% idêntica à SEQ ID Ne: 9 ou SEQ ID NQ: 10.Em outra modalidade, a enzima é uma de hidroxicinamoil-CoA quinato hi-droxicinamoiltransferase que é pelo menos 78,1% idêntica à SEQ ID Ns: 11ou SEQ ID Ne: 12. Em outra modalidade, a enzima é uma p-cumaroil 3' hi-droxilase que é pelo menos 82,9% idêntica à SEQ ID Ns: 13. Em outra mo-dalidade, a enzima é uma cafeoil-CoA 3-0 metitransferase que é pelo menos86,3% idêntica à SEQ ID N9: 14, SEQ ID N9: 15, ou SEQ ID Ne: 16.
Em certas modalidades, a molécula de ácido nucléico é um ge-ne que tem uma estrutura de leitura aberta compreendendo a seqüência decodificação. Alternativamente, ele pode compreender uma molécula de mR-NA produzida por transcrição daquele gene, ou uma molécula de cDNA pro-duzida por transcrição reversa da molécula de mRNA. A invenção tambémcaracteriza um oligonucleotídeo entre 8 e 100 bases em comprimento que écomplementar a um segmento da molécula de ácido nucléico acima mencionada.
Outro aspecto da invenção caracteriza um vetor que compreen-de as moléculas de ácido nucléico de codificação da enzima da via de fenil-propanóide acima descritas. Em certas modalidades, o vetor é um vetor deexpressão selecionado do grupo de vetores que consistem em vetores deplasmídeo, fagomídeo, cosmídeo, baculovírus, bacmídeo, bacterianos, delevedura e virais. Em certas modalidades, o vetor contém a seqüência decodificação da molécula de ácido nucléico operavelmente ligada a um pro-motor constitutivo. Em outras modalidades, a seqüência de codificação estáoperavelmente ligada a um promotor induzível. Em outras modalidades, aseqüência de codificação da molécula de ácido nucléico está operavelmenteligada a um promotor tecido-específico, como um promotor semente-específico, preferivelmente um promotor semente-específico de café.De acordo com outro aspecto da invenção, é fornecida uma cé-lula hospedeira transformada com o vetor acima mencionado. A célula hos-pedeira pode ser uma célula de planta, bacteriana, fúngica, de inseto oumamífera. Em certas modalidades, a célula hospedeira é uma célula deplanta selecionada de qualquer um de café, tabaco, Arabidopsis, milho, trigo,arroz, feijão-soja, cevada, centeio, aveia, sorgo, alfafa, trevo, óleo de canola,cártamo, girassol, amendoim, cacau, tomate, tomate-de-árvore, batata, pi-menta, berinjela, beterraba-açucareira, cenoura, pepino, alface, ervilha, ás-ter, begônia, crisântemo, delfínio, zínia, e grama. A invenção também carac-teriza .uma planta transgênica fértil produzida regenerando a célula de plantatransformada. Em uma modalidade específica, a planta transgênica fértil éuma espécie de Coffea.
Outro aspecto da invenção caracteriza um método para modularsabor ou aroma de feijões de café. O método compreende modular a produ-ção de uma ou mais enzimas da via de fenilpropanóide dentro de sementesde café. Em algumas modalidades, o método compreende produção cres-cente da uma ou mais enzimas da via de fenilpropanóide, por exemplo, au-mentando a expressão de uma ou mais genes de codificação da enzima davia de fenilpropanóide endógena dentro das sementes de café, ou introdu-zindo uma transgene de codificação da enzima da via de fenilpropanóide naplanta. Em outras modalidades, o método compreende produção decrescen-te da uma ou mais enzimas da via de fenilpropanóide, por exemplo, introdu-zindo uma molécula de ácido nucléico no café que inibe a expressão de umou mais genes de codificação da enzima da via de fenilpropanóide.
Outras características e vantagens da invenção serão entendi-das em referência aos desenhos, descrição detalhada e exemplos que se-guem.
Breve Descrição dos Desenhos
Figura 1: VIA DE FENILPROPANÓIDE. Esta representação davia de fenilpropanóide de planta é uma modificação de Hoffman et al., 2004,PAL, amônia de fenilalanina-liase; C4H, Cinamato 4-hidroxilase; 4CL, 4-hidroxicinamoil-CoA ligase; HCT, Hidroxicinamoil-coenzima A Chiquima-to/Quinato Hidroxicinamoiltransferase; HQT, hidroxicinamoil-CoA: quinatohidroxicinamoiltransferase; C3H, p-cumarato 3-hidroxilase; CCoAOMT1 Ca-feoil-CoA O-metiltransferase; CAD1 cinamil-álcool desidrogenase; CCR, cina-moil-CoA reductase; COMT I, ácido caféico/5-hidroxiferúlico O-metiltrans-ferase; F5H, ferulato 5-hidroxilase; SAD, sinapil-álcool desidrogenase.
Figura 2. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CcHCT DE Coffea canephora. A) Isolamento de um cDNAcontendo a ORF completa de HCT de C. canephora. Dois clones de cDNAforam obtidos cobrindo a ORF completa de CcHCT, o produto de RACE 5'(Race1_CcHC7) (SEQ ID N9: 17) contendo a terminação 5' do HCT-de C.canephora e um clone parcial de cDNA pcccwc22w14m23 (SEQ ID NQ: 18),J contendo a terminação 3' restante deste gene (vide métodos nos exemplos).Estas seqüências foram usadas para projetar os preparadores novos paraamplificar por PCR um fragmento de 1388bp fragmento (CcHCT em pML1) (SEQ ID N9: 1) de cDNA de BP409 de C. canephora (grão, estágio amarelo).A região não-transladada de 5' é mostrada como uma barra preta grossa, aregião de ORF é mostrada como uma barra listrada, e os códons de início(ATG) e parada (TGA) de iniciação de translação são indicados. A regiãonão-transladada de 3' é mostrada em linha preta fina. Β) A seqüência inseri- da de pML1 (SEQ ID N9: 1) foi alinhada com o pcccwc22w14m23 das se-qüências de cDNA (SEQ ID N9: 18) e Racel_CcHCT (SEQ ID N9: 17). O ali-nhamento foi feito usando o programa de CLUSTAL W (pacote Lasergene1DNASTAR) e manualmente otimizado. Ácidos nucléicos marcados em cinzaemparelharam com a seqüência inserida de pML1 (CcHCT) (SEQ ID N9: 1).
Figura 3. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CaHCT DE Coffea arabica. A) Isolamento de um cDNA con-tendo a ORF completa de HCT de Coffea arabica. Um fragmento de DNAgenômico (GW1_CaHC7) (SEQ ID N9: 19) codificando a terminação 5' deum HCT de C. arabica foi obtido (vide métodos nos exemplos) contendo uma sobreposição com o cDNA de HCT de C. canephora pcccwc22w14m23(SEQ ID N9: 18). A seqüência genômica de C. arabica continha quase umemparelhamento idêntico à seqüência de preparador de terminação 5' HCT-FullUpl (SEQ ID Ne: 50), assim este preparador foi usado com CcHCT-RIpara amplificar por PCR um fragmento de 1388pb (CaHCTem pML5) (SEQID NQ: 2) de cDNA de T2308 de C. arabica (grão, estágio amarelo). A regiãonão-transladada de 5' é mostrada como uma barra preta grossa, a região deORF é mostrada como uma barra listrada, os códons de início (ATG) e para-da de iniciação de translação (TGA) são indicados. A região não-transladadade 3' é mostrada como uma linha preta fina. A região genômica é mostradacomo uma linha cinza grossa. É observado que a maior parte da região não-transladada de 5' deste gene ainda não tinha sido definida. Β) A seqüênciainserida de pML5 foi alinhada com a seqüência genômica de C. arabicaGW1_CaHCT (SEQ ID Ne: 19) e a seqüência de cDNA de C. canephorapcccwc22w14m23 (SEQ ID N-: 18) usando CLUSTAL W e manualmenteotimizada. Ácidos nucléicos marcados em cinza emparelharam com a se-qüência inserida de pML5 (CaHCT) (SEQ ID N9: 2).
Figura 4. ALINHAMENTO DE SEQÜÊNCIA DE PROTEÍNA DECcHCT, CaHCT, CcHQTE CaHQTCOU OUTRAS SEQÜÊNCIAS PROTE-ÍNA DE HCT E HQT DE PLANTA. O alinhamento das seqüências de codifi-cação de proteína dos genes CcHCT (SEQ ID N5: 9), CaHCT (SEQ ID Ne:10), CcHQT(SEQ ID Ns: 11) e CcHQT(SEQ ID Ne: 12) com outras proteínasde HCT e de HQT disponíveis na base de dados de NCBI foi feito usando oCLUSTAL W (pacote Lasergene, DNASTAR). Aminoácidos marcados emcinza denotam os resíduos freqüentemente encontrados. Os nomes de genesão listados, com números de acesso dados entre parênteses. NtHCT (Nico-tiana tabacum, CAD47830 (SEQ ID Ns: 20)), AtHCT (Arabidpsis thaliana,NP_199704 (SEQ ID Ns: 21)), IbHCBT (Ipomea batatas, BAA87043.1 (SEQID N9: 22)), NtHQT (Nicotiana tabacum, CAE46932,1 (SEQ ID N9: 23)), eLeHQT (Lycopersicon esculentum, CAE46933.1 (SEQ ID N9: 24)). As caixasverdes e azuis indicam resíduos de aminoácidos conservados, HXXXD (SEQID N9: 25) e DFGWG (SEQ ID N9: 26) respectivamente. O X circulado naposição 272 na seqüência de proteína de pML3 representa um códon deparada codificado pela seqüência de inserção de pML3. Mas, como determi-nado no Exemplo 6, este códon de parada foi inserido durante a etapa dePCR como foi mostrado que a seqüência genômica codifica um Q nesta po-sição.
Figura 5. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CcHQT DE Coffea canephora. A) Isolamento de um cDNAcontendo a ORF completa para CcHQT de C. canephora. Dois fragmentosde cDNA (Race3_CcHQT (SEQ ID N9: 27) e pcccs30w13p12 (SEQ ID N9:28)) foram obtidos cobrindo a ORF completa de CcHQT (vide métodos nosexemplos). Estas seqüências foram usadas para projetar os preparadorespara amplificar por PCR o fragmento de 1534 pb {CcHQT em pML2) (SEQID NQ: 3) de BP409 de Coffea canephora (pericarpo, estágio verde pequeno).A região de codificação de proteína é mostrada como uma linha listrada, oscódons de início (ATG) e parada de iniciação de translação (TGA) são indi-cados. A região não-transladada de 3' é mostrada em linha preta fina. Sím-bolos são iguais aos das Figuras 2 e 3, Β). A seqüência inserida de pML2 foialinhada com as seqüências de cDNA Race3_CcHQT (SEQ ID Ns: 27) epcccs30w13p12 (SEQ ID N9: 28). O alinhamento foi feito usando o CLUS-TAL W e manualmente otimizado. Ácidos nucléicos marcados em cinza em-parelharam com a seqüência inserida de pML2 (CcHQT) (SEQ ID N9: 3).
Figura 6. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CaHQT DE Coffea arabica. A) Isolamento de um cDNA conten-do uma ORF completa que codifica CaHQT de C. arabica. Um fragmento decDNA de RACE de 5' (Race2_CaHQT) (SEQ ID N9: 29) foi obtido que codificaa terminação 5' de um HQT de C. arabica. Os preparadores HQT-Fullup2(SEQ ID N9: 52) e HQT-FullLow2 (SEQ ID N9: 53) previamente usados paraamplificar por PCR CcHQT foram também de forma bem sucedida usadospara amplificar um fragmento de 1533 pb (CaHQTem pML3) (SEQ ID N9: 4)de cDNA de T2308 de C. arabica (flores inteiras). Símbolos são iguais aos dasFiguras 2 e 3. Β) A seqüência inserida (SEQ ID N9: 4) de pML3 foi alinhadacom a seqüência de cDNA de C. arabica Race2_CaHQT(SEQ ID N9: 29) e aseqüência de C. canaphora pcccs30w13p12 (SEQ ID N9: 28). O alinhamentofoi feito usando CLUSTAL W e manualmente otimizado. Ácidos nucléicosmarcados em cinza emparelharam com a seqüência de dpML3 (CaHQf)(SEQ ID NQ: 4). A base cercada mostra um códon de parada na ORF de pML3(SEQ ID Ne: 4), como debatido no texto e na legenda para Figura 4.
Figura 7. ALINHAMENTO DE CcC3H COM OUTRAS SE-QÜÊNCIAS DE PROTEÍNA DE C3H DE PLANTA. O alinhamento da se-qüência de proteína (SEQ ID N2: 13) codificada por CcC3H (em pcccl20d10(SEQ ID N-: 5)) com outras proteínas de C3H altamente relacionadas na ba-se de dados de NCBI foi feito usando CLUSTAL W (Nota: estas proteínassão proteínas relacionadas a CYP, desse modo a proteína de Arabidopsis foioriginalmente AtCYP). Aminoácidos marcados em cinza emparelharam comaqueles na seqüência de CcC3H (SEQ ID N9: 13). AtCYP (Arabidopsis thaii-ana 22203) (SEQ ID Ne: 30), ObC3H (Ocimum basilicum, AAL99201) (SEQID N5: 31), LeC3H putativo (Lycopersicon escuientum, TC163965 (anotaçãode TIGR Tomato Gene Index) (SEQ ID N9: 32)).
Figura 8. Análise de expressão quantitativa de HQT HCT, C3H,CCoAOMTI, CC0AOMT2 e CCoAOMT3 em C. canephora (robusta, BP409)e C. arabica (arabica, T2308). A expressão de cada gene foi determinadapor RT-PCR quantitativa usando sondas específicas de TaqMan como des-critas nos métodos. O valor de RQ para cada amostra de tecido foi determi-nado normalizando o nível de transcrição do gene de teste versus o nível detranscrição do gene de rpl39 ubiquosamente expresso em cada amostra a-nalisada. Os dados mostrados representam valores médios obtidos de trêsreações de amplificação para cada amostra e as barras de erro indicam o SD.
Figura 9. ISOLAMENTO E CARACTERIZAÇÃO DA ORF COM-PLETA PARA CaCCoAOMT-LI (pNT8) DE Coffea arabica A) Isolamento decDNA contendo a ORF completa para CCoAOMT-L1 (SEQ ID Ne: 7) de C.arabica. Um fragmento de cDNA (Race1_CcCCoAOMT-L1) (SEQ ID N9: 33)foi obtido de Coffea canephora (Grão, estágio amarelo) cobrindo a termina-ção 5' completa de ORF de CCoAOMT-L1 de Coffea canephora (SEQ ID N9:7) (vide métodos nos exemplos). Esta seqüência e a seqüência da inserçãocontidas em pcccs30w29k18 (SEQ ID N9: 34) foram usadas para projetar ospreparadores CCoAOMT-L1-FuIIUp (SEQ ID N9: 56) e CCoAOMT-L1 FullLow(SEQ ID N9: 57) para amplificar um fragmento de Coffea arabica T2308(Grão, estágio amarelo) contendo a ORF completa (CaCCoAOMT-LI empNT8) (SEQ ID Ng: 7). Símbolos são iguais aos das Figuras 2 e 3, Β). A se-qüência inserida de pNT8 (SEQ ID Ne: 7) foi alinhada com as seqüências decDNA Race 1 _CcCCoAOMT-L1 (SEQ ID N9: 33) e pcccs30w29k18 (SEQ IDN9: 34) usando o CLUSTALW e manualmente otimizadas. Bases marcadasem cinza emparelharam com a base mais freqüentemente encontrada na-quela posição.
Figura 10. ISOLAMENTO E CARACTERIZAÇÃO DA ORFCOMPLETA PARA CcCCoAOMT-L2 (pNT4) DE Coffea canephora. A) Iso-lamento de um cDNA contendo a ORF completa (SEQ ID N9: 8) para CCo-A0MT-L2 de C. canephora. Um fragmento de cDNA (Racel _CaCCoAOMT-L2) (SEQ ID N9: 35) foi obtido de Coffea arabica (Grão, estágio amarelo) co-brindo a terminação 5' completa de ORF de CCoAOMT-L2 de Coffea arabica(SEQ ID Ns: 8) (vide métodos nos exemplos). Esta seqüência e a seqüênciada inserção contidas em pcccs46w30m24 (SEQ ID Ne: 36) foi usada paraprojetar os preparadores CCoAOMT-L2-FullUp (SEQ ID Ne: 58) e CCoA-OMT-L2-FullLow (SEQ ID N9: 59), e estes preparadores foram usados paraamplificar um fragmento de BP409 de Coffea canephora (Grão, estágio ama-relo) denominado CcCCoAOMT-L2 (pNT4) (SEQ ID N9: 8). Os símbolos sãoiguais aos das Figuras 2 e 3. Β) A seqüência inserida (SEQ ID N9: 8) depNT4 foi alinhada com as seqüências de cDNA Racel_CaCCoAOMT-L2(SEQ ID N9: 35) e pcccs46w30m24 (SEQ ID N9: 36). O alinhamento foi feitousando o CLUSTALW e manualmente otimizado. Bases em cinza empare-lharam com o resíduo mais freqüentemente encontrado naquela posição.
Figura 11. ALINHAMENTO DE SEQÜÊNCIA DE PROTEÍNA DECcCCoAOMT-1 (pcccl15a11), CaCCoAOMT-LI (pNT8), E CcCCoAOMT-L2(pNT4). Um alinhamento das seqüências de proteína CcCCoAOMT-1, CaC-CoAOMT-LI e CcCCoAOMT-L2 (SEQ ID NOs: 14, 15, 16, respectivamente)codificadas por (SEQ ID NOs: 6, 7, 8, respectivamente) foi feito usandoCLUSTALW e manualmente otimizado. Aminoácidos marcados em cinzaemparelharam com o resíduo mais freqüentemente encontrado naquela po-sição. As interações de aminoácido a seguir foram caracterizadas na recenteestrutura de cristal do CCoAOMT de alfafa (Medicago sativa) complexadocom os produtos de reação (Ferrer et al, 2005): as caixas rosas indicam a-minoácidos que interagem com o grupo 3'-fosfato negativamente carregadoda metade de difosfato de 3'-5' adenosina de CoA, as caixas azuis indicamaminoácidos envolvidos em reconhecimento de substrato, e as caixas ver-des indicam aminoácidos envolvidos em ligação de íon de metal divalente ede co-fator.
Figura 12. ALINHAMENTO DE SEQÜÊNCIA DE PROTEÍNA DE CcCCoAOMT-1 (pcccl15a11), MsCCoAOMT, NtCCoAOMT, VvCCoAOMT,CaCCoAOMT-LI (pNT8), E CcCCoAOMT-L2 (pNT4). Um alinhamento dasseqüências de proteína MsCCoAOMT (SEQ ID Ne: 37), NtCCoAOMT (SEQID Ne: 38) e VvCCoAOMT (SEQ ID Ns: 39) disponíveis na base de dados deNCBI com as seqüências de proteína codificadas pelos genes CcCCoAOMT-1, CaCCoAOMT-LI e CcCCoAOMT-L2 (SEQ ID NOs: 6, 7, 8, respectiva-mente) foi feito usando CLUSTAL W e manualmente otimizado. Aminoácidosmarcados em cinza emparelharam com o resíduo mais freqüentemente en-contrado naquela posição. As interações de aminoácido a seguir foram ca-racterizadas na recente estrutura de cristal do CCoAOMT de alfafa (Medica-go sativa) complexado com produtos de reação (Ferrer e al, 2005): as caixasrosas indicam aminoácidos que interagem com o grupo de 3'-fosfato negati-vamente carregado da metade de 3'-5' difosfato de adenosina de CoA, ascaixas azuis indicam aminoácidos envolvidos no reconhecimento de substra-to, e as caixas verdes indicam aminoácidos envolvidos em ligação de íon demetal divalente e de co-fator. Números de acesso para seqüências de prote-ína disponíveis na base de dados de NCBI é dado entre parênteses: MsC-CoAOMT (Medicago sativa, AAC28973 (SEQ ID Ne: 37)), NtCCoAOMT (Ni-cotiana tabacum, AAC49913 (SEQ ID Ne: 38)), e VvCCoAOMT (Vitisvinifera,CAA90969 (SEQ ID Ne: 39)).
Figura 13. EXPRESSÃO E PURIFICAÇÃO DA PROTEÍNA DECcHCT RECOMBINANTE. A) Extratos de vários estágios da expressão epurificação da proteína fusão de GST-CcHCT recombinante(pGTPcl 03a_HCT) foram analisados por, A) usando 5-18% de SDS-PAGE etingimento com Coomassie blue e por B) usando a análise de western blot(vide métodos nos exemplos). Rotas em A; 1. Lisado total de células recom-binantes BI21 contendo pGTPc103a_HCT e induzido com 0,2 mM de IPTG2. Lisado de fração solúvel, 3. Fração insolúvel de lisado, 4. Primeira lava-gem de coluna de NiNTA com tampão de lavagem, 5 a 9 frações sucessivaseluídas da coluna de Ni-NTA usando tampão de eluição, escada de Peso 9.Rotas em B; 1. Material agrupado eluído da coluna de theNi-NTA. 2. Escadade peso.
Figura 14. EXPRESSÃO E PURIFICAÇÃO DA PROTEÍNA DECcHQT RECOMBINANTE. A) Extratos de vários estágios da expressão epurificação da proteína de fusão de GST-CcHQT recombinante(pGTPc103a_HQT) foi analisada por, A) usando 5-18% de SDS-PAGE e tin-gimento com Coomassie blue e por B) usando a análise de western blot (vi-de métodos nos exemplos). Rotas em A; 1. Lisado total de células recombi-nantes BI21 contendo pGTPc103a_HQT e introduzido com 0,2 mM de IPTG2. Lisado de fração solúvel, 3. Fração insolúvel de lisado, 4. Primeira lava-gem de coluna de NiNTA com tampão de lavagem, 5 a 9 frações sucessivaseluídas da coluna de Ni-NTA usando tampão de eluição, escada de Peso 9.Rotas em B; 1. Material agrupado eluído da coluna de Ni-NTA. 2. Escada depeso.
Figura 15 ANÁLISE DE EXPRESSÃO E PURIFICAÇÃO DECcCCoAOMT-1 (pNT16). A) A expressão da proteína de fusão de His-marcador-CcCCoAOMTI foi analisada em um gel a 12% de SDS-PAGE etingida com Coomassie azul. Rota A 1. Extrato bruto de células recombinan-tes BI21 contendo pNT16 e com indução de expressão usando 0,2% ded'arabinose, 2. Extrato bruto de Células recombinantes BI21 com pNT16 ecom supressão de expressão usando 0,1% de glicose. Rota B 1. Lisado car-regado em coluna de NiNTA, 2. Primeira fração de lavagem: 3. Segunda fra-ção de lavagem, 4 a 7, frações 1-4 eluídas da coluna de NiNTA usando tam-pão de eluição. MW: Marcador de peso molecular (Precision Plus PrestainedAll Blue #161-0373)).Figura 16. ANÁLISE DE CaCCoAOMT-LI (pNT12) EXPRES-SÃO E PURIFICAÇÃO. A) A expressão dA proteína de fusão His-marcador-CaCCoAOMT-LI foi analisada em um gel a 12% de SDS-PAGE e tingidacom Coomassie azul. ROTA A 1. Extrato bruto de células recombinantesB121 contendo pNT12 e com indução de expressão usando 0,2%d'arabinose, 2. Extrato bruto de células recombinantes B121 com pNT12 ecom supressão de expressão usando 0,1% de glicose MW: marcador de pe-so molecular (Precision Plus Prestained All Blue (Biorad #161-0373)). ROTAB 1-4 frações 1-4 eluídas da coluna de NiNTA usando tampão de eluição.MW: marcador de peso molecular (Unstained Precision Broad Range (Biorad#161-0362)).
Figura 17. ANÁLISE DE EXPRESSÃO E PURIFICAÇÃO DECcCCoAOMT-L2 (pNT17). A) A expressão da proteína de fusão de His-marcador-CcCCoAOMT-L2 foi analisada em um gel a 12% de SDS-PAGE etingidA com Coomassie azul. ROTA A 1. Extrato bruto de Células recombi-nantes BI21 contendo pNT17 e com indução de expressão usando 0,2%d'arabinose, 2. Extrato bruto de células recombinantes BI21 com pNT17 ecom supressão de expressão usando 0,1% de glicose, MW: marcador depeso molecular (Precision Plus Prestained All Blue (Biorad #161-0373)).ROTA B 1-4 frações 1-4 eluídas da coluna de NiNTA usando tampão de elu-ição. MW: marcador de peso molecular (Unstained Precision Broad Range(Biorad #161-0362)).
Figura 18. ANÁLISE DE ATIVIDADE PARA A PROTEÍNA RE-COMBINANTE DE HIS-MARCADOR-CcCCoAOMT1. Amostras das reaçõesde atividade descritas na seção de método foram carregadas em uma colunade HPLC e o perfil de elução foi medido a 324nm PAINEL A perfil de eluçãode HPLC das amostras de reação contendo 40 pg de proteína recombinantetiradas respectivamente a 0, 6, e 24 horas. PAINEL B perfil de HPLC de rea-ção de controle sem enzima adicionada nos mesmo pontos de tempo.
Figura 19. IDENTIFICAÇÃO DO PRODUTO DESCONHECIDODA PROTEÍNA DE CcCCoAOMTI COMO ÁCIDO FERÚLICO. O pico notempo de retenção de 14,8 min foi identificado como ácido ferúlico adicio-nando um ácido ferúlico "pico" diretamente na amostra de enzima de 24 ho-ras ilustrado na Figura 18 painel A. A absorbância de UV a 324 nm da amos-tra de 24 horas + e -"pico" é apresentada. A curva verde representa o perfilde elução da amostra de 24 h, e a curva amarela representa o perfil de elu-ção da amostra de 24 horas mais o "pico" de ácido ferúlico: o produto des-conhecido co-elui claramente com o "pico" de ácido ferúlico.
Figura 20. Perfil de elução de HPLC de amostra de 5CQA a40°C em tampão de atividade (controle negativo). A: espectro de HPLC emT=O1 B: espectro de HPLC em T2 hora. C: espectro de HPLC em T4 hora.
- Figura 21. Perfil de elução de HPLC das amostras tiradas de re-ação com HCT recombinante (liberado após clivagem com AcTEV protease)e substrato de 5CQA. A: perfil de HPLC de amostra em T = 0, B: perfil deHPLC de amostra após incubação de 4 h a 40°C. C: perfil de HPLC de a-mostra após incubação de 24 h a 40°C. O pico no tempo de retenção de a-proximadamente 14,4 min foi identificado como 5CQA por comparação deinjeção padrão. Similarmente, o pico em 2 min foi identificado como Coenzi-ma A.
Descrição Detalhada das Modalidades IlustrativasDefinições:
Vários termos relativos às moléculas biológicas e similares as-pectos da presente invenção são usados ao longo do relatório descritivo ereivindicações.
O termo "polipeptídeos, proteínas ou enzimas da via de fenilpro-panóide" refere-se aos polipeptídeos que participam na via de fenilpropanói-de que, entre outras coisas, conduz à biossíntese de ácido clorogênico emplantas, e mais especificamente, em plantas de café. Este termo abrange omecanismo específico de ação de cada respectiva proteína na via. Os poli-peptídeos incluem sem limitação, amônia de fenilalanina-liase, cinamato4-hidroxilase, 4-hidroxicinamoil-CoA Iigase (também referida como 4 cuma-roil-CoA ligase), hidroxicinamoil coenzima A chiquimato hidroxicinamoiltrans-ferase, hidroxicinamoil coenzima A quinato hidroxicinamoiltransferasep-cumarato 3-hidroxilase, cafeoil-CoA O-metiltransferase, cinamil-álcool de-sidrogenase, cinamoil-CoA reductase, ácido caféico/5-hidroxiferúlicoO-metiltransferase, ferulato 5-hidroxilase, sinapil-álcool desidrogenase, esimilares, como exemplificados aqui.
"Isolado" significa alterar "pela mão de homem" do estado natu-ral. Se uma composição ou substância ocorre em natureza, foi "isolada" sefoi alterada ou removida de seu ambiente original, ou ambos. Por exemplo,um polinucleotídeo ou um polipeptídeo naturalmente presentes em umaplanta ou animal vivos não são "isolados", mas o mesmo polinucleotídeo oupolipeptídeo separado dos materiais coexistente de seu estado natural são"isolados", como é empregado o termo aqui.
"Polinucleotídeo", também referido como "molécula de ácido nu-cléico". Em geral refere-se a qualquer polirribonucleotídeo ou polideoxrribo-nucleotídeo que podem ser RNA ou DNA inalterados ou RNA ou DNA modi-ficados. "Polinucleotídeos" incluem, sem limitação, DNA uni- e bifilamentar,DNA que é uma mistura de regiões uni e bifilamentares, RNA uni e bifila-mentar, e RNA que é mistura de regiões uni e bifilamentares, moléculas hí-bridas que compreendem o DNA e RNA que podem ser unifilamentares ou,mais tipicamente, bifilamentares ou uma mistura de regiões uni e bifilamen-tares. Além disso, "polinucleotídeo" refere-se às regiões trifilamentares com-preendendo RNA ou DNA ou RNA e DNA. O termo polinucleotídeo tambéminclui DNAs ou RNAs que contêm uma ou mais bases modificadas e DNAsou RNAs com cadeias principais modificadas para estabilidade ou por outrasrazões. Bases "modificadas" incluem, por exemplo, bases tritiladas e basesincomuns como inosina. Uma variedade de modificações pode ser feita aoDNA e RNA; desse modo, "polinucleotídeo" abrange formas química, enzi-mática ou metabolicamente modificadas de polinucleotídeos como tipica-mente encontrados na natureza, como também as formas químicas de DNAe RNA característicos de vírus e células. "Polinucleotídeo" também abrangepolinucleotídeos relativamente curtos, freqüentemente referidos como oligo-nucleotídeos.
"Polipeptídeo" refere-se a qualquer peptídeo ou proteína quecompreende dois ou mais aminoácidos unidos um ao outro por ligações depeptídeo ou ligações de peptídeo modificado, isto é, isósteres de peptídeo."Polipeptídeo" refere-se tanto às cadeias curtas, comumente referidas comopeptídeos, oligopeptídeos ou oligômeros, como às cadeias mais longas, emgeral referidas como proteínas. Polipeptídeos podem conter aminoácidosdiferentes dos 20 aminoácidos codificados pelo gene. "Polipeptídeos" inclu-em seqüências de aminoácido ou modificadas por processos naturais, comoprocessamento pós-translacional, ou por técnicas de modificação químicaque são bem conhecidas na técnica. Tais modificações são bem descritasem textos básicos e em monografias mais detalhadas, como também emuma literatura de pesquisa volumosa. Modificações podem ocorrer em qual-quer lugar em um polipeptídeo, incluindo a cadeia principal peptídica, as ca-deias laterais de aminoácido e os términos amino ou carboxila. Será apreci-ado que o mesmo tipo de modificação pode estar presente nos mesmosgraus ou variados em vários sítios em um polipeptídeo dado. Também, umpolipeptídeo dado pode conter muitos tipos de modificações. Polipeptídeospodem ser ramificados como resultado de ubiquitinação, e eles podem sercíclicos, com ou sem ramificação. Polipeptídeos cíclicos, ramificados e cícli-cos ramificados podem ser o resultado de processos naturais pós-translacionais ou podem ser feitos através de métodos sintéticos. Modifica-ções incluem acetilação, acilação, PAD-ribosilação, amidação, ligação cova-Iente de flavina, ligação covalente de uma metade de heme, ligação covalen-te de um nucleotídeo ou derivado de nucleotídeo, ligação covalente de umlipídio ou derivado de lipídio, ligação covalente de fosfotidilinositol, reticula-ção, ciclização, formação de ligação de dissulfeto, desmetilação, formaçãode reticulações covalentes, formação de cistina, formação de piroglutamato,formilação, gama-carboxilação, glicosilação, formação de âncora de GPI,hidroxilação, iodinação, metilação, miristoilação, oxidação, processamentoproteolítico, fosforilação, prenilação, racemização, selenoilação, sulfação,adição mediada por RNA de transferência de aminoácidos para proteínascomo arginilação, e ubiquitinação. Por exemplo, vide Proteins - Structure andMolecular Properties, 2ã Ed., Τ. E. Creightonl W. H. Freeman and Company,Nova Iorque, 1993 e Wold, F., Posttranslational Protein Modifications: Pers-pectives and Prospects,páginas 1-12 em Posttranslational Covalent Modifi-cation of Proteins, B, C. Johnson, Ed., Academic Press, Nova Iorque, 1983;Seifter et ai, Analysis for Protein Modifications and Nonprotein Cofactors,Meth Enzymol (1990) 182:626-646 e Rattan et ai, Protein Synthesis: Post-translational Modifieations and Aging, Ann NY Aead Sei (1992) 663:48-62.
"Variante" como o termo é aqui usado, é um polinucleotídeo oupolipeptídeo que diferem respectivamente de um polinucleotídeo ou polipep-tídeo de referência, mas retêm as propriedades essenciais. Uma variantetípica de um polinucleotídeo difere em seqüência de nucleotídeo de outropolinucleotídeo de referência. Alterações na seqüência de nucleotídeo davariante podem ou não alterar a seqüência de aminoácido de um polipeptí-deo codificado pelo polinucleotídeo de referência. Alterações de nucleotídeopodem resultar em substituições, adições, deleções, fusões e mutilações deaminoácido no polipeptídeo codificado pela seqüência de referência, comodebatido abaixo. Uma variante típica de um polipeptídeo difere em seqüên-cia de aminoácido do outro polipeptídeo de referência. Em geral, diferençassão limitadas de forma que as seqüências do polipeptídeo de referência e avariante são em geral estritamente similares e, em muitas regiões, idênticos.Uma variante e polipeptídeo de referência podem diferir em seqüência deaminoácido em uma ou mais substituições, adições ou deleções em qual-quer combinação. Um resíduo de aminoácido substituído ou inserido podeou não ser codificado pelo código genético. Uma variante de um polinucleo-tídeo ou polipeptídeo pode ser de ocorrência natural, como uma variantealélica, ou pode ser uma variante que não é conhecida ocorrer naturalmente.Variantes de polinucleotídeos de ocorrência natural e polipeptídeos de ocor-rência não-natural podem ser feitos através de técnicas de mutagênese ouatravés de síntese direta.
Em referência às plantas mutantes, os termos "mutante nulo" ou"mutante de perda-de-função" são usados para designar um organismo ouseqüência de DNA genômico com uma mutação que faz um produto de geneser não-funcional ou grandemente ausente. Tais mutações podem ocorrernas regiões de codificação e/ou reguladoras do gene, e pode ser alteraçõesde resíduos individuais, ou inserções ou deleções de regiões de ácidos nu-cléicos. Estas mutações podem também ocorrer nas regiões de codificaçãoe/ou reguladoras de similares genes que podem regular ou controlar um ge-ne e/ou proteína codificada, para fazer a proteína tornar-se não-funcional ougrandemente ausente.
O termo "substancialmente o mesmo" refere-se às seqüênciasde ácido nucléico ou de aminoácido tendo variações de seqüência que nãomaterialmente afetam a natureza da proteína (isto é a estrutura, característi-cas de estabilidade, especificidade de substrato e/ou atividade biológica daproteína). Com referência particular às seqüências de ácido nucléico, o ter-mo "substancialmente o mesmo" é intencionado referir-se à região de codifi-cação e à expressão de controle das seqüências conservadas, e refere-seprimariamente aos códons de degeneração que codificam o mesmo aminoá-cido, ou códons alternados que codificam aminoácidos suplentes conserva-dores no polipeptídeo codificado. Com referência às seqüências de aminoá-cido, o termo "substancialmente o mesmo" refer-se em geral às substituiçõese/ou variações conservadoras nas regiões do polipeptídeo não envolvido nadeterminação da estrutura ou função.
Os termos "por cento idêntico" e "por cento similar" são tambémaqui usados em comparações entre seqüências de aminoácido e de ácidonucléico. Quando referir às seqüências de aminoácido, "identidade" ou "porcento idêntico" refere-se ao por cento dos aminoácidos da seqüência de a-minoácido em questão que foi emparelhado com os aminoácidos idênticosna seqüência de aminoácido comparada por um programa de análise de se-qüência. "Por cento similar" refere-se ao por cento dos aminoácidos da se-qüência de aminoácido em questão que foi emparelhado com aminoácidosidêntico ou conservados. Aminoácidos conservados são aqueles que diferemem estrutura mas são similares em propriedades físicas de modo que apermuta de um para o outro não é apreciavelmente alterar a estrutura terciá-ria da proteína resultante. Substituições conservadoras são definidas emTaylor (1986, J. Theor. Biol. 119:205). Quando referir às moléculas de ácidonucléico, "por cento idêntico" refere-se ao por cento dos nucleotídeos da se-qüência de ácido nucléico em questão que foi emparelhado com os nucleotí-deos idênticos por um programa de análise de seqüência. Os termos "identi-dade" ou "idêntico" são usados alternadamente com os termos "homologia"ou "homólogo".
"Identidade" e "similaridade" podem ser facilmente calculadasatravés de métodos conhecidos. Seqüências de ácido nucléico e seqüênciasde aminoácido podem ser comparadas usando programas de computaçãoque alinham as seqüências similares dos ácidos nucléicos ou aminoácidos edesse modo definem as diferenças. Em metodologias preferidas, programa.BLAST (NCBI) e parâmetros usados nele são empregado, e o pacote Laser-gene do sistema de DNAstar (Madison, Wl) é usado para alinhar os frag-mentos de seqüência das seqüências de DNA genômicas, como tambémseqüências de cDNA e de proteína. Porém, alinhamentos equivalentes eavaliações de similaridade/identidade podem ser obtidos através do uso dequalquer software de alinhamento padrão. Por exemplo, o Pacote de GCGWisconsin versão 9.1, disponível do Genetics Computer Groups em Madi-son, Wisconsin, e os parâmetros predefinidos usados (penalidade de criaçãode intervalo = 12, penalidade de extensão de intervalo = 4) por aquele pro-grama podem também ser usados para comparar a identidade e similaridadedas seqüências.
"Anticorpos" como aqui usado inclui anticorpos policlonais e mo-noclonais, anticorpos quiméricos, de cadeia simples, e humanizados, comotambém fragmentos de anticorpo (por exemplo, Fab, Fab', F(ab')2 e Fv), in-cluindo os produtos de um Fab ou outra biblioteca de expressão de imuno-globulina. Com respeito aos anticorpos, o termo, Timunologicamente especí-fico" ou "específico" refere-se a anticorpos que ligam a um ou mais epítoposde uma proteína de interesse, mas que não reconhece substancialmente eliga a outras moléculas em uma amostra contendo uma população misturadade moléculas biológicas antigênicas. Ensaios de triagem para determinar aespecificidade de ligação de um anticorpo são bem conhecidos e habitual-mente praticados na técnica. Para um debate inclusivo de tais ensaios, videHarlow et al. (Eds.), Antibodies A Laboratory Manual; Cold Spring HarborLaboratory; Cold Spring Harbor, NY (1988), Capítulo 6.
O termo "substancialmente puro" refere-se a uma preparaçãocompreendendo pelo menos 50-60% em peso o composto de interesse (porexemplo, ácido nucléico, oligonucleotídeo, proteína, etc.). Mais preferivel-mente, a preparação compreende pelo menos 75% em peso, e o mais prefe-rivelmente 90-99% em peso o composto de interesse. Pureza é medida atra-vés de métodos apropriados para o composto de interesse (por exemplo,métodos cromatográficos, agarose ou eletroforese em gel de poliacrilamida,análise de HPLC, e similares).
Com respeito às moléculas de ácido nucléico unifilamentar, otermo "especificamente híbrida com" refere-se à associação entre duas mo-léculas de ácido nucléico unifilamentar de seqüência suficientemente com-plementar para permitir tal hibridação sob condições predeterminadas emgeral usadas na técnica (às vezes denominada "substancialmente comple-mentar"). Em particular, o termo refere-se à hibridação de um oligonucleotí-deo com uma seqüência substancialmente complementar contida dentro deum DNA unifilamentar ou molécula de RNA, para a exclusão substancial dehibridação do oligonucleotídeo com ácidos nucléicos unifilamentares da se-qüência não-complementar.
Uma "seqüência de codificação" ou "região de codificação" refe-rem-se a uma molécula de ácido nucléico que tem informação de seqüêncianecessária para produzir um produto de gene, quando a seqüência é ex-pressada. A seqüência de codificação pode compreender seqüências não-transladadas (por exemplo, íntrons ou regiões de 5' ou 3' não-transladadas)dentro de regiões transladadas, ou podem carecer de tais seqüências não-transladadas intervenientes (por exemplo, como em cDNA).
"íntron" refere-se às seqüências de polinucleotídeo em um ácidonucléico que não codifica informação relacionada com a síntese de proteína.Tais seqüências são transcritas em mRNA, mas são removidas antes datranslação do mRNA para uma proteína.
O termo "operavelmente ligado" ou "operavelmente inserido"significa que as seqüências reguladoras necessárias para expressão da se-qüência de codificação são colocadas em uma molécula de ácido nucléiconas posições apropriadas com relação à seqüência de codificação parapermitir expressão da seqüência de codificação. Por via de exemplo, umpromotor está operavelmente ligado com uma seqüência de codificaçãoquando o promotor for capaz de controlar a transcrição ou expressão daque-la seqüência de codificação. Seqüências de codificação podem ser opera-velmente ligadas de certo modo às seqüências de promotor ou reguladorasou orientação anti-sentido. O termo "operavelmente ligado" às vezes é apli-cado ao arranjo de similares elementos de controle de transcrição (por e-xemplo, intensificadores) em um vetor de expressão.
Seqüências de controle transcricionais e translacionais são se-qüências reguladoras de DNA, como promotores, intensificadores, sinais depoliadenilação, terminadores, e similares, que provêem a expressão de umaseqüência de codificação em uma célula hospedeira.
Os termos "promotor", "região de promotor" ou "seqüência depromotor" se referem em geral às regiões reguladoras transcricionais de umgene que pode ser encontrado no lado 5' ou 3' da região de codificação oudentro da região de codificação, ou dentro dos íntrons. Tipicamente, umpromotor é uma região reguladora de DNA capaz de ligar RNA polimeraseem uma célula e iniciar transcrição de uma seqüência de codificação a ju-sante (direção de 3'). A seqüência de promotor de 5' típica é ligada em seutérmino de 3' pelo sítio de iniciação de transcrição e estende-se a montante(direção de 5') para incluir o número mínimo de bases ou elementos neces-sários para iniciar transcrição dos níveis detectáveis acima da base. Dentroda seqüência de promotor está um sítio de iniciação de transcrição (conve-nientemente definido mapeando com nuclease S1), como também domíniosde ligação de proteína (seqüências de consenso) responsáveis pela ligaçãode RNA polimerase.
Um "vetor" é um replicon, como plasmídeo, fago, cosmídeo, ouvírus ao qual outro segmento de ácido nucléico pode ser operavelmente in-serido para provocar a replicação ou expressão do segmento.
O termo "constructo de ácido nucléico" ou "constructo de DNA"às vezes usado refere-se a uma seqüência de codificação ou seqüênciasoperavelmente ligadas às seqüências reguladoras apropriadas e inseridasem um vetor para transformar uma célula. Este termo pode ser usado alter-nadamente com o termo "DNA transformante" ou "transgene". Uma tal cons-tructo de ácido nucléico pode conter uma seqüência de codificação para umproduto de gene de interesse, junto com um gene marcador e/ou um generepórter selecionáveis.
Um "gene marcador" ou "gene marcador selecionável" é um ge-ne cujo produto de gene codificado confere uma característica que permiteuma célula contendo o gene a ser selecionado de entre células que não con-têm o gene. Vetores usados para engenharia genética tipicamente contêmum ou mais genes marcadores selecionáveis. Tipos de genes marcadoresselecionáveis incluem (1) genes de resistência a antibióticos, (2) genes tole-rância ou resistência a herbicidas, e (3) genes metabólicos ou marcadoresauxotróficos que permitem células transformadas sintetizar um componenteessencial, usualmente um aminoácido que, do contrário, as células não po-dem produzir.
Um "gene repórter" é também um tipo de gene marcador. Estetipicamente codifica um produto de gene que é ensaiável ou detectável atra-vés de meios de laboratório padrões (por exemplo, atividade enzimática, flu-orescência).
O termo "expressar", "expressado", ou "expressão" de um generefere-se à biossíntese de um produto de gene. O processo envolve transcri-ção do gene em mRNA e depois translação do mRNA em um ou mais poli-peptídeos, e abrange todas modificações pós-translacionais de ocorrêncianatural.
"Endógeno" refere-se a qualquer constituinte, por exemplo, umgene ou ácido nucléico, ou polipeptídeo que pode ser encontrado natural-mente dentro do organismo especificado.
Um "heterólogo" região de um constructo de ácido nucléico é umsegmento identificável (ou segmentos) da molécula de ácido nucléico dentrode uma molécula maior que não é encontrada em associação com a molécu-la maior em natureza. Desse modo, quando a região heteróloga codificar umgene, o gene usualmente será flanqueado por DNA que não flanqueia oDNA genômico no genoma do organismo fonte. Em outro exemplo, uma re-gião heteróloga é um constructo onde a própria seqüência de codificaçãonão é encontrada na natureza (por exemplo, um cDNA onde a seqüência decodificação genômica contém íntrons, ou seqüências sintéticas tendo códonsdiferentes que o gene nativo). Variações alélicas ou eventos mutacionais deocorrência natural não dão origem a uma região heteróloga de DNA comodefinida aqui. O termo "constructo de DNA", como definido acima, é tambémusado para referir-se a uma região heteróloga, particularmente uma constru-ída para o uso em transformação de uma célula.
Uma célula foi "transformada" ou "transfeccionada" por DNA e-xógeno ou heterólogo quando tal DNA foi introduzido dentro da célula. ODNA transformante pode ou não ser integrado (covalentemente ligado) nogenoma da célula. Em células procariotes, de levedura, e mamíferas, porexemplo, o DNA transformando pode ser mantido em um elemento episso-mal como um plasmídeo. Com respeito às células eucarióticas, uma célulaestavelmente transformada é uma em que o DNA transformante foi integradoem um cromossomo de forma que ele é herdado através de células-filhasatravés de replicação de cromossomo. Esta estabilidade é demonstrada pelahabilidade da célula eucariótica para estabelecer linhagens celulares ou clo-nes compreendidos de uma população de células-filhas contendo o DNAtransformando. Um "clone" é uma população de células derivada de umacélula simples ou antepassado comum através de mitose. Uma "linhagemcelular" é um clone de uma célula primária que é capaz de crescimento es-tável in vitro por muitas gerações.
"Grão", "semente", ou "feijão", referem-se à unidade de umaplanta em florescência de reprodução, capaz de desenvolver-se em outra talplanta. Como aqui usado, especialmente com respeito às plantas de café, ostermos são sinônima e alternadamente usados.
Como aqui usado, o termo "planta" inclui referência às plantasinteiras, órgãos de planta (por exemplo, folhas, talos, brotos, raízes), semen-tes, pólen, células de planta, organelas de células de planta, e progênie des-tas. Partes de plantas transgênicas são para ser entendidas dentro do esco-po da invenção para compreender, por exemplo, células de planta, proto-plastos, tecidos, calo, embriões como também flores, talos, sementes, pólen,frutas, folhas, ou raízes que originam em plantas transgênicas ou sua progê-nie.
Descrição:
Em um de seus aspectos, a presente invenção caracteriza mo-léculas de ácido nucléico de café que codifica uma variedade de proteínasque compreendem a via de fenilpropanóide que, entre outras funções, con-duz à biossíntese de ácido clorogênico. Exemplos representativos de molé-culas de ácido nucléico que codificam proteínas que compreendem a via defenilpropanóide foram identificados de bases de dados de mais de 47.000marcadores de seqüência expressos (ESTs) de várias bibliotecas de cDNAde Coffea canephora (robusta) feitas com RNA isolado de folhas jovens e dogrão e tecidos de pericarpo de cerejas colhidas em estágios diferentes dedesenvolvimento. ESTs foram identificados sobrepondo e "agrupados" emunigenes (contíguos) compreendendo seqüências de codificação completas.As seqüências de unigene foram anotadas executando uma pesquisa deBLAST de cada seqüência individual contra junto à base de dados de NCBI(National Center for Biotechnology) de proteína não-redundante.
O acima descrito analisa seqüências de gene reveladas que re-presentam várias enzimas importantes da via de fenilpropanóide na plantade café. cDNAs que representa as estruturas de leitura aberta completas(ORF) de várias destas seqüências foram agora obtidos. Estes cDNAs e su-as proteínas codificadas são referidos aqui como segue:<table>table see original document page 32</column></row><table>
As proteínas codificadas têm massas moleculares de aproxima-damente 48,06 kDa CcHCT (SEQ ID N9: 9), 48,19 kDa CaHCT (SEQ ID N5:10), 47,72 kDa CcHQT SEQ ID Ns: 11), 47,54 kDa CaHQT (SEQ ID N2: 12),57,9 kDa CcC3H (SEQ ID N9: 13), 27,97 kDa CcCCoAOMTI (SEQ ID N2:14), 25,71 kDa CaCCoAOM L1 (SEQ ID Ne: 15), e 26,3 kDa CcCCoAOMTL2 (SEQ ID N9: 16). Embora polinucleotídeos que codificam proteínas quecompreendem a via de fenilpropanóide de Coffea canephora e Coffea arabi-ca sejam descritos e exemplificados aqui, esta invenção é intencionada a-branger ácidos nucléicos e proteínas codificadas de outras espécies de Cof-fea que são suficientemente similares para ser usadas alternadamente comos polinucleotídeos de Coffea exemplificados e proteínas para os propósitosdescritos abaixo. Conseqüentemente, quando os termos polipeptídeos ouproteínas que "compreendem a via de fenilpropanóide" forem aqui usados, éintencionado abranger todas as proteínas de Coffea tendo as característicasfísicas, bioquímicas, e funcionais gerais descritas aqui, como também ospolinucleotídeos que as codificam.
Considerado em termos de suas seqüências, os polinucleotí-deos da invenção que codifica proteínas que compreendem a via de fenil-propanóide incluem variantes alélicas e mutantes naturais das SEQ ID Nss:1-8, que são provavelmente encontradas em variedades diferentes de C.canephora e C. arabica, e homólogos das SEQ ID N9®: 1-8 provavelmenteencontrados em espécies de café diferentes. Porque tais variantes e homó-logos são esperados possuir certas diferenças em seqüência de nucleotídeoe de aminoácido, esta invenção fornece polinucleotídeos isolados que codifi-cam proteínas que compreendem a via de fenilpropanóide que tem pelo me-nos cerca de 50%, preferivelmente pelo menos cerca de 60, 65, ou 70%,mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%,77%,. 78%, 79%, ou 80%, até mesmo mais preferivelmente 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, e até mesmo mais preferivelmente 90%,91%, 92%, 93%, 94%, 95%, e o mais preferivelmente 96%, 97%, 98% e 99%ou mais identidade com qualquer uma das SEQ ID Nes: 9-16, e compreendeuma seqüência de nucleotídeo que tem faixas equivalentes de identidade aqualquer uma das SEQ ID NQS: 1-8. Porque a variação de seqüência naturalprovavelmente existe entre as proteínas que compreendem a via de fenil-propanóide, e os genes que os codificam em variedades e espécies de cafédiferentes, alguém versado na técnica esperaria encontrar este nível de vari-ação, embora ainda mantendo as propriedades únicas dos polipeptídeos epolinucleotídeos da presente invenção. Uma tal expectativa é em parte devi-do à degeneração do código genético, como também ao sucesso evolutivoconhecido de variações de seqüência de aminoácido conservadoras queapreciavelmente não alteram a natureza da proteína codificada. Conseqüen-temente, tais variantes e homólogos são considerados substancialmenteiguais uns aos outros e são incluídos dentro do escopo da presente inven-ção.
As seqüências reguladoras de gene associadas aos genes quecodificam proteínas que compreendem a via de fenilpropanóide são de utili-dade prática e são considerados dentro do escopo da presente invenção. Qspromotores e outras seqüências reguladoras de gene de genes que codifi-cam proteínas que compreendem a via de fenilpropanóide de qualquer es-pécie de café podem ser obtidos pelos métodos descritos abaixo, e podemser utilizados de acordo com a presente invenção. Os elementos promotorese reguladores que controlam a especificidade de tecido e especificidadetemporal da expressão de genes que codificam proteínas que compreendema via de fenilpropanóide podem ser usados para tirar vantagem, alterar oumodificar a expressão das proteínas que compreendem a via de fenilpropa-nóide para a meta de intensificar o sabor e aroma de produtos de café pro-duzidos de feijões de.café que compreendem tais modificações, entre outrasutilidades.
As seções a seguir expõem os procedimentos gerais envolvidosna prática da presente invenção. À extensão que os materiais específicossão mencionados, é meramente para o propósito de ilustração, e não é in-tencionado a limitar a invenção. A menos que do contrário especificado, pro-cedimentos biológicos bioquímicos e moleculares gerais, como aqueles ex-postos em Sambrook et ai, Molecular Cloning, Cold Spring Harbor Labora-tory (1989) ou Ausubel et al. (eds), Current Protocols in Molecular Biology,John Wiley & Sons (2005) são usados.Moléculas de Ácido Nucléico. Proteínas e Anticorpos:
Moléculas de ácido nucléico da invenção podem ser preparadasatravés de dois métodos gerais: (1) elas podem ser sintetizadas de trifosfa-tos de nucleotídeo apropriados, ou (2) elas podem ser isoladas de fontesbiológicas. Ambos os métodos utilizam protocolos bem conhecidos na técnica.
A disponibilidade de informação de seqüência de nucleotídeo,como o cDNA que tem SEQ ID Nqs:: 1-8, permite preparação de uma molé-cula de ácido nucléico isolada da invenção através de síntese de oligonucle-otídeo. Oligonucleotídeos sintéticos podem ser preparados pelo método defosforamidita empregado nos Sintetizador de DNA Applied Biosystem 38A oudispositivos similares. A constructo resultante pode ser purificada de acordocom os métodos conhecidos na técnica, como cromatografia líquida de de-sempenho alto (HPLC). Polinucleotídeos longos, bifilamentares devem sersintetizados como uma molécula de DNA da presente invenção. Em está-gios, devido às limitações de tamanho inerente em métodos sintéticos deoligonucleotídeo atuais. Desse modo, por exemplo, uma molécula bifilamen-tar longa pode ser sintetizada como vários segmentos menores de comple-mentaridade apropriada. Segmentos complementares desse modo produzi-dos podem ser anelados de modo que cada segmento possua os términosaderentes apropriados para ligação de um segmento adjacente. Segmentosadjacentes podem ser ligados recozendo os términos aderentes na presençade DNA Iigase para constructo uma molécula bifilamentar longa inteira. Umamolécula de DNA sintética assim construída pode depois ser clonada e am-u plificada em um vetor apropriado.
De acordo com a presente invenção, ácidos nucléicos que têm ahomologia de seqüência de nível apropriado com parte ou todos dos genesde regiões de codificação e/ou reguladoras que codificam proteínas quecompreendem a via de fenilpropanóide podem ser identificados usando con-dições de hibridação e lavagem de severidade apropriada. Será apreciadopor aqueles versados na técnica que a estratégia acima mencionada, quan-do aplicada às seqüências genômicas, além de permitir as seqüências decodificação de isolamento para genes que codificam proteínas que compre-endem a via de fenilpropanóide, também permitirão isolamento de promoto-res e outras seqüências reguladoras de gene associadas aos genes que co-dificam proteínas que compreendem a via de fenilpropanóide, embora asseqüências reguladoras em si podem não compartilhar homologia suficientepara permitir hibridação adequada.
Como uma ilustração típica, hibridações podem ser executadas,de acordo com o método de Sambrook et al., usando uma solução de hibri-dação que compreende: 5X SSC, reagente de 5X Denhardt, 1,0% de SDS1100 Mg/ml de DNA de esperma de salmão fragmentado desnaturado, 0,05%de pirofosfato de sódio e até 50% de formamida. Hibridação é realizada a37-42°C por pelo menos seis horas. Seguindo hibridação, os filtros são lava-dos como segue: (1) 5 minutos em temperatura ambiente em 2X SSC e 1%de SDS; (2) 15 minutos em temperatura ambiente em 2X SSC e 0,1% deSDS; (3) 30 minutos-1 hora a 37°C em 2X SSC e 0,1% de SDS; (4) 2 horasa 45-55°C em 2X SSC e 0,1% de SDS, alterando a solução a cada 30 minutos.
Uma fórmula comum para calcular as condições de severidaderequeridas para alcançar hibridação entre as moléculas de ácido nucléico deuma homologia de seqüência especificada (Sambrook et al., 1989):
Tm = 81,5°C + 16,6Log [Na+] + 0,41 (% G+C) - 0,63 (% formamida) - 600/#bp em dúplex
Como uma ilustração da fórmula acima, usando [Na+] = [0,368]e 50% formamida, com teor de GC de 42% e um tamanho de sonda médiode 200 bases, a Tm é 57°C. A Tm de um dúplex de DNA diminui em 1 -1,5°C com cada 1 % de diminuição em homologia. Desse modo, alvos commais que cerca de 75% de identidade de seqüência seriam observados u-sando uma temperatura de hibridação de 42°C. Em uma modalidade, a hi-bridação fica a 37°C e a lavagem final fica a 42°C; em outra modalidade ahibridação fica a 42°C e a lavagem final fica a 50°C; e em ainda outra moda-lidade a hibridação fica a 42°C e lavagem final fica a 65°C, com as soluçõesde hibridação e de lavagem acima. Condições de severidade alta incluemhibridação a 42°C na solução de hibridação acima e uma lavagem final a65°C em 0,1 X SSC e 0,1% de SDS durante 10 minutos.
Ácidos nucléicos da presente invenção podem ser mantidos co-mo DNA em qualquer vetor de clonagem conveniente. Em uma modalidadepreferida, clones são mantidos em vetor de clonagem/expressão de plasmí-deo, como pGEM-T (Promega Biotech, Madison, Wl), pBluescript (Stratage-ne, La Jolla, CA), pCR4-TOPO (Invitrogen, Carlsbad, CA) ou pET28a+ (No-vagen, Madison, Wl) todos destes podem ser propagados em uma célulahospedeira de E. coli adequada.
Moléculas de ácido nucléico da invenção incluem cDNA, DNAgenômico, RNA, e fragmentos destes que pode ser uni-, bi- ou até mesmotrifilamentar. Desse modo, esta invenção fornece oligonucleotídeos (filamen-tos sense ou anti-sentido de DNA ou RNA) tendo seqüências capazes dehibridar com pelo menos uma seqüência de uma molécula de ácido nucléicoda presente invenção. Tais oligonucleotídeos são úteis como sondas paradetectar genes que codificam proteínas que compreendem a via de fenilpro-panóide ou mRNA em amostras de teste de tecido de planta, por exemplo,por amplificação de PCR1 ou para a regulação positiva ou negativa de genesde expressão que codificam proteínas que compreendem a via de fenilpro-panóide ou antes da translação do mRNA para as proteínas. Métodos emque oligonucleotídeos ou polinucleotídeos podem ser utilizados como son-das para tais ensaios incluem, mas não são limitados a: (1) hibridação in si-tu] (2) hibridação Southern (3) hibridação Northern; e (4) reações de amplifi-cação sortidas como reação em cadeia de polimerase (PCR, incluindo RT-PCR) e reação em cadeia de Iigase (LCR).
Polipeptídeos codificados por ácidos nucléicos da invenção po-dem ser preparados em uma variedade de modos, de acordo com os méto-dos conhecidos. Se produzidos in situ os polipeptídeos podem ser purifica-dos de fontes apropriadas, por exemplo, sementes, pericarpos, ou outraspartes de planta.
Alternativamente, a disponibilidade das moléculas de ácido nu-cléico que codificam os polipeptídeos permite produção das proteínas usan-do métodos de expressão in vitro conhecidos na técnica. Por exemplo, umcDNA ou gene pode ser clonado em um vetor de transcrição apropriado invitro, um tal pSP64 ou pSP65 para transcrição in vitro, seguido por transla-ção livre de célula em um sistema de translação livre de célula adequado,como reticulócitos de germe de trigo ou de coelho. Sistemas de transcrição ede translação in vitro estão comercialmente disponíveis, por exemplo, dePromega Biotech, Madison, Wl, BRL, Rockville, MD ou Invitrogen, Carlsbad,CA.
De acordo com uma modalidade preferida, quantidades maioresde polipeptídeos que compreendem a via de fenilpropanóide podem ser pro-duzidas através de expressão em um sistema procariótico ou eucarióticoadequado. Por exemplo, parte ou toda de uma molécula de DNA, como oscDNAs que tem SEQ ID NQS: 1-8, pode ser inserida em um vetor de plasmí-deo adaptado para expressão em uma célula bacteriana (como E. coli) ouuma célula de levedura .(como Saccharomyces cerevisiae), ou em um vetorde baculovírus para expressão em uma célula de inseto. Tais vetores com-preendem os elementos reguladores necessários para expressão do DNA nacélula hospedeira, posicionado em uma tal maneira a controlar a expressãodo DNA na célula hospedeira. Tais elementos reguladores requeridos paraexpressão incluem seqüências de promotor, seqüências de iniciação detranscrição e, opcionalmente, seqüências de intensificador.
Os polipeptídeos que compreendem a via de fenilpropanóideproduzidos por expressão de gene podem ser purificados em um sistemaprocariótico ou eucariótico recombinante de acordo com os métodos conhe-cidos na técnica. Em uma modalidade preferida, um sistema de expres-são/secreção comercialmente disponível pode ser usado, por meio do qual aproteína recombinante é expressada e depois disso segregada da célulahospedeira, para ser facilmente purificada do meio circunvizinho. Se vetoresde expressão/secreção não forem usados, um método alternativo envolvepurificar a proteína recombinante através de separação de afinidade, comopor interação imunológica com anticorpos que especificamente ligam à pro-teína recombinante. Tais métodos são comumente usados por médicos ver-sados.
Polipeptídeos da invenção podem também ser sintetizados eexpressos como proteínas de fusão com um ou mais domínios adicionaisligados a estas para, por exemplo, produzir um peptídeo mais imunogênico,isolar mais facilmente um peptídeo recombinantemente sintetizado, identifi-car e isolar anticorpos e células B de expressão de anticorpos, e similares.Domínios facilitadores de detecção e purificação incluem, por exemplo, pep-tídeos quelantes de metal como tratos de poli-histidina e módulos de histidi-na-triptofano que permitem purificação em metais imobilizados, domínios deproteína A que permitem purificação em imunoglobulina imobilizada, e o do-mínio utilizado no sistema de extensão/purificação por afinidade de FLAG(Immunex Corp, Seattle Wash.). A inclusão de umas seqüências Iigadorascliváveis como Fator Xa ou enterocinase (Invitrogen, San Diego Calif.) entreum domínio de purificação e o peptídeo ou polipeptídeo compreendendo omotivo facilita a purificação. Por exemplo, um vetor de expressão pode inclu-ir uma seqüência de ácido nucléico de codificação de epítopo ligada a seisresíduos de histidina seguido por uma tiorredoxina e um sítio de clivagem deenterocinase (vide por exemplo, Williams, Biochemistry 1995, 34: 1787-1797; Dobeli, Protein Expr. Purif. 1998, 12: 404-14,). Os resíduos de histidi-na facilitam a detecção e purificação enquanto o sítio de clivagem de entero-cinase provê um meio para purificar o epítopo do restante da proteína defusão. Tecnologia que pertence aos vetores que codificam proteínas de fu-são e aplicação de proteínas de fusão são bem descritas na literatura cientí-fica e de patente, (vide por exemplo, Kroll, DNA Ceii Biol. 1993, 12: 441-53).
Os polipeptídeos que compreendem a via de fenilpropanóidepodem ser analisados, preparados pelos métodos acima mencionados, deacordo com os procedimentos padrão.
Polipeptídeos que compreendem a via de fenilpropanóide purifi-cados de café, ou produzidos recombinantemente, podem ser usados paragerar anticorpos policlonais ou monoclonais, fragmentos de anticorpo ou de-rivados como definidos aqui, de acordo com os métodos conhecidos. Anti-corpos que reconhecem e ligam fragmentos dos polipeptídeos que compre-endem a via de fenilpropanóide da invenção são também contemplados,contanto que os anticorpos sejam específicos para polipeptídeos que com-preendem a via de fenilpropanóide. Por exemplo, se análises das proteínasou análises de Sourthern e de clonagem (vide abaixo) indicarem que os ge-nes clonados pertencem a uma família de multigene, então anticorpos mem-bro-específicos feitos para peptídeos sintéticos que correspondem às regi-ões não conservadas da proteína podem ser gerados.
Estojos que compreendem um anticorpo da invenção paraquaisquer dos propósitos descritos aqui são também inclusos dentro do es-copo da invenção. Em geral, um tal estojo inclui um antígeno de controlepara o qual o anticorpo é imunoespecífico.
Ácidos clorogênicos são prováveis de representar um papel emvários aspectos de saúde e bem-estar humana. Os ácidos clorogênicos fo-ram demonstrados ser antioxidantes poderosos in vitro (Rice-Evands, CA etal. 1996), exibem efeitos protetores contra dano de DNA in vitro (Shibata, Het al. 1999), exibem propriedades anticarcinogênicas e antimutagênicas, epodem por fim reduzir o risco de certos cânceres (Olthof, MR et al. 2001; eHollman, PC 2001), e podem proteger contra doença cardiovascular (Olthof,MR et al. 2001; e Hollman, PC 2001). Esta lista de benefícios de saúde atri-buível aos ácidos clorogênicos é intencionada ser ilustrativa e não exaustiva,e é presumido que há muitos outros efeitos de saúde benéficos atribuíveispara ácidos clorogênicos presentemente desconhecidos. Conseqüentemen-te, os polipeptídeos de café que compreendem a via biossintética de ácidosclorogênicos descritos e exemplificados aqui são esperados encontrar utili-dade em uma variedade de aplicações alimentícias, saúde, e de bem-estar.Por exemplo, os polipeptídeos de café que compreendem a via biossintéticade ácidos clorogênicos, ou seus respectivos produtos de ácido clorogênico,podem ser utilizados como suplementos dietéticos, ou em vários produtosalimentícios e de bebida.
Uma ou mais das aplicações acima mencionadas para os poli-peptídeos que compreendem a via de fenilpropanóide podem ser buscadasexplorando a disponibilidade dos polinucleotídeos que codificam polipeptí-deos que compreendem a via de fenilpropanóide descrita aqui para gerarquantidades significativas de proteína pura usando organismos recombinan-tes (por exemplo, no Picia pastoris de levedura ou em Lactobacilli compatí-veis com alimento, ou em células de planta), e depois testando as proteínasem ensaios novos ou estabelecidos para potencial antioxidante, potencialquimioprotetor ou quimioterapêutico, potencial para promover saúde cardio-vascular, e similares. Testagem similar pode ser realizada usando os ácidosclorogênicos produzidos por estas proteínas de acordo com meios adequa-dos estabelecidos ou desenvolvidos na técnica. Se as proteínas purificadasespecíficas, ou produtos de ácido clorogênico produzidos por tais proteínasforem descobertas ser particularmente úteis, versões naturais daquelas pro-teínas e seus produtos de ácido clorogênico também podem ser isoladas degrãos de café determinados ser ricos naqueles polipeptídeos particularesque compreendem a via de fenilpropanóide.Vetores, Células, Tecidos e Plantas:
Também caracterizados de acordo com a presente invenção sãovetores e estojos para produzir células hospedeiras transgênicas que con-têm um polinucleotídeo que codifica polipeptídeos que compreendem a viade fenilpropanóide, ou um oligonucleotídeo, ou homólogo, análogo ou vari-ante destes em uma orientação sense ou anti-sentido, ou um gene repórter eoutros constructos sob controle de promotores célula ou tecido-específicos eoutras seqüências reguladoras. Células hospedeiras adequadas incluem,mas não são limitadas a, células de planta, células bacterianas, levedura eoutras células fúngicas, células de inseto e células mamíferas. Vetores paratransformar uma ampla variedade destas células hospedeiras são bem co-nhecidos àqueles de habilidade na técnica. Eles incluem, mas não são limi-tados a, plasmídeos, fagemídeos, cosmídeos, baculovíruses, bacmídeos,cromossomos artificiais bacterianos (BACs), cromossomos artificiais de le-vedura (YACs), como também outros vetores bacterianos, de levedura e vi-rais. Tipicamente, estojos para produzir células hospedeiras transgênicasconterão um ou mais vetores apropriados e instruções para produzir as célu-las transgênicas usando o vetor. Estojos podem também incluir um ou maiscomponentes adicionais, como meios de cultura para cultivar as células, re-agentes para executar a transformação das células e reagentes para testaras células transgênicas para expressão de gene, para citar alguns.
A presente invenção inclui plantas transgênicas que compreen-dem uma ou mais cópias de um gene que codifica um polipeptídeo quecompreende a via de fenilpropanóide, ou seqüências de ácido nucléico queinibem a produção ou função dos polipeptídeos endógenos de uma plantaque compreendem a via de fenilpropanóide. Isto é realizado transformandocélulas de planta com um transgene que compreende parte ou toda de umaseqüência de codificação para um polipeptídeo que compreende a via defenilpropanóide, ou mutante, anti-sentido ou variante destes, incluindo RNA,controlado por seqüências reguladoras nativas ou recombinantes, comodescrito abaixo. Espécies de café de plantas transgênicas são preferidas,incluindo, sem limitação, C. abeokutae, C. arabica, C. arnoldiana, C. aruwe-miensis, C. bengalensis, C. canephora, C. congensis C. dewevrei, C. excel-sa, C. eugenioides ,and C. heterocalyx, C. kapakata, C. khasiana, C. liberica,C. moloundou, C. rasemosa, C. salvatrix, C.sessiflora, C. stenophylla, C. tra-vencorensis, C. wightiana e C. zanguebariae. Plantas de qualquer espéciesão também inclusas na invenção; estas incluem, mas não são limitadas a,tabaco, Arabidopsis e outras espécies "amigáveis de laboratório", plantaçõesde cereais como milho, trigo, arroz, feijão-soja cevada, centeio, aveias, sor-go, alfaia, trevo e similares, plantas produtoras de óleo como óleo de canola,cártamo, girassol, amendoim, cacau e similares, plantações vegetais comotomate, tomate-de-árvore, batata, pimenta, berinjela, beterraba açucareira,cenoura, pepino, alface, ervilha e similares, plantas hortícolas como áster,begônia, crisântemo, delfínio, petúnia, zínia, gramado e gramas e similares.
Plantas transgênicas podem ser geradas usando métodos detransformação de planta padrões conhecidos àqueles versados na técnica.
Estes incluem, mas não são limitados a, vetores de Agrobacterium, trata-mento de polietileno glicol de protoplastos, liberação biolística de DNA, mi-cro-feixe de laser UV, vetores de vírus gêmeos ou outros vetores virais deplanta, tratamento de fosfato de cálcio de protoplastos, eletroporação de pro-toplastos isolados, agitação de suspensões de célula em solução com mi-crocontas revestidas com o DNA transformante, agitação de suspensão decélula em solução com fibras de silício revestidas com DNA transformante,absorção de DNA direta, absorção de DNA mediada por lipossoma, e simila-res. Tais métodos foram publicados na técnica. Vide, por exemplo, Methodsfor Plant Molecular Biology (Weissbach & Weissbach, eds., 1988); Methodsin Plant Molecular Biology (Schuler & Zielinski, eds., 1989); Plant MolecularBiology Manual (Gelvin, Schilperoort, Verma, eds., 1993); e Methods in PlantMolecular Biology - A Laboratory Manual (Maliga, Klessig, Cashmore, Gruis-sem & Varner, eds., 1994).
O método de transformação depende da planta a ser transfor-mada. Vetores de Agrobacterium são freqüentemente usados para transfor-mar espécies de dicotiledônea. Vetores binários de Agrobacterium incluem,mas não são limitados a, BIN19 e derivados destes, a série de vetor de pBI,e vetores binário de pGA482, pGA492, pLH7000 (Acesso de GenBankAY234330) e qualquer um adequado dos vetores de pCAMBIA (derivadosdos vetores de pPZP construídos por Hajdukiewicz1 Svab & Maliga, (1994)Plant Mol Biol 25: 989-994, disponível de CAMBIA, GPO Box 3200, Canber-ra ACT 2601, Austrália ou por meio da rede mundial em CAMBIA.org). Paratransformação de espécies de monocotiledônea, bombardeio biolístico compartículas revestidas com DNA transformante e fibras de silício revestidascom DNA transformante é freqüentemente útil para transformação nuclear.Alternativamente, vetores de Agrobacterium "superbinários" foram usados deforma bem-sucedida para a transformação de arroz, milho e várias outrasespécies de monocotiledônea.
Constructos de DNA para transformar uma planta selecionadacompreendem uma seqüência de codificação de interesse operavelmenteligada às seqüências reguladoras de 5' apropriadas (por exemplo, as se-qüências promotoras e reguladoras translacionais) e seqüências reguladorasde 3' (por exemplo, terminadores). Em uma modalidade preferida, é utilizadauma seqüência de codificação que codifica um polipeptídeo que compreendea via de fenilpropanóide sob controle de seus elementos reguladores natu-rais de 5' e 3'. Em outras modalidades, as seqüências de codificação e regu-ladoras são trocadas para alterar o teor de proteína da semente da plantatransformada para uma melhoria fenotípica, por exemplo, em sabor, aromaou outra característica.
Em uma modalidade alternativa, a região de codificação do geneé colocada sob um promotor constitutivo poderoso, como o promotor de 35Sdo Vírus do Mosaico de Couve-flor (CaMV) ou o promotor de 35S do vírus domosaico de escrofulária. Outros promotores constitutivos contemplados para ouso na presente invenção incluem, mas não são limitados a: promotores deT-DNA manopina sintetase, nopalina sintase e octopina sintase. Em outrasmodalidades, um promotor de monocotiledônea forte é usado, por exemplo, opromotor de ubiquitina de milho, o promotor de actina de arroz ou o promotorde tubulina de arroz (Jeon et al., Plant Physiology. 123: 1005-14, 2000).Plantas transgênicas com seqüências de codificação para ex-pressar polipeptídeos que compreendem a via de fenilpropanóide sob umpromotor induzível são também contempladas estar dentro do escopo dapresente invenção. Promotores de planta induzíveis incluem o promotor con-trolado por repressor/operador de tetraciclina, os promotores de gene dechoque térmico, promotores induzidos por tensão (por exemplo, ferimento),promotores de gene responsivos à defesa (por exemplo, genes de amôniade fenilalanina liase), promotores de gene induzidos por ferida (por exemplo,genes de proteína de parede celular rica em hidroxiprolina), os promotoresde gene quimicamente-induzíveis (por exemplo, genes de nitrato reductase,genes de glucanase, genes de quitinase, etc.) e os promotores de gene in-duzíveis por escuridão (por exemplo, gene de asparagina sintetase) paracitar apenas alguns.
Promotores tecido-específicos e desenvolvimento-específicossão também contemplados para o uso na presente invenção. Exemplos não-Iimitativos de promotores semente-específicos incluem Cim 1 (mensageminduzida por citocinina), CZ19B1 (zeína de 19 kDa de milho), milps (mio-inositol-1-fosfato sintase), e celA (celulose sintase) (Pedido U. S. Ne09/377.648), feijão beta.-faseolina, napina, beta.-conglicinina, Iecitina de fei-jão-soja, cruciferina, zeína de 15 kDa de milho, zeína de 22 kDa, zeína de 27kDa, g-zeína, cera, shrunken 1, shrunken 2, e globulina 1, feijão-soja 11SIegumina (Báumlein et al., 1992), e proteína armazenamento semente 11Sde C. canephora (Marraccini et al., 1999, Plant Physiol. Biochem. 37: 273-282). Vide também WO 00/12733, onde são revelados os promotores se-mente-preferidos de genes end1 e de end2. Outros promotores semente-específicos de Coffea podem também ser utilizados, incluindo, mas não limi-tados ao promotor de gene de oleosina descrito no Pedido de PCTco-pendente de propriedade comum Nq US2006/026121, o promotor de ge-ne de deidrina descrito no Pedido de PCT co-pendente de propriedade co-mum Ne US2006/026234, e o promotor de gene de 9-cis-epoxicarotenóidedioxigenase descrito no Pedido de PCT co-pendente de propriedade comumN9 US2006/34402. Exemplos de similares promotores tecido-específicos in-cluem, mas não são limitados a: os promotores de gene de subunidade pe-quena de ribulose bisfosfato carboxilase (RuBisCo) (por exemplo, o promotorde subunidade pequena de café como descrito por Marracini et al., 2003) ouos promotores de gene de proteína Iigadora a/b de clorofila (CAB) para ex-pressão em tecido fotossintético; e os promotores de gene de glutamina sin-tetase raiz-específicos onde expressão em raízes é desejada.
A região de codificação é também operavelmente ligada a umaseqüência reguladora de 3' apropriada. Em modalidades onde a seqüênciareguladora de 3' nativa não é estiver em uso, a região de poliadenilação no-palina sintetase pode ser usada. Outras regiões reguladoras de 3' úteis in-cluem, mas não são limitadas à região de poliadenilação de octopina sinta-se.
A região de codificação selecionada, sob controle de elementosreguladores apropriados, é operavelmente ligada a um marcador de resis-tência de fármaco nuclear, como resistência de canamicina. Outros sistemasde marcadores selecionáveis úteis incluem genes que conferem resistênciasà antibiótico ou herbicidas (por exemplo, resistência à higromicina, sulfonilu-réia, fosfinotricina, ou glifosato) ou genes que conferem crescimento seletivo(por exemplo, fosfomanose isomerase, permitindo crescimento de células deplanta em manose). Genes marcadores selecionáveis incluem, sem limita-ção, genes que codificam resistência antibiótica, como aqueles codificandoneomicina fosfotransferase Il (ΝΕΟ), diidrofolato reductase (DHFR) e higro-micina fosfotransferase (HPT), como também genes que conferem resistên-cia aos compostos herbicidas, como EPSPS resistente a glifosato e/ou glifo-sato oxidorreducatase (GOX), Bromoxynil nitrilase (BXN) para resistência abromoxinil, genes de AHAS para resistência a imidazolinonas, genes de re-sistência à sulfoniluréia, e genes de resistência a 2,4-diclorofenoxiacetato(2,4-D).
Em certas modalidades, promotores e outras seqüências regu-ladoras de expressão são abrangidas pela presente invenção operavelmenteligadas aos genes repórteres. Genes repórteres contemplados para o uso nainvenção incluem, mas não são limitados a, genes que codificam proteínafluorescente verde (GFP), proteína fluorescente vermelha (DsRed), ProteínaFluorescente Ciana (CFP), Proteína Fluorescente Amarela (YFP), ProteínaFluorescente Laranja de Cerianthus (cOFP), fosfatase alcalina (AP), β-lactamase, cloranfenicol acetiltransferase (CAT), adenosina desaminase (A-DA), aminoglicosídeo fosfotransferase (neor, G418r) diidrofolato reductase(DHFR), higromicina-B-fosfotransferase (HPH), timidina cinase (TK), IacZ(codificando α-galactosidase), e xantina guanina fosforibosiltransferase (XG-PRT), Beta-Glucuronidase (gus), Fosfatase Alcalina Placentária (PLAP)1Fosfatase Alcalina Embrionária Segregada (SEAP), ou Luciferase de Vaga-lume ou Bacteriana (LUC). Como com muitos dos procedimentos padrãoassociados à prática da invenção, os artesãos versados estarão cientes dasseqüências adicionais que podem servir a função de um marcador ou repór-ter.
Modificações de seqüência adicionais são conhecidas na técni-ca intensificar a expressão de gene em um hospedeiro celular. Estas modifi-cações incluem eliminação das seqüências que codificam sinais de poliade-nilação supérfluos, sinais de sítio de encaixe de éxon-íntron, repetições se-melhantes a transposon, e outras tais seqüências bem caracterizadas quepodem ser deletérias à expressão de gene. Alternativamente, se necessário,o teor de G/C da seqüência de codificação pode ser ajustado em níveis pon-derados para um hospedeiro de célula de planta de café dado, como calcu-lado por referência aos genes conhecidos expressos em uma célula de plan-ta de café. Também, quando possível, a seqüência de codificação é modifi-cada para evitar estruturas de mRNA secundárias de alfinete prognostica-das. Outra alternativa para intensificar a expressão de gene é usar seqüên-cias líderes de 5'. Seqüências líderes de translação são bem conhecidas natécnica, e incluem o derivado de ação eis (ômega') da seqüência líder de 5'(omega) do vírus do mosaico de tabaco, as seqüências líderes de 5' do vírusdo mosaico de capim-cevadinha, vírus do mosaico de alfafa, e vírus de mo-saico de nabo amarelo.
As plantas são transformadas e depois disso triadas para umaou mais propriedades, incluindo a presença do produto de transgene, o mR-NA de codificação de transgene, ou um fenótipo alterado associado à ex-pressão do transgene. Deveria ser reconhecido que a quantidade de expres-são, como também o padrão tecido- e temporal-específico de expressão dostransgenes em plantas transformadas pode variar, dependendo da posiçãode sua inserção no genoma nuclear. Tais efeitos posicionais são bem co-nhecidos na técnica. Por este motivo, vários transformantes nucleares deve-riam ser regenerados e testados para expressão do transgene.
Métodos:
Os ácidos nucléicos e polipeptídeos da presente invenção po-dem ser usados em qualquer um de vários métodos por meio do qual osprodutos de proteína podem ser expressados em plantas de café para queas proteínas possam representar um papel na proteção da planta de infec-ção ou tensão oxidativa, e na intensificação de sabor e/ou aroma da bebidade café ou produtos de café por fim produzidos do feijão da planta de caféexpressando a proteína. Similarmente, os polipeptídeos da invenção podemser usados em qualquer um de vários métodos por meio dos quais os ácidosclorogênicos, e similares tais produtos fitoquímicos sintetizados pelos poli-peptídeos, podem representar um papel na proteção da planta de infecçãoou tensão oxidativa, e na intensificação de sabor e/ou aroma da bebida decafé ou produtos de café por fim produzidos do feijão da planta de café con-tendo os ácidos clorogênicos.
Com respeito à proteção da planta de doença, e mais especifi-camente, doença infecciosa, foi demonstrado que produção elevada de CGApode diminuir suscetibilidade das plantas à infecção microbiana. Por exem-plo, produção crescente de CGA na planta de tomate resultou em progres-são mais lenta e níveis mais baixos de infecção pelas bactérias Pseudomo-nas syringae. (Niggeweg R, et al. 2004). Similarmente, produção suprimidade CGA foi mostrada aumentar suscetibilidade de plantas de tabaco à infec-ção fúngica. (Maher EA et al. 1994). Tais estudos destacam a importância defenilpropanóides como CGA em sustentar a saúde de planta. Desse modo, ahabilidade para manipular produção de polipeptídeos que compreendem avia biossintética para ácidos clorogênicos em uma planta como café, ou atémesmo usar os polinucleotídeos e proteínas da invenção para monitorar ex-pressão de gene relevante, permitirá estudo e manipulação da resposta daplanta de café aos patógenos. Deste conhecimento, pode ser possível gerarplantas de café geneticamente modificadas com resistência aumentada apatógenos de planta, especialmente patógenos de planta de café. Exemplosde patógenos de café incluem Hemileia vastatrix, o agente etiológico da"Ferrugem de Café", e Colletotrichum coffeanum, o agente etiológico da"Doença do Fruto Cafeeiro", e Pseudomanas syringae pv. Garcae, o agenteetiológico da "Ferrugem de Café". Desse modo, um aspecto dos métodos dainvenção caracteriza para diminuir suscetibilidade de doença infecciosa emplantas, preferivelmente plantas de café, modulando a expressão de polipep-tídeos que compreendem a via de fenilpropanóide e o modulando o perfil deácidos clorogênicos na planta.
Com respeito à proteção da planta de tensão oxidativa, ácidosclorogênicos foram demonstrados ser antioxidantes potentes nas plantas emsi. Em muitas espécies de planta, tensões ambientais como luz alta, baixatemperatura, lesão ao tecido da planta, deficiência de nitrogênio, e infecçãoforam observadas desencadear biossíntese de CGA. (Grace SC. et al.,2000). Ácidos clorogênicos foram demonstrados ter propriedades desconta- minantes de radicais livres (Ohnishi M. et al. 1994), incluindo o descontami-nante do cátion de radical verde estável de ácido 2,2'-azinobis-(3-etilbenzotiazolino-6-sulfônico e o ânion de superóxido. (Grace SC et al.2000). Em plantas, oxidantes são formados, entre outras coisas sob condi-ções de tensão de luz como luz de excesso, ou por exposição aos poluentes ambientais, como ozônio. Portanto, a habilidade para manipular produção depolipeptídeos que compreendem a via biossintética para ácidos clorogênicosem uma planta, ou até mesmo usar os polinucleotídeos e proteínas da in-venção para monitorar tal expressão de gene, permitirá estudo e manipula-ção da resposta da planta de café às tensões ambientais e a geração deespécies oxidativas. Deste conhecimento, é possível gerar plantas de cafégeneticamente modificadas que são melhores equipadas para crescimentosaudável e produção de plantação sob condições de tensões ambientaisagudas ou prolongadas. Desse modo, um aspecto dos métodos da invençãocaracteriza intensificar descontaminação de radical livre em plantas, preferi-velmente plantas de café, modulando a expressão de polipeptídeos quecompreendem a via de fenilpropanóide e o modulando o perfil de ácidos clo-rogênicos na planta.
Com respeito ao sabor e aroma de grão de café assado, é espe-rado que os polipeptídeos que compreendem a via de fenilpropanóide exer-çam alguma influência na geração de sabores de café por meio da reaçãode Maillard que ocorre durante a torrefação, por meio do teor das proteínasem si, ou os produtos como ácidos clorogênicos que elas produzem. Proteí-nas, e particularmente produtos de degradação de proteína (peptídeos e a-minoácidos), representam um grupo importante de precursores de sabor(Spanier et al., 2004). Portanto, proteínas relativamente abundantes comoaquelas que compreendem a via de fenilpropanóide podem ser esperadasfazer alguma contribuição às reações geradoras de sabor que ocorrem du-rante a torrefação do café. Uma tal contribuição pode prover da concentra-ção das proteínas em si no feijão de café, ou da concentração dos ácidosclorogênicos por fim produzidos das proteínas. A habilidade para monitorar(por exemplo, através de procriação assistida por marcador) ou manipularperfis de expressão de proteína para polipeptídeos que compreendem a viade fenilpropanóide é fornecida pelos polinucleotídeos da presente invenção,de acordo com os métodos descritos aqui.
Desse modo, um aspecto dos métodos da presente invençãocaracteriza alterar o perfil de polipeptídeos que compreendem a via de fenil-propanóide em uma planta, preferivelmente café, compreendendo aumentarou diminuir uma quantidade ou atividade de um ou mais polipeptídeos quecompreendem a via de fenilpropanóide na planta. Por exemplo. Em umamodalidade da invenção, um gene que codifica um polipeptídeo que com-preende a via de fenilpropanóide sob controle de suas próprias seqüênciasde controle de expressão é usado para transformar uma planta para o pro-pósito de produção crescente daquele polipeptídeo na planta. Alternativa-mente, uma região de codificação para um polipeptídeo que compreende avia de fenilpropanóide é operavelmente ligada às regiões de controle de ex-pressão heteróloga, como promotores constitutivos ou induzíveis.
Em algumas modalidades, pode ser desejável ter produção di-minuída de um ou mais dos polipeptídeos que compreendem a via de fenil-propanóide na planta. Isto pode ser realizado por vários modos, por exem-plo, triando variantes de ocorrência natural para expressão diminuída de po-lipeptídeos que compreendem a via de fenilpropanóide, ou triar variantes deocorrência natural para níveis diminuídos dos vários ácidos clorogênicos.
Por exemplo, plantas mutantes de perda-de-função (nulas) podem ser cria-das ou selecionadas de populações de mutantes de planta correntementedisponíveis. Será também apreciado por aqueles de habilidade na técnicaque populações de planta mutante podem também ser tríadas para mutantesque sobreexpressam um polipeptídeo particular que compreende a via defenilpropanóide, utilizando um ou mais dos métodos descritos aqui. Popula-ções mutantes podem ser feitas por mutagênese química, mutagênese deradiação, e inserções de transposon ou de T-DNA, ou alvejando lesões lo-cais induzidas em genomas (TILLING, vide, por exemplo, Henikoff et al.,2004, Plant Physiol. 135(2): 630-636; Gilchrist & Haughn, 2005, Curr. Opin.Plant Biol. 8(2): 211-215). Os métodos para fazer populações mutantes sãobem conhecidos na técnica.
Os ácidos nucléicos da invenção podem ser usados para identi-ficar polipeptídeos mutantes que compreendem a via de fenilpropanóide emvárias espécies de planta. Em espécies como milho ou Arabidopsis ondelinhas de inserção de transposon estão disponíveis, preparadores de oligo-nucleotídeo podem ser projetados para triar linhas para inserções nos genesque codificam polipeptídeos que compreendem a via de fenilpropanóide.Mediante criação, uma linha de planta pode depois ser desenvolvida que éheterozigota ou homozigota para o gene interrompido.
Uma planta também pode ser criada para exibir um fenótipo si-milar àquele visto em mutantes nulos criados por técnicas mutagênicas. Ummutante nulo transgênico pode ser criado expressando uma forma mutantede um polipeptídeo selecionado que compreende a via de fenilpropanóidepara criar um "efeito negativo dominante". Embora não limitando a invençãoa qualquer um mecanismo, esta proteína mutante competirá com a proteínado tipo selvagem para interação de proteínas ou outros fatores celulares.Exemplos deste tipo de efeito "negativo dominante" são bem conhecidospara sistemas de inseto e vertebrados (Radke et al., 1997, Genetics 145:163-171; Kolch et al., 1991, Nature 349: 426-428).
Outro tipo de mutante nulo transgênico pode ser criado inibindoa translação de mRNA que codifica as enzimas da via de fenilpropanóide por"silenciamento de gene pós-transcricional". O gene das espécies alvejadaspara sub-regulação, ou um fragmento deste, pode ser utilizado para contro-lar a produção da proteína codificada. Moléculas anti-sentido de comprimen-to total podem ser usadas para este propósito. Alternativamente, oligonucle-otídeos anti-sentido alvejados podem ser utilizados para regiões específicasdo mRNA que são críticas para translação. O uso de moléculas anti-sentidopara diminuir os níveis de expressão de um gene predeterminado é conheci-do na técnica. Moléculas anti-sentido podem ser fornecidas in situ transfor-mando as células de planta com um constructo de DNA que, sob transcrição,produz as seqüências de RNA anti-sentido. Tais construções podem ser pro-jetadas para produzir seqüências anti-sentido de comprimento totais ou par-ciais. Este efeito de silenciamento de gene pode ser intensificado sobrepro-duzindo transgenicamente tanto RNA sense como anti-sentido da seqüênciade codificação de gene de forma que uma quantidade alta de dsRNA é pro-duzida (por exemplo, vide Waterhouse et al., 1998, PNAS 95: 13959-13964).Nesta consideração, seqüências contendo dsRNA que correspondem a par-te ou todo de pelo menos um íntron foram observadas particularmente efica-zes. Em uma modalidade, parte ou toda do filamento anti-sentido da se-qüência de codificação é expressada por um transgene. Em outra modalida-de, filamentos senses e anti-sentido de hibridação de parte ou toda da se-qüência de codificação para polipeptídeos que compreendem a via de fenil-propanóide são transgenicamente expressos.
Em outra modalidade, gene de codificação da enzima da via defenilpropanóides pode ser silenciado através do uso de uma variedade deoutras técnicas de silenciamento de gene pós-transcricional (silenciamentode RNA) que estão correntemente disponíveis para sistemas de planta. Si-lenciamento de RNA envolve o processamento de RNA bifilamentar (dsRNA)em 21-28 fragmentos de nucleotídeos pequenos por uma enzima com baseem RNase H ("Dicer" ou "parecido com Dicer"). Os produtos de clivagem quesão siRNA (RNA de interferência pequena) ou Mirna (micro-RNA) são incor-porados nos complexos efetores de proteína regulam a expressão de genede uma maneira seqüência-específica (para revisões de silenciamento deRNA em plantas, vide Horiguchi, 2004, Diferentiation 72: 65-73; Baulcombe,2004, Nature 431: 356-363; Herr, 2004, Biochem. Soe. Trans. 32: 946-951).
RNA de interferência pequena pode ser quimicamente sintetiza-do ou transcrito e amplificado in vitro, e depois liberado às células. Liberaçãopode ser através de microinjeção (Tuschl T et ai-, 2002), transfecção química(Agrawal N et ai., 2003), eletroporação ou transfecção mediada por Iiposso-ma catiônica (Brummelkamp TR et al., 2002; Elbashir SM et al., 2002), ouquaisquer outros meios disponíveis na técnica que serão apreciadao peloartesão versado. Alternativamente, o siRNA podem ser expressados intrace-lularmente inserindo modelos de DNA a siRNA nas células de interesse, porexemplo, por meio de um plasmídeo, (Tuschl T et al., 2002), e especifica-mente pode ser alvejado para selecionar as células. RNA de interferênciapequena foi de forma bem-sucedida introduzido em plantas. (Klahre U et al.,2002).
Um método preferido de silenciamento de RNA na presente in-venção é o uso de RNA de alfinete curto (shRNA). Um vetor contendo umaseqüência de DNA que codifica para uma seqüência de siRNA desejada par-ticular é liberado em uma célula alvo por uns meios comuns. Uma vez nacélula, a seqüência de DNA é transcrita continuamente para as moléculas deRNA que fazem um ciclo de volta para elas mesmas e formam estruturas dealfinete mediante emparelhamento da base intramolecular. Estas estruturas de alfinete, uma vez processadas pela célula, são equivalentes às moléculasde siRNA e são usadas pela célula para mediar o silenciamento de RNA daproteína desejada. Vários constructos de utilidade particular para silencia-mento de RNA em plantas são descritos por Horiguchi, 2004, supra. Tipica-mente, um tal constructo compreende um promotor, uma seqüência do genealvo a ser silenciado na orientação "sense", um espaçador, o anti-sentido daseqüência de gene alvo, e um terminador. Se expressão em mais ou todosos tecidos de planta for desejada, os promotores constitutivos fortes, como opromotor de 35S de CaMV, podem ser usados. Igualmente, os promotorestecido-específicos, desenvolventemente-específicos ou temporalmente-específicos podem ser selecionados em outras modalidades, como debatidomais acima.
Ainda outro tipo de mutante nulo sintético pode também ser cri-ado pela técnica de "co-supressão" (Vaucheret et al., 1998, Plant J. 16(6):651-659). As células de planta são transformadas com uma cópia do geneendógeno alvejado para repressão. Em muitos casos, isto resulta na repres-são completa do gene nativo como também do transgene. Em uma modali-dade, um gene que codifica um polipeptídeo que compreende a via de fenil-propanóide das espécies de planta de interesse é isolado e usado paratransformar células daquela mesma espécie.
Plantas mutantes ou transgênicas produzidas por quaisquer dosmétodos anteriores são também caracterizadas de acordo com a presenteinvenção. Preferivelmente, as plantas são férteis, assim sendo úteis parapropósitos de criação. Desse modo, mutante ou plantas que exibem um oumais dos fenótipos desejáveis acima mencionados podem ser usadas paracriação de plantas, ou diretamente em aplicações agrícolas ou hortícolas.
Elas vão também ser de utilidade como ferramentas de pesquisa para a elu-cidação adicional da participação de polipeptídeos que compreendem a viade fenilpropanóide em sabor, aroma e outras características de sementes decafé associadas aos pigmentos e fotossíntese. Plantas que contêm umtransgene ou uma mutação especificada podem também ser cruzadas complantas que contêm um transgene ou genótipo complementar para produzirplantas com fenótipos intensificados ou combinados.
A presente invenção também caracteriza composições e méto-dos para produzir, de uma maneira semente-preferida ou semente-específica, qualquer produto de gene heterólogo selecionado em uma plan-ta. Uma seqüência de codificação de interesse é colocada sob controle deum promotor de café semente-específico e outras seqüências reguladorasapropriadas, para produzir um gene quimérico semente-específico. O genequimérico é introduzido em uma célula de planta por qualquer um dos méto-dos de transformação descritos aqui ou conhecidos na técnica. Estes genesquiméricos e métodos podem ser usados para produzir uma variedade deprodutos de gene de interesse na planta, incluindo, mas não limitados a: (1)produtos de gene detectáveis como GFP ou GUS, como enumerados acima;(2) produtos de gene que conferem um benefício agronômico ou hortíGola,como aqueles cujas atividades da enzima resultam em produção de micro-nutrientes (por exemplo, pró-vitamina A, também conhecida como beta-caroteno) ou antioxidantes (por exemplo, ácido ascórbico, ácidos graxos deomega, licopeno, isoprenos, terpenos); ou (3) produtos de gene para contro-lar patógenos ou pestes, como descritos por Mourgues et al., (1998), TibTe-ch 16: 203-210 ou outros conhecidos ser protetores para sementes de plantaou prejudiciais aos patógenos.
Os exemplos a seguir são fornecidos para descrever a invençãoem maior detalhe. Os exemplos são intencionados a ilustrar, não limitar, ainvenção.
Exemplo 1
Material de Planta para Extração de RNA
Raízes recentemente colhidas, folhas jovens, talos, flores e frutaem estágios diferentes de desenvolvimento foram colhidos de Coffea arabicaL. cv. Caturra T-2308 e tecidos de folhas jovens foram colhidas de Coffeacanephora. var Robusta BP409 crescidas sob condições de estufa a Tours(25°C, 70 RH). Todos os outros tecidos de Coffea canephora BP-409 foramcrescidos no campo em East Oriental, Indonésia. Os estágios de desenvol-vimento são definidos como segue: fruta verde pequena (SG), fruta verdegrande (LG), fruta amarela (Y) e fruta vermelha (R). Tecidos frescos foramimediatamente congelados em nitrogênio líquido, depois armazenados a-80°C até usados para extração de RNA.Exemplo 2
Protocolos para extração de RNA Total, geração de Cdna, e condições dereação de PCR
Para descobrir as seqüências de DNA que codificam parte, ou to-das, das enzimas de HCT de café (HidroxicinamoiI-CoA chiquimato/quinatohidroxicinamoiltransferase), HQT (hidroxicinamoil-CoA quinato hidroxicinamoil-transferase), C3H (p-cumaroil 3' hidroxilase), e CCoAOMT (cafeoilCoA-3-Ο-metiltransferase), que controlam as etapas principais na síntese de ácidosclorogênicos (CGA) em café, as seqüências de unigene de café com similari-dade alta para seqüências de proteína de base de dados públicas que codifi-cam HCT, HQT, C3H, e CCoAOMT de plantas como tomate, tabaco e Arabi-dopsis foram descobertas usando o algoritmo de TBLASTN (Altschul et al.,1990). Um dos cDNA mais longos de cada unigene com as melhores repeti-ções para cada seqüência de proteína foi depois completamente seqüencia-da. Se a seqüência de proteína codificada no EST mais longo foi julgada nãoconter a ORF completa, ou marcha de genoma assistida por PCR de RACE 5'ou preparador foi usada para isolar as seqüências de codificação de proteínaperdidas. Uma vez a seqüência de estrutura de leitura aberta completa (ORF)para cada uma destes genes de café foi estabelecida, análise de expressãode gene era realizada para os respectivos genes para confirmar a informaçãode expressão preliminar observada da base de dados de EST.
RNA foi extraído de tecidos diferentes isto é, raiz, talo, folhas,flores, pericarpo e grão em quatro estágios de maturação diferentes-VerdePequeno ("SG"), Verde Grande ("LG"), Amarelo ("Y"), e Vermelho ("R") deCoffea arabica (T2308 04-2003) e Coffea canephora (BP409) de acordo comos métodos de Rogers et al. (1999).
Do RNA extraído, os cDNAs eram preparados de acordo comdois métodos diferentes. No primeiro método, cada amostra de cDNA especí-fica era preparada de 1 pg de RNA total e 50 ng oligo dT(i8) (Sigma ChemicalCo., St. Loius, MO) como segue: A amostra de 1 pg de RNA total e oligo dTfoi suspensa em um volume de 12 ul de água tratada com DEPC. Esta mistu-ra foi incubada a 70°C durante 10 min e depois rapidamente esfriada em gelo.Em seguida, 4,0 μΙ de tampão de primeiro filamento 5X (Invitrogen)1 2,0 μΙ de0,1 M DTT (Invitrogen) e 1,0 μΙ de mistura de dNTP (10 mM cada, Invitrogen)foram adicionados. Esta mistura de reação foi incubada a 42°C durante 2 min,e depois 1,0 μΙ de transcriptase reversa SuperScript Ill Rnase (200υ/μΙ) (Invi-trogen) foi adicionado. A reação foi subseqüentemente incubada a 25°C du-rante 10 min. e depois a 42°C durante 50 min, e seguido por inativação deenzima aquecendo a 70°C durante 10 min. As amostras de cDNA geradasforam depois diluídas dez vezes em água estéril e armazenadas a -20°C du-rante o uso em experimentos diferentes (RT-PCR, RT-PCR de tempo real,RACE 5' e 3', e os clones de isolamento de cDNA de comprimento total).
Sob o segundo método, as amostras de cDNA específicas forampreparadas de 1 μg de amostra de RNA total e 870 ng de oligo dT (ProIigo)suspensos em um volume final de 13 μΙ com água tratada com DEPC. Estamistura foi incubada a 65°C durante 5 min para desnaturar os ácidos nucléi-cos, e as amostras foram depois colocadas em gelo. Em seguida, Tampãode Reação de RT de Transcritor (Roche) foi adicionado a uma concentraçãode 1X, e 10,0 U de Inibidor de Ribonuclease (Sigma), 1 mM final de cadadNTP (Roche) e 10 U de Transcriptase Reversa de Transcritor (20υ/μΙ, Ro-che) foram adicionados. A 20 μΙ reação foi misturada através de vórtice edepois brevemente centrifugada. As misturas foram incubadas a 55°C duran-te 50 min, e depois 1,0 U de RNase H (Invitrogen) foi adicionado à reação,seguido por uma incubação a 37°C durante 30 min. As amostras foram de-pois armazenadas a -20°C.
Cinco reações de RACE 5' diferentes foram realizadas usando osistema de RACE 5' para Amplificação Rápida de estojo de Terminações decDNA (Invitrogen) de acordo com as especificações do fabricante. As prepa-rações de cDNA usadas neste experimento foram purificadas para removerqualquer nucleotídeo não-incorporado primeiro (visto que eles interfeririamna reação de cauda de DC). Purificação foi realizada usando Colunas deS.N.A.P (Invitrogen) de acordo com as instruções dadas pelo fabricante.Uma vez purificado, o cDNA era restabelecido em 50 μΙ_ de água esterilizadae depois armazenado a -20°C antes de ser usado para PCR de RACE 5'.Os experimentos de RACE 5' todos começaram com uma caudade TdT de cada cDNA purificada com S.N.A.P específico. A reação de caudade poli DC foi como segue: reações de 25 μΙ foram fixadas com 5 μΙ do cD-NA purificado, 11,5 μΙ de água tratada com DEPC, 5 μΙ 5x tampão de caudade TdT (Invitrogen), e 2,5 μΙ de 2 mM de dCTP. As reações foram depoisincubadas a 94°C durante 3 minutos, seguido esfriando em gelo. 1 μΙ de TdTfoi depois adicionado, e a reação foi incubada durante 10 minutos a 37°C. Asreações foram feitas aquecendo durante 10 minutos a 65°C, e foram depoiscolocadas em gelo.
A primeira rodada de Reações de PCR de RACE 5' foram realiza-das em um volume final de 50 μΙ, como segue: 5 μΙ de cada cDNA com cauda,5 μL de 10 χ tampão de PCR (tampão de ThermoPoI), 400 nM cada um doPreparador Gene Específico 1 (GSP1) e o Preparador de Âncora Com Ponte(AAP) (o GSP diferente e similares preparadores estão na Tabela 1), 200 μΜcada dNTP, e 2,5 U de Taq DNA polimerase (BioLabs). As condições de ciclode PCR da primeira rodada eram como segue: 94°C durante 2 min; depois94°C durante 1 min, temperatura de recozimento (observada na Tabela 2) para1 min e 72°C durante 2 min e 45 ciclos. Uma etapa final adicional de alonga-mento foi feita a 72°C durante 7 min. Produtos de PCR eram depois analisadospor eletroforese em gel de agarose e tingimento de brometo de etídio.
A segunda rodada de reações de PCR foi executada em um vo-lume final de 50 μΙ, como segue: 5 μΙ de 1% de produto de PCR diluído (Pri-meira Rodada); 5 μί de 10 χ tampão de PCR (tampão de LA Il Mg++ plus),200 nM de cada um do preparador de GSP2 (Preparador Gene Específico 2) e do Preparador de Amplificação Universal Com Ponte (AUAP) (vide prepa-radores na Tabela 1), 200 μΜ de cada dNTP, e 0,5 U de DNA polimeraseTakara LA Taq (Cambrex Bio Science). O protocolo de ciclismo foi como se-gue: 94°C durante 2 min; depois 94°C durante 1 min, temperatura de reco-zimento (observada na Tabela 2) para 1 min e 72°C durante 30 e 40 ciclosde 1 min. Uma etapa final adicional de alongamento foi feita a 72°C durante7 min. Produtos de PCR eram depois analisados em eletroforese em gel deagarose e tingimento de brometo de etídio;Tabela 1. Preparadores usados para experimentos de PCR RaceS'.
<table>table see original document page 58</column></row><table>
Tabela 2. Preparadores de experimentos de PCR de Race 5' e temperaturade recozimentos.
<table>table see original document page 58</column></row><table>As seqüências de cDNA existentes, e as seqüências novas de 5'obtidas de RACE 5' ou experimentos de marcha de genoma assistida porpreparador, foram usadas para projetar preparadores nas seqüências deUTR de 5' e 3' para amplificar a seqüência de cDNA alvo contendo as se-qüências de ORF completas de CcHCT, CaHCT, CcHQT, CaHQT, CaCCo-A0MT-L1, e CcCCoAOMT-L2. Todos do cDNA usado para isolar estas se-qüências de DNA de ORF completa foram preparados usando o primeirométodo de síntese de cDNA descrito acima. Os dois preparadores gene es-pecíficos foram projetados a montante na região do Códon de início de ATGe na UTR de 3' para cada gene e estes são dados na Tabela 3. O cDNA es-pecífico e temperaturas de anelamento usadas para as reações de PCR di-ferentes são dadas na Tabela 4.
Para CcHCT (pML1) (SEQ ID Ne: 1), CaHCT (pML5) (SEQ IDN2: 2), CcHQT (pML2) (SEQ ID Ne: 3), CaHQT (pML3) (SEQ ID N9: 4) eCcCCoAOMT-L2 (pNT4) (SEQ ID N9: 8), as reações de PCR foram executa-das em reações de 50 μΙ como segue: 5 μΙ de cDNA (tabela 4), 5 μί de 10 χtampão de PCR (Tampão de La PCR Il Mg"" plus), 800 nM de cada Prepa-rador Gene específico, 200 μΜ cada dNTP, e 0,5 U de DNA polimerase Ta-kara LA Taq (Cambrex Bio Science). Após desnaturar a 94°C durante 2 min,a amplificação consistiu em 35 ciclos (com exceção de CcCCoAOMT-L2(SEQ ID N9: 8) onde a amplificação era durante 40 ciclos) de 1 min a 94°C, 1min em temperatura de recozimento (Tabela 4), e alongamento por 2 min a72°C. Uma etapa final adicional de alongamento foi feita a 72°C durante 7min. Produtos de PCR foram depois analisados por eletroforese em gel deagarose e tingimento de brometo de etídio. Fragmentos do tamanho espera-do foram depois clonados em pCR4-TOPO usando Estojo de clonagem deTOPO TA para Seqüenciação (Invitrogen) de acordo com as instruções da-das pelo fabricante. As inserções dos plasmídeos gerados foram depois se-qüenciadas completamente.
Para CaCCoAOMT-LI (pNT8) (SEQ ID N9: 7), a reação de PCRfoi executada em reações de 50 μΙ como segue: 5 μί de cDNA (Tabela 4), 5μL de 10 χ tampão de PCR (Tampão de Reação de Pfu Clonado), 400 nM decada Preparador Gene específico, 200 μΜ de cada dNTP, e 1,25 U de DNApolimerase Pfu Turbo. Após desnaturar a 94°C durante 2 minutos, a amplifi-cação consistiu em 40 ciclos de 1 minuto a 94°C, 1 minuto a 55°C e 2 minu-tos a 72°C. Uma etapa final adicional de alongamento foi feita a 72°C duran-te 7 minutos. Produto de PCR foi depois analisado em eletroforese em gelde agarose e tingimento de brometo de etídio. O fragmento do tamanho es-perado foi depois clonado em uma orientação de 5' para 3' em pENTR/D-TOPO de acordo com as instruções dadas pelo fabricante (estojo de pENTRTOPO Cloning Direcional, Invitrogen). A inserção do plasmídeo gerado(pNT8) foi depois seqüenciada completamente.
TABELA 3. Preparadores usados para amplificacão de CDNA DE CcHQT(pML2). CaHQT (pML3). CcHCT (PMU), CaHCT (PML5). CcCCoAOMTI(PNT15), CaCCoAOMT-LI (pNT8), CcCCoAOMT-L2 (pNT4), E CcCCoA-
<table>table see original document page 60</column></row><table>Tabela 4. Temperaturas de recozimento de isolamento de ORF
<table>table see original document page 61</column></row><table>
cDNAs subclonados em plasmídeos foram seqüenciados de a-cordo com o protocolo a seguir. DNA de plasmídeo foi purificado do hospe-deiro usando estojos de Qiagen de acordo com as instruções dadas pelofabricante. DNA de plasmídeo recombinante preparado e produtos de PCRforam seqüenciados através de GATC Biotech AG (Konstanz, Alemanha)pelo método de terminação de dideóxi de Sanger et al. Os únicos fragmen-tos de PCR produzidos dos experimentos de RACE 5' e marcha de genomaforam ou seqüenciados sem purificação e clonando com os preparadoresespecíficos usados para sua amplificação, ou seqüenciados após clonagem.Análise de computador foi executada usando o pacote de software de LaserGene (DNASTAR). Homologias de seqüência foram verificadas junto às ba-ses de dados de GenBank usando os programas BLAST. (Altschul et al.1990).
RT-PCR de tempo real foi realizada de acordo com o protocolo aseguir. cDNA preparado pelo primeiro método descrito acima foi amplificadousando estojos de TaqMan-PCR como recomendado pelo fabricante (Appli-ed Biosystem1 Perkin-Elmer), e como previamente descrito por Privat et al.,2004. O tampão de TaqMan contém AmpRease® UNG (Uracil-N-glicosilase)que é ativo durante os primeiros 2 minutos a 50°C e é depois inativo a 95°Cno começo do ciclo de PCR.
Os preparadores de Q-PCR e sondas de TaqMan usados foramprojetados usando o software PRIMER EXPRESS (Applied Biosystem) e sãolistados na Tabela 5. Quantificação foi realizada usando o método de quanti- ficação relativa, com a proteína ribossômica constitutivamente expressadarpl39 como a referência de linha base. Para usar o método de quantificaçãorelativa, foi necessário mostrar que a eficiência de amplificação para as se-qüências de cDNA candidato foi aproximadamente equivalente à eficiênciade amplificação da seqüência de referência (seqüência de cDNA de rpl39) usando os preparadores e sondas definidos. Para determinar esta equiva-lência relativa, DNA de plasmídeo contendo as seqüências de cDNA apro-priadas foi diluído 1/1000, 1/10.000, 1/100.000, e 1/1.000.000 vezes, eusando as condições de Q-PCR descritas acima; o declive da curva Ct =f(quantidade de Log de DNA) foi calculado para cada conjunto de sonda de plasmídeo/preparador/TaqMan. Conjuntos de sonda de plasmídeo/prepara-dor/TaqMan dando curvas com declives perto de 3,32, que representa umaeficiência de 100%, são considerados aceitáveis. Os conjuntos de sonda deplasmídeo/preparador/TaqMan apresentados na Tabela 5 todos deram valo-res aceitáveis por Ct = f(quantidade de Log de DNA). Todas as Sondas deMGB foram marcadas na terminação 5' com a tintura de repórter fluorescen-te de 6-carboxifluoresceína (FAM) e na 3' com tintura de extintor 6-carbóxi-tetrametil-rodamina (TAMRA), exceto a sonda de RPL39 que foi marcada naterminação 5' com a tintura de repórter fluorescente VIC e na terminação 3'com TAMRA de extintor.
Tabela 5. Preparadores e sondas de TaaMan usados para experimentos deQ-RT-PCR. _
<table>table see original document page 62</column></row><table><table>table see original document page 63</column></row><table>
Exemplo 3
Isolamento e caracterização de um clone de cDNA DE Coffea canephoracodificando hidroxicinamoil-COA chiquimato/auinato hidroxicinamoilTRANS-FERASE (CcHCT)
Para encontrar um cDNA que codifica a HCT de café, a seqüên-cia de proteína de HCT de Nicotiana tabacum (número de acessoCAD47830 (SEQ ID Ns: 20)); Hoffmann et al., 2003) serviu como a seqüên-cia de consulta para uma pesquisa de BLAST junto ao conjunto de "unigene"5 usando o algoritmo de tblastn. A melhor repetição obtida foi unigene#123197 (valor de e = e-150), embora um segundo unigene de café(#125212) foi também observado estar altamente relacionado à seqüênciade HCT de N. tabacum (valor de e = e-108). Alinhamento das seqüências deDNA e de proteína in silico dos unigenes #123197 e #125212 indicaram queembora eles estejam potencialmente relacionados, estas duas seqüênciasde unigene codificaram genes de café diferentes.
Um cDNA que representa a terminação 5' de unigene #123197(pcccwc22w14m23) (SEQ ID NQ: 18), e desse modo codificando o cDNA decafé mais longo na base de dados relacionada à HCT de tabaco, foi isoladoe seqüenciado. A inserção de pcccwc22w14m23 (SEQ ID N9: 18) foi obser-vada ser 1465 pb de comprimento, e codifica uma seqüência de ORF parcialde 389 aminoácidos. Porque a proteína de tabaco de comprimento total erade 435 aminoácidos de comprimento, foi assumido que este cDNA de HCTde café estava carecendo de aproximadamente 150 pares de base (isto é, ocDNA de HCT de café de comprimento total seria esperado codificar maisaproximadamente 46 aminoácidos). Com base na parte significativa da se-qüência de HCT de café codificada por pcccwc22w14m23 (SEQ ID Ns: 18),preparadores específicos para o uso na técnica bem estabelecidos de PCRde RACE 5' foram inventados para isolar a terminação 5' da seqüência degene correspondente. Este experimento, usando cDNA feito pelo segundoMétodo descrito acima no Exemplo 2 de grão de RNA de C. canephora(BP409) no estágio desenvolvente Vermelho, e usando os Preparadores deGene 22w14m23-GSP1-Específicos (SEQ ID N9: 44) na PCR de PrimeiraRodada e 22w14m23-GSP2 (SEQ ID N9: 45) na PCR de segunda rodada,produziu um fragmento de PCR de aproximadamente 300 pares de base(comprimento estimado em gel de agarose) que foi diretamente seqüenciadocom Preparador Gene 22w14m23-GSP2 específico (SEQ ID Ng: 45). A se-qüência resultante (Racel_CcHCT) (SEQ ID N9: 17) era 209 pb de compri-mento e sobreposta na terminação 5' do clone de cDNA pcccwc22w14m23(SEQ ID N9: 18) (Figura 2a: 60 pb de seqüência de sobreposição).
Esta seqüência de HCT de terminação 5' de café recentementeisolada (Race1_CcHC7) (SEQ ID N9: 17), e a seqüência de codificação qua-se de comprimento total no cDNA pcccwc22w14m23 (SEQ ID N9: 18), permi-tiu o projeto de dois preparadores novos (HCT-FullUp1 (SEQ ID N9: 50) eCcHCΓ-R1 (SEQ ID N9: 51), Tabelas 3 e 4) para amplificação específica daseqüência de ORF completa do HCT de café usando cDNA feito pelo Méto-do 1 de RNA de grão de C. canephora (BP-409) no estágio de desenvolvi-mento amarelo. Este experimento de amplificação de PCR resultou na gera-ção da seqüência de cDNA CcHCT (SEQ ID NQ: 1) contida no plasmídeopML1 (Figura 2b). Análise de seqüência da inserção de pML1 (SEQ ID Ns: 1)indicou que este cDNA era 1388 pb de comprimento, com uma ORF comple-ta de 1305 pb que codifica um polipeptídeo de 434 aminoácidos (SEQ ID Ne:9) tendo um peso molecular estimado de 48,06 kDa. Alinhamento da se-qüência de proteína de HCT completa (SEQ ID N9: 9) com a seqüência deproteína da HCT de tabaco e uma seqüência relacionada de Arabidopsisfhaliana (número de acesso CAD47830 (SEQ ID Ns: 20) e NP_199704 (SEQID Ne: 21), respectivamente, vide Figura 4) confirmou que a anotação inicialdesta seqüência de café usando BLAST, isto é, a ORF de pML1 (SEQ ID Ne:1) codifica uma proteína de HCT de café. No nível de proteína, a seqüênciade café (SEQ ID Ne: 9) exibe 86,9% e 78,3% de homologia com as seqüên-cias de tabaco e de A. thaliana, respectivamente (Figura 4). Ao nível nucléi-co, a ORF completa da seqüência de café exibe 78,5% e 70% de homologiacom as seqüências de tabaco e A. thaliana de ORF completas, respectiva-mente. O alinhamento de seqüência de proteína também mostra que a se-qüência de HCT de pML1 de café tem duas seqüências conservadas,HXXXD (SEQ ID Ne: 25) e DFGWG (SEQ ID Ne: 26) que foi identificado co-mo regiões fundamentais em classe de proteínas aciltransferases de planta.
Exemplo 4
Isolamento e caracterização de um clone cDNA DE Coffea arabica codifi-cando hidroxicinamoil-COA chiquimato/guinato hidroxicinamoiltransferase(CaHCT)
DNA genômico total foi extraído de folhas frescas de T2308 deC. arabica colhidas da estufa usando o método de Crouzillat et al., (1996).Marcha assistida com preparador foi executada usando o estojo de Geno-meWalker Universal (BD Biosciences) de acordo com o protocolo sugeridopelo fabricante. As quatro bibliotecas de GenomeWaIker usadas aqui forampreviamente construídas de DNA genômico de T2308 de C. arabica que ti-nham sido digeridas com Dral1 EcoRV1 Pvul, Stul e depois ligadas em termi-nação cega ao GenomeWaIker Adaptor do estojo GenomeWaIker Universal.As digestões de DNA genômico e as reações de ligação de GenomeWaIkerAdaptor foram realizadas de acordo com as instruções do fabricante. Asquatro bibliotecas foram depois usadas como modelos em reações de PCRusando os preparadores gene-específicos de HCT-GSP (Tabela 6). As mis-tura de reação de PCR continham 10 μΙ de modelo de biblioteca de Geno-meWalker (1/100 diluído), 5 pL de 10 χ tampão de PCR (tampão de LA IlMg++ mais), 200 μΜ de cada dNTP, 400 nM de cada preparador (AP1 eHCT-GSP1), e 0,5 U de DNA polimerase Takara LA Taq (Cambrex Bio Sci-ence) em um volume final de 50 μΙ. As condições a seguir foram usadas paraa primeira PCR: após desnaturar durante 2 minutos a 95°C, os primeirossete ciclos foram executados a 95°C durante 25 s, seguido por um anela-mento e alongamento a 72°C durante 3 minutos. Um adicional de 31 ciclosfoi realizado, a 95°C durante 25 s, com uma temperatura de recozimen-to/elongação de 67°C durante 3 minutos. Uma etapa final adicional de alon-gamento foi realizada a 67°C durante 7 minutos. A segunda reação de PCRfoi exatamente fixa como descrito acima para a Primeira Rodada, salvo osubstrato de DNA 1 foi μΙ da primeira reação de amplificação que tinha sidodiluída 1/50 da primeira reação. As condições de ciclo de PCR eram 5 ciclosde desnaturação a 94°C durante 25 s, recozimento e alongamento 72°C du-rante 3 minutos. Um adicional de 25 ciclos foi realizado, a 95°C durante 25 se uma temperatura de recozimento/elongação de 67°C durante 3 minutos.Uma etapa final adicional de alongamento foi realizada a 67°C durante 7 mi-nutos. Os fragmentos de PCR resultantes foram separados através de ele-troforese em gel de agarose. Um produto de PCR da biblioteca nomeadaStul GW1 _CaHCT, mostrando uma única banda, foi depois clonado em p-CR4-TOPO usando Estojo de clonagem de TOPO TA para Seqüenciação(Invitrogen), depois PCR foi realizada em colônias isoladas positivas. O pro-duto de PCR com o comprimento esperado foi depois seqüenciado com pre-paradores T7 e de T3. A seqüência resultante (GW1-CaHC7) (SEQ ID Ne:19) era 685 pb de comprimento e sobrepôs a seqüência empcccwc22w14m23 (SEQ ID N6: 18) mais de 117 pb (Figura 3A, 3B). É obser-vado que esta seqüência genômica provavelmente codifique aproximada-mente 430 pb da região de 5' de não codificação do gene de CaHCT, e des-se modo codifique pelo menos parte deste promotor de genes.
Tabela 6. Preparadores usados para experimentos de GenomeWaIker.
<table>table see original document page 67</column></row><table>
O mesmo conjunto de preparadores específicos e condições dePCR usadas para isolar a ORF completa de HCT de C. canephora (CcHCT)foi empregado para isolar um cDNA que codifica uma ORF completa paraHCT de C. arabica (vide Exemplo 2 e Tabelas 3 e 4 para detalhes). cDNA foifeito usando Método 1 de RNA isolado de grão de C. arabica (T2308) no es-tágio amarelo e clonado em plasmídeo pML5 (Figura 3b). Análise de se-qüência da inserção de pML5 (SEQ ID Ns: 2) indicou que este cDNA era1388 pb de comprimento, com uma ORF completa de 1305 pb que codificaum polipeptídeo (SEQ ID NQ: 10) de 434 aminoácidos que têm um peso mo-lecular estimado de 48.186 kDa. Um alinhamento ótimo das inserções empML1 (CcHCT) (SEQ ID N5: 1) e pML5 (CaHCT) (SEQ ID Ne: 2) usandoCIustaIW mostra que as duas seqüências têm 98,9% de identidade no nívelde DNA, com diferenças de 14 nucleotídeos simples sendo observadas entreas duas seqüências. Estas diferenças dentro da seqüência de DNA para aORF translada em 5 alterações na seqüência de aminoácido (Figura 4). Éobservado que variações de seqüência poderiam ser esperadas mais signifi-cativas nas seqüências de UTR de 5' e 3' destes genes a maioria destasperdendo pML1 e pML5. Como mostrado na Figura 4, todas as quatro se-qüências de HCT têm a mesma seqüência (HHAAD) (SEQ ID Ne: 85) na cai-xa de HXXXD altamente conservada (SEQ ID Ne: 25). Isto também suporta acontenção que pML1 e pML5 codifiquem proteínas de HCT de café.Exemplo 5
Isolamento e caracterização de um clone de cDNA de Coffea canephora co-dificando hidroxicinamoil-COA quinato hidroxicinamoiltransferase (CcHQT)
As seqüências de proteína recentemente publicadas para HQTde tabaco (NtHQT, número de acesso CAE46932; Niggeweg et al., 2004) eHQT de tomate (LeHQT, número de acesso CAE46933, Niggeweg et al.,2004) foram empregadas em uma pesquisa junto ao conjunto de "unigene" 5usando o algoritmo de tblastn. Usando NtHQT de tabaco como a seqüênciade consulta, as duas melhores repetições foram unigene #125212 (valor dee = e-119) e unigene #123197 (valor de e = e-100). Usando LeHQT de toma-te como a seqüência de consulta, as duas melhores repetições foram tam-bém unigene #125212 (valor de e = e-127) e unigene #123197 (valor de e =e-103). As contagens de valor de e muito altas para unigene #125212 daspesquisas de BLAST com as seqüências de proteína de NtHQT e LeHQTfortemente indicaram que esta seqüência de unigene in silico era provávelde codificar uma proteína de HQT.
Um do EST mais longo para unigene #125212,(pcccs30w13p12) (SEQ ID Ne: 28) foi isolado da biblioteca de pericarpo ecompletamente seqüenciado. Análise de seqüência mostrou este cDNA codi-ficou uma inserção de 1056 pb contendo uma ORF parcial que codifica 292aminoácidos. A seqüência de polipeptídeo codificada por pcccs30w13p12(SEQ ID N9: 28) foi alinhada com as seqüências de proteína de HQT de ta-baco e de tomate usando o software de Megalign (pacote de software deLaser Gene, DNASTAR). Estes alinhamentos manualmente otimizados con-firmaram que a ORF parcial de pcccs30w13p12 (SEQ ID Ng: 28) provavel-mente codifique uma proteína de HQT. Estes alinhamentos também indica-ram que este clone de cDNA não continha uma ORF completa. A seqüênciade polipeptídeo codificada por pcccs30w13p12 (SEQ ID N9: 28) foi tambémalinhada com a seqüência de polipeptídeo codificada por cDNA mais longode unigene 123197 (pcccwc22w14m23) (SEQ ID N9: 18). Este alinhamentode proteína mostrou que estas duas seqüências eram significativamente di-ferentes (aproximadamente 61,3% de identidade no nível de aminoácido u-sando o Método de ClustalW), e desse modo, estas seqüências representamgenes diferentes.
O alinhamento das seqüências de proteína de HQT de tomate etabaco com a seqüência de ORF parcial de pcccs30w13p12 (SEQ ID Ns: 28)mostrou que esta seqüência de HQT de café careceu aproximadamente de140-150 aminoácidos na terminação N-terminal. Porém, com base na partesignificativa da seqüência de HQT de café codificada por pcccs30w13p12(SEQ ID N9: 28), preparadores específicos para o uso na técnica bem esta-belecida de PCR de RACE 5' foram inventados para isolar a terminação de5' perdida da seqüência de codificação de HQT de café. Usando o cDNApreparado pelo Método 1 usando RNA isolado de pericarpo de C. canephora(BP 409) (todos os estágios desenvolventes misturados) e os preparadorese condições de PCR expostos acima. No Exemplo 2 foi obtido um únicofragmento de aproximadamente 750 pb e diretamente seqüenciado usandopreparador 22m12-GSP2 específico (SEQ ID N9: 43) para amplificação dofragmento. A seqüência resultante (RACE3_CcHQ7) (SEQ ID N9: 27) era639 pb de comprimento e, sobrepôs a terminação 5' da seqüência empcccs30w13p12 (SEQ ID N9: 28) em 62 bp. (Figura 5a).
Esta seqüência de HQT de terminação 5' de C. canephora re-centemente isolada (RACE3_CcHQT) (SEQ ID N9: 27), e a seqüência decodificação no cDNA pcccs30w13p12 (SEQ ID N9: 28), permitiram o projetode dois preparadores novos capazes de especificamente amplificar a se-qüência de ORF completa de um CcHQTde HCT de café usando cDNA feitode RNA de pericarpo de C. canephora (BP-409) no estágio verde pequeno.(Tabelas 3 e 4). O cDNA obtido foi clonado em plasmídeo pML2 (Figura 5A e5B). Análise de seqüência da inserção em pML2 (SEQ ID N9: 3) indicou queeste cDNA era 1534 pb de comprimento e tinha uma ORF completa de 1293bp, codificando um polipeptídeo (SEQ ID N9: 11) de 430 aminoácidos tendoum peso molecular estimado dé 47,72kDa.
Alinhamento da seqüência de ORF completa de CcHQT (SEQID N9: 3) com as seqüências de HQT de tabaco e tomate previamente carac-terizadas, e a seqüência altamente relacionada de IbHCBT de Ipomea bata-tas acesso número BAA87043 (SEQ ID N9: 22) confirma a anotação inicialdesta seqüência de café da análise de BLAST, isto é, a ORF completa depML2 (SEQ ID N9: 3) codifica um proteína de HQT de café (SEQ ID N9: 11)5 (Figura 4). No nível de proteína, a seqüência de proteína de HQT de caféexibe 75,8%, 75,1% e 78,1% homologia às seqüências de tabaco, tomate eI. batatas, respectivamente. No nível de nucleotídeo, a seqüência de ORF deHQT de café exibe 72,1%, 70,1% e 71,1% de identidade com as seqüênciasde ORF de tabaco, tomate e I. batatas, respectivamente.
O alinhamento na Figura 4 também mostra que a seqüência deHQT de café de pML2 (SEQ ID N9: 11) tem as duas seqüências conserva-das, HXXXD (SEQ ID N9: 25) e DFGWG (SEQ ID N9: 26) que foram identifi-cadas como regiões fundamentais na classe de proteínas de planta acil-transferases (Yang et al. 1997, St-Pierre et al. 2000, Hoffmann et ai. 2003).
15 Como mostrado na Figura 4, todas as cinco seqüências de HQT têm quasea mesma seqüência (HT/NLSD) na caixa HXXXD altamente conservada(SEQ ID N9: 25), suportando também a contenção que pML2 codifica umaproteína de HQT de café.
Exemplo 6
Isolamento e caracterização de um clone de cDNA de Coffea arabica codifi-cando hidroxicinamoil-COA quinato hidroxicinamoiltransferase (CaHQT)
O mesmo conjunto de preparadores específicos e condições dePCR usado para isolar a ORF completa de HQT de C. canephora foi empre-gado para isolar um cDNA que codifica uma ORF completa para HQT de C.arabica (vide Exemplo 2 e Tabela 3 e 4). O cDNA empregado foi preparado,usando Método 1, de RNA isolado de flores de C. arabica (T2308) foramsubclonados e o fragmento de CaHQT específico amplificado para gerar oplasmídeo pML3 (Figura 6). Análise de seqüência da inserção em pML3 re-velou que este cDNA era 1533 pb de comprimento e tinha uma ORF poten-cialmente completa de 1293 pb que foi interrompido por um códon de paradasimples na posição 814-816 na seqüência de ORF (posição 272 na proteí-na). É presumido que esta mutação foi o resultado de uma mutação de pa-res de base simples (ÇAA para TAA) durante a amplificação de PCR comTaq DNA polimerase. Para assegurar que o códon de parada foi gerado porTaq e não é um códon de parada codificado por genoma, cDNA foi preparadousando Método 1 de RNA isolado de raízes de T2308 de C. arabica. Este cD-NA foi depois usado para amplificar por PCR a região do códon de parada.
A reação de PCR foi executada em um volume final de 50 μΙ,como segue; 5 pL de cDNA; 10 χ tampão de PCR (tampão de LA Il Mg++mais), 500 nM do preparador HQT-FullLup1 (5' CTGGAGGAAAGCAGAGA-AGCAT 3') (SEQ ID Ne: 86) e preparadores de HQT-FullLow2 (SEQ ID N9:52) (Tabela 3A), 200 μΜ de cada dNTP, 0,5 U de DNA polimerase TakaraLA Taq (Cambrex Bio Science). As condições de reação de PCR foram co-mo segue: 94°C durante 2 minutos; depois 94°C durante 1 minuto, 56°C du-rante 1 minuto e 72°C durante 2 e 40 ciclos. Uma etapa final adicional dealongamento foi realizada a 72°C durante 7 minutos. O produto de PCR foidepois analisado em eletroforese em gel de agarose e tingimento de brome-to de etídio.
Esta amplificação de PCR produziu um único fragmento de a-proximadamente 1600 pb. Este único fragmento (R-CaHQT) foi depois dire-tamente seqüenciado usando o preparador de HQT-FullLow2 (SEQ ID N9:52) (Tabela 4). Uma seqüência de 626 pb foi obtida que sobrepôs comple-tamente a seqüência de pML3 (CaHQT) (SEQ ID Ne: 4). A seqüência destefragmento de cDNA novo codificou a região que contém o sítio de mutação(98,9% homólogo na região de sobreposição de 626 pb), e no sítio de muta-ção, tinha ÇAA (para aminoácido esperado Q) e não TAA (PARADA) comoencontrado em pML3.
Comparação das seqüências de cDNA clonadas para CcHQT(SEQ ID Ng: 3) e CaHQT (SEQ ID Ns: 4) revelou 15 diferenças de nucleotí-deo simples. O alinhamento otimizado das seqüências de polipeptídeo deCcHQT (SEQ ID NQ: 11) e CaHQT (SEQ ID Ne: 12) revelou 7 diferenças deaminoácido (Figura 4).Exemplo 7
isolamento e caracterização de um clone de cDNA de Coffea canephora co-dificando P-cumaroil 3' hidroxilase CcC3H
Para encontrar cDNA de café que codifica a enzima p-cumaroilchiquimato 3'-hidroxilase (C3H), duas seqüências de proteína que codificamatividades de C3H bioquimicamente bem caracterizadas, a isoforma 2 de p-cumaroil chiquimato 3'-hidroxilase de Ocimun basilicum (Gangue et al.,2002; número de acesso AAL99201) e o citocromo de Arabidopsis P450CYP98A3 (Schoch et al., 2001; número de acesso 022203) foram usadaspara pesquisar o conjunto de "unigene" 5 usando o algoritmo de tblastn. Estapesquisa descobriu um unigene (#124852) exibindo um nível muito alto dehomologia às seqüências de proteína de C3H de O. basilicum e Arabidopsis.
Um cDNA que representa a terminação 5' do unigene #124852 (pcccl20d10(SEQ ID Ne: 5)), codificando potencialmente a ORF total desta proteína, foidepois isolado e seqüenciado.
A inserção de pcccl20d10 (SEQ ID N2: 5) foi determinada paraser 1728 pb de comprimento, e codificar uma ORF de 1527 pb. A seqüênciade proteína deduzida (SEQ ID N2: 13) compreende 508 aminoácidos, e temum peso molecular prognosticado de 57,9 kDa. A seqüência de proteína(SEQ ID N2: 13) de pcccl20d10 (SEQ ID Ne: 5) foi alinhada com as seqüên-cias de proteína homólogas de C3H de O. basilicum, A. thaliana, e uma se-qüência ortólogo de L. esculentum (Figura 7). Este alinhamento demonstrouque a proteína (SEQ ID N2: 13) codificada através de pcccl20d10 (SEQ IDN2: 5) compartilha, respectivamente, 75,1%, 73,9% e 82,9% homologia comestas seqüências de proteína. Desse modo, pode ser concluído que pcc-cl20d10 (SEQ ID N9: 5) codifica um cDNA de comprimento total para uma p-cumaroil chiquimato 3'-hidroxilase de C. canephora (CcC3H). Um alinhamen-to da seqüência de DNA que codifica a seqüência de ORF contida em pcc-cl20d10 (SEQ ID N2: 5) com as seqüências de DNA que codificam as se-qüências de ORF de C3H de O. basilicum e do citocromo P450 CYP98A3 deA. thaliana demonstrou que a seqüência de DNA de ORF de CcC3H com-partilha 69,4% e 69,2% de identidade com as seqüências de DNA de C3Hde O. basilicum e P450 CYP98A3 de A. thaliana.
Exemplo 8
Isolamento e caracterização de três clones de cDNA de Coffea canephoracodificando CCoAOMT
Para encontrar cDNA de café que codifica a enzima CCoAOMT,duas seqüências de proteína que codificam as atividades de CCoAOMT bemcaracterizadas, CCoAOMT de Nicotiana tabacum (número de acesso A-AC49913 (SEQ ID N9: 38) Martz et a!., 1998) e CCoAOMT de Medicago sati-va (alfafa) (número de acesso AAC28973 (SEQ ID N9: 37), Ferrer et al.,2005) foram usadas para pesquisar o conjunto de "unigene" 5 usando o al-goritmo de tblastn. Esta análise descobriu 3 unigenes que exibem níveis re-lativamente altos de homologia nas seqüências de proteína de N. tabacumCCoAOMT, #119965 (value = e-125 de e), #122801 (valor de e = e-63), e#119560 (valor de e = e-56). Estes unigenes foram também mostrados terhomologias relativamente altas à seqüência de proteína de M. sativa, isto é,#119965 (valor de e = e-127), #122801 (valor de e = e-64), e #119560 (valorde e = e-59).
Um do cDNA mais longo que representa a terminação 5' do uni-gene #119965 (pcccl15a11 (SEQ ID Ns: 6)), e potencialmente codificando aORF total desta proteína, foi depois isolado da biblioteca de folha e comple-tamente seqüenciado. A inserção de pcccl15a11 (SEQ ID N9: 6) foi determi-nado ser 1144 pb de comprimento e pra codificar uma ORF de 744 bp. Aseqüência de proteína de comprimento total deduzida (SEQ ID N9: 14) foideterminada ser 247 aminoácidos, com um peso molecular prognosticado de27,97 kDa. Figura 12 mostra um alinhamento otimizado da seqüência deproteína (SEQ ID N9: 14) de pcccl15a11 (SEQ ID N9: 6) com as seqüênciasde proteína de CCoAOMT de N. tabacum, e M. sativa revelou que a proteínade pcccl15a11 compartilha 85,1%, e 86,3% de homologia com estas se-qüências de proteína, respectivamente. Este alinhamento também demons-tra que a proteína de CcCCoAOMTI (SEQ ID N9: 14) contém todos os resí-duos de aminoácido que foram determinados por Ferrer et al. 2005. O grupode Ferrer determinou a estrutura da Cafeoil Coenzima A 3-O-Metiltransferase de alfaia através de cristalografia de raio X para a) interagirem reconhecimento da Co-enzima A, b) estar envolvido no reconhecimentode substrato, e c) estar envolvido em íon de metal divalente e ligação de co-fator. Desse modo, estes dados de alinhamento suportam a reivindicaçãoque pcccl15a11 (SEQ ID N9: 6) codifica um cDNA de comprimento total parauma Cafeoil CoA-O MetiITransferase de C. canephora (CcCCoAOMTI)(SEQ ID N2: 14).
É observado que as bases de dados públicas contêm uma se-qüência de cDNA parcial de C. canephora (Número de Acesso AF534905,codificando uma ORF de 108aa). Quando alinhada com CcCCoAOMTI(SEQ ID N9: 14), esta seqüência de base de dados exibe 97,5% de identida-de nas regiões apropriadas ao nível de DNA que indica o cDNA de C. cane-phora parcial (Número de Acesso AF534905) é provavelmente alélico aocDNA completo em CcCCoAOMTI, e que desse modo são dois alelos deCoffea canephora diferentes do mesmo gene.
O cDNA mais longo que representa a terminação 5' do unigene#122801 (cccs30w29k18), e codificando potencialmente uma proteína seme-lhante a CcCCoAOMT, foi isolado da biblioteca de grão de 30 semanas (30semanas após florescer) e completamente seqüenciado. A inserção depcccs30w29k18 (SEQ JD N9: 34) foi determinada ser 722 pb de comprimentoe codificar uma ORF parcial de 576 pb de comprimento. A seqüência de pro-teína parcial deduzida foi determinada codificar 191 aminoácidos. A seqüên-cia de polipeptídeo parcial codificada por pcccs30w29k18 (SEQ ID N9: 34) foialinhada e comparada com as seqüências de proteína de CCoAOMT de N.tabacum, e M. sativa. Este alinhamento mostrou que a seqüência de ORFinserida de pcccs30w29k18 (SEQ ID N9: 34) compartilhou 56,2% de identi-dade com ambas estas seqüências de proteína de planta CCoAOMT, poten-cialmente sugerindo esta proteína era uma proteína semelhante a CCoA-OMT. Este alinhamento também indicou que este clone de cDNA não conti-nha uma ORF completa.
Com base na seqüência codificada por pcccs30w29k18 (SEQ IDN9: 34), preparadores específicos foram inventados para isolar a terminação5' da seqüência de gene correspondente usando a técnica bem estabelecidade PCR de RACE 5'. Usando as condições de PCR de RACE descritas noExemplo 2 e Tabela 2 acima, os Preparadores de Gene 122801-GSPE1-específicos (SEQ ID Ns: 46) (PCR de RACE da primeira rodada) e 122801-GSP2 (SEQ ID Ne: 47) (PCR de RACE da segunda redonda), e cDNA prepa-rado pelo Método 1 usando RNA isolado de grão de BP409 de C. canephorano estágio amarelo de desenvolvimento produziu um fragmento de PCR de218 pares de base que foi clonado em pCR4-TOPO de acordo com o proto-colo previamente descrito e seqüenciado. A seqüência resultante (Ra-ce 1 _CcCCoAOMT-L1 em pNT13 (SEQ ID Ns: 33)) sobrepôs a terminação 5'do clone de cDNA pcccs30w29k18 (SEQ ID NQ: 34) (Figura 9A: 61 pb de se-qüência de sobreposição). Esta seqüência semelhante a CcCCoAOMT determinação 5' de café recentemente isolada (Race1_CcCCoAOMT-L1 (SEQID N5: 33)), e a seqüência de codificação parcial no pcccs30w29k18 de cD-NA (SEQ ID Ne: 34), permitiu o projeto de dois preparadores novos (CCoA-OMT-L1 -FuIIup (SEQ ID N9: 54) e CCoAOMT-L1-FullLow (SEQ ID Ne: 55),Tabelas 3 e 4) para especificamente amplificar a seqüência de ORF comple-ta do CaCCoAOMT-LI de café (SEQ ID Ne: 15) usando cDNA feito de RNAisolado de grão de C. arabica (T2308) (estágio de desenvolvimento amarelo)(Tabela 4).
A amplificação de PCR foi realizada em um volume final de 50μΙ, como segue: 5 μΙ de cDNA, 5 μΙ_ de 10 χ tampão de PCR (Tampão deReação de Pfu Clonado), 400 nM de ambos os preparadores específicos,200 μΜ de cada dNTP, e 1,25 U de DNA polimerase Pfu Turbo (Stratagene).As condições de ciclismo de PCR foram como segue: 94°C durante 2 min;depois 40 ciclos de 94°C durante 1 min, temperatura de recozimento 55°Cdurante 1 min, e 72°C durante 2 min. Uma etapa final adicional de alonga-mento foi feita a 72°C durante 7 min. Esta PCR resultou na geração de umfragmento de cDNA que foi clonado diretamente em vetor de pENTR/D-TOPO para formar o plasmídeo pNT8 (Figura 9B). Análise de seqüência dainserção de pNT8 (SEQ ID Ne: 7) indicou que este cDNA era 717 pb decomprimento (incluindo a seqüência de CACC usada na clonagem). O pias-mídeo pNT8 tem uma ORF completa de 690 pb que codifica um polipeptídeo(SEQ ID Ne: 15) de 229 aminoácidos tendo um peso molecular estimado de25,71 kDa.
O alinhamento apresentado na Figura 11 confirma que a ORFde CaCCoAOMT-LI (pNT8) em não um alelo de CcCCoAOMT-1 mas é cla-ramente um produto de gene diferente. Eficazmente, a seqüência de proteí-na CaCCoAOMT-LI (SEQ ID Ne: 15) codificada para ORF contida em pNT8(SEQ ID N9: 7) (54,6% de identidade de CcCCoAOMT-1). Além disso, estasproteínas mostram apenas 54,2%, 57,8% e 57,4% de identidade com proteí-nas MsCCoAOMT, NtCCoAOMT e de VvCCoAOMT caracterizadas (núme-ros de Acesso de Genbank são respectivamente AAC28973 (SEQ ID Ne:37), AAC49913 (SEQ ID N9: 38), e CAA90969 (SEQ ID N2: 39), vide Figura12). Como mostrado na Figura 12, cinco dos sítios caracterizados descritosna estrutura de cristal do CCoAOMT de alfafa são diferentes na seqüênciade proteína do CCoAOMT-L1 de Coffea. Dois de doze aminoácidos conser-vados que foram determinados estão implicados na ligação de co-fator (Fer-rer et al. 2005): isto é, Glu67 e Prol 39 de MsCCoAOMT são substituídosrespectivamente por um resíduo de Ala e um de Glu em CaCCoAOMT-LI(SEQ ID N2: 15), e três de seis resíduos envolvidos em reconhecimento desubstrato (Ferrer et al. 2005): isto é, Arg206, Tyr208 e Tyr212 são substituí-dos em proteína de CaCCoAOMT-LI (SEQ ID N9: 15) por um resíduo deAla, um de Glu, e um de Gly, respectivamente.
O cDNA mais longo que representa a terminação 5' do unigene#119560 (cccs46w30m24), e codificando uma ORF parcial potencialmentedesta proteína, foi depois isolado da biblioteca de grão de 46 semanas (46semanas após florescência) e completamente seqüenciado. Análise de se-qüência mostrou que este cDNA (SEQ ID N9: 36) codificou uma inserção 934pb. Um alinhamento da seqüência de DNA desta inserção com as seqüên-cias de proteína bem caracterizadas de NtCCoAOMT e MsCCoAOMT (Nú-meros de Acesso de Genbank AAC49913 (SEQ ID Ne: 38) e AAC28973(SEQ ID N9: 37), respectivamente) usando CLUSTALW provavelmente indi-ca que este cDNA contém um íntron. O alinhamento otimizado das seqüên-cias de DNA de NtCCoAOMT e MsCCoAOMT com inserção depcccs46w30m24 pelo programa de CLUSTALW produziu uma inserção de72 pb dentro da ORF cujas seqüências de DNA das outras seqüências decDNA de planta caracterizadas comparadas à seqüência da inserção depcccs46w30m24. Adicionalmente, a ORF de inserção de cccs46w30m24codificou uma seqüência de proteína truncada 92 aminoácidos mais curtaque NtCCoAOMT e MsCCoAOMT no término C devido a um códon de para-da dentro da seqüência de íntrons proposta de pcccs46w30m24.
Com base na observação que a seqüência de cDNA depcccs46w30m24 (SEQ ID Ns: 36) contém um íntron, uma seqüência proces-sada foi gerada in silico. O processamento de encaixe foi realizado a pb 426a 497 que representaram o íntron hipotético. Análise de seqüência da se-qüência de 862 pb encaixada resultante (seqüência de pcccs46w30m24 me-nos íntron hipotético) revelou que este cDNA continha uma ORF de 702bp,codificando uma proteína parcial de 233 aminoácidos. Esta seqüência depolipeptídeo hipotético foi depois alinhada com as seqüências de proteína deNtCCoAOMT e MsCCoAOMT descritas na seção anterior (Figura 12), reve-lando que a ORF parcial de pcccs46w30m24 compartilha 48,9% de identida-de com cada uma destas seqüências de CCoAOMT. Este proteína associa-da a esta ORF parcial foi chamada CcCCoAOMT-L2 (SEQ ID N9: 16).
Porém, como pcccs46w30m24 (SEQ ID Ng: 36) codifica umaparte significativa de uma seqüência semelhante a CCoAOMT de Coffeaprognosticada, isto permitiu o projeto de preparadores específicos para isolara seqüência de codificação de terminação de 5' perdida deste gene. ComcDNA preparado pelo Método 1 usando RNA isolado de grão de C. arabica(T-2308) em estágio amarelo, os preparadores 119560-GSP1 (SEQ ID Ng:48) (PCR de RACE de primeira rodada) e 119560-GSP2 (SEQ ID Ng: 49)(PCR de RACE de segunda rodada) e as condições de PCR observadas noExemplo 2 e na Tabela 2, foram obtidos em um único fragmento. Este frag-mento foi clonado diretamente no vetor de pCR4-T0P0 para dar pNT14 eseqüenciado usando o preparador universal T3. A seqüência inserida resul-tante (Racel_CaCCoAOMT-L2 (SEQ ID Ng: 35)) era 349 pb de comprimentoe, como esperado, sobrepôs a terminação 5' da seqüência empcccs46w30m24 (SEQ ID Ne: 36) (Figura 10A, com 224 pb da seqüência desobreposição). Esta seqüência semelhante a CCoAOMT de C. arabica re-centemente isolada de terminação 5' (Racel_CaCCoAOMT-L2) (SEQ ID NQ:35), e a seqüência de codificação no pcccs46w30m24 de cDNA (SEQ ID Ne:36), permitiram o projeto de dois preparadores novos CCoAOMT-L2-Fulll)p(SEQ ID N9: 58) e CCoAOMT-L2-FullLow (SEQ ID N9: 59) (Tabelas 3 e 4)capazes de especificamente amplificar a seqüência de ORF completa deCCoAOMT-L2 (SEQ ID N9: 8).
O cDNA usado para este experimento para amplificar a ORFcompleta de CC0AMT-L2 foi gerado através do Método 1 usando RNA isola-do de grão de C. canephora (BP-409) em estágio amarelo de desenvolvi-mento (mesmo cDNA usado para fazer o cDNA de comprimento total paraHCT, vide Tabela 4). Como descrito no Exemplo 2, o experimento foi reali-zado usando Takara LA Taq DNA polimerase (em um final 50 μΙ de volume,como segue: 5 μΙ de cDNA (Tabela 4), 5 μί de 10 χ tampão de PCR (LAPCR Il Mg2+), 800 nM de ambos os preparadores específicos, 200 μΜ decada dNTP, e 0,5 U de Takara LA Taq DNA polimerase (Cambrex Bio Sci-ence). As condições de ciclismo de PCR foram iguais às descritas no Exem-plo 2. Este experimento gerou um produto de PCR principal simples que foiclonado diretamente no vetor de pCR4-TOPO como descrito previamenteresultando no plasmídeo pNT4 (Vide Figura 10B para seqüência de DNA).pNT4 (SEQ ID N9: 8) codifica uma ORF completa de 717 pb que codifica umpolipeptídeo (SEQ ID Ng: 16) de 238 aminoácidos com um peso molecularestimado de 26,30 kDa.
Alinhamento de ORF completo da seqüência de CC0AOMT-L2de Coffea com as seqüências de CCoAOMT de Medicago sativa, Nicotianatabaeum e Vitisvinifera previamente caracterizadas (observadas acima) con-firma a anotação inicial de seqüência de Coffea parcial de pcccs46w30m24(SEQ ID Ne: 36) usando BLAST como proteína semelhante a CCoAOMT decafé (Figura 12). No nível de proteína, a seqüência de ORF de CcCCoA-OMT-L2 de café (pNT4) exibe 46,6% de identidade com a MsCCoAOMT,47% de identidade com a NtCCoAOMT-1 e 47,8 identidade com a seqüênciaproteína VvCCoAOMT. O alinhamento apresentado na Figura 11 entre a se-qüência de CcCoAOMT-L2 de Coffea (SEQ ID N9: 16) e a seqüência de pro-teína de CaCCoAOMT-LI de Coffea (SEQ ID N9: 15) descritas acima eCcCCoAOMT-1 (SEQ ID N9: 14) claramente mostra que estas três seqüên-cias de proteína representam grupos altamente relacionados diferentes de proteínas.
Um segundo alinhamento executado com todas as três proteí-nas (isto é, a CCoAOMT de café (SEQ ID N9: 14) e as duas proteínas seme-lhantes a CCoAOMT (SEQ ID NOs: 15 e 16)) com as proteínas de CCoA-OMT bem caracterizadas na Figura 12 claramente ilustra que a seqüênciada proteína de CcCCoAOMT-L2 de Coffea (SEQ ID N9: 16) é mais distante-mente relacionada à proteínas de CCoAOMT de planta bem caracterizadasque à proteína de CaCCoAOMT-LI (SEQ ID N9: 15). Além disso, é tambémobservado na Figura 12 que a seqüência de proteína de CcCCoAOMT-L2(SEQ ID N9: 16) tem várias alterações de aminoácido em regiões associadasao reconhecimento de substrato (número acesso de Medicago sativa A-AC28973 (SEQ ID N9: 37), Ferrer et al., 2005).
Exemplo 9
Sobre-expressão e caracterização de CCCCOAOMTI
A tecnologia de Gateaway (Invitrogen) composta de dois veto-res: pENTR/D-TOPO e do vetor de expressão pDEST17, foi usada para so-bre-produzir a proteína de CcCCoAOMTI (SEQ ID N9: 14). A estratégia con-sistiu em transferir a ORF de CcCCoAOMTI (SEQ ID N9: 6) para o primeirovetor (pENTR/D-TOPO) na estrutura com a seqüência de HisTag. Dois pre-paradores específicos foram projetados para realizar isto. O primeiro prepa-rador (CCoAOMTI-FuIIup (SEQ ID N9: 54) Tabela 3) inclui a seqüência es-pecífica para os primeiros códons da ORF (começando com o códon de co-meço ATG) e o adaptador de CACC necessário para direcionar clonagemem pENTR/D-TOPO é 5' para o códon de ATG. O segundo preparador(CCoAOMTI -FullLow, (SEQ ID N9: 55) Tabela 3) contém o códon de paradada ORF e várias bases (14bp) na 3' UTR.Depois, uma reação de PCR foi executada com os preparadoresespecíficos descritos acima e DNA polimerase Pfu Turbo (Statagene), quenão gera uma adenina na terminação 5' do produto e permite clonagem dire-ta de produto de PCR de CcCCoAOMTI em pENTR/D-TOPO. A amplifica-ção de PCR foi realizada em um volume final de 50 μΙ, como segue: 5 μΙ deplasmídeo de pcccl15a11 (1/50 diluído), 5 μΙ_ de 10 χ tampão de PCR (Tam-pão de Reação de Pfu Clonado), 400 nM de ambos os preparadores específi-cos, 200 μΜ de cada dNTP, e 1,25 U de DNA polimerase Pfu Turbo (Strata-gene). As condições de ciclismo de PCR foram como segue: 94°C durante 2minutos; depois 40 ciclos a 94°C durante 1 minuto, temperatura de recozimen-to 55°C durante 1 minuto, e 72°C durante 2 minutos. Uma etapa final adicionalde alongamento foi feita a 72°C durante 7 minutos. Este experimento pôs aORF de CcCCoAOMTI no vetor de pENTR/D-TOPO para formar o plasmídeopNT15.
Depois, pNT15 foi recombinado com pDEST17 (resistência àampicilina) de acordo com o protocolo GATEWAY sugerido pelo fabricante(Invitrogen) para produzir pNT16 em que a ORF está em estrutura empDEST17. Os produtos da recombinação foram transformados em célulascompetentes TopIO (Invitrogen) e clones que foram resistentes à ampicilina.Clones positivos foram verificados conter a inserção de CCoAOMTI por tria-gem de PCR com os preparadores específicos CCoAOMTI-FuIIUp (SEQ IDNe: 54) e CCoAOMTI -FullLow (SEQ ID N9: 55) descritos na TABELA 3. Apóspurificação, pNT16 foi depois transformado em células competentes BI21AI(para expressão de proteína) de acordo com o protocolo sugerido pelo pro-vedor (Invitrogen).
Para expressão da proteína, uma pré-cultura das células deBI12AI com pNT16 foi crescida durante noite a 37°C em 5 ml de meio de LBcontendo 100 pg/ml de ampicilina. 200 μΙ de cada pré-cultura serviram parainocular duas culturas (50 ml de meio de LB com 100 μg/ml de ampicilina), eas células foram crescidas até uma OD6oonm=0,6. A expressão da proteínaclonada foi depois induzida com 0,2% de L-arabinose e a cultura foi incuba-da por um adicional de 6 h a 27°C. Um controle negativo com repressão(produzido fazendo outra cultura de controle de 0,1% de glicose) foi tambémrealizado.
Depois as células foram empelotadas, colhidas e ressuspensasem dois ml de tampão de Iise (50 mM de fosfato de Potássio pH 7,8, 400 mMde NaCI, 100 mM de KCI, 20 mM de β-mercaptoetanol, 10% de Glicerol,0,5% de Triton X100, imidazol a 10 mM). A Iise é realizada por três ciclos decongelamento/descongelamento (-180°C/42°C) e seguido por 3 ciclos desonicação (1 minuto de tratamento/um minuto de refrigeração) em gelo como ajuste de potência da sonda inserida sendo usado a 40% do máximo (Vi-braCell72412, BIOBLOCK Scientific). As células Iisadas foram depois centri-fugadas (30 minutos 10.000 g), e o sobrenadante foi incubado com contas1,1 de Ni-Nta (produto de Qiagen 1004494) durante uma hora e depois a misturainteira foi transferida para uma coluna de cromatografia (Invitrogen #númerode cat). Esta coluna foi depois lavada duas vezes com 4 ml de tampão delavagem (50 mM de Tris HCI pH 7,5, 500 mM de NaCL, 20 mM de imidazol,20 mM de β-mercaptoetanol, 10% de Glicerol, 0,2 mM de MgCI2). A proteínamarcada com His foi eluída com cinco frações de 0,5 ml de tampão de elui-ção (50 mM de Tris HCI pH 7,5, 500 mM de NaCI, 0,2 mM de MgCI2, 20 mMde β-mercaptoetanol, 10% de Glicerol, 250 mM de imidazol).
Após agrupar as frações contendo a proteína, este fundo geralfoi dializado contra o tampão de atividade (50 mM de Tris HCI pH 7,5, 500mM de NaCL, 0,2 mM de MgCI2, 20 mM de β-mercaptoetanol, 10% de Glice-rol). A purificação da proteína foi verificada por uma análise em um gel a12% de SDS-PAGE (Figura 15). A indução de células recombinantes causoua acumulação de uma quantidade grande de proteína recombinante, com umpeso molecular estimado de 30 Kda (Figura 15A) que corresponde ao tama-nho prognosticado da proteína marcada com His CcCCoAOMTI. A proteínarecombinante marcada com His foi principalmente encontrada nas primeirastrês frações iludidas e a ausência de qualquer outra banda significativa nestafração eluída mostra que há pequena contaminação com proteína não-específica, e a análise de gel também demonstra a ausência de degradaçãode proteína recombinante (Figura 15B). Este experimento mostra que a cro-matografia de HisTag permitiu o isolamento de uma quantidade grande deproteína de CcCCoAOMTI marcada com His.
Quantificação de proteína foi executada usando o protocolo pa-drão de Bradford (estojo de Bradford Sigma #B6916).
O ensaio de CcCCoAOMTI foi executado por um protocolo rela-cionado àqueles usados por Inoue et al. 1998. O ensaio foi realizado em umvolume final de 200 pL de tampão de atividade (50 mM de Tris HCI pH 7,5,500 mM de NaCL1 0,2 mM de MgCI2, 20 mM de β-mercaptoetanol, 10% deGlicerol) contendo 40 pg de proteína, 150 μΜ de SAM e 200 μΜ de ácidocaféico. As reações foram realizadas a 30°C, e nos tempos indicados a rea-ção foi parada adicionando 9 volumes de tampão de parada (0,1% (v/v) deácido fórmico, 5% (v/v) de acetonitrila, pH 2,5). Estas amostras foram depoisclarificadas em filtros de 0,22 μΜ e 20 pL deste foram injetados na HPLC.
A análise de HPLC foi operada como segue: coluna (MacheryNagel Nucleosil 5 C18, 8 pm, 4 χ 250 mm); elução de gradiente, solvente A(0,1% (v/v) de ácido fórmico) e solvente B (5% (v/v) de acetonitrila): 0-15minutos 5%B-50%B, 15-17 minutos 50%B-70%B, 17-23 minutos 70%B, 23-25 minutos 70%B-100%B, 25-30 minutos 100%B, 30-32 minutos 100%B-5%B, 32-40 minutos 5%B, taxa de fluxo, 1 mL/min e detecção por espectro-fotômetro de UV a 324 nm (Waters 2487).
Ao ensaio da enzima de CcCCoAOMTI não foi realizado comCafeoil CoA, o substrato preferido da enzima, porque este substrato não estácomercialmente disponível. Do contrário, ácido caféico, um composto previa-mente usado para a proteína recombinante de Medicago saí/Vati, CCoAOMTfoi usado como o substrato. Ácido caféico tem uma especificidade inferior.(Inoue et al. 1998; Parvathi et al. 2001) neste ensaio, o produto esperado dereação é o ácido ferúlico. A comparação de espectros de análise de HPLCdas reações de controle e de teste é mostrada nas Figuras 18 A e B. Os resul-tados obtidos demonstram que um pico novo surge em 14,8 min após 6 horas,e este pico é maior em 24 horas. Este tempo de retenção é idêntico a um pa-drão de ácido ferúlico. Além disso, quando a amostra foi excitada com ácidoferúlico, o ácido ferúlico co-eluído recentemente adicionado com o pico pro-posto de ácido ferúlico (Figura 19), confirmando a proposta que este pico ge-rado por CcCCoAOMTI é ácido ferúlico. Um segundo pico pode ser identifi-cado no momento de retenção de 15,2 min, e porque este pico não está naamostra de controle (nenhuma enzima), poderia ser qualquer outro produtogerado por CcCCoAOMTI, ou um produto de degradação de ácido ferúlico.Em geral, os dados da Figura 18 demonstram que a proteína codificada porCcCCoAOMTI tem uma das atividades enzimáticas prognosticadas associa-das às proteínas de CcCCoAOMT como MsCCoAOMT e desse modo CcC-CoAOMTI codifica uma proteína de café cafeoil CoA O-metil transferase.
Exemplo 10
Sobreexpressão de proteínas de CaCCoAOMT-LI e de CcCCoAOMT-L2
A ORF (SEQ ID N9: 7) correspondendo à proteína de CaCCoA-OMT-L1 (SEQ ID N9: 15) já estava presente no vetor de entrada pENTR/D-TOPO (isto é, pNT8). A fim de sobreexpressar a proteína de CaCCoAOMT-L1 (SEQ ID N9: 15), esta ORF foi transferida para pDEST17 como descritoacima para CcCCoAOMTI (SEQ ID N9: 14), rendendo o plasmídeo pNT12.Este plasmídeo foi depois transformado em células de BL21-AI e a proteínafoi sobreexpressa e purificada como descrita para CcCCoAOMTI, excetoque a indução de expressão com arabinose foi realizada durante noite a20°C. Figura 16 mostra os resultados deste experimento de purificação desobreexpressão. Painel A (Figura 16) demonstra que uma indução boa deuma proteína com o tamanho esperado aproximado (aproximadamente 26kDa) ocorreu na indução das células transformadas. Os resultados de purifi-cação mostram que embora CaCCoAOMT-LI seja relativamente sobreex-pressado, a purificação na coluna de HisTag não foi muito eficiente (Figura16, Painel B). É acreditado tanto da proteína produzida era insolúvel e estaproteína teria sido perdida na etapa de centrifugação.
Para sobreexpressar a proteína de CcCCoAOMT-L2 (SEQ IDN9: 16), dois preparadores CCoAOMT-L2-FullUp (SEQ ID N9: 58) e CCoA-OMT-L2-FullLow (SEQ ID N9: 59) (Tabela 3) foram projetados para amplificara ORF que corresponde à CcCCoAOMT-L2 do plasmídeo pNT4. Estes pre-paradores geraram um fragmento de PCR que poderia ser clonado em pEN-TR/D-TOPO usando a mesma estratégia como descrita para CcCCoAOMTI.As condições da PCR usando DNA polimerase Pfu Turbo são também iguaisàs para CcCCoAOMTI, e gerou pNT10. A fim de sobreexpressar a proteínade CcCCoAOMT-L2, a ORF contida em pNT10 foi transferida para pDEST17como descrito acima para CcCCoAOMTI, rendendo o plasmídeo pNT17.Este plasmídeo foi depois transformado em células de BL21-AI e a proteínafoi sobreexpressa e purificada como descrito para CcCCoAOMTI exceto quea indução de expressão com arabinose foi realizada durante a noite a 20°C.Figura 17 mostra os resultados deste experimento de purificação de sobre-expressão. Painel A (Figura 16) demonstra que uma indução boa de umaproteína com o tamanho aproximado esperado (aproximadamente 28 kDa)ocorreu na indução das células transformadas. Os resultados de purificaçãomostram que embora CcCCoAOMT-L2 seja relativamente sobreexpressada,a purificação na coluna de HisTag não foi muito eficiente. É acreditado queum tanto da proteína de CcCCoAOMT-L2 produzida era insolúvel e dessemodo esta proteína teria sido perdida na etapa de centrifugação.
Exemplo 11
Sobreexpressão e purificação de proteínas de HCT e HQT
Para demonstrar que as proteínas codificadas através de pML1{CcHCT (SEQ ID Ns: 1)) e pML2 (CcHQT(SEQ ID N9: 3)) poderiam ser pro-duzidas em formas recombinantes, estes proteínas foram sobreexpressadasem E. coli. Isto foi realizado amplificando cada ORF por amplificação dePCR usando os preparadores observados na Tabela 7. O preparador dePCR de terminação 5' teve um sítio de BamHI logo antes do códon de iníciode ATG e o preparador de terminação de 3' teve um sítio de Xbal logo apóso códon de parada. As reações de PCR foram executadas com a PhusionPolimerase (FinnZymes) sob as condições especificadas pelo fabricante. Osprodutos de PCR específicos desse modo gerados foi purificado em géis deagarose e depois isolados dos géis usando o estojo de GeneCIean Turbo(Q-biogene) de acordo com o protocolo do fabricante. Os fragmentos purifi-cados foram depois digeridos com enzimas de restrição de BamHI e Xbal(New England Biolabs).O vetor de expressão (plasmídeo pGTPc103a) foi também dige-rido com BamHI e Xbal sob as mesmas condições. Os fragmentos purifica-dos com gel foram quantificados e depois ligados no vetor de pGTPc103adigerido usando T4 DNALigase (New Englands Biolabs), uma etapa que foiprojetada (por meio dos preparadores de PCR usados) para colocar o mar-cador de GST codificado pela estrutura interna de vetor com a seqüência deproteína de HCT/HQT sendo clonada. Células competentes de DH5a (Invi-trogen) foram depois transformadas com cada mistura de ligação de acordocom os protocolos do fabricante. Triagem das colônias para aquelas com asinserções apropriadas foi executada por PCR usando os mesmos prepara-dores empregados para clonar a ORF e com digestão enzimática. Plasm í-deos selecionados foram depois purificados e as inserções de HCT e HQTpresentes foram seqüenciadas (para assegurar nenhum erro durante a etapade PCR). O plasmídeo de pGTPc103a que contém a seqüência de CcHCTfoi nomeado pGTPc103a_HCT e o plasmídeo de pGTPc103a que contêm aseqüência de CcHQT foi nomeado pGTPc103a_HQT. Por fim, células com-petentes de expressão BI21(DE3) foram transformadas compGTPc103a_HCT ou pGTPcl 03a_HQT a fim de expressar a proteína.
Para sobreexpressar as proteínas, uma pré-cultura de cada cé-lula recombinante de BI21(DE3) contendo CcHCT ou CcHQT foram crescidadurante noite a 37°C entre 10 ml de meio de LB contendo 50 pg/ml de ca-namicina. Cada pré-cultura foi depois usada para inocular duas culturasmaiores (200 ml de meio de LB com 50 pg/ml de canamicina), e as célulasforam crescidas até que a OD6oo alcançasse 1. Expressão da proteína foidepois induzida adicionando 0,2 mM de IPTG e as culturas foram depoiscrescidas para um adicional de 3h a 37°C.
Após este tratamento de indução, as células foram empelotadas,e depois ressuspensas em 25 ml de tampão de Iise (20 mM de NaPO4 pH7,3, 150 mM de NaCI, 1% Triton X100, 2 mM de EDTA, 0,1% de β-mercaptoetanol, 1X mistura de inibidor de protease). Lise foi realizada atra-vés de sonicação (Vibracel 72,434) em gelo durante 3 ciclos de 10 segun-dos. As células Iisadas foram centrifugadas (30 minutos 10.000 g), e o so-brenadante foi aplicado a uma amostra de meios de GST-Sepharose 4B (A-mersham) durante duas horas. Esta mistura foi depois transferida para umacoluna de cromatografia pequena, e lavada 3 vezes com 5 ml de tampão delavagem (420 mM de NaPO4 pH 7,3, 150 mM de NaCI, 1X mistura de inibi- dor de protease). A proteína marcada com GST foi eluída em quatro fraçõesdistintas de 0,5 ml de tampão eluição (50 mM de Tris HCI pH 8, 10 mM deglutationa reduzida, 10% de glicerol, 1X mistura de inibidor de protease).A produção das proteínas recombinantes e purificações de cada fração fo-ram seguidas por análise em 5-18% de gel de gradiente de SDS-PAGE e porwestern blot usando um anticorpo específico contra o marcador de GST (Fi-guras 13 e 14).
Os resultados apresentados na Figura 13A mostram que HCTfoi sobreexpressado fracamente e que esta proteína poderia ser purificadaatravés de cromatografia de marcador de GST. A preparação da proteínapurificada (eluída mais de quatro frações) continha duas bandas na faixa depeso molecular mais alto (72,2 e 70 kDa). A proteína de 72,2 kDa tem o ta-manho mais próximo ao tamanho esperado para a fusão de GST-HCT. Aproteína de 70 kDa não é conhecida. O material de peso molecular baixo(aprox 28 kDa) corresponde sozinho ao marcador de GST. Os resultados dowestern blot apresentados na Figura 13B demonstram que a proteína de72,2 kDa reage com o anticorpo contra o marcador de GST como esperadopara a proteína de fusão GST-HCT. Similarmente, a banda de 28 kDa reagefortemente com o anticorpo contra GST, confirmando isto é a proteína deGST. Os resultados apresentados na Figura 14A mostram que HQT foi so-breexpressado fracamente e que esta proteína poderia ser purificada atravésde cromatografia de marcador de GST. A preparação de proteína purificada(eluída nas primeiras duas frações) continha duas bandas na faixa de pesomolecular mais alto (73,1 e 70 kDa). A proteína de 73,1 kDa aproximou-seao tamanho esperado para a fusão de GST-HQT. A proteína de 70 kDa nãoé conhecida. O material de peso molecular baixo (aprox 28 kDa) correspon-de sozinho ao marcador de GST. Os resultados do western blot apresenta-dos na Figura 14B demonstram que a proteína de 73,1 kDa reage com oanticorpo contra o marcador de GST como esperado para a proteína de fu-são de GST-HCT. Similarmente a banda a 28 kDa reage fortemente com oanticorpo contra GST1 confirmando isto é a proteína de GST.
Tabela 7. Lista de preparadores específicos usados para a sub-clonagem
<table>table see original document page 87</column></row><table>
Exemplo 12
Análise de expressão de gene de HQT. HCT. C3H. CCOAOMT-1, CCOA-OMT-L1. ANDCCOAOMT-L2 por RT-PCR quantitativa
Para medir a expressão precisamente de cada um destes ge-nes, os níveis de transcrições dos genes de HQT, HCT, C3H, CCoAOMT-1,CCoAOMT-L1 e CC0AOMT-L2 foram determinados para vários tecidos davariedade de arabica C. arabica T2308 e da variedade de robusta C. cane-phora pb 409 usando preparadores/sondas de TaqMan gene-específicos(Tabela 5). O cDNA diferente para estes experimentos foi preparado atravésdo Método 1 com RNA isolado de raízes, talos, folhas, flores, e dos tecidosdo grão e pericarpo isolados de 4 estágios diferentes de grãos secos de caféde arabica e de robusta em desenvolvimento como descrito no Exemplo 2,acima. Os resultados destes experimentos são apresentados na Figura 8.
GENES QUE CODIFICAM HCT E HQT. Sonda de TaqMan epreparadores para os genes de HQT e HCT foram projetados (vide Tabela 5)e estes foram depois usados para medir os níveis de transcrição para cadaum destes genes em vários tecidos de café de arabica e de robusta diferen-tes (vide Exemplo 2). O perfil de expressão de HQT (Figura 8) visto para ro-busta mostra que este gene é expresso em níveis relativamente altos (RQ0,71) no grão no estágio verde pequeno, e em níveis um pouco inferiores emtodos os outros tecidos examinados. É observado que a amostra de pericar-po verde pequena também tem um nível ligeiramente elevado de HQT comrelação aos estágios posteriores de desenvolvimento de pericarpo. Previa-mente foi demonstrado pelos inventores que esta amostra de grão verderobusta não tem nenhuma expressão de gene específica para endosperma(Pedido provisório N9 60/696.445). Esta última observação leva à sugestãoque o gene de HQT pode ser altamente expresso durante os estágios pre-maturos de grão e desenvolvimento de pericarpo, e que o nível de transcri-ção deste cai para níveis relativamente baixos em ambos os tecidos conco-mitantes com o começo de desenvolvimento de endosperma.
Os níveis de expressão de HQT nos outros tecidos de robustasugerem que este gene é em geral expressos em vários tecidos de café emníveis baixos constantes, sugerindo que ele pode ter algum tipo de funçãode "manutenção". Quando os níveis de HQT são examinados em arabica,níveis relativamente similares foram vistos para robusta nas raízes, talos, efolhas jovens e na maioria dos tecidos de grão e de pericarpo. Isto é consis-tente com a idéia que é um gene do tipo de manutenção potencialmente im-portante. Os baixos níveis de HQT no grão verde pequeno de arabica e a-mostras de pericarpo são consistentes com a idéia que HQT cai quando aexpressão de gene endosperma-específica é induzida porque estes grãosverdes pequenos de arabica expressam genes endosperma-específicos(Pedido provisório N- 60/696.445). Por fim, é observado que diferençasgrandes foram também detectadas para expressão de HQT nas flores dearabica e robusta. As diferenças são provavelmente devido às diferenças noestágio desenvolvente preciso destas duas amostras de flor como a expres-são de vários genes foi vista ser extremamente variável entre estas duasamostras de flor.O perfil de expressão de HCT visto para robusta indica que estegene é expressado em níveis relativamente altos no pericarpo nos estágiosverde grande (RQ 0,33), e amarelo com níveis inferiores vistos no pericarponos estágios verde pequeno (RQ 0,09) e vermelho. Níveis de transcrição sãorelativamente altos nas raízes e talos em robusta, enquanto níveis inferioressão vistos nas folhas e flores. Níveis muito baixos foram também detectadosno grão em todos estágios estudados. Um padrão um pouco diferente deexpressão é visto em arabica, sem detecção das transcrições de HCT nopericarpo, com exceção de um nível baixo visto no estágio verde pequeno.Além disso, nenhuma transcrição de HCT foi detectada nos tecidos de talode arabica. Em contraste, níveis ligeiramente mais altos de HCT foram de-1,1 tectados nas folhas e no grão no estágio vermelho em arabica com relação àrobusta. A detecção de expressão de HCT em um número limitado de amos-tras de tecido de arabica elimina a possibilidade que o conjunto de sonda de HCT Taqman, que foi projetado da seqüência de robusta, não é reconhecidonesta variedade de arabica. Os níveis de HCT foram similares nas amostrasde flor de arabica e robusta.
A expressão mais alta de HCT no grão de arabica versus o grãode robusta sugere que diferenças nos perfis de ácidos clorogênicos em ara-bica e robusta pudessem, em parte, ser devido a níveis diferentes de ex-pressão de HCT no grão de café maduro. Similarmente, dado o envolvimen-to potencial de ácidos clorogênicos em resistência de patógeno (Shadle etal. (2003); Niggeweg et al. (2004)), a expressão alta de HCT em raízes derobusta e talos poderia contribuir para resistência a patógehos significativa-mente elevada em geral associada aos cafés de robusta versus de arabica.É observado que há uma expressão relativamente baixa de HCT nas amos-tra de flor de robusta BP-409. Porém, considerando esta amostra de folha éde folhas em expansão jovens, é possível que a expressão de HCT na folhamadura seja significativamente mais alta que em folhas jovens, talvez devidoao uso alternativo de CGA para a síntese de Iignina e similares componentesestruturais durante a expansão da folha. Esta explanação para níveis detranscrição de HCT mais baixos que esperado em folhas jovens suportariatambém aquele argumento que a expressão de HCT mais alta está ligada àresistência mais alta a patógenos ou a doenças, visto que seria uma caracte-rística importante para folhas maduras.
GENES QUE CODIFICAM C3H. Preparadores específicos esondas de TaqMan foram projetados para o gene de C3H (vide Tabela 5).Este conjunto de sonda foi usado para medir os níveis de transcrição C3Hem vários tecidos de café de arabica e de robusta diferentes como observa-do no Exemplo 2. Os dados mostrados na Figura 8 indicam que transcriçõesde C3H podem ser detectadas em todos os tecidos de robusta testados. Umnível relativamente alto de transcrições de C3H é visto na amostra de grãode estágio verde pequena de robusta, e níveis relativamente altos de trans-crições de C3H são também vistos no pericarpo (picando nos estágios verdegrande e amarelo). Níveis inferiores de transcrições de C3H são vistos nasamostras de talo, folha e de flor de robusta. De forma interessante, nenhumatranscrição de C3H foi detectada nas amostras de raiz de robusta. Em arabi-ca, níveis de transcrição de C3H foram similares no grão para robusta, exce-to no estágio verde pequeno. É acreditado que a última observação acimaestá ligada ao último estágio desenvolvente da amostra de arabica comoobservado. De forma interessante, níveis de transcrição de C3H nas amos-tras de pericarpo de arabica são indetectáveis no estágio verde pequeno edepois sobem consistentemente até o estágio vermelho. Isto está em con-traste distinto com as amostras de robusta onde expressão de C3H foi maisalta antecipadamente em desenvolvimento e depois diminuída na maturidade.
GENE QUE CODIFICA CCOAOMT-1. Uma sonda de TaqManespecífica e dois preparadores foram projetados para o gene de CCoAOMTI(vide Tabela 5). Os dados de RT-PCR quantitativa para este gene estão a-presentados na Figura 8. Em grão de robusta, transcrições de CCoAOMT-1foram muito baixas no estágio verde pequeno (RQ 0,05), mas mais altas nosestágios de grão verde grande (RQ 0,31) e amarelo (RQ 0,76), depois caiupara um nível muito baixo no grão maduro (RQ 0,09). No pericarpo, os níveissão baixos no pericarpo verde pequeno (RQ 0,15), ligeiramente mais altonos estágios verde grande (RQ 0,56) e amarelo (RQ 0,65), e depois caemnovamente para um nível muito baixo no estágio vermelho (RQ 0,06). Emrobusta, os níveis de transcrição de CCoAOMT-1 foram observados ser rela-tivamente altos nas raízes (RQ 1,09) e talos (RQ 1,5), moderadamente altosnas flores (RQ 0,58) e muito baixos na folha (RQ 0,06). Em comparação àamostra de BP409 de robusta. Em T2308 de arabica, os níveis de CCoA-OMT-1 são relativamente altos no grão verde pequeno (RQ 0,56) e grande(RQ 1,21), e no grão vermelho (RQ 1,43). A queda inesperada nos níveis deCCoAOMT-1 no estágio de grão amarelo (RQ 0,16) foi inesperada e neces-sitará ser verificada em outras amostras de arabica. Os níveis de transcriçãode CCoAOMT-1 nas amostras de pericarpo de arabica verde pequeno, ver-des, amarelo grande são relativamente baixas.
GENE QUE CODIFICA CCOAOMT-L1. Uma sonda de TaqManespecífica e dois preparadores foram projetados para o gene de CCoAMT-L1 (vide Tabela 5). Em geral, os resultados de RT-PCR quantitativa obtidosindicam que o nível de transcrições para o gene de CCoAOMT-L1 ou estápróximo, ou abaixo, do nível de detecção em todos os tecidos de robustaexaminados. Um resultado relativamente similar foi obtido para todas as a-mostras de arabica, exceto a amostra de flor. Neste caso, transcrições deCCoAOMT-L1 foram muito claramente detectadas (RQ 0,14), ou seja, estegene tem um nível 7,8 vezes mais alto de transcrições que aquele detectadono grão verde pequeno de arabica (RQ 0,018). A presença destas transcri-ções na amostra de flor arabica sugere que este gene é especificamenteexpressado em uma ou mais partes da flor. Além disso, a ausência de trans-crições de CCoAOMT-L1 nas flores de robusta sugere que as flores de ara-bica e de robusta estejam em estágios diferentes de maturidade, e dessemodo a expressão de CCoAOMT-L1 poderia ser específico para o estágiodurante o desenvolvimento da flor. Suportando este último argumento, váriosoutros genes de café mostraram expressão extensamente diferente nasmesmas amostras de flor de arabica e robusta, indicando novamente estasamostras estão em estágios diferentes de maturidade.
GENE QUE CODIFICA CCOAOMT-L2. Uma sonda de TaqManespecífica e dois preparadores foram projetados para o gene de CCoAOMT-L2 (vide Tabela 5). Os resultados de RT-PCR quantitativa obtidos para estegene indicaram que, além da amostra de flor de robusta, expressão deCCoAOMT-L2 não foi detectada confiantemente em quaisquer das amostrasde tecido de robusta ou arabica usando as condições experimentais descri-tas aqui. É observado que experimentos de controle mostraram que a efici-ência de amplificação do conjunto de preparador/sonda de rpl39 e a eficiên-cia do conjunto de preparador/sonda de CCoAOMT-L2 são similares quandotestadas contra seus respectivos plasmídeos. Desse modo, não é provavel-mente que a ausência de expressão detectável para o gene de CCoAOMT-L2 em robusta ou arabica encontrados aqui seja devida a um problema es-pecífico com o conjunto de preparador/sonda de CCoAOMT-L2.
Exemplo 13
Atividade funcional de HCT de café recombinante
Atividade não foi detectada de HCT marcado GST recombinantee proteínas de HQT marcadas como GST produzidas em E. coli. Para de-terminar se o marcador de GST estava impedindo a atividade destas proteí-nas, os marcadores de GST foram removidos enzimaticamente de cada pro-teína. A proteína de HCT e HQT recombinante (sem marcadores) foi depoisreensaiada para atividade.
DIGESTÃO DE ACTEV PROTEASE: As proteínas de HCT-GSTrecombinante ou HQT-GST recombinante, produzidas e purificadas comodescritas no Exemplo 11, foram digeridos por AcTEV de acordo com as ins-truções do provedor (Invitrogen): 140 μΙ de enzima recombinante foram dige-ridos a 30°C durante duas horas com 7,5 μΙ de tampão de TEV (20 χ tam-pão, Invitrogen), 1,5 μΙ de 0,1 mM de DTT, e 2 μΙ de AcTEV protease (20unidades).
ENSAIO DE ENZIMA: MÉTODOS MODIFICADOS NIGGEWEGet al, 2004 e HOFFMANN et al, 2003 foram usados. Atividade da enzima foideterminada a 40°C usando a reação reversa (clivagem de 5-CQA para ca-feoil-CoA e ácido quínico). A mistura de reação (200 μΙ total) foi: 100 mM detampão de Na-pi pH 6,5, 1 mM de DTT, 5 mM de CGA (5-CQA - Sigma), 3,3mM de CoA1 e 30 μL de enzima de GST-HCT ou GST-HQT recombinantedigerida com AcTEV. A reação foi iniciada por adição do substrato CoA. Acada ponto de tempo; 30 μΙ da mistura de reação foram parados por adiçãode 170 μL de tampão de parada (0,1% de ácido fórmico, 5% de acetonitrila).
Este material foi depois filtrado usando um filtro de 0,2 μm, e depois carre-gado para a coluna de HPLC.
MÉTODO DE HPLC: Produtos de reação foram analisados porHPLC, usando uma coluna C18 de fase reversa de Waters (4 μιτι, 4,6 χ 250mm) e um gradiente de acetonitrila (8-50%): solvente A era 91% de milliQH2O, 8% de CH3CN, e 1% de ácido fórmico; solvente B era 49% de milliQH2O, 50% de CH3CN, e 1% de ácido fórmico, solventes foram pulverizadoscom 30% de hélio). O gradiente era como segue; a 0 min, 98% A - 2% B; a 5min, 92% A - 8% B; a 25 min, 50% A - 50% B; a 30 min, 30% A - 70% B; a35 min, 30% A - 70% B; depois de 37-45 minutos, 98% A - 2% B. Os corrí-postos eluídos a 325 nm foram detectados. Os compostos foram caracteri-zados por seus tempos de eluição e seus espectros de absorção de UV, esuas identidades foram confirmadas através de padrões quando disponíveis.
Resultados:
O tratamento de proteínas de HCT marcado com GST e de HQTmarcado com GST com proteína de AcTEV foi mostrado por eletroforese emgel de SDS PAGE gel e tingimento de coomassie para gerar um polipeptídeomenor com o peso molecular esperado das proteínas de comprimento totalde cada um das proteínas "precursoras" marcadas com GST. Esta observa-ção demonstra que a AvTEV protease de forma bem sucedida liberou oMarcador GST das proteínas de GST-HCT e de GST-HQT e desse modoproduziu os polipeptídeos de HCT e de HQT normais de comprimento total.
Figura 20 mostra a reação de controle para atividade deHCT/HQT (5-CQA clivado com cafeoil-CoA e ácido quínico). Aquela reaçãocontinha todos os reagentes, mas sem enzima adicionada. Os resultadosmostrados na Figura 20 demonstram que sob as condições empregadas,ácido clorogênico (5-CQA) é estável; o pico de CGA é apenas ligeiramentemenor em T=4 horas versus o tamanho de pico em T=O, e apenas um picomuito pequeno aparece a 12,1 minutos.
Em contraste, Figura 21 mostra que o pico de CGA na reaçãocom proteína de GST-HCT tratada com AvTEV foi significativamente reduzi-do (de aproximadamente 0,035 em T=O para aproximadamente 0,02 em T=4horas). A redução do pico de CGA é acompanhada pelo surgimento de vá-rios picos novos. Os picos novos estão respectivamente em cerca de 8 mi-nutos, 17,1 minutos e 18,3 minutos, além do desenvolvimento de uma sali-ência significativa no pico de CGA. Porque sob estas condições de eluição,ácido caféico elui muito próximo do pico de 5-CQA pico, a adição do polipep-tídeo de HCT de café recombinante causa a acumulação de ácido caféico.Embora o produto esperado desta reação tenha sido cafeoil-CoA, é prova-velmente que esta molécula seja instável no tampão usado e rapidamentedegradada, formando o ácido caféico observado. De acordo com este argu-mento, é provavelmente que um dos picos a 17,1 minutos e 18,3 minutossão de fato cafeoil-CoA.
REFERÊNCIAS:
Altschul S.F., Madden T.L., Schaffer A.A., Zhang J., Zhang Z.,Miller W., Lipman D.J. (1997) Gapped BLAST and PSI-BLAST: a new gene-ration of protein database search programs. Nucleic Acids Res. 25: 3389-3402.
Ben Amor M. e McCarthy J. (2003) Modulation of coffee flavourprecursor leveis in green coffee grains. Patente européia EPC/03394056.0.
Clifford M.N. (1985) Chlorogenic acids, em Coffee 1. Chemistry,Ed por Ciarke RJ e Macrae R. Elsevier Applied Science, Londres, páginas153-202.
Clifford M.N., Walker R (1987) Chlorogenic acids-confounders ofcoffee±serum cholesterol relationships. Food Chem 24: 77-80.
Clifford M.N. (1998) The nature of chlorogenic acids-are theyadvantageous compounds in coffee?, em Dix-septième Colloque ScientifiqueInternational sur Ie Café. ASIC, Paris, páginas 79-91.
Clifford M.N. (1999) Chlorogenic acids and other cinnamates-nature, occurence and dietary burden. J Sci FoodAgric 79: 362-372.Clifford Μ.Ν. (2000) Chlorogenic acids and other cinnamates -nature, occurrence, dietary burden, absorption and metabolism J Sci FoodAgric 80: 1033-1043.
Crouzillat D., Lerceteau E., Petiard V., Morera J., Rodriguez H.,Walker D., Philips W.R.R., Schnell J., Osei J. e Fritz P. (1996). Theobromaeaeao L.: a genetic Iinkage map and quantitative trait Ioei analysis. TheorAp-pIGenet. 93:205-214.
Ferrer JL1 Zubieta C, Dixon RA, Noel JP (2005) Crystal structu-res of alfalfa caffeoyl coenzyme A 3-O-methyltransferase. Plant Physiol 137:1009-1017.
Gang D., Wang J., Dudareva N., Hee Nam K1 Simon J., Lewin-sohn E., Piehersky E (2001) An Investigation of the Storage and Biosynthesisof Phenylpropenes in Sweet Basil Plantphysiol. 125: 539-555.
Graee S.C., Logan B.A. (2000) Energy dissipation and radicalscavenging by the plant phenylpropanoid pathway Phil. Trans. R. Soe. Lond.S. 355:1499-1510.
Hoffmann L., Maury S., Martz F., Geoffroy P., Legrand M..(2003) Purification, Cloning, and Properties of an Aeyltransferase ControllingShikimate and Quinate Ester Intermediates in Phenylpropanoid MetabolismJ. Bio. Chem. 278(1): 95-103.
Hoffmann L., Besseau S., Geoffroy P, Ritzenthaler C., Meyer D.Lapierre C, Pollet B. Legrand M (2004) Sileneing of Hydroxycinnamoyl-Coenzyme A Shikimate/Quinate Hydroxycinnamoyltransferase Affeets Phen-ylpropanoid Biosynthesis Plant Cell Λ 6: 1446-1465.
Hollman P.C.H. (2001) Evidenee for health benefits of plant phe-nols: local or systemic effects? J. Sei. FoodAgric. 81:842-852.
Inoue K, Sewalt VJ1 Murray GB, Ni W, Sturzer C, Dixon RA(1998) Developmental expression and substrate specificities of alfalfa caffeicacid 3-O-methyltransferase and caffeoyl coenzyme A 3-O-methyltransferasein relation to lignification. Plant Physiol 117: 761 -770.
Ky C.-L., Louarn J., Dussert S., Guyot B., Hamon S., Noirot M.(2001) Cafeine1 trigonelline, chlorogenic acids and sucrose diversityin wildCoffea arabica L. and C. canephora P. accessions Food Chemistry 75: 223-230.
Lee C. Y., Jaworski A. (1987) Phenolic compounds in white gra-pes grown in New York. Am. Enol. & Viticul. 38: 277-281.
Leloup V., Louvrier A., Liardon R. (1995) Degradation meca-nisms of chlorogenic acids during roasting. Compte-rendus du Seizième Col-Ioque de I1ASIC (Association Scientifique Internationale sur Ie Café) ASICKyoto páginas 192-198.
Maher E.A., Bate N.J., Ni W., Elkind Y., Dixon R.A., Lamb C.J.(1994) Increased disease susceptibility of transgenic tobacco plants withsuppressed leveis of preformed phenylpropanoid products. Proc. Nati Acad.Sei. USA 91:7802-7806.
Marraeeini P., Deshayes A., Pétiard V. e Rogers W.J. 1999. Mo-lecular cloning of the complete 11S seed storage protein gene of Coffea ara-bica and promoter analysis in the transgenic tobacco plants. Plant Physiol.Biochem. 37:273-282.
Maury1S., Geoffroy1P., Legrand1M. (1999) Tobacco O-methyltransferases involved in phenylpropanoid metabolism. The differentcaffeoyl-coenzyme Α/5-hydroxyferuloyl-coenzyme A 3/5-O-methyltransferaseand caffeic acid/5-hydroxyferulic acid 3/5-O-methyltransferase classes havedistinet substrate specificities and expression patterns. Plant Physiol. 121:215-224.
Mitchell H.J., Hall S.A., Stratford R., Hall J.L., Barber M.S.(1999). Differential induetion of cinnamyl alcohol dehydrogenase during de-fensive Iignification in wheat (Triticum aestivum L.): characterisation of themajor inducible form. Planta 208 : 31-37.
Montavon P., Duruz E., Rumo G., Pratz G. (2003a) Evolution ofGreen Coffee Protein Profiles with Maturation and Relationship to CoffeeCup Quality J. Agric. Food Chem. 51: 2328-2334
Montavon P., Mauron A.F. Duruz E. (2003b) Changes in GreenCoffee Protein Profiles during Roasting Food Chem. 51: 2335-2343.
Nair R., Xia Q., Kartha C., Kurylo E., Hirji R., Datla R., SelvarajG. (2002) Arabidopsis CYP98A3 Mediating Aromatic 3-Hydroxylation. Deve-Iopmental Regulation of the Gene, and Expression in Yeast Plant physiol.130:210-220.
Natella F., Nardini M., Giannetti I., Datillo C., Scaccini C.(2002)Coffee Drinking Influenees Plasma Antioxidant Capaeity in Humans J. Agric.Food Chem.50: 6211 -6216.
Niggeweg R., Miehael A., Martin C. (2004) Engineering plantswith increased leveis of the antioxydant chlorogenic acid Nature Biotech.22(6): 746-54.
Ohnishi M., Morishita H., Iwahasi H., Toda S., Shirataki Y., Kimu-ra M., Kido R. (1994) Inhibitory effects of chlorogenic acids on Iinoleic acidperoxidation and haemolysis. Phytochemistry 36 :579-584.
Olthof M.R., Hollman P.C.H., Katan M.B. (2001) Chlorogenic a-cid and caffeic acid are absorbed in humans. J. Nutr. 131 :66-71.
Parvathi K, Chen F1 Guo DJ, Blount JW, Dixon RA (2001) Subs-trate preferences of O-methyltransferases in alfalfa suggest new pathwaysfor 3-O-methylation of monolignols. Plant Journal 25:193-202.
Rice-Evans C.A., Miller M.J., Paganga G. (1996) Strueture-antioxidant activity relationships of flavonoids and phenolic acids. Free Rad.Biol. Med. 20 :933-956.
Rogers J., Michaux S., Bastin M., Bucheli P. (1999) Changes tothe content of sugars, sugar alcohols, myo-inositol, carboxylic acids and i-norganic anions in developing grains from different varieties of Robusta (Cof-fea canephora) and Arabica (C. arabica) coffees Plant Science. 149: 115-123.
Schoch G., Goepfert S., Morant M., Hehn A., Meyer D., UllmannP., Werek-Reichhart D. (2001) CYP98A3 from Arabidopsis thaliana Is a 3-Hydroxylase of Phenolic Esters, a Missing Link in the Phenylpropanoid Pa-thway . J. Bio. Chem. 266(39): 36566-36574.
Shadle G., Wesley V., Korth K., Chen F., Lamb C., Dixon R.(2003) Phenylpropanoid compounds and disease resistance in transgenictobacco with altered expression of l-phenylalanine ammonia-lyase Phyto-chemistry 64: 153-161.
Shibata H., Sakamoto Y., Oka M., Kono Υ. (1999) Natural antio-xidant, chlorogenic acid, protects against DNA breakage caused by monoc-hloramine. Biosci. Biotechnol. Biochem. 63:1295-1297.
Tamagnone T, Merida A., Stacey N., Plaskitt K., Parr A., ChangC.F., Lynn D., Dow M., Roberts K., Martin C. (1998) Inhibition of PhenolicAeid Metabolism Results in Preeoeious Cell Death and Altered Cell Morpho-Iogy in Leaves of Transgenie Tobacco Plants Plant Cell 10: 1801-1816.
Voilley, A., Sauvageot1 F., Durand, D. (1977). Influence sur l'a-mertume d'un café boisson de quelques paramètres d'extraction. Compte-Rendus du Huitième Colloque de 1'ASIC (Association Scientifique Internatio-nal sur Ie Café), ASIC páginas 192-198251-259.
Zhong R, Ill W1 Negrel J, Ye ZH (1998) Dual methylation path-ways in Iignin biosynthesis. PIantCeI11998 Dec;10(12):2033-46.LISTAGEM DE SEQÜÊNCIA
<110> Cornei! Research FoundationNestec s.a.LEPELLEY, MaudCHEMInade, GeraldmccartHY, James Gerardpetiard, vincentLlN1 ChenweiTanksley, Steven D.
<120> Polinucleotídeos que codificam enzimas da via de fenilpropanóide em café
<130> 48520-1004 WO (N07975/W0) (232313)
<140> PCT/US2006/039618
<141> 2006-10-10
<150> 60/724,673
<151> 2006-10-07
<160> 90
<170> Versão de Patente 3.3
<210> 1
<211> 1388
<212> DNA
<213> Coffea canephora
<400> 1
ccatgaaaat cgaggtgaag gaatcgacta tggtgagacc tgcccaagaa actcctggga 60ggaacttgtg gaactcgaac gtggacttgg tggtgccaaa tttccacacc cctagcgtct 120acttctatag gccgacggga tcatcgaatt tctttgatgc caaagtgcta aaggacgctt 180tgagccgagc ccttgtcccg ttctacccaa tggctggtag gttaaagaga gacgaagatg 240ggcggattga gattgagtgc aatggtgaag gcgtgctttt cgtggaggcc gagtctgatg 300gagtagttga tgatttcggt gactttgcac caactttaga gcttcgtaga ctcattcctg 360cagttgatta ttctcaagga atatcaagct acgctctcct agtgctgcag gtgacatatt 420tcaagtgtgg tggagtctct cttggtgttg gcatgcgaca tcatgcagct gatggatttt 480caggtcttca tttcatcaat tcatggtctg atatggcccg tggccttgat gtgaccctgc 540caccattcat agaccgcacc ctcctccgtg cccgcgatcc gccccagcct caattccagc 600acattgagta ccaacctcct ccagccttaa aagtttcccc gcaaactgca aaatctgact 660cagttcctga aactgcggtg tccatcttca agrtaaccag ggagcaaatc agtgccctga 720aagccaagtc caaggaagat ggaaacacca ttagctatag ctcctacgaa atgttggcag 780gccatgtatg gcgctgtgct tgcaaggcac gaggactcga agttgatcaa ggaacaaaat 840tgtacattgc tactgatgga cgggcaagac ttaggccttc gctcccacct ggctattttg 900gcaatgtcat cttcacggca accccgatag ctatagctgg tgaccttgaa ttcaagccag 960tctggtatgc tgccagtaaa atccacgatg cattggcgag gatggacaac gactacttaa 1020ggtcagctct tgattacttg gaattacagc ctgatttgaa ggccctggtt cgtggtgccc 1080atactttcaa gtgtccaaat ctggggatca caagctgggt aaggttaccc atccatgatg 1140ctgattttgg ctggggtcgg cccatattta tgggtcctgg tggcatcgct tatgaaggtt 1200taagctttat attgcctagt ccaaccaatg atggaagcat gtcagtagct atttcattgc 1260agggcgagca catgaaactc ttccagagtt tcttgtatga catttgaacg ggagcacatc 1320acatgaattt tcacgcttgt attaatagct ttcggttccg ggccagctat tcatgcggtg 1380gtggtttc 1388<210> 2 <211> 1388 <212> DNA <213> Coffea arabica <400> 2 ccatgaaaat cgaggtgaag gaatcgacta tggtgagacc tgcccacgaa actcctagga 60ggaacttgtg gaactcgaac gtggacttgg tggtgccaaa tttccacacc cctagcgtct 120acttctatag gccgacggga tcatcgaatt tctttgatgc caaagtgctg aaggacgctt 180tgagccgagc ccttgtcccg ttctacccaa tggctggtag gttaaagaga gacgaagatg 240ggcggattga gattgagtgc aatggtgaag gcgtgctttt cgtggaggcc gagtctgatg 300gagtagttga tgatttcggt gactttgcac caactttaga gcttcgtaga ctcattcctg 360cagttgatta ttctcaagga atatcaagct acgctctcct agtgctgcag gtgacatatt 420tcaagtgtgg tggagtctct cttggtgttg gcatgcaaca tcatgcagct gatggatttt 480caggtcttca tttcatcaat tcatggtctg atatggcccg tggccttgat gtgaccctgc 540caccattcat agaccgcacc ctcctccgtg cccgcgatcc gccccagccc caattccagc 600acattgagta ccaaccccct ccaaccttaa aagtttcccc gcaaactgca aaatctgact 660cagttcctga aactgcagtg tccatcttca agttaaccag ggagcaaatc agtgccctga 720aagccaagtc caaggaagat ggaaacacca ttagctatag ctcctacgaa atgttggcag 780gccatgtatg gcgctgtgct tgcaaggcac gaggactcga agttgatcaa ggaacaaaat 840tgtacattgc tactgatgga cgagcaagac ttaggccttc gctcccgcct ggctattttg 900gcaatgtcat cttcacggca accctgatag ctatagctgg tgaccttgaa ttcaagccag 960tctggtatgc tgcaagtaaa atccacgatg cattggcgag gatggacaac gactacttaa 1020ggtcagctct tgattacttg gaattacagc ctgatttgaa ggccctggtt cgtggtgccc 1080atactttcaa gtgtccaaat ctggggatca caagctgggt aaggttaccc atccatgatg 1140ctgattttgg ctggggtcgg cccatattta tgggtcctgg tggtatcgct tatgaaggtt 1200taagctttat attgcctagt ccaaccaatg atggaagcat gtcagtagct atttcattgc 1260agggcgagca catgaaactc ttccagagtt tcctgtatga catttgaatg ggagcacatc 1320acatgaattt tcacgcttgt attaatagct ttcggttccg ggccagctat tcatgcggtg 1380gtggtttc 1388<210> 3 <211> 1534 <212> DNA <213> Coffea canephora <400> 3 cttctccatc ccagctcgtt tctgacaaat ccctttcgtc aatcaacaaa actctttaca 60tattttctgc taaatctcag cttatttcat cttgtttgat cagcgtggga agcgagaaaa 120tgaagataac cgtgaaggaa acagcaatgg ttcgtccagc ccaaccaaca cccacaaaga 180ggctatggaa ctcgaatttg gatcttctgg tagcaagaat tcatatcttg accgtctact 240tctacaagcc taatggttct gctaatttct ttgatacccg tgtgctcaaa gaagcattga 300gcaatgttct tgtctctttc taccccatgg ctgggagatt agcaagagat gaagaaggaa 360ggattgagat cgactgtaac ggtgaaggtg tactctttgt tgaggctgaa tcagactcga 420gtgtcgatga ttttggtgat tttgcaccaa gtttggagct caggaggctc atcccgaccg 480tcgattgttc tggtgacatt tcttcttacc ccctcgttat tttccaggta actcgtttca 540agtgtggagc agcagctctt ggagctgggg tgcagcacaa tttatcagat ggcgtttcat 600ctctgcactt catcaataca tggtcagaca tagctcgtgg cctcaccatt gctgtccctc 660cgttcattga ccggacactt atccgtgcta gggaccctcc cgtgcctgta ttcgaacatg 720tcgaatatta tccgccccct caactaaaat cagattcaag aattcaagaa ctcaaaacag 780gccctagggc aagtaccaca gctgtactaa aaatcacacc tgaacaactt agccagctta 840aagctaaggc caacaatgag ggcagcactt atgagatctt agcagcacat atatggcgta 900ctgcatgcaa agcacgtggc ctcaccaatg atcaatccac caagctgtac gttgccactg 960atggccggtc taggctgatt cctcccctgc ctcctggcta tctaggtaat gtggtcttca 1020ctgcaactcc áattgctgaa tccagtaatc ttcaatcaga gcccttgacc aattctgcaa 1080aaagaatcca caacgccttg gcaagaatgg ataatgatta cttaagatca gccctggatt 1140atcttgaaat tcaacctgat ttgtctgctt tggttagagg gcctcggcat tttgctagtc 1200ctaatttgaa tatcaatagt tggacaaggc ttccgtttca tgatgcagac tttggctggg 1260gcagacctat tcatataggg ccggcaatca ttctttatga gggtacggta tatgtattgc 1320caagtccagg caaagacagg actttatcgt tagctgtgtg cttagatgcc gatcacatgc 1380cactcttcca aaggttcctg tacgatttct gagaaatttt gaaatatcaa caacaatcaa 1440taatcaagct tctggaagag aatggatgga attaccattt ttagatggta caaatcaagg 1500
cagcctcgtg acacttgtga ttggattggg actc 1534
<210> 4<211> 1533<212> DNA
<213> Coffea arabi ca<220>
<221> característica mista<222> (932)..(932)<223> η é a, c, g ou t
<400> 4
cttctccatc ccagccgttt ctgacaaatc cctttcgtca atcaacaaaa ctctttacat 60
attttctgct aaatctcagc ttatttcatc ttgtttgatc agcgtgggaa gcgagaaaat 120
gaagataacc gtgaaggaaa cagcaatggt tcgtccagcc caaccaacac ccacaaagag 180
gctatggaac tcgaatttgg atcttctggt agcasgaatt catatcttga ccatctactt 240
ttacaagcct aatggttctg ctaatttctt tgatacccgt gtgctcaaag aagcattgag 300
caatgttctt gtctctttct accccatggc tgggagatta gcaagagatg aagaaggaag 360
gattgagatc gactgtaacg gtgaaggtgt actctttgtt gaggctgaat cagactcgag 420
tgtcgatgat tttggtgatt ttgcaccaag tttggagctc aggaggctca tcccgaccgt 480
cgattgttct ggtgacattt cttcttaccc cctcgttatt ttccaggtaa ctcgtttcaa 540
gtgtggagca gcagctcttg gagctggggt gcagcacaat ttatcagatg gcgtttcatc 600
tctgcacttc atcaatacat ggtcagacat agctcgtggc ctcaccattg ctgtccctcc 660
gttcattgac cggacactta tccatgctag ggaccctccc gtgcctgtat tcgaacatgt 720
cgaatattat ccgccccctc aactaaaatc agattcaaga attcaagaac tcaaaacagg 780
ccccagggca agtaccacag ctgtactaaa aatcactcct gaacaactta gccagcttaa 840
agctaaggcc aacaatgagg gcagcactta tgagatctta gcagcacata tatggcgtac 900
cgcatgcaaa gcacgtggcc ccaccaatga tnaatccacc aagctgtacg ttgccaccga 960
tggccggtct aggctgattc ctcccctgcc tcctggctat ctaggtaatg tggtcttcac 1020
tgcaactcca attgctgaat ccagtgatct tcaatcagag cccttgacca attctgcaaa 1080
aagaatccac aatgccttgg caagaatgga taatgattac ttaagatcag ccctggatta 1140
tcttgaaatt caacctgatt tgtctgcttt ggttagaggg cctcggcatt ttgctagtcc 1200
taacttgaat atcaatagtt ggacagggct tccgtttcat gatgcagact ttggctgggg 1260
cagacctatt catatagggc cggcaatcat tctttatgag ggtacggtat atgtattgcc 1320
aggtccaggc aaagacagga ctttatcgtt agctgtgtgc ttagatgccg atcacatgcc 1380actcttccaa aagttcctgt acgatttctg agaaattttg aaatatcaac aacaatcaat 1440aatcaagctt ctggaagaga atggatagaa ttaccatttt tagacggtac aaatcaaggc 1500agcctcgtga cacttgtgat tggattggga CtC 1533<210> 5 <211> 1728 <212> DNA <213> Coffea canephora <400> 5 caaatctcaa accttcgtat taaccaatgg ctctgcttct gatcctcctc ccagttgcct 60tcatcttcct agcctacagc ctctatgaac gccttagatt caaactgcca cccgggccac 120ggccaaaacc ggtggtcgga aacatttacg acataaaacc ggtgaggttc aagtgctatg 180cggagtggtc aaaactctat ggtccaatat tttctgtcta cttcggttcc cagctgaata 240ctgttgtgaa cactgcagaa ctggccaaag aagttcttaa agacaatgat cagcaattgg 300cagataggta caggagtaga ccctctgcca gaatgagcag aaatggccaa gatttgatat 360gggctgatta tggtcctcat tatgtgaagg tcagaaaact gtgcaatctt gaactcttca 420ctccaaaaag actggaaggc cttagacctt taagagagga tgaagttaca gccatggttg 480attccatctt caaggactgc accaaacctg aaaacaaagg caagagtctg ttgatgcgca 540actacttggg atcagtagca ttcaacaaca ttacaaggct aacatttggg aagaggttca 600tgaattcaga gggtgtggtt gatgaacaag gccaagagtt taagggcatt gtatcaaatg 660ggataaggat tggtgcaaaa ctctccgtgg cagatcacat tccttggctt cgttggatgt 720ttgtaggcga aaatgaggac ctggataagc acaatgcgcg gagagacaaa ctgaccagaa 780tgatcatgga agagcacact cttgcaaggc aaaagagtgg caatactaag cagcattttg 840ttgatgcatt gctcactctt caaaagcaat atgaattgag cgatgacact gtcattggac 900tcctttggga catgattact gctggcatgg atacaaccac aatctcagta gaatgggcaa 960tggcagagct ggtgaagaat ccaagggtgc agcaaaaggc gcaagaggaa cttgaccgag 1020tcattggctc cgatagaatc atgactgaag ctgattttgc aaagctccca tacttacagt 1080gtgtagctaa ggaagctcta aggctgcacc ctccaactcc actaatgctt cctcatagag 1140ccaatgccaa tgtgaagatc ggtggttatg acatccctaa agggtctatc gtgcacgtta 1200acgtctgggc gattgctcgt gatcctgcag cctggaaaaa tccactggaa ttccgacctg 1260agagattcct ggaggaagat gttgacatca agggccacga ttatcggctc ctgccttttg 1320gtgctggaag gaggatctgc cctggtgcac aacttgcact caãtctggtc acttctatgc 1380tggggcattt gttgcaccac tttacttggt ctccaccacc tggggtcagg cctgaagaga 1440ttgacctgga agagagccct ggaacagtta cttatatgag aacccctttg caagctgttg 1500caacaccaag attgcctgca catttgtaca atcgtgtgcc agtagagctg taatgcttcc 1560
tttctcttgt tactaaattt tcagcttgca agagttgctt cacttccaac tctccatttg 1620
attgtgaaga acttgttgga ttctccgagg tatttgagaa aagctactat ttttctagga 1680
aaaataaaat aagggttttc taaaaaaaaa aaaaaaaaaa aaaaaaaa 1728
<210> 6
<211> 1144
<212> DNA
<213> Coffea canephora
<400> 6
gtctgtccaa agctccctca aactaaaaga gaaagaaaga aaaaaaaagc cccagaaatc 60taatctccaa acaacaatta tggcccagaa tggagaagga aaggatagcc aaaatctcag 120gcatcaagaa gtaggccaca aaagccttct gcaaagtgat gcactctacc agtacatcct 180ggaaaccagc gtgtatccaa gagagccaga gcccatgaaa gagctgagag aactgacagc 240aaagcatcca tggaatatta tgactacatc tgctgatgaa gggcagttct tgaacatgat 300tatcaagttg atcaatgcca agaaaaccat ggagattgga gtttacactg gttactcgct 360tctggctaca gctctcgctc ttccagaaga tgggaagata ttggccatgg atattaacag 420agaaaactac gaattgggtc tgcccgtgat cgaaagggct ggtgtgtccc ataaaattga 480cttcagagaa ggccctgctt tgccagtgct tgatgagttg attgaagatg acaagaacca 540tggaagtttt gatttcatct tcgtggatgc tgacaaggac aactatctca actaccacaa 600gaggataatc gagttggtca aggttggggg aatgattggg tacgacaaca ccctatggaa 660cggctccgtg gtggccccac cagatgctcc aatgaggaag tacgtgaggt actacaggga 720cttcgtcttg gagctcaaca aagccctggc cgctgatccc aggatcgaga tctgcatgct 780ccccgttggc gacggtatca ccctgtgccg ccgcgtcagc taattaattt ccctactaaa 840cccctgcgga aagttgggaa tcaaatgcaa atgaaaaata gcccaacacc tacttctttt 900gcttcctcct cttttttgtt tttgggaccc tttgtatttt actactgcta tttgtttatt 960ctgtgggaca cgctgttata tttgtaattt tctttgtact gagaataatt attactatat 1020gaatctccct gtttacggca actagcaagg actagttgct tttaaaaaaa aaaaaaaaaa 1080aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1140
aaaa 1144
<210> 7
<211> 713
<212> DNA
<213> Coffea arabica
<400> 7atggaaaaca agggattgtt gcagagtagg gaactctatc agtacctcct ggagactagt 60gtctatccac atgaactgca gcctctcaag gagctaaggg atgttactgc aagtcatccg 120tgggccacta tggcaactgc cccagatgct ggtcagttga ttgccatgct cttgaaacta 180ataagtgcca aaaagacaat agagattggt gtctttactg gatactccct actgcttact 240gcccttacaa taccagatga tggcaggatt gtagcaattg accagaacag agatacatat 300gagatagggc tgccaattat aagaaaagct gcagttgagc ataagatcga cttcattgag 360tccgaggctc ttccagttct tgataaactc cttgaagaaa atcttaacca tgaagccttt 420gactttgctt tcgttgatgc ggacaaatta aattatctga agtaccatga gaaactgttg 480aaattgttaa agcttggtgg aatagttgta tacgacaaca cactttgggg aggattggtg 540gccttgccgg aagaatctgt ggctgaggaa atgaaagcag gcaggcattt cacaattgag 600ttcaacaaat tgctagctgc tgatacccga gttcaaatat cccaggttcc tctgggtgat 660gggattacta tttgtaagcg tctccactaa atcttatgct ggagtactta Ctt 713
<210> 8
<211> 727
<212> DNA
<213> coffea canephora
<400> 8
atggccaagg aaggaggttc taaaatgaag acaattctcc agagtgaggc cctccagaag 60tacatcttga atactagcac atacccaaaa gagcatgaac aactgaagga gctaagagaa 120gagactgcca ggaaatatgg tgccagggct attataggtg tgccacctga tgaggggctc 180ttcctgtcta tgtttttgaa agtaatgaat gccaagaaga cactggagat tggtgttttt 240actggctatt ctcttcttac tactgctctt gcacttcctg atgatggcca gatagttgca 300atagaccctg atcaaggagc atttgaagtt ggtctgaaat tcatcaagaa agctggtgtg 360gagaacaaaa tcaaattcat caaatcagat ggcatttctg ctctaaatga tttgttgaac 420aatgaagcta gtgaagcaac attcgacttt gcatttgtgg atgcagacaa gccaagctac 480atccagtacc atgaacaact aataaagctg gtgaagattg gaggaattat cgcttacgat S40aatactctat acggtggata tgttgtcagt gaagaaattg aaatgcacga aggatccact 600gtcaacagaa aagccatcat acaattcaac aactatatag cctcggatcc gcgagttgag 660atctctcagg ttcctatagg agatggtgtt acattgtgta ggcgcatcat cgcttagctg 720acatgat 727
<210> 9
<211> 434
<212> PRT
<213> Coffea canephora<400> 9
Met Lys He Glu Val Lys Glu Ser Thr Met vai Arg Pro Ala Gln Glu1 5 10 15
Thr Pro Gly Arg Asn Leu Trp Asn Ser Asn vai Asp Leu vai vai Pro20 25 30
Asn Phe His Thr Pro ser Val Tyr Phe Tyr Arg Pro Thr Gly ser Ser35 40 45
Asn Phe Phe Asp Ala Lys vai Leu Lys Asp Ala Leu Ser Arg Ala Leu50 55 60
vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Lys Arg Asp Glu Asp Gly65 70 75 80
Arg Ile Glu lie Glu Cys Asn Gly Glu Gly vai Leu Phe Val Glu Ala85 90 95
Glu Ser Asp Gly vai Val Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110
Glu Leu Arg Arg Leu Ile Pro Ala Val Asp Tyr Ser Gln Gly lie Ser115 120 125
ser Tyr Ala Leu Leu Val Leu Gln vai Thr Tyr Phe Lys Cys Gly Gly130 135 140
vai Ser Leu Gly Val Gly Met Arg His His Ala Ala Asp Gly Phe Ser145 150 155 160
Gly Leu His Phe Ile Asn Ser Trp ser Asp Met Ala Arg Gly Leu Asp165 170 175
vai Thr Leu Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190
Pro Pro Gln Pro Gln Phe Gln His Ile Glu Tyr Gln Pro Pro Pro Ala195 200 205
Leu Lys Val Ser Pro Gln Thr Ala Lys Ser Asp ser vai Pro Glu Thr210 215 220
Ala Val ser Ile Phe Lys Leu Thr Arg Glu Gln Ile Ser Ala Leu Lys225 230 235 240
Ala Lys Ser Lys Glu Asp Gly Asn Thr Ile ser Tyr Ser Ser Tyr Glu245 250 255
Met Leu Ala Gly His Val Trp Arg Cys Ala Cys Lys Ala Arg Gly Leu260 265 270
Glu Val Asp Gln Gly Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg Ala275 280 285
Arg Leu Arg Pro ser Leu Pro Pro Gly Tyr Phe Gly Asn Val Ile Phe290 295 300
Thr Ala Thr Pro Ile Ala Ile Ala Gly Asp Leu Glu Phe Lys Pro Val305 310 315 320
Trp Tyr Ala Ala ser Lys Ile His Asp Ala Leu Ala Arg Met Asp Asn325 330 335
Asp Tyr Leu Arg Ser Ala Leu Asp Tyr Leu Glu Leu Gln Pro Asp Leu340 345 350
Lys Ala Leu Val Arg Gly Ala His Thr Phe Lys Cys Pro Asn Leu Gly355 360 365
Ile Thr Ser Trp Val Arg Leu Pro Ile His Asp Ala Asp Phe Gly Trp370 375 380
Gly Arg Pro Ile Phe Met Gly Pro Gly Gly Ile Ala Tyr Glu Gly Leu385 390 395 400
Ser Phe Ile Leu Pro Ser Pro Thr Asn Asp Gly Ser Met ser Val Ala405 410 415
Ile ser Leu Gln Gly Glu His Met Lys Leu Phe Gln ser Phe Leu Tyr420 425 430
Asp Ile
<210> 10<211> 434<212> PRT
<213> Coffea arabica<400> 10
Met Lys Ile Glu Val Lys Glu Ser Thr Met vai Arg Pro Ala His Glu1 5 10 15
Thr Pro Arg Arg Asn Leu Trp Asn Ser Asn Val Asp Leu vai vai ProAsn Phe His Thr Pro Ser Val Tyr Phe Tyr Arg Pro Thr Gly Ser Ser35 40 45
Asn Phe Phe Asp Ala Lys Val Leu Lys Asp Ala Leu Ser Arg Ala Leu50 55 60
vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Lys Arg Asp Glu Asp Gly65 70 75 80
Arg Ile Glu Ile Glu Cys Asn Gly Glu Gly Val Leu Phe Val Glu Ala85 90 95
Glu Ser Asp Gly vai vai Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110
Glu Leu Arg Arg Leu lie Pro Ala vai Asp Tyr ser Gln Gly Ile Ser115 120 125
Ser Tyr Ala Leu Leu vai Leu Gln vai Thr Tyr Phe Lys Cys Gly Gly130 135 140
vai Ser Leu Gly vai Gly Met Gln His His Ala Ala Asp Gly Phe ser145 150 155 160
Gly Leu His Phe Ile Asn Ser Trp ser Asp Met Ala Arg Gly Leu Asp165 170 175
vai Thr Leu Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190
Pro Pro Gln Pro Gln Phe Gln His Ile Glu Tyr Gln Pro Pro Pro Thr195 200 205
Leu Lys Val ser Pro Gln Thr Ala Lys Ser Asp Ser vai Pro Glu Thr210 215 220
Ala Val ser Ile Phe Lys Leu Thr Arg Glu Gln Ile ser Ala Leu Lys225 230 235 240
Ala Lys Ser Lys Glu Asp Gly Asn Thr Ile Ser Tyr Ser Ser Tyr Glu245 250 255
Met Leu Ala Gly His vai Trp Arg Cys Ala Cys Lys Ala Arg Gly Leu260 265 270Glu vai Asp Gln Gly Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg Ala275 280 285
Arg Leu Arg Pro Ser Leu Pro Pro Gly Tyr Phe Gly Asn Val Ile Phe290 295 300
Thr Ala Thr Leu Ile Ala Ile Ala Gly Asp Leu Glu Phe Lys Pro Val305 310 315 320
Trp Tyr Ala Ala Ser Lys Ile His Asp Ala Leu Ala Arg Met Asp Asn325 330 335
Asp Tyr Leu Arg ser Ala Leu Asp Tyr Leu Glu Leu Gln Pro Asp Leu340 345 350
Lys Ala Leu Val Arg Gly Ala His Thr Phe Lys Cys Pro Asn Leu Gly355 360 365
Ile Thr ser Trp Val Arg Leu Pro lie His Asp Ala Asp Phe Gly Trp370 375 380
Gly Arg Pro lie Phe Met Gly Pro Gly Gly Ile Ala Tyr Glu Gly Leu385 390 395 400
Ser Phe lie Leu Pro ser Pro Thr Asn Asp Gly Ser Met ser vai Ala405 410 415
Ile Ser Leu Gln Gly Glu His Met Lys Leu Phe Gln ser Phe Leu Tyr420 425 430
Asp Ile
<210> 11
<211> 430
<212> PRT
<213> coffea canephora
<400> 11
Met Lys Ile Thr vai Lys Glu Thr Ala Met vai Arg Pro Ala Gln Pro1 5 10 15
Thr Pro Thr Lys Arg Leu Trp Asn Ser Asn Leu Asp Leu Leu Val Ala20 25 30
Arg Ile His Ile Leu Thr Val Tyr Phe Tyr Lys Pro Asn Gly Ser Ala35 40 45
<210> 12
<211> 430
<212> PRT
<213> Coffea arabicalie Ala Glu Ser Ser Asn Leu Gln Ser Glu Pro Leu Thr Asn Ser Ala305 310 315 320
Lys Arg Ile His Asn Ala Leu Ala Arg Met Asp Asn Asp Tyr Leu Arg325 330 335
ser Ala Leu Asp Tyr Leu Glu Ile Gln pro Asp Leu Ser Ala Leu vai340 345 350
Arg Gly Pro Arg His Phe Ala Ser Pro Asn Leu Asn Ile Asn Ser Trp355 360 365
Thr Arg Leu Pro Phe His Asp Ala Asp Phe Gly Trp Gly Arg Pro Ile370 375 380
His Ile Gly Pro Ala Ile Ile Leu Tyr Glu Gly Thr vai Tyr Val Leu385 390 395 400
pro ser Pro Gly Lys Asp Arg Ttir Leu Ser Leu Ala vai cys Leu Asp405 410 415
Ala Asp His Met Pro Leu Phe Gln Arg Phe Leu Tyr Asp Phe420 425 430
<210> 12<211> 430<212> PRT<213> Coffea arabica<220><221> característica mista<222> (272)..(272)<223> Xaa é qualquer aminoácido que ocorre natural e preferivelmente, um Gln ou similar.
Um códon de parada correspondendo a esta locação foi encontrado na seqüência deácido nucléico, mas mostrado para ser um artefato de clonagem.
<400> 12
Met Lys Ile Thr vai Lys Glu Thr Ala Met Val Arg Pro Ala Gln Pro1 5 10 15
Thr pro Thr Lys Arg Leu Trp Asn ser Asn Leu Asp Leu Leu Val Ala20 25 30
Arg Ile His Ile Leu Thr Ile Tyr Phe Tyr Lys Pro Asn Gly ser Ala35 40 45
Asn Phe Phe Asp Thr Arg Val Leu Lys Glu Ala Leu Ser Asn vai Leu50 55 60vai Ser Phe Tyr Pro Met Ala Gly Arg.Leu Ala Arg Asp Glu Glu Gly65 70 75 80
Arg Xle Glu Ile Asp Cys Asn Gly Glu Gly Val Leu Phe vai Glu Ala85 90 95
Glu Ser Asp Ser Ser Val Asp Asp Phe Gly Asp Phe Ala Pro Ser Leu100 105 110
Glu Leu Arg Arg Leu lie Pro Thr vai Asp Cys Ser Gly Asp Ile ser115 120 125
ser Tyr Pro Leu vai Ile Phe Gln vai Thr Arg Phe Lys Cys Gly Ala130 135 140
Ala Ala Leu Gly Ala Gly vai Gln His Asn Leu Ser Asp Gly Val Ser145 150 155 160
Ser Leu His Phe Ile Asn Thr Trp Ser Asp Ile Ala Arg Gly Leu Thr165 170 175
Ile Ala vai Pro Pro Phe Ile Asp Arg Thr Leu Ile His Ala Arg Asp180 185 190
Pro Pro Val Pro Val Phe Glu His Val Glu Tyr Tyr Pro Pro Pro Gln195 200 205
Leu Lys ser Asp Ser Arg Ile Gln Glu Leu Lys Thr Gly Pro Arg Ala210 215 220
Ser Thr Thr Ala Val Leu Lys Ile Thr Pro Glu Gln Leu ser Gln Leu225 230 235 240
Lys Ala Lys Ala Asn Asn Glu Gly Ser Thr Tyr Glu Ile Leu Ala Ala245 250 255
His Ile Trp Arg Thr Ala Cys Lys Ala Arg Gly Pro Thr Asn Asp Xaa260 265 270
Ser Thr Lys Leu Tyr Val Ala Thr Asp Gly Arg Ser Arg Leu lie Pro275 280 285
Pro Leu Pro Pro Gly Tyr Leu Gly Asn Val Val Phe Thr Ala Thr Pro290 295 300
Ile Ala Glu Ser Ser Asp Leu Gln ser Glu Pro Leu Thr Asn ser Ala305 310 315 320
Lys Arg Ile His Asn Ala Leu Ala Arg Met Asp Asn Asp Tyr Leu Arg
ser Ala Leu Asp Tyr Leu Glu Ile Gln Pro Asp Leu ser Ala Leu vai340 345 350
Arg Gly Pro Arg His Phe Ala ser Pro Asn Leu Asn Ile Asn ser Trp355 360 365
Thr Gly Leu Pro Phe His Asp Ala Asp Phe Gly Trp Gly Arg Pro Ile370 375 380
His lie Gly Pro Ala lie Ile Leu Tyr Glu Gly Thr vai Tyr vai Leu385 390 395 400
Pro Gly Pro Gly Lys Asp Arg Thr Leu ser Leu Ala Val Cys Leu Asp405 410 415
Ala Asp His Met Pro Leu Phe Gln Lys Phe Leu Tyr Asp Phe420 425 430
<210> 13<211> 508<212> PRT
<213> Coffea canephora<400> 13
Met Ala Leu Leu Leu Ile Leu Leu Pro vai Ala Phe Ile Phe Leu Ala1 5 10 15
Tyr ser Leu Tyr Glu Arg Leu Arg Phe Lys Leu Pro Pro Gly Pro Arg20 25 30
Pro Lys Pro Val Val Gly Asn Ile Tyr Asp Ile Lys Pro Val Arg Phe35 40 45
Lys cys Tyr Ala Glu Trp Ser Lys Leu Tyr Gly Pro Ile Phe Ser Val50 55 60
Tvr Phe Gly Ser Gln Leu Asn Thr Val vai Asn Thr Ala Glu Leu Ala65 70 75 80
Lys Glu vai Leu Lys Asp Asn Asp Gln Gln Leu Ala Asp Arg Tyr Arg85 90 95
ser Arg Pro Ser Ala Arg Met ser Arg Asn Gly Gln Asp Leu Ile TrpAla Asp Tyr Gly Pro His Tyr vai Lys vai Arg Lys Leu Cys Asn Leu
115
120
125
Glu Leu Phe Thr Pro Lys Arg Leu Glu Gly Leu Arg Pro Leu Arg Glu
130
135
140
Asp Glu vai Thr Ala Met vai Asp ser Ile Phe Lys Asp Cys Thr Lys145 150 155 160
Pro Glu Asn Lys Gly Lys Ser Leu Leu Met Arg Asn Tyr Leu Gly Ser165 170 175
vai Ala Phe Asn Asn Ile Thr Arg Leu Thr Phe Gly Lys Arg Phe Met
180
185
190
Asn Ser Glu Gly Val vai Asp Glu Gln Gly Gln Glu Phe Lys Gly Ile
195
200
205
Val Ser Asn Gly Ile Arg Ile Gly Ala Lys Leu Ser Val Ala Asp His210 215 220
Ile Pro Trp Leu Arg Trp Met Phe vai Gly Glu Asn Glu Asp Leu Asp
225
230
235
240
Lys His Asn Ala Arg Arg Asp Lys Leu Thr Arg Met Ile Met Glu Glu
245
250
255
His Thr Leu Ala Arg Gln Lys Ser Gly Asn Thr Lys Gln His Phe vai260 265 270
Asp Ala Leu Leu Thr Leu Gln Lys GTn Tyr Glu Leu Ser Asp Asp Thr275 280 285
Val lie Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr Thr290 295 300
Thr Ile Ser vai Glu Trp Ala Met Ala Glu Leu vai Lys Asn Pro Arg
305
310
315
320
vai Gln Gln Lys Ala Gln Glu Glu Leu Asp Arg vai Ile Gly Ser Asp
325
330
335
Arg Ile Met Thr Glu Ala Asp Phe Ala Lys Leu Pro Tyr Leu Gln Cys340 345 350Val Ala Lys Glu Ala Leu Arg Leu His Pro Pro Thr Pro Leu Met Leu355 360 365
Pro His Arg Ala Asn Ala Asn vai Lys Ile Gly Gly Tyr Asp Ile Pro370 375 380
Lys Gly Ser Ile Val His Val Asn vai Trp Ala Ile Ala Arg Asp Pro385 390 395 400
Ala Ala Trp Lys Asn Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Glu405 410 415
Glu Asp vai Asp Ile Lys Gly His Asp Tyr Arg Leu Leu Pro Phe Gly420 425 430
Ala Gly Arg Arg Ile Cys Pro Gly Ala Gln Leu Ala Leu Asn Leu Val435 440 445
Thr ser Met Leu Gly His Leu Leu His His Phe Thr Trp ser Pro Pro450 455 460
Pro Gly vai Arg Pro Glu Glu Ile Asp Leu Glu Glu Ser Pro Gly Thr465 470 475 480
vai Thr Tyr Met Arg Thr Pro Leu Gln Ala Val Ala Thr Pro Arg Leu485 490 495
Pro Ala His Leu Tyr Asn Arg vai Pro Val Glu Leu500 505
<210> 14<211> 247<212> PRT
<213> coffea canephora<400> 14
Met Ala Gln Asn Gly Glu Gly Lys Asp Ser Gln Asn Leu Arg His Gln1 5 10 15
Glu Val Gly His Lys Ser Leu Leu Gln ser Asp Ala Leu Tyr Gln Tyr20 25 30
Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Glu Pro Met Lys Glu35 40 45
Leu Arg Glu Leu Thr Ala Lys His Pro Trp Asn Ile Met Thr Thr Ser50 55 60Ala Asp Glu Gly Gln Phe Leu Asn Met Ile Ile Lys Leu Ile Asn Ala65 70 75 80
Lys Lys Thr Met Glu Ile Gly vai Tyr Thr Gly Tyr Ser Leu Leu Ala85 90 95
Thr Ala Leu Ala Leu Pro Glu Asp Gly Lys Ile Leu Ala Met Asp Ile100 105 110
Asn Arg Glu Asn Tyr Glu Leu Gly Leu Pro Val Ile Glu Arg Ala Gly115 120 125
vai Ser His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu Pro vai Leu130 135 140
Asp Glu Leu Ile Glu Asp Asp Lys Asn His Gly ser Phe Asp Phe Ile145 150 155 160
Phe Val Asp Ala Asp Lys Asp Asn Tyr Leu Asn Tyr His Lys Arg Ile165 170 175
Ile Glu Leu vai Lys vai Gly Gly Met Ile Gly Tyr Asp Asn Thr Leu180 185 190
Trp Asn Gly ser vai vai Ala Pro Pro Asp Ala Pro Met Arg Lys Tyr195 200 205
Val Arg Tyr Tyr Arg Asp Phe vai Leu Glu Leu Asn Lys Ala Leu Ala210 215 220
Ala Asp Pro Arg Ile Glu Ile Cys Met Leu Pro vai Gly Asp Gly Ile225 230 235 240
Thr Leu Cys Arg Arg vai Ser245
<210> 15<211> 229<212> PRT
<213> Coffea arabica<400> 15
Met Glu Asn Lys Gly Leu Leu Gln Ser Arg Glu Leu Tyr Gln Tyr Leu1 5 10 15
Leu Glu Thr Ser vai Tyr Pro His Glu Leu Gln Pro Leu Lys Glu Leu20 25 30Ala Leu Gln Lys Tyr lie Leu Asn Thr ser Thr Tyr Pro Lys Glu His20 25 30
Glu Gln Leu Lys Glu Leu Arg Glu Glu Thr Ala Arg Lys Tyr Gly Ala35 40 45
Arg Ala Ile Ile Gly Val Pro Pro Asp Glu Gly Leu Phe Leu Ser Met50 55 60
Phe Leu Lys vai Met Asn Ala Lys Lys Thr Leu Glu Ile Gly Val Phe65 70 75 80
Thr Gly Tyr Ser Leu Leu Thr Thr Ala Leu Ala Leu Pro Asp Asp Gly85 90 95
Gln Ile Val Ala Ile Asp Pro Asp Gln Gly Ala Phe Glu Val Gly Leu100 105 110
Lys Phe Ile Lys Lys Ala Gly vai Glu Asn Lys Ile Lys Phe Ile Lys115 120 125
Ser Asp Gly Ile Ser Ala Leu Asn Asp Leu Leu Asn Asn Glu Ala Ser130 135 140
Glu Ala Thr Phe Asp Phe Ala Phe Val Asp Ala Asp Lys Pro Ser Tyr145 150 155 160
Ile Gln Tyr His Glu Gln Leu lie Lys Leu Val Lys lie Gly Gly Ile165 170 175
Ile Ala Tyr Asp Asn Thr Leu Tyr Gly Gly Tyr vai vai Ser Glu Glu180 185 190
Ile Glu Met His Glu Gly Ser Thr vai Asn Arg Lys Ala Ile Ile Gln195 200 205
Phe Asn Asn Tyr Ile Ala Ser Asp Pro Arg Val Glu Ile Ser Gln Val210 215 220
Pro Ile Gly Asp Gly vai Thr Leu Cys Arg Arg Ile Ile Ala225 230 235
<210> 17
<211> 209
<212> DNA
<213> Coffea canephora<220>
<221> característica mista
<222> (184).. (184)
<223> η é a , c, g ou t<220><221 > característica mista<222> (196)..(197)<223> η é a , c, g ou t
<400> 17
tacaactttc aaccatgaaa atcgaggtga aggaatcgac tatggtgaga cctgcccaag 60
aaactcctgg gaggaacttg tggaactcga acgtggactt ggtagtgcca aatttccaca 120
cccctagcgt ctacttctat aggccgacgg gatcatcgaa tttctttgat gccaaagtgc 180
taanggacgc tttganncga gcccttgtc 209
<210> 18<211> 1465<212> DNA
<213> Coffea canephora<400> 18
ggatcatcga atttctttga tgccaaagtg ctaaaggacg ctttgagccg agcccttgtc 60
ccgttctacc caatggctgg taggttaaag agagacgaag atgggcggat tgagattgag 120
tgcaatggtg aaggcgtgct tttcgtggag gccgagtctg atggagtagt tgatgatttc 180
ggtgactttg caccaacttt agagcttcgt agactcattc ctgcagttga ttattctcaa 240
ggaatatcaa gctacgctct cctagtgctg caggtgacat atttcaagtg tggtggagtc 300
tctcttggtg ttggcatgca acatcatgca gctgatggat tttcaggtct tcatttcatc 360
aattcatggt ctgatatggc ccgtggcctt gatgtgaccc tgccaccatt catagaccgc 420
accctcctcc gtgcccgcga tccgccccag cctcaattcc agcacattga gtaccaacct 480
cctccagcct taaaagtttc cccgcaaact gcaaaatctg actcagttcc tgaaactgcg 540
gtgtccatct tcaagttaac cagggagcaa atcagtgccc tgaaagccaa gtccaaggaa 600
gatggaaaca ccattagcta tagctcctac gaaatgttgg caggccatgt atggcgctgt 660
gcttgcaagg cacgaggact cgaagttgat caaggaacaa aattgtacat tgctactgat 720
ggacgggcaa gacttaggcc ttcgctccca cctggctatt ttggcaatgt catcttcacg 780
gcaaccccga tagctatagc tggtgacctt gaattcaagc cagtctggta tgctgcaagt 840
aaaatccacg atgcattggc gaggatggac aacgactact taaggtcagc tcttgattac 900
ttggaattac agcctgattt gaaggccctg gttcgtggtg cccatacttt caagtgtcca 960
aatctgggga tcacaagctg ggtcaggtta cccatccatg atgctgattt tggctggggt 1020
cggcccatat ttatgggtcc tggtggcatc gcttatgaag gtttaagctt tatattgcct 1080
agtccaacca atgatggaag catgtcagta gctatttcat tgcagggcga gcacatgaaa 1140ctcttccaga gtttcttgta tgacatttga acgggagcac atcacatgaa ttttcacgct 1200tgtattaata gctttcggtt ccgggccagc tattcatgcg gtggtggttt cttgagtaat 1260tgtttaagct tatgaagaac cactgttctg ttttgtacct atgtggacaa taattcttgt 1320ctaagttcct tgtgcatgta atgatggtga aaggataagg ttcatttcat tttattgttt 1380tgtcatttga gttctaaagt tgtaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1440aaaaaaaaaa aaaaaaaaaa aaaaa 1465
<210> 19
<211> 685
<212> DNA
<213> Coffea arabica
<400> 19
tttcttaggc gcggtaggta agtcccccaa aacaaattat atagtccccc tacggtctcg 60cactctttaa catttttttc ccgttttgtt aggacgcaga tcagattcat ttcgattaaa 120gtccaafccca cttcgaacaa caccatacct acaacatcat tgtccttacc acttctccca 180ttagccagec tgccacctcc tcctcctcct CCCCCtCttC ctttttgaat ttcttatccc 240accacccaac attcttcttc cttctcaact cttcaggtac gtttaatgca aatttcacgt 300aatatttcac gttcgaaatc cattcttcat caccattaaa ctaatcaaag tatgtttatt 360gcaccatttt cttttatgtt ttttggggta cagttgttgt acgtgtcaag caaggatcat 420acaactttca accatgaaaa tcaaggtgaa ggaatcgact atggtgagac ctgcccaaga 480aactcctagg aggaacttgt ggaactcgaa cgtggacttg gtggtgccaa atttccacac 540ccctagcgtc tacttctata ggccgacggg atcatcgaat ttctttgatg ccaaagtgct 600gaaggacgct ctgagccgag cçcttgtccc gttctaccca atggctggta ggttaaagag 660
agacgaagat gggcggattg agatt 685
<210> 20
<211> 435
<212> PRT
<213> Nicotiana tabacum
<400> 20
Met Lys Ile Glu Val Lys Glu Ser Thr Met Val Lys Pro Ala Ala Glu1 5 10 15
Thr Pro Gln Gln Arg Leu Trp Asn Ser Asn Val Asp Leu Val Val Pro20 25 30
Asn Phe His Thr Pro Ser Val Tyr Phe Tyr Arg Pro Thr Gly Ser Pro35 40 45Asn Phe Phe Asp Gly Lys Val Leu Lys Glu Ala Leu Ser Lys Ala Leu50 55 60
vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Cys Arg Asp Glu Asp Gly65 70 75 80
Arg Ile Glu Ile Asp Cys Lys Gly Gln Gly vai Leu Phe vai Glu Ala85 90 95
Glu ser Asp Gly vai vai Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110
Glu Leu Arg Gln Leu lie Pro Ala Val Asp Tyr ser Gln Gly Ile Gln115 120 125
Ser Tyr Ala Leu Leu Val Leu Gln lie Thr His Phe Lys Cys Gly Gly130 135 140
vai Ser Leu Gly Val Gly Met Gln His His Ala Ala Asp Gly Ala Ser145 150 155 160
Gly Leu His Phe Ile Asn Thr Trp Ser Asp Met Ala Arg Gly Leu Asp165 170 175
Leu Thr Ile Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190
Pro Pro Gln Pro Gln Phe Pro His vai Glu Tyr Gln Pro Pro Pro Thr195 200 205
Leu Lys vai Thr Pro Glu Asn Thr Pro Ile ser Glu Ala Val Pro Glu210 215 220
Thr Ser Val Ser Ile Phe Lys Leu Thr Arg Asp Gln Ile Asn Thr Leu225 230 235 · 240
Lys Ala Lys Ser Lys Glu Asp Gly Asn Thr vai Asn Tyr Ser Ser Tyr245 250 255
Glu Met Leu Ala Gly His Val Trp Arg Ser Thr Cys Met Ala Arg Gly260 265 270
Leu Ala His Asp Gln Glu Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg275 280 285
Ser Arg Leu Arg Pro ser Leu Pro Pro G7y TVr Phe GTy Asn Va7 ITe290 295 300Phe Thr Thr Thr Pro lie Ala vai Ala Gly Asp Ile Gln ser Lys Pro305 310 315 320
Ile Trp Tyr Ala Ala ser Lys Leu His Asp Ala Leu Ala Arg Met Asp325 330 335
Asn Asp Tyr Leu Arg ser Ala Leu Asp Tyr Leu Glu Leu Gln. Pro Asp340 345 350
Leu Lys Ala Leu Val Arg Gly Ala His Thr Phe Lys Cys Pro Asn Leu355 360 365
Gly Ile Thr ser Trp ser Arg Leu Pro Ile His Asp Ala Asp Phe Gly370 375 380
Trp Gly Arg Pro Ile Phe Met Gly Pro Gly Gly Ile Ala Tyr Glu Gly385 390 395 400
Leu Ser Phe lie Leu Pro Ser Pro Thr Asn Asp Gly Ser Gln ser Val405 410 415
Ala Ile Ser Leu Gln Ala Glu His Met Lys Leu Phe Glu Lys Phe Leu420 425 430
Tyr Asp Phe435
<210> 21
<211> 433
<212> PRT
<213> Arabidopsis thaliana
<400> 21
Met Lys lie Asn Ile Arg Asp Ser Thr Met Val Arg Pro Ala Thr Glu1 5 10 15
Thr Pro Ile Thr Asn Leu Trp Asn Ser Asn vai Asp Leu vai Ile Pro20 25 30
Arg Phe His Thr Pro Ser vai Tyr Phe Tyr Arg Pro Thr Gly Ala ser35 40 45
Asn Phe Phe Asp Pro Gln vai Met Lys Glu Ala Leu Ser Lys Ala Leu50 55 60
vai Pro Phe Tyr Pro Met Ala Gly Arg Leu Lys Arg Asp Asp Asp Gly65 70 75 80Arg Ile Glu Ile Asp Cys Asn Gly Ala Gly Val Leu Phe vai Val Ala85 90 95
Asp Thr Pro Ser Val Ile Asp Asp Phe Gly Asp Phe Ala Pro Thr Leu100 105 110
Asn Leu Arg Gln Leu Ile Pro Glu Val Asp His ser Ala Gly Ile His115 120 125
ser Phe Pro Leu Leu Val Leu Gln vai Thr Phe Phe Lys Cys Gly Gly130 135 140
Ala Ser Leu Gly vai Gly Met Gln His His Ala Ala Asp Gly Phe ser145 150 155 160
Gly Leu His Phe Ile Asn Thr Trp ser Asp Met Ala Arg Gly Leu Asp165 170 175
Leu Thr lie Pro Pro Phe Ile Asp Arg Thr Leu Leu Arg Ala Arg Asp180 185 190
Pro Pro Gln Pro Ala Phe His His Val Glu Tyr Gln Pro Ala Pro Ser195 200 205
Met Lys lie Pro Leu Asp Pro ser Lys Ser Gly Pro Glu Asn Thr Thr210 215 220.
vai ser Ile Phe Lys Leu Thr Arg Asp Gln Leu vai Ala Leu Lys Ala225 230 235 240
Lys Ser Lys Glu Asp Gly Asn Thr Val ser Tyr Ser Ser Tyr Glu Met245 250 255
Leu Ala Gly His vai Trp Arg ser vai Gly Lys Ala Arg Gly Leu Pro260 265 270
Asn Asp Gln Glu Thr Lys Leu Tyr Ile Ala Thr Asp Gly Arg ser Arg275 280 285
Leu Arg Pro Gln Leu Pro Pro Gly Tyr Phe Gly Asn vai Ile Phe Thr290 295 300
Ala Thr Pro Leu Ala Val Ala Gly Asp Leu Leu Ser Lys Pro Thr Trp305 310 315 320
Tyr Ala Ala Gly Gln Ile His Asp Phe Leu vai Arg Met Asp Asp Asn325 330 335Tyr Leu Arg ser Ala Leu Asp Tyr Leu Glu Met Gln Pro Asp Leu Ser340 345 350
Ala Leu vai Arg Gly Ala His Thr Tyr Lys Cys Pro Asn Leu Gly Ile355 360 365
Thr Ser Trp vai Arg Leu Pro Ile Tyr Asp Ala Asp Phe Gly Trp Gly370 375 380
Arg Pro Ile Phe Met Gly Pro Gly Gly Ile Pro Tyr Glu Gly Leu ser385 390 395 400
Phe vai Leu Pro Ser Pro Thr Asn Asp Gly Ser Leu ser vai Ala Ile405 410 415
Ala Leu Gln Ser Glu His Met Lys Leu Phe Glu Lys Phe Leu Phe Glu420 425 430
Ile
<210> 22<211> 431<212> PRT
<213> Ipomoea batatas<400> 22
Met Ala Ser Glu Lys Phe Lys Ile ser Ile Lys Glu ser Thr Met Val1 5 10 15
Lys Pro Ala Lys Pro Thr Pro Ala Lys Arg Leu Trp Asn Ser Asn Leu20 25 30
Asp Leu lie vai Gly Arg Ile His Leu Leu Thr vai Tyr Phe Tyr Arg35 40 45
Pro Asn Gly Ser Pro Asn Phe Phe Asp ser Lys vai Met Lys Glu Ala50 55 60
Leu Ser Asn vai Leu Val Ser Phe Tyr Pro Met Ala Gly Arg Leu Ala65 70 75 80
Arg Asp Gly Glu Gly Arg Ile Glu Ile Asp Cys Asn Glu Glu Gly vai85 90 95
Leu Phe Val Glu Ala Glu Ser Asp Ala Cys vai Asp Asp Phe Gly Asp100 105 110Phe Thr Pro Ser Leu Glu Leu Arg Lys Phe He Pro Thr vai Asp Thr115 120 125
ser Gly Asp Ile Ser Ser Phe Pro Leu Ile lie Phe Gln Val Thr Arg130 135 140
Phe Lys cys Gly Gly vai Cys Leu Gly Thr Gly Val Phe His Thr Leu145 150 155 160
Ser Asp Gly vai Ser Ser Leu His Phe Ile Asn Thr Trp Ser Asp Met165 170 175
Ala Arg Gly Leu Ser Val Ala Ile Pro Pro Phe Ile Asp Arg Thr Leu180 185 190
Leu Arg Ala Arg Asp Pro Pro Thr Pro Ala Phe Glu His Ser Glu Tyr195 200 205
Asp Gln Pro Pro Lys Leu Lys Ser Val Pro Glu Ser Lys Arg Gly Ser210 215 220
ser Ala ser Thr Thr Met Leu Lys lie Thr Pro Glu Gln Leu Ala Leu225 230 235 240
Leu Lys Thr Lys Ser Lys His Glu Gly ser Thr Tyr Glu Ile Leu Ala245 250 255
Ala His Ile Trp Arg Cys Ala cys Lys Ala Arg Gly Leu Thr Asp Asp260 265 270
Gln Ala Thr Lys Leu Tyr vai Ala Thr Asp Gly Arg ser Arg Leu cys275 280 285
Pro Pro Leu Pro Pro Gly Tyr Leu Gly Asn vai Val Phe Thr Ala Thr290 295 300
Pro Met Ala Glu Ser Gly Glu Leu Gln ser Glu Pro Leu Thr Asn Ser305 310 315 320
Ala Lys Arg Ile His Ser Ala Leu Ser Arg Met Asp Asp Glu Tyr Leu325 330 335
Arg Ser Ala Leu Asp Phe Leu Glu Cys Gln Pro Asp Leu ser Lys Leu340 345 350
Ile Arg Gly Ser Asn Tyr Phe Ala ser Pro Asn Leu Asn Ile Asn Ser
355 60 365Trp Thr Arg Leu Pro Val His Glu Ser Asp Phe Gly Trp Gly Arg Pro370 375 380
Ile His Met Gly Pro Ala Cys Ile Leu Tyr Glu Gly Thr vai Tyr Ile385 390 395 400
Leu Pro Ser Pro Asn Lys Asp Arg Thr Leu ser Leu Ala Val Cys Leu405 410 415
Asp Ala Glu His Met Pro Leu Phe Lys Glu Phe Leu Tyr Asp Phe420 425 430
<210> 23<211> 436<212> PRT
<213> Lycopersicon esculentum<400> 23
Met Gly ser Glu Lys Met Met Lys Ile Asn Ile Lys Glu Ser Thr Leu1 5 10 15
vai Lys Pro ser Lys Pro Thr Pro Thr Lys Arg Leu Trp Ser Ser Asn20 25 30
Leu Asp Leu Ile vai Gly Arg Ile His Leu Leu Thr vai Tyr Phe Tyr35 40 45
Lys Pro Asn Gly Ser Ser Asn Phe Phe Asp ser Lys Ile Met Lys Glu50 55 60
Ala Leu Ser Asn vai Leu Val ser Phe Tyr Pro Met Ala Gly Arg Leu65 70 75 80
Ala Arg Asp Glu Gln Gly Arg Ile Glu Ile Asn Cys Asn Gly Glu Gly85 90 95
vai Leu Phe vai Glu Ala Glu ser Asp Ala Phe Val Asp Asp Phe Gly100 105 UO
Asp Phe Thr Pro ser Leu Glu Leu Arg Lys Leu Ile Pro Thr Val Asp115 120 125
Thr Ser Gly Asp Ile ser Thr Phe Pro Leu Ile Ile Phe Gln vai Thr130 135 140
Arg Phe Lys Cys Gly Gly Val Ser Leu Gly Gly Gly vai Phe His Thr145 150 155 160Leu ser Asp Gly Leu Ser Ser Ile His Phe ile Asn Thr Trp Ser Asp165 170 175
Ile Ala Arg Gly Leu Ser Val Ala Ile Pro Pro Phe Ile Asp Arg Thr180 185 190
Leu Leu Arg Ala Arg Asp Pro Pro Thr Ser ser Phe Glu His Val Glu195 200 205
Tyr His Pro Pro Pro Ser Leu lie Ser ser ser Lys Ser Leu Glu Ser210 215 220
Thr Ser Pro Lys Pro ser Thr Thr Thr Met Leu Lys Phe ser Ser Asp225 230 235 240
Gln Leu Gly Leu Leu Lys Ser Lys Ser Lys His Asp Gly Ser Thr Tyr245 250 255
Glu Ile Leu Ala Ala His Ile Trp Arg Cys Thr Cys Lys Ala Arg Ala
260
265
270
Leu ser Asp Asp Gln Leu Thr Lys Leu His Val Ala Thr Asp Gly Arg
275
280
285
Ser Arg Leu Cys Pro Pro Leu Pro Pro Gly Tyr Leu Gly Asn Val vai290 295 300
Phe Thr Gly Thr Pro Met Ala Lys Ser ser Glu Leu Leu Gln Glu Pro305 310 315 320
Leu Thr Asn Ser Ala Lys Arg lie His Ser Ala Leu ser Lys Met Asp325 330 335
Asp Asn Tyr Leu Arg Ser Ala Leu Asp Tyr Leu Glu Leu Leu Pro Asp340 345 350
Leu ser Ala Leu Ile Arg Gly Pro Thr Tyr Phe Ala Ser Pro Asn Leu355 360 365
Asn lie Asn ser Trp Thr Arg Leu Pro vai His Asp ser Asp Phe Gly370 375 380
Trp Gly Arg Pro Ile His Met Gly Pro Ala Cys Ile Leu Tyr Glu Gly385 390 395 400Leu Tyr Glu Phe435
<210> 24<211> 430<212> PRT
<213> Lycopersicon esculentum<400> 24
Met Gly Ser Glu Lys Met Met Lys Ile Asn Ile Lys Glu Ser Thr Leu1 5 10 15
vai Lys Pro Ser Lys Pro Thr Pro Thr Lys Arg Ile Trp Ser Ser Asn20 25 30
Leu Asp Leu Ile Val Gly Arg Ile His Leu Leu Thr Val Tyr Phe Tyr35 40 45
Lys Pro Asn Gly Ser Ser Asn Phe Phe Asp Asn Lys Val Ile Lys Glu50 55 60
Ala Leu Ser Asn vai Leu Val Ser Phe Tyr Pro Met Ala Gly Arg Leu65 70 75 80
Gly Arg Asp Glu Gln Gly Arg Ile Glu Val Asn Cys Asn Gly Glu Gly85 90 95
Val Leu Phe Val Glu Ala Glu Ser Asp Ser Cys Val Asp Asp Phe Gly100 105 110
Asp Phe Thr Pro Ser Leu Glu Leu Arg Lys Leu Ile Pro Ser Val Glu115 120 125
Thr Ser Gly Asp Ile Ser Thr Phe Pro Leu Val Ile Phe Gln Ile Thr130 135 140
Arg Phe Lys Cys Gly Gly Val Ala Leu Gly Gly Gly Val Phe His Thr145 150 155 160
Leu Ser Asp Gly Leu Ser Ser Ile His Phe Ile Asn Thr Trp Ser Asp165 170 175He Ala Arg Gly Leu Ser vai Ala Val Pro Pro Phe Ile Asp Arg Thr180 185 190
Leu Leu Arg Ala Arg Asp Pro Pro Thr Tyr Ser Phe Glu His vai Glu195 200 205
Tyr His Pro Pro Pro Thr Leu Asn Ser ser Lys Asn Arg Glu ser Ser210 215 220
Thr Thr Thr Met Leu Lys Phe Ser ser Glu Gln Leu Gly Leu Leu Lys225 230 235 240
Ser Lys ser Lys Asn Glu Gly Ser Thr Tyr Glu Ile Leu Ala Ala His245 250 255
Ile Trp Arg Cys Thr Cys Lys Ala Arg Gly Leu Pro Glu Asp Gln Leu260 265 270
Thr Lys Leu His vai Ala Thr Asp Gly Arg Ser Arg Leu Cys Pro Pro275 280 285
Leu Pro Pro Gly Tyr Leu Gly Asn Val vai Phe Thr Ala Thr Pro lie290 295 300
Ala Lys Ser Cys Glu Leu Gln ser Glu Pro Leu Thr Asn Ser Val Lys305 310 315 320
Arg Ile His Asn Glu Leu Ile Lys Met Asp Asp Asn Tyr Leu Arg Ser325 330 335
Ala Leu Asp Tyr Leu Glu Leu Gln Pro Asp Leu Ser Thr Leu Ile Arg340 345 350
Gly Pro Ala Tyr Phe Ala Ser Pro Asn Leu Asn Ile Asn Ser Trp Thr355 360 365
Arg Leu Pro Val His Glu Cys Asp Phe Gly Trp Gly Arg Pro Ile His370 375 380
Met Gly Pro Ala Cys Ile Leu Tyr Glu Gly Thr Ile Tyr Ile Ile Pro385 390 395 400
Ser Pro Asn Ser Lys Asp Arg Asn Leu Arg Leu Ala vai Cys Leu Asp405 410 415
Ala Gly His Met Ser Leu Phe Glu Lys Tyr Leu Tyr Glu Leu420 425 430<210> 25
<211> 5
<212> PRT
<213> Coffea canephora
<220>
<221> característica mista
<222> (1)..C5)
<223> Caixa HXXXD conservada encontrada em proteínas HQT e HCT.<220>
<221> característica mista
<222> (2)..C4)
<223> Cada X pode independentemente ser qualquer aminoácido.
<400> 25
His Xaa xaa xaa Asp
1 5
<210> 26
<211> 5
<212> PRT
<213> coffea canephora
<220>
<22l> característica mista
<222> CD - (5)
<223> Seqüência conservada ('caixa DFGWG") encontrada em proteínas HQT e HCT.
<400> 26
Asp Phe Gly Trp Gly
1 5
<210> 27
<211> 639
<212> DNA
<213> Coffea canephora
<400> 27
cctgcacttc tatttatcta gaccatttgt ccgtctacac acctttcttc tccatcccag 60ctcgtttctg acaaatccct ttcgtcaatc aacaaaactc tttacatatt ttctgctaaa 120tctcagctta tttcatcttg tttgatcagc gtgggaagcg agaaaatgaa gataaccgtg 180aaggaaacag caatggttcg tccagcccaa ccaacaccca caaagaggct atggaactcg 240aatttggatc ttctggtagc aagaattcat atcttgaccg tctacttcta caagcctaat 300ggttctgcta atttctttga tacccgtgtg ctcaaagaag cattgagcaa tgttcttgtc 360tctttctacc ccatggctgg gagattagca agagatgaag aaggaaggat tgagatcgac 420tgtaacggtg aaggtgtact ctttgttgag gctgaatcag actcgagtgt cgatgatttt 480ggtgattttg caccaagttt ggagctcagg aggctcatcc cgaccgtcga ttgttccggt 540
gacatttctt cttaccccct cgttattttc caggtaactc gtttcaagtg tggagcagca 600gctcttggag ctggggtgca gcacaattta tcagatggc 639
<210> 28
<211> 1056
<212> DNA
<213> coffea canephora<220>
<221 > característica mista<222> (1042).. (1042)
<223> η é a, c, g ou t
<400> 28 ctcgtttcaa gtgtggagca gcagctcttg gagctggggt gcagcacaat ttatcagatg 60gcgtttcatc tctgcacttc atcaatacat ggtcagacat agctcgtggc ctcaccattg 120ctgtccctcc gttcattgac cggacactta tccatgctag ggaccctccc gtgcctgtat 180tcgaacatgt cgaatattat ccgccccctc aactaaaatc agattcaaga attcaagaac 240tcaaaacagg ccctagggca agtaccacag ctgtactaaa aatcacacct gaacaactta 300gccagcttaa agctaaggcc aacaatgagg gcagcactta tgagatctta gcagcacata 360tatggcgtac tgcatgcaaa gcacgtggcc tcaccaatga tcaatccacc aagctgtacg 420ttgccactga tggccggtct aggctgattc ctcccctgcc tcctggctat ctaggtaatg 480tggtcttcac tgcaactcca attgctgaat ccagtgatct tcaatcagag cccttgacca 540attctgcaaa aagaatccac aatgccttag caagaatgga taatgattac ttaagatcag 600ccctggatta tcttgaaatt caacctgatt tgtctgcttt ggttagaggg cctcggcatt 660ttgctagtcc taatttgaat atcaatagtt ggacaaggct tccgtttcat gatgcagact 720ttggctgggg cagacctatt catatagggc cggcaatcat tctttatgag ggtacggtat 780atgtattgcc aagtccaggc aaagacagga ctttatcgtt agctgtgtgc ttagatgccg 840atcacatgcc actcttccaa aagttcctgt acgatttctg agaaattttg aaatatcaac 900aacaatcaag cttctggaag agaatggatg gaattaccat ttttagatgg tataaatcaa 960ggcagcctcg tgacacttgt gattggattg ggactctctt ttttgtattg gtgttttgct 1020tagtgatttt ctcattttct tnaaaaaaaa aaaaaa 1056<210> 29 <211> 617 <212> DNA <213> Coffea arabica <400> 29 ttgcctggag gaaagcagag aagcatccct ccacccaatt ttcacaagac acttttgtgg 60tcatctttca atagccactc ttcctcatca tattccacaa aggacaaagg ttatttcatc 120ttgtttgacc agcgtgggaa gcgagaaaat gaagataacc gtgaaggaaa cagcaatggt 180tcgtccagcc caaccaacgc ctacaaagag gctatggaac tcgaatttgg atcttttggt 240agcaagaatt catatcttga ccgtctactt ttacaagcct aatggttctg ctaatttctt 300tgatacccgt gtgctcaaag aagcattgag caatgttctt gtctctttct accccatggc 360tgggagatta gcaagagatg aagaaggaag gattgagatc gactgtaacg gcgaaggtgt 420actgtttgtc gaggctgaat cagactcaag tgtcgatgat tttggtgatt ttgcaccaag 480tttggagctc aggaggctca ttccgaccgt cgattgttct ggtgacattt cttcttaccc 540cctcgttatt ttccaggtaa ctcgtttcaa gtgtggagga gcagctcttg gagctggggt 600gcagcacaat ttatcag 617
<210> 30<211> 508<212> PRT<213> Arabidopsis thaliana<400> 30
Met Ser Trp Phe Leu Ile Ala Val Ala Thr Ile Ala Ala vai vai ser1 5 10 15
Tyr Lys Leu Ile Gln Arg Leu Arg Tyr Lys Phe Pro Pro Gly Pro Ser20 25 30
Pro Lys Pro Ile Val Gly Asn Leu Tyr Asp Ile Lys Pro Val Arg Phe35 40 45
Arg Cys Tyr Tyr Glu Trp Ala Gln Ser Tyr Gly pro Ile Ile Ser Val50 55 60
Trp Ile Gly Ser Ile Leu Asn Val Val Val Ser ser Ala Glu Leu Ala65 70 75 80
Lys Glu vai Leu Lys Glu His Asp Gln Lys Leu Ala Asp Arg His Arg85 90 95
Asn Arg ser Thr Glu Ala Phe ser Arg Asn Gly Gln Asp Leu Ile Trp100 105 110
Ala Asp Tyr Gly Pro His Tyr vai Lys Val Arg Lys Val Cys Thr Leu115 120 125
Glu Leu Phe Thr Pro Lys Arg Leu Glu ser Leu Arg Pro Ile Arg Glu130 135 140Asp Glu Val Thr Ala Met Val Glu ser Val Phe Arg Asp Cys Asn Leu145 150 155 160
Pro Glu Asn Arg Ala Lys Gly Leu Gln Leu Arg Lys Tyr Leu Gly Ala165 170 175
val Ala Phe Asn Asn Ile Thr Arg Leu Ala Phe Gly Lys Arg Phe Met180 185 190
Asn Ala Glu Gly vai Val Asp Glu Gln Gly Leu Glu Phe Lys Ala Ile195 200 205
Val Ser Asn Gly Leu Lys Leu Gly Ala Ser Leu Ser Ile Ala Glu His210 215 220
Ile Pro Trp Leu Arg Trp Met Phe Pro Ala Asp Glu Lys Ala Phe Ala225 230 235 240
Glu His Gly Ala Arg Arg Asp Arg Leu Thr Arg Ala Ile Met Glu Glu245 250 255
His Thr Leu Ala Arg Gln Lys Ser ser Gly Ala Lys Gln His Phe Val260 265 270
Asp Ala Leu Leu Thr Leu Lys Asp Gln Tyr Asp Leu ser Glu Asp Thr275 280 285
Ile Ile Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr Thr290 295 300
Ala Ile Thr Ala Glu Trp Ala Met Ala Glu Met Ile Lys Asn Pro Arg305 310 315 320
vai Gln Gln Lys vai Gln Glu Glu Phe Asp Arg vai vai Gly Leu Asp325 330 335
Arg Ile Leu Thr Glu Ala Asp Phe Ser Arg Leu Pro Tyr Leu Gln Cys340 345 350
Val Val Lys Glu ser Phe Arg Leu His Pro Pro Thr Pro Leu Met Leu355 360 365
Pro His Arg Ser Asn Ala Asp vai Lys Ile Gly Gly Tyr Asp Ile Pro370 375 380
Lys Gly Ser Asn Val His vai Asn Val Trp Ala vai Ala Arg Asp Pro385 390 395 400Ala Val Trp Lys Asn Pro Phe Glu Phe Arg Pro Glu Arg Phe Leu Glu405 410 415
Glu Asp vai Asp Met Lys Gly His Asp Phe Arg Leu Leu Pro Phe Gly 420 425 430
Ala Gly Arg Arg vai Cys Pro Gly Ala Gln Leu Gly Ile Asn Leu Val435 440 445
Thr Ser Met Met Ser His Leu Leu His His Phe Val Trp Thr Pro Pro450 455 460
Gln Gly Thr Lys Pro Glu Glu Ile Asp Met ser Glu Asn Pro Gly Leu465 470 475 480
vai Thr Tyr Met Arg Thr Pro vai Gln Ala Val Ala Thr Pro Arg Leu485 490 495
Pro ser Asp Leu Tyr Lys Arg vai Pro Tyr Asp Met 500 505
<210> 31
<211> 509
<212> PRT
<213> Ocimum basilicum
<400> 31
Met Ala Ala Leu Leu Leu Leu Leu Leu Leu Leu Pro Ala lie Phe Leu1 5 10 15
Leu His His Leu Tyr Tyr Arg Leu Arg Phe Arg Leu Pro Pro Gly Pro20 25 30
Arg Pro Leu Pro vai vai Gly Asn Leu Tyr Asp Val Lys Pro vai Arg35 40 45
Phe Arg Cys Phe Ala Asp Trp Ala Gln ser Tyr Gly Pro Ile Ile Ser50 55 60
Val Trp Phe Gly Ser Thr Leu Asn vai Ile Val Ser Asn Thr Glu Leu65 70 75 80
Ala Lys Glu Val Leu Lys Glu Lys Asp Gln Gln Leu Ala Asp Arg His85 90 95
Arg ser Arg Ser Ala Ala Lys Phe Ser Arg Asp Gly Gln Asp Leu Ile100 105 110Trp Ala Asp Tyr Gly Pro His Tyr vai Lys vai Arg Lys vai Cys Met115 120 125
Leu Glu Leu Phe Ser Pro Lys Arg Leu Glu Ala Leu Arg Pro Ile Arg130 135 140
Glu Asp Glu vai Thr Ala Met Val Glu Ser He Tyr His Asp Cys Thr145 150 155 160
Ala Pro Asp Asn Ala Gly Lys Ser Leu Leu vai Lys Lys Tyr Leu Gly165 170 175
Ala vai Ala Phe Asn Asn Ile Thr Arg Leu Ala Phe Gly Lys Arg Phe180 185 190
Val Asn ser Glu Gly Ile Ile Asp Lys Gln Gly Leu Glu Phe Lys Ala195 200 205
Ile vai Ser Asn Gly Leu Lys Leu Gly Ala Ser Leu Ala Met Ala Glu210 215 220
His Ile Pro Trp Leu Arg Trp Met Phe Pro Leu Asp Glu Asp Ala Phe225 230 235 240
Ala Lys His Gly Ala Arg Arg Asp Gln Leu Thr Arg Glu Ile Met Glu245 250 255
Glu His Thr Arg Ala Arg Glu Glu Ser Gly Gly Ala Lys Gln His Phe260 265 270
Phe Asp Ala Leu Leu Thr Leu Lys Asp Lys Tyr Asp Leu Ser Glu Asp275 280 285
Thr lie Ile Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr290 295 300
Thr Ala lie Ser Val Glu Trp Ala Met Ala Glu Leu Ile Lys Asn Pro305 310 315 320
Arg vai Gln Gln Lys Ala Gln Glu Glu Leu Asp Arg vai Ile Gly Tyr325 330 335
Glu Arg Val Met Thr Glu Leu Asp Phe Ser Asn Leu Pro Tyr Leu Gln340 345 350
Cys vai Ala Lys Glu Ala Leu Arg Leu His Pro Pro Thr Pro Leu Met
355
360
365Leu ργο His Arg ser Asn ser Asn vai Lys Ile Gly Gly Tyr Asp Ile370 375 380
Pro Lys Gly ser Asn vai His Val Asn vai Trp Ala Val Ala Arg Asp385 390 395 400
Pro Ala Val Trp Lys Asn Pro ser Glu Phe Arg Pro Glu Arg Phe Leu405 410 415
Glu Glu Asp Val Asp Met Lys Gly His Asp Phe Arg Leu Leu Pro Phe420 425 430
Gly Ala Gly Arg Arg vai Cys Pro Gly Ala Gln Leu Gly Ile Asn Leu435 440 445
Val Thr ser Met Ile Gly His Leu Leu His His Phe Asn Trp Ala Pro450 455 460
Pro Ser Gly vai Ser Thr Asp Glu Leu Asp Met Gly Glu Asn Pro Gly465 470 475 480
Leu Val Thr Tyr Met Arg Thr Pro Leu Glu Ala vai Pro Thr Pro Arg485 490 495
Leu Pro Ser Asp Leu Tyr Lys Arg Ile Ala Val Asp Leu500 505
<210> 32<211> 509<212> PRT
<213> Lycopersicon esculentum<400> 32
Met Ala Leu Phe Leu Ile lie Leu Thr ser Ile Ala Leu Ile Phe Leu1 5 10 15
Ala His Lys Leu Tyr His Arg Leu Arg Phe Lys Leu Pro Pro Gly Pro20 25 30
Arg Pro Leu Pro vai Val Gly Asn Leu Tyr Asp Ile Lys Pro vai Arg35 40 45
Phe Arg Cys Phe Ala Asp Trp Ala Gln Thr Tyr Gly Pro Ile Phe Ser50 55 60
vai Tyr Phe Gly ser Gln Leu Asn vai Val vai Thr Thr Ala Glu Leu65
70
75
80
Ala Lys Gln Val Leu Lys Glu Asn Asp Gln Asn Leu Ala Asp Arg Phe85 90 95
Arg Thr Arg Pro Ala Asn Asn Leu Ser Arg Asn Gly Met Asp Leu Ile100 105 110
Trp Ala Asp Tyr Gly Pro His Tyr vai Lys Val Arg Lys Leu Cys Asn115 120 125
Leu Glu Leu Phe Thr Pro Lys Arg Leu Glu Ser Leu Arg Pro Ile Arg130 135 140
Glu Asp Glu vai Thr Ala Met vai Glu ser Ile Phe Asn Asp Cys Thr145 150 155 160
Lys Pro Asp Asn Arg Gly Lys Ser Leu Leu Met Arg Glu Tyr Leu Gly165 170 175
Ser vai Ala Phe Asn Asn Ile Thr Arg Leu Thr Phe Gly Lys Arg Phe180 185 190
Met Asn Ala Ala Gly Glu lie Asp Glu Gln Gly Gln Glu Phe Lys Gly195 200 205
Ile vai ser Asn Gly Ile Lys Ile Gly Gly Lys Leu Pro Leu Ala Glu210 215 220
Tyr Val Pro Trp Leu Arg Trp Phe Phe Ser Met Glu Asn Glu Ala Leu225 230 235 240
Val Lys His ser Glu Arg Arg Asp Arg Leu Thr Arg lie lie Met Asp245 250 255
Glu His Thr Leu Ala Arg Lys Gln Thr Gly Asp Thr Lys Gln His Phe260 265 270
Val Asp Ala Leu Leu Thr Leu Gln Lys Gln Tyr Asp Leu Ser Asp Asp275 280 285
Thr Val Ile Gly Leu Leu Trp Asp Met Ile Thr Ala Gly Met Asp Thr290 295 300
Thr Thr lie Thr Val Glu Trp Ala Met Ala Glu Leu Val Arg Asn Pro305 310 315 320Arg vai Gln Gln Lys Ala Gln Glu Glu Leu Asp Arg Val Ile Gly ser325 330 335
Asp Arg lie Met ser Glu Thr Asp Phe Ser Arg Leu Pro Tyr Leu Gln340 345 350
Cys vai Ala Lys Glu Ala Leu Arg Leu His Pro Pro Thr Pro Leu Met355 360 365
Leu Pro His Lys Ala Ser Ala Gly Val Lys Ile Gly Gly Tyr Asp Ile370 375 380
Pro Lys Gly Ala Ile Val His Val Asn vai Trp Ala vai Ala Arg Asp385 390 395 400
Pro Ala vai Trp Lys Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu405 410 415
Glu Glu Asp vai Asp Met Lys Gly His Asp Tyr Arg Leu Leu Pro Phe420 425 430
Gly Ala Gly Arg Arg Val Cys Pro Gly Ala Gln Leu Ala Ile Asn Leu435 440 445
Val Thr Ser Met Leu Gly His Leu Leu His His Phe Thr Trp Ser Pro450 455 460
Pro Pro Gly vai Ser Pro Glu Asp Ile Asp Leu Thr Glu Asn Pro Gly465 470 475 480
Thr Val Thr Tyr Met Lys Asn Pro Ile Gln Ala Ile Pro Thr Pro Arg485 490 495
Leu Pro Ala His Leu Tyr Lys Arg vai Pro Met Asp Met500 505
<210> 33<211> 218<212> DNA<213> Coffea canephora<400> 33
agagaacggg aaaatttaaa ataaggctta ggttgcttgg gaacaatgga aaacaaggga 60ttgttgcaga gtagggaact ctatcagtac ctcctggaga ctagtgtcta tccacatgaa 120ctgcagcctc tcaaggagct aagggatgtt actgcaagtc atccgtgggc cactatggca 180accgccccag atgctggtca gttgattgcc atgctctt 218<210> 34 <211> 722 <212> DNA <213> Coffea canephora <400> 34 gtcatccgtg ggccactatg gcaactgccc cagatgctgg tcagttgatt gccatgctct 60tgaaactaat aagtgccaaa aagacaatag agattggtgt ctttactgga tactccctac 120tgcttactgc ccttacaata ccagatgatg gcaggattgt agcaattgac cagaacagag 180atacatatga gatagggctg ccaattataa gaaaagctgc agttgagcat aagatcgact 240tcattgagtc cgaggctctt ccagttcttg ataaactcct tgaagaaaat cttaaccatg 300aagcctttga ctttgctttc gttgatgcgg acaaattaaa ttatctgaag taccatgaga 360aactgttgaa attgttaaag cttggtggaa tagttgtata cgacaacaca ctttggggag 420gatcggtggc cttgccggaa gaatctgtgg ctgaggaaat gaaagcaggc aggcatttca 480caattgagtt caacaaattg ctagctgctg atacccgagt tcaaatatcc caggttcctc 540tgggtgatgg gattactatt tgtaagcgtc tccactaaat cttatgctgg agtacttact 600tggtagttgt aaattcttgt tctttatcaa catgcttgta agcatgaact tgtggacttg 660agattcttct aa tttgtgttta taatgtcagc cttcagtaca agatttaaaa aaaaaaaaaa 720 722
<210> 35
<211> 349
<212> DNA
<213> Coffea arabica
<220>
<221> característica mista
<222> (29).. (29)
<223> η é a, c, g ou t<220>
<221 > característica mista
<222> (31)..(31)
<223> η é a, c, g ou t
<400> 35 aaacttcgga ttaatatcct tatatgccna nagccccacc gtcttctggg ctgaataaag 60ctaagaggca tttctgcacg ttacaaaatc tcctgaattc atcttcagta tcatggccaa 120ggaaggaggt tctaaagtga agacaattct ccagagtgag gccctccaga agtacatctt 180gaatactagc acatacccaa gagagcatga acaactgaag gagctaagag aagagactgc 240caggaaatat ggtgccaggg ctattatagg tgtgccacct gatgaggggc tcttcctgtc 300tatgtttttg aaagtaatga atgccaagaa gacactggag attggtgtt 349<210> 36
<211> 934
<212> DNA
<213> Coffea arabica
<400> 36
gaggttctaa aatgaagaca attctccaga gtgaggccct ccagaagtac atcttgaata 60ctagcacata cccaagagag catgaacaac tgaaggagct aagagaagag actgccagga 120aatatggtgc cagggctatt ataggtgtgc cacctgatga ggggctcttc ctgtctatgt 180ttttgaaagt aatgaatgcc aagaagacac tggagattgg tgtttttact ggctattctc 240ttcttactac tgctcttgca cttcctgatg atggccagat agttgcaata gaccctgatc 300aaggagcatt tgaagttggt ctgaaattca tcaagaaagc tggtgtggag aacaaaatca 360aattcatcaa atcagatggc atttctgctc taaatgattt gttgaacaat gtgaatatgc 420agcatttgcc agaagctccc ttcagatttt tctggaaaaa gtgcactata aagtaaccac 480tagaagctag tgaagcaaca ttcgactttg catttgtgga tgcagacaag ccaagctaca 540tccagtacca tgaacaacta ataaagctgg tgaagattgg aggaattatc gcttacgata 600atactctata cggtggatat gttgtcagtg aagaaattga aatgcacgaa agatccactg 660tcaacagaaa agccatcata caattcaaca actatatagc ctcggatccg cgagttgaga 720tctctcaggt tcctatagga gatggtgtta cattgtgtag gcgcatcatc gcttagctga 780catgatattt tacatgaatt ttattaatag tgcaactgct acggtagcat agttggatgg 840tttgcttggt cataattcct tgatgctgtc ccaataacat caggcataag aaagatttct 900gctctgagca aaaaaaaaaa aaaaaaaaaa aaaa 934
<210> 37<211> 247<212> PRT
<213> Medicago sativa<400> 37
Met Ala Thr Asn Glu Asp Gln Lys Gln Thr Glu Ser Gly Arg His Gln1 5 10 15
Glu vai Gly His Lys Ser Leu Leu Gln ser Asp Ala Leu Tyr Gln Tyr20 25 30
Ile Leu Glu Thr ser Val Phe Pro Arg Glu His Glu Ala Met Lys Glu35 40 45
Leu Arg Glu Val Thr Ala Lys His Pro Trp Asn Ile Met Thr Thr Ser50 55 60
Ala Asp Glu Gly Gln Phe Leu Ser Met Leu Leu Lys Leu Ile Asn Ala65 70 75 80
Lys Asn Thr Met Glu lie Gly Val Tyr Thr Gly Tyr Ser Leu Leu Ala85 90 95
Thr Ala Leu Ala lie Pro Glu Asp Gly Lys Ile Leu Ala Met Asp Ile100 105 110
Asn Lys Glu Asn Tyr Glu Leu Gly Leu Pro vai Ile Lys Lys Ala Gly115 120 125
vai Asp His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu Pro vai Leu130 135 140
Asp Glu Met Ile Lys Asp Glu Lys Asn His Gly Ser Tyr Asp Phe Ile145 150 155 160
Phe Val Asp Ala Asp Lys Asp Asn Tyr Leu Asn Tyr His Lys Arg Leu165 170 175
Ile Asp Leu Val Lys vai Gly Gly vai Ile Gly Tyr Asp Asn Thr Leu180 185 190
Trp Asn Gly Ser vai vai Ala Pro Pro Asp Ala Pro Leu Arg Lys Tyr195 200 205
Val Arg Tyr Tyr Arg Asp Phe Val Leu Glu Leu Asn Lys Ala Leu Ala210 215 220
Val Asp Pro Arg lie Glu Ile Cys Met Leu Pro Val Gly Asp Gly Ile225 230 235 240
Thr rle Cys Arg Arg lie Lys245
<210> 38<2ll> 239<212> PRT
<213> Nicotiana tabacum<400> 38
Met Ala Thr Asn Gly Arg His Gln Glu Val Gly His Lys Ser Leu Leu1 5 10 15
Gln Ser Asp Ala Leu Tyr Gln Tyr lie Leu Glu Thr Ser vai Tyr Pro20 25 30
Arg Glu Pro Glu Pro Met Lys Glu Leu Arg Glu lie Thr Ala Lys His
35 40 45Pro Trp Asn Leu Met Thr Thr ser Ala Asp Glu Gly Gln Phe Leu Ser50 55 60
Met Leu Ile Lys Leu Ile Asn Ala Lys Asn Thr Met Glu lie Gly vai65 70 75 80
Phe Thr Gly Tyr Ser Leu Leu ATa Thr A7a Met Ala Leu Pro Asp Asp85 90 95
Gly Lys Ile Leu Ala Met Asp Ile Asn Arg Glu Asn Tyr Glu Ile Gly100 105 110
Leu Pro Val Ile Glu Lys Ala Gly Leu Ala His Lys lie Glu Phe Lys115 120 125
Glu Gly Pro Ala Leu Pro vai Leu Asp Gln Met Ile Glu Asp Gly Lys130 135 140
Tyr His Gly Ser Tyr Asp Phe lie Phe vai Asp Ala Asp Lys Asp Asn145 150 155 160
Tyr Leu Asn Tyr His Lys Arg Leu Ile Asp Leu Val Lys Ile Gly Gly165 170 175
Leu lie Gly Tyr Asp Asn Thr Leu Trp Asn Gly Ser vai vai Ala Pro180 185 190
Pro Asp Ala Pro Leu Arg Lys Tyr Val Arg Tyr Tyr Arg Asp Phe vai195 200 205
Leu Glu Leu Asn Lys Ala Leu Ala Ala Asp Ser Arg Ile Glu Ile Cys210 215 220
Gln Leu Pro vai Gly Asp Gly Ile Thr Leu Cys Arg Arg Ile Ser225 230 235
<210> 39
<211> 242
<212> PRT
<213> Vitis vinifera
<400> 39
Met Ala Thr Asn Gln Glu Ala Gly Arg His Gln Glu Val Gly His Lys1 5 10 15
Ser Leu Leu Gln ser Asp Ala Leu Tyr Gln Tyr Ile Leu Glu Thr ser20 25 30vai Tyr Pro Arg Glu Pro Glu Ser Met Lys Glu Leu Arg Glu Leu Thr35 40 45
Ala Gln His Pro Trp Asn lie Met Thr Thr Ser Ala Asp Glu Gly Gln50 55 60
Phe Leu Asn Met Leu Leu Lys Leu Ile Asn Ala Lys Asn Thr Met Glu65 70 75 80
Ile Gly Val Tyr Thr Gly Tyr Ser Leu Leu Ala Thr Ala Leu Ala Leu85 90 95
Pro Asp Asp Gly Lys Ile Leu Ala Met Asp Ile Asn Lys Glu Asn Tyr100 105 110
Glu Leu Gly Leu Pro Val Ile Gln Lys Ala Gly Val Ala His Lys Ile115 120 125
Asp Phe Lys Glu Gly Pro Ala Leu Pro Val Leu Asp Gln Met Ile Glu130 135 140
Asp Gly Lys Tyr His Gly Ser Phe Asp Phe Ile Phe Val Asp Ala Asp145 150 155 160
Lys Asp Asn Tyr Leu Asn Tyr His Lys Arg Leu Ile Asp Leu Val Lys165 170 175
vai Gly Gly Ile Ile Gly Tyr Asp Asn Thr Leu Trp Asn Gly Ser vai180 185 190
vai Ala Pro Pro Asp Ala Pro Leu Arg Lys Tyr vai Arg Tyr Tyr Arg195 200 205
Asp Phe vai Leu Glu Leu Asn Lys Ala Leu Ala Ala Asp Pro Arg Ile210 215 220
Glu Ile Cys Met Leu Pro vai Gly Asp Gly Ile Thr Leu Cys Arg Arg225 230 235 240
Leu Ser
<210> 40<211> 36<212> DNA<213> Seqüência artificial<220><223> Iniciador de AAP<220><221> Basemodificada<222> (24).. (25)
<223> cada η = inosine<220>
<221 > característica mista
<222> (24)..(25)
<223> η é a, c, g ou t<220>
<221 > Basemodificada
<222> (29)..(30)
<223> cada η = inosine<220>
<221 > característica mista
<222> (29).. (30)
<223> η é a, c, g ou t
<220>
<221 > Basemodificada
<222> (34).. (35)
<223> cada η = inosine<220>
<221 > característica mista
<222> (34).. (35)
<223> η é a, c, g ou t
<400> 40
ggccacgcgt cgactagtac gggnngggnn gggnng 36
<210> 41
<211> 20
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de AUAP
<400> 41
ggccacgcgt cgactagtac 20<210> 42
<211> 27
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador de 22m12-GSP1
<400> 42
caatgaacgg agggacagca atggtga 27
<210> 43
<211> 30
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador de 22m12-GSP2
<400> 43
ggccacgagc tatgtctgac catgtattga 30
<210> 44
<211> 29
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de 22w14m23-GSP1
<400> 44
ccatcagact cggcctccac gaaaagcac 29
<210> 45
<211> 32
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador de 22w14m23-GSP2
<400> 45
cactcaatct caatccgccc atcttcgtct ct 32
<210> 46
<211> 26<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde 122801-GSP1
<400> 46
ttgtaagggc agtaagcagt agggag
<210> 47
<211> 26
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde 122801-GSP2
<400> 47
aagagcatgg caatcaactg accagc
<210> 48
<211> 27
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de 119560-GSP1<400> 48
aacttcaaat gctccttgat cagggtc
<210> 49
<211> 27
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de 119560-GSP2
<400> 49
aacaccaatc tccagtgtct tcttggc
<210> 50
<211> 22
<212> DNA
<213> Seqüência artificial<220><223> Iniciador superior 1 de HCT-Fu11<400> 50
ccatgaaaat cgaggtgaag ga
<210> 51<211> 19<212> DNA<213> Seqüência artificial<220><223> Iniciador de CcHCT-RI<400> 51
gaaaccacca ccgcatgaa
<210> 52<211> 23<212> DNA<213> Seqüência artificial<220><223> Iniciador superior 2 de HQT-Fu11<400> 52
cttctccatc ccagctcgtt tct
<210> 53<211> 22<212> DNA<213> Seqüência artificial<220><223> Iniciador inferior 2 de HQT-Fu11<400> 53
gagtcccaat ccaatcacaa gt
<210> 54<211> 23<212> DNA<213> Seqüência artificial<220><223> CCoAOMT1-Fu11 superior<400> 54
caccatggcc agaatggaga agg
<210> 55
<211> 25
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador inferior de CCoAOMTI -Fu11
<400> 55
agtagggaaa ttaattagct gacgc
<210> 56
<211> 30
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador superior de CCoAOMT-Fu11
<400> 56
caccatggaa aacaagggat tgttgcagag
<210> 57
<211> 30
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador inferior de CCoAOMT-L1 -Fu11
<400> 57
aagtaagtac tccagcataa gatttagtgg
<210> 58
<211> 24
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador superior de CCoAOMT-L2-Fu11
<400> 58caccatggcc aaggaaggag gttc<210> 59
<211> 24
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador inferior de CCoAOMT-L2-Fu11
<400> 59
accatgtcag ctaagcgatg atgc
<210> 60
<211> 21
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador de rp139-F1
<400> 60
gaacaggccc atcccttatt g
<210> 61<211> 17<212> DNA<213> Seqüência artificial<220> <223> Iniciadorde rp139-R1<400> 61 cggcgcttgg cattgta<210> 62<211> 16<212> DNA<213> Seqüência artificial<220> <223> Iniciadorde rp139-MGB1<400> 62 atgcgcactg acaaca<210> 63<211> 27<212> DNA<213> Seqüência artificiai<220>
<223> Iniciador de CcC3H-F1
<400> 63
ctcttgttac taaattttca gcttgca
<210> 64
<211> 24
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcC3H-R1
<400> 64
ggagaatcca acaagttctt caca
<210> 65
<211> 18
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde CcC3H-MGB1
<400> 65
agttgcttca cttccaac
<210> 66
<211> 23
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcHCT-FI
<400> 66
gggagcacat cacatgaatt ttc
<210> 67
<211> 19
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcHCT-FI<400> 67
gaaaccacca ccgcatgaa
<210> 68
<211> 14
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcHCT-MGBI
<400> 68cggttccggg ccag
<210> 69
<211> 10
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcHQT-FI
<400> 69
ttgccaagtc caggcaaag
<210> 70
<211> 21
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcHQT-RI
<400> 70
catgtgatcg gcatctaagc a
<210> 71
<211> 20
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcHQT-MGBI
<400> 71
caggacttta tcgttagctg<210> 72<211> 19
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde CcCCoAOMT1-F1
<400> 72
tgcggaaagt tgggaatca
<210> 73
<211> 26
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcCCoAOMTI -R1
<400> 73
aagaggagga agcaaaagaa gtaggt
<210> 74
<211> 20
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcCCoAOMTI -MGB11
<400> 74
tgcaaatgaa aaatagccca
<210> 75
<211> 22
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador CcCCoAOMTI -L1 -F1
<400> 75
gctagctgct gatacccgag tt
<210> 76
<211> 27
<212> DNA<213> Seqüência artificial<220>
<223> Iniciador de CcCCoAOMTI -L1 -R1
<400> 76
gacgcttaca aatagtaatc ccatcac
<210> 77
<211> 17
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcCCoAOMTI -L1-MGB1
<400> 77
tatcccaggt tcctctg
<210> 78
<211> 24
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcCCoAOMT-L2-F1
<400> 78
gttacattgt gtaggcgcat catc
<210> 79
<211> 24
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de CcCCoAOMT-L2-R1
<400> 79
tgctaccgta gcagttgcac tatt
<210> 80
<211> 20
<212> DNA
<213> Seqüência artificial<220><223> Iniciador de CcCCoAOMT-L2-MGB1
<400> 79
<400> 80
tagctgacat gatattttac
<210> 81
<211> 22
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de AP1
<400> 81qgtaatacgac tcactatagg gc
<210> 82
<211> 19
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador de AP2
<400> 82
actatagggc acgcgtggt
<210> 83
<211> 29
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador de HCT-GSP1
<400> 83
ccatcagact cggcctccac gaaaagcac
<210> 84
<211> 32
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde HCT-GSP2<400> 84
cactcaatct caatccgccc atcttcgtct ct 32
<210> 85<211> 5<212> PRT
<213> Coffea canephora<220>
<221 > CaixaHHAAD
<222> (1)..(5)
<223> Seqüência conservada HHAAD, uma forma de caixa HXXXD encon-trada em proteínas HQT e HCT
<400> 85
His His Ala Ala Asp1 5
<210> 86
<211> 22
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciador inferior 1 de HQT-Fu11
<400> 86
ctggaggaaa gcagagaagc at 22
<210> 87
<211> 39
<212> DNA
<213> Seqüência artificial
<220>
<223> Iniciador de 178-HCT-S
<400> 87
ttaattaatt cgcggatcca tgaaaatcga ggtgaagga 39
<210> 88
<211> 44
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde 178-HCT-R<400> 88
tatatatact agtctagatc aaatgtcata caagaaactc tgga 44
<210> 89
<211> 39
<212> DNA
<213> Seqüência artificial<220>
<223> Iniciadorde 178-HQT-S
<400> 89
tttaaatttc gcggatccat gaagataacc gtgaaggaa 39
<210> 90
<211> 39
<212> DNA
<213> Seqüência artificial<220>
<223> iniciado 178-HQT-R
<400> 90
tatatatact agtctagatc agaaatcgta caggaacct 39
Claims (41)
1. Molécula de ácido nucléico isolada de café (Coffea spp.), ca-racterizada pelo fato de que apresenta uma seqüência de codificação quecodifica uma enzima da via de fenilpropanóide selecionada de hidroxicina-moil-CoA chiquimato/quinato hidroxicinamoiltransferase, hidroxicinamoil-CoAquinato hidroxicinamoiltransferase, p-cumaroil 3' hidroxilase e cafeoil-CoA 3-O metitransferase.
2. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma hi-droxicinamoil-CoA chiquimato/quinato hidroxicinamoiltransferase.
3. Molécula de ácido nucléico de acordo com a reivindicação 2,caracterizada pelo fato de que a hidroxicinamoil-CoA chiquimato/quinato hi-droxicinamoiltransferase tem uma seqüência de aminoácido maior que86,9% idêntica à SEQ ID N9: 9 ou SEQ ID Ns: 10.
4. Molécula de ácido nucléico de acordo com a reivindicação 3,caracterizada pelo fato de que a hidroxicinamoil-CoA chiquimato/quinato hi-droxicinamoiltransferase tem uma seqüência de aminoácido que compreen-de SEQ ID N9: 9 ou SEQ ID N9: 10.
5. Molécula de ácido nucléico de acordo com a reivindicação 2,caracterizada pelo fato de que a seqüência de codificação é maior que78,5% idêntica à SEQ ID N9: 1 ou SEQ ID N9: 2.
6. Molécula de ácido nucléico de acordo com a reivindicação 5,caracterizada pelo fato de que a seqüência de codificação compreende SEQID N9: 1 ou SEQ ID N9: 2.
7. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma hi-droxicinamoil-CoA quinato hidroxicinamoiltransferase.
8. Molécula de ácido nucléico de acordo com a reivindicação 7,caracterizada pelo fato de que a hidroxicinamoil-CoA quinato hidroxicinamoil-transferase tem uma seqüência de aminoácido maior que 78,1% idêntica àSEQ ID N9: 11 ou SEQ ID N9: 12.
9. Molécula de ácido nucléico de acordo com a reivindicação 8,caracterizada pelo fato de que a hidroxicinamoil-CoA quinato hidroxicinamoil-transferase tem uma seqüência de aminoácido que compreende SEQ ID Ng:-11 ou SEQ ID N9: 12.
10. Molécula de ácido nucléico de acordo com a reivindicação 7,caracterizada pelo fato de que a seqüência de codificação é maior que-72,1% idêntica à SEQ ID Ne: 3 ou SEQ ID N9: 4.
11. Molécula de ácido nucléico de acordo com a reivindicação-10, caracterizada pelo fato de que a seqüência de codificação compreendeSEQ ID N9: 3 ou SEQ ID N9: 4.
12.- Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma p-cumaroil 3' hidroxilase.
13. Molécula de ácido nucléico de acordo com a reivindicação-12, caracterizada pelo fato de que a p-cumaroil 3' hidroxilase tem uma se-qüência de aminoácido maior que 82,9% idêntica à SEQ ID N9:13.
14. Molécula de ácido nucléico de acordo com a reivindicação-13, caracterizada pelo fato de que a p-cumaroil 3' hidroxilase tem uma se-qüência de aminoácido que compreende SEQ ID N9:13.
15. Molécula de ácido nucléico de acordo com a reivindicação-12, caracterizada pelo fato de que a seqüência de codificação é maior que-69,4% idêntica à SEQ ID N9: 5.
16. Molécula de ácido nucléico de acordo com a reivindicação-15, caracterizada pelo fato de que a seqüência de codificação compreendeSEQ ID N9: 5.
17. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação codifica uma ca-feoil-CoA 3-0 metitransferase.
18. Molécula de ácido nucléico de acordo com a reivindicação-17, caracterizada pelo fato de que a cafeoil-CoA 3-0 metitransferase temuma seqüência de aminoácido maior que 86,3% idêntica à SEQ ID N9: 14,SEQ ID N9: 15 ou SEQ ID N9: 16.
19. Molécula de ácido nucléico de acordo com a reivindicação-18, caracterizada pelo fato de que a cafeoil-CoA 3-0 metitransferase temuma seqüência de aminoácido que compreende SEQ ID Ne: 14, SEQ ID NQ:-15 ou SEQ ID NQ: 16.
20. Molécula de ácido nucléico de acordo com a reivindicação-19, caracterizada pelo fato de que a seqüência de codificação compreendeSEQ ID Ne: 6, SEQ ID N9: 7 ou SEQ ID N2: 8.
21. Molécula de ácido nucléico de acordo com a reivindicação 1,caracterizada pelo fato de que a seqüência de codificação é uma estruturade leitura aberta de um gene.
22. Molécula de mRNA, caracterizada pelo fato de que é produ-zida por transcrição do gene como definido na reivindicação 21.
23. Molécula de cDNA, caracterizada pelo fato de que é produzi-da por transcrição reversa da molécula de mRNA como definida na reivindi-cação 22.
24. Oligonucleotídeo entre 8 e 100 bases em comprimento, ca-racterizado pelo fato de que é complementar a um segmento da molécula deácido nucléico como definida na reivindicação 1.
25. Vetor, caracterizado pelo fato de que compreende a seqüên-cia de codificação da molécula de ácido nucléico como definida na reivindi-cação 1.
26. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que é um vetor de expressão selecionado do grupo de vetores queconsiste em vetores de plasmídeo, fagemídeo, cosmídeo, baculovírus, bac-mídeo, bacteriano, de levedura e virais.
27. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que a seqüência de codificação da molécula de ácido nucléico é ope-ravelmente ligada a um promotor constitutivo.
28. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que a seqüência de codificação da molécula de ácido nucléico é ope-ravelmente ligada a um promotor induzível.
29. Vetor de acordo com a reivindicação 25, caracterizado pelofato de que a seqüência de codificação da molécula de ácido nucléico é ope-ravelmente ligada a um promotor tecido-específico.
30. Vetor de acordo com a reivindicação 29, caracterizado pelofato de que o promotor tecido-específico é um promotor semente-específico.
31. Vetor de acordo com a reivindicação 30, caracterizado pelofato de que o promotor semente-específico é um promotor específico parasemente de café.
32. Célula hospedeira, caracterizada pelo fato de que é trans-formada com o vetor como definido na reivindicação 25.
33. Célula hospedeira de acordo com a reivindicação 32, carac-terizada pelo fato de que é selecionada do grupo que consiste em células deplanta, células bacterianas, células fúngicas, células de inseto e células ma-míferas.
34. Célula hospedeira de acordo com a reivindicação 33, carac-terizada pelo fato de que é uma célula de planta selecionada do grupo deplantas que consiste em café, tabaco, Arabidopsis, milho, trigo, arroz, feijão-soja cevada, centeio, aveia, sorgo, alfafa, trevo, óleo de canola, cártamo,girassol, amendoim, cacau, tomate-de-árvore, batata, pimenta, berinjela, be-terraba açucareira, cenoura, pepino, alface, ervilha, áster, begônia, crisân-temo, delfínio, zínia, e gramas.
35. Planta fértil, caracterizada pelo fato de que é produzida dacélula de planta como definida na reivindicação 34.
36. Método de modular sabor ou aroma de feijões de café, carac-terizado pelo fato de que compreende modular a produção ou atividade deuma ou mais enzimas da via de fenilpropanóide dentro das sementes de café,em que as enzimas da via de fenilpropanóide são selecionadas de hidroxici-namoil-CoA chiquimato/qui-nato hidroxicinamoiltransferase, hidroxicinamoil-CoA quinato hidroxicinamoiltransferase, p-cumaroil 3' hidroxilase e cafeoil-CoA 3-0 metitransferase.
37. Método de acordo com a reivindicação 36, caracterizado pe-lo fato de que compreende aumentar a produção ou atividade da uma oumais enzimas da via de fenilpropanóide.
38. Método de acordo com a reivindicação 37, caracterizado pe-lo fato de que compreende aumentar a expressão de um ou mais genes en-dógenos da enzima da via de fenilpropanóide dentro das sementes de café.
39. Método de acordo com a reivindicação 37, caracterizado pe-lo fato de que compreende introduzir um transgene de codificação da enzimada via de fenilpropanóide na planta.
40. Método de acordo com a reivindicação 36, caracterizado pe-lo fato de que compreende aumentar a produção ou atividade da uma oumais enzimas da via de fenilpropanóide.
41. Método de acordo com a reivindicação 40, caracterizado pe-lo fato de que compreende introduzir uma molécula de ácido nucléico no ca-fé que inibe a expressão de um ou mais genes de codificação da enzima da-1,1 via de fenilpropanóide.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US72467305P | 2005-10-07 | 2005-10-07 | |
| US60/724,673 | 2005-10-07 | ||
| PCT/US2006/039618 WO2007044751A2 (en) | 2005-10-07 | 2006-10-10 | Polynucleotides encoding phenylpropanoid pathway enzymes in coffee |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0616979A2 true BRPI0616979A2 (pt) | 2011-07-05 |
Family
ID=37943484
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0616979-1A BRPI0616979A2 (pt) | 2005-10-07 | 2006-10-10 | molécula de ácido nucléico isolada do café (coffea spp), moléculas de mrna e cdna, oligonucleotìdeo, vetor, célula hospedeira, planta fértil e método de modular sabor ou aroma de grãos de café |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US8362328B2 (pt) |
| EP (1) | EP1940868A2 (pt) |
| CN (1) | CN101326194A (pt) |
| AP (1) | AP2008004413A0 (pt) |
| AU (1) | AU2006302107A1 (pt) |
| BR (1) | BRPI0616979A2 (pt) |
| CA (1) | CA2625350A1 (pt) |
| EC (1) | ECSP088355A (pt) |
| WO (1) | WO2007044751A2 (pt) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102061301B (zh) * | 2010-08-04 | 2012-12-05 | 陕西师范大学 | 丹参羟基肉桂酰转移酶基因序列和编码的氨基酸序列及其应用 |
| CN102465135A (zh) * | 2010-11-05 | 2012-05-23 | 中国中医科学院中药研究所 | 黄芩咖啡酰辅酶A-3-O-甲基转移酶(SbCCOMT2)基因及其编码产物和应用 |
| WO2012126789A1 (en) | 2011-03-18 | 2012-09-27 | Nestec S.A. | Production of chlorogenic and dactylifric acid species |
| US9428759B2 (en) | 2012-07-26 | 2016-08-30 | Casa Luker S.A. | Methods for increasing the production of phenolic compounds from Theobroma cacao |
| CN105087592B (zh) * | 2015-09-23 | 2017-10-24 | 山东大学 | 金银花hqt基因冷诱导型启动子 |
| CN106834246B (zh) * | 2016-12-30 | 2020-10-23 | 江苏省中国科学院植物研究所 | 石蒜科植物忽地笑细胞色素p450还原酶2及其编码基因与应用 |
| CN108795899B (zh) * | 2018-06-25 | 2021-06-04 | 黄冈师范学院 | NtCCoAOMT基因在提高烟草产绿原酸中的应用 |
| CN110904067B (zh) * | 2019-12-20 | 2022-08-26 | 中国烟草总公司郑州烟草研究院 | 烟草绿原酸合成基因NtHQT及其应用 |
| CN115704004A (zh) * | 2021-08-05 | 2023-02-17 | 杭州唯铂莱生物科技有限公司 | 一种利用固定化酶合成苯丙醇衍生物的方法 |
| CN114317304B (zh) * | 2021-12-21 | 2024-03-15 | 浙江工业大学 | 酿酒酵母产绿原酸工程菌株的构建方法及其应用 |
| CN116240225B (zh) * | 2023-01-12 | 2025-05-02 | 中国烟草总公司郑州烟草研究院 | 系列烟草NtHQT基因及其应用 |
| CN119060967A (zh) * | 2024-09-25 | 2024-12-03 | 河北省科学院生物研究所 | 一种合成绿原酸的酶产品和方法 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB0214406D0 (en) | 2002-06-21 | 2002-07-31 | Plant Bioscience Ltd | Plant-derived transferase genes |
| CA2501631A1 (en) | 2002-10-16 | 2004-04-29 | U.S. Smokeless Tobacco Company | Cloning of cytochrome p450 genes from nicotiana |
| WO2006012594A2 (en) * | 2004-07-24 | 2006-02-02 | The Samuel Roberts Noble Foundation, Inc. | Modification of lignin biosynthesis |
-
2006
- 2006-10-10 AU AU2006302107A patent/AU2006302107A1/en not_active Abandoned
- 2006-10-10 CN CNA2006800458899A patent/CN101326194A/zh active Pending
- 2006-10-10 AP AP2008004413A patent/AP2008004413A0/xx unknown
- 2006-10-10 US US12/083,041 patent/US8362328B2/en not_active Expired - Fee Related
- 2006-10-10 CA CA002625350A patent/CA2625350A1/en not_active Abandoned
- 2006-10-10 BR BRPI0616979-1A patent/BRPI0616979A2/pt not_active IP Right Cessation
- 2006-10-10 WO PCT/US2006/039618 patent/WO2007044751A2/en not_active Ceased
- 2006-10-10 EP EP06816655A patent/EP1940868A2/en not_active Withdrawn
-
2008
- 2008-04-07 EC EC2008008355A patent/ECSP088355A/es unknown
Also Published As
| Publication number | Publication date |
|---|---|
| AU2006302107A1 (en) | 2007-04-19 |
| WO2007044751A2 (en) | 2007-04-19 |
| CA2625350A1 (en) | 2007-04-19 |
| ECSP088355A (es) | 2008-06-30 |
| US8362328B2 (en) | 2013-01-29 |
| EP1940868A2 (en) | 2008-07-09 |
| CN101326194A (zh) | 2008-12-17 |
| WO2007044751A3 (en) | 2007-11-15 |
| AP2008004413A0 (en) | 2008-04-30 |
| US20090158456A1 (en) | 2009-06-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7297541B2 (en) | Genes encoding 4-hydroxyphenylpyruvate dioxygenase (HPPD) enzymes for plant metabolic engineering | |
| JP5158639B2 (ja) | 植物の内胚乳に特異的に発現する遺伝子および該遺伝子のプロモーター、並びにそれらの利用 | |
| US20040045051A1 (en) | Tocopherol biosynthesis related genes and uses thereof | |
| US7989677B2 (en) | Nucleic acids and proteins associated with sucrose accumulation in coffee | |
| BRPI0616979A2 (pt) | molécula de ácido nucléico isolada do café (coffea spp), moléculas de mrna e cdna, oligonucleotìdeo, vetor, célula hospedeira, planta fértil e método de modular sabor ou aroma de grãos de café | |
| AU2016317094B2 (en) | Increasing plant oil content by altering a negative regulator of acetyl-CoA carboxylase | |
| WO2019101179A1 (zh) | 抗除草剂基因及其在植物育种中的应用 | |
| CN101213302B (zh) | 咖啡油质蛋白基因和启动子 | |
| JP2011004761A (ja) | 緑のコーヒー粒中のコーヒーフレーバー前駆体レベルの調節 | |
| US20120278914A1 (en) | Methods and compositions for regulating production of proanthocyanidins | |
| EP1931774A2 (en) | Invertase and inhibitors from coffee | |
| JP5292094B2 (ja) | コーヒー中のカロテノイド及びアポカロテノイド生合成経路の酵素をコードするポリヌクレオチド | |
| KR101730074B1 (ko) | 플라보놀 합성 유전자 및 이로 형질전환된 형질전환 식물 | |
| CN101356277A (zh) | 咖啡中与半乳甘露聚糖合成有关的核酸和蛋白质 | |
| US20100037357A1 (en) | Polynucleotides Encoding Phenylpropanoid and Falvonoid Biosynthetic Pathway Enzymes in Coffee | |
| US8158853B2 (en) | Polynucleotides encoding lignin biosynthetic pathway enzymes in coffee | |
| KR20130095482A (ko) | 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg3 단백질과 그 유전자 및 이들의 용도 | |
| KR20120121351A (ko) | 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg8 단백질과 그 유전자 및 이들의 용도 | |
| MX2008004640A (en) | Polynucleotides encoding phenylpropanoid pathway enzymes in coffee | |
| JP5458348B2 (ja) | コエンザイムq10強化糖質突然変異植物体およびその製造方法 | |
| MX2007015995A (en) | Oleosin genes and promoters from coffee | |
| BRPI0810658B1 (pt) | Construto de dna, método de produção de uma planta de milho transgênica com teor alto de asparagina, alimento ou ração e método de produção do mesmo |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE A 5A ANUIDADE. |
|
| B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2161 DE 05/06/2012. |