BRPI0711953A2 - polinucleotìdeo isolado e polipeptìdeo conferindo resistência a glutamina sintetase e métodos para produzir plantas e células vegetais transgênicas apresentando produção e utilização de nitrogênio melhoradas - Google Patents
polinucleotìdeo isolado e polipeptìdeo conferindo resistência a glutamina sintetase e métodos para produzir plantas e células vegetais transgênicas apresentando produção e utilização de nitrogênio melhoradas Download PDFInfo
- Publication number
- BRPI0711953A2 BRPI0711953A2 BRPI0711953-4A BRPI0711953A BRPI0711953A2 BR PI0711953 A2 BRPI0711953 A2 BR PI0711953A2 BR PI0711953 A BRPI0711953 A BR PI0711953A BR PI0711953 A2 BRPI0711953 A2 BR PI0711953A2
- Authority
- BR
- Brazil
- Prior art keywords
- wing
- gly
- glu
- asp
- ile
- Prior art date
Links
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 160
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 160
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 160
- 108020002326 glutamine synthetase Proteins 0.000 title claims abstract description 125
- 102000005396 glutamine synthetase Human genes 0.000 title claims abstract description 124
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 118
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims abstract description 109
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 109
- 230000009261 transgenic effect Effects 0.000 title claims abstract description 21
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 title abstract description 60
- 229910052757 nitrogen Inorganic materials 0.000 title abstract description 30
- 238000004519 manufacturing process Methods 0.000 title abstract description 8
- 230000002363 herbicidal effect Effects 0.000 claims abstract description 103
- 239000004009 herbicide Substances 0.000 claims abstract description 77
- 239000003112 inhibitor Substances 0.000 claims abstract description 52
- 230000014509 gene expression Effects 0.000 claims abstract description 35
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims abstract description 34
- 241000894006 Bacteria Species 0.000 claims abstract description 18
- 230000005764 inhibitory process Effects 0.000 claims abstract description 12
- 230000014075 nitrogen utilization Effects 0.000 claims abstract description 5
- 241000196324 Embryophyta Species 0.000 claims description 241
- 108090000623 proteins and genes Proteins 0.000 claims description 91
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 claims description 70
- 239000005561 Glufosinate Substances 0.000 claims description 61
- 150000001413 amino acids Chemical class 0.000 claims description 45
- 102000004190 Enzymes Human genes 0.000 claims description 33
- 108090000790 Enzymes Proteins 0.000 claims description 33
- 125000003729 nucleotide group Chemical group 0.000 claims description 32
- 230000004048 modification Effects 0.000 claims description 30
- 238000012986 modification Methods 0.000 claims description 30
- 239000002773 nucleotide Substances 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 30
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 23
- 230000001580 bacterial effect Effects 0.000 claims description 20
- 230000006154 adenylylation Effects 0.000 claims description 18
- 239000013612 plasmid Substances 0.000 claims description 12
- 241000238631 Hexapoda Species 0.000 claims description 11
- 240000008042 Zea mays Species 0.000 claims description 10
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 8
- 240000007594 Oryza sativa Species 0.000 claims description 6
- 235000007164 Oryza sativa Nutrition 0.000 claims description 6
- 240000003768 Solanum lycopersicum Species 0.000 claims description 6
- 239000002158 endotoxin Substances 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 claims description 5
- 240000002791 Brassica napus Species 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 5
- 244000061176 Nicotiana tabacum Species 0.000 claims description 5
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 5
- 244000061456 Solanum tuberosum Species 0.000 claims description 5
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 5
- 235000021307 Triticum Nutrition 0.000 claims description 5
- 244000098338 Triticum aestivum Species 0.000 claims description 5
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 5
- 235000009973 maize Nutrition 0.000 claims description 5
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 4
- 235000002566 Capsicum Nutrition 0.000 claims description 4
- 229920000742 Cotton Polymers 0.000 claims description 4
- 235000010469 Glycine max Nutrition 0.000 claims description 4
- 244000068988 Glycine max Species 0.000 claims description 4
- 244000020551 Helianthus annuus Species 0.000 claims description 4
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 4
- 229930006000 Sucrose Natural products 0.000 claims description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 4
- 239000006002 Pepper Substances 0.000 claims description 3
- 235000016761 Piper aduncum Nutrition 0.000 claims description 3
- 235000017804 Piper guineense Nutrition 0.000 claims description 3
- 235000008184 Piper nigrum Nutrition 0.000 claims description 3
- 235000016068 Berberis vulgaris Nutrition 0.000 claims 2
- 241000335053 Beta vulgaris Species 0.000 claims 2
- 244000299507 Gossypium hirsutum Species 0.000 claims 2
- 244000203593 Piper nigrum Species 0.000 claims 2
- 240000006394 Sorghum bicolor Species 0.000 claims 2
- 229960004793 sucrose Drugs 0.000 claims 2
- 108020004414 DNA Proteins 0.000 abstract description 55
- 230000009466 transformation Effects 0.000 abstract description 30
- 239000000203 mixture Substances 0.000 abstract description 17
- 108091026890 Coding region Proteins 0.000 abstract description 7
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 132
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 103
- 210000004027 cell Anatomy 0.000 description 89
- 108010064235 lysylglycine Proteins 0.000 description 66
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 52
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 51
- 108010047857 aspartylglycine Proteins 0.000 description 51
- KASDBWKLWJKTLJ-GUBZILKMSA-N Glu-Glu-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O KASDBWKLWJKTLJ-GUBZILKMSA-N 0.000 description 48
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 48
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 47
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 46
- 235000001014 amino acid Nutrition 0.000 description 45
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 44
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 42
- 102000004169 proteins and genes Human genes 0.000 description 41
- 235000018102 proteins Nutrition 0.000 description 40
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 39
- 108010015792 glycyllysine Proteins 0.000 description 37
- 108010012581 phenylalanylglutamate Proteins 0.000 description 35
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 34
- 108010053725 prolylvaline Proteins 0.000 description 34
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 33
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 33
- 229940024606 amino acid Drugs 0.000 description 33
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 32
- DJCAHYVLMSRBFR-QXEWZRGKSA-N Asp-Met-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(O)=O DJCAHYVLMSRBFR-QXEWZRGKSA-N 0.000 description 32
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 32
- 108010077245 asparaginyl-proline Proteins 0.000 description 32
- 230000000694 effects Effects 0.000 description 32
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 31
- PRLPSDIHSRITSF-UNQGMJICSA-N Arg-Phe-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PRLPSDIHSRITSF-UNQGMJICSA-N 0.000 description 31
- QLRMMMQNCWBNPQ-QXEWZRGKSA-N Ile-Arg-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N QLRMMMQNCWBNPQ-QXEWZRGKSA-N 0.000 description 31
- IILAGWCGKJSBGB-IHRRRGAJSA-N Met-Phe-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IILAGWCGKJSBGB-IHRRRGAJSA-N 0.000 description 31
- 108010073969 valyllysine Proteins 0.000 description 31
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 30
- 241000880493 Leptailurus serval Species 0.000 description 30
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 30
- RFWXYTJSVDUBBZ-DCAQKATOSA-N Pro-Pro-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RFWXYTJSVDUBBZ-DCAQKATOSA-N 0.000 description 30
- YJCVECXVYHZOBK-KNZXXDILSA-N Thr-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H]([C@@H](C)O)N YJCVECXVYHZOBK-KNZXXDILSA-N 0.000 description 30
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 30
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 29
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 29
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 29
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 29
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 29
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 29
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 29
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 28
- GXMXPCXXKVWOSM-KQXIARHKSA-N Glu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N GXMXPCXXKVWOSM-KQXIARHKSA-N 0.000 description 28
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 28
- GNNJKUYDWFIBTK-QWRGUYRKSA-N Gly-Tyr-Asp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O GNNJKUYDWFIBTK-QWRGUYRKSA-N 0.000 description 28
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 28
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 28
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 28
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 28
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 28
- 108010078144 glutaminyl-glycine Proteins 0.000 description 28
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 27
- 108010065920 Insulin Lispro Proteins 0.000 description 27
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 27
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 27
- 108010005233 alanylglutamic acid Proteins 0.000 description 27
- 125000003275 alpha amino acid group Chemical group 0.000 description 27
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 26
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 26
- WKXVAXOSIPTXEC-HAFWLYHUSA-N Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O WKXVAXOSIPTXEC-HAFWLYHUSA-N 0.000 description 26
- XRGIDCGRSSWCKE-SRVKXCTJSA-N Pro-Val-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O XRGIDCGRSSWCKE-SRVKXCTJSA-N 0.000 description 26
- 239000012634 fragment Substances 0.000 description 26
- 108010017391 lysylvaline Proteins 0.000 description 26
- 108010070643 prolylglutamic acid Proteins 0.000 description 26
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 25
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 25
- GNRPTBRHRRZCMA-RWMBFGLXSA-N Leu-Met-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N GNRPTBRHRRZCMA-RWMBFGLXSA-N 0.000 description 25
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 25
- GRQCSEWEPIHLBI-JQWIXIFHSA-N Trp-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-JQWIXIFHSA-N 0.000 description 25
- 108010054155 lysyllysine Proteins 0.000 description 25
- 108010029020 prolylglycine Proteins 0.000 description 25
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 24
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 24
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 24
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 24
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 24
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 24
- OWQKBXKXZFRRQL-XGEHTFHBSA-N Thr-Met-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N)O OWQKBXKXZFRRQL-XGEHTFHBSA-N 0.000 description 24
- 108010087823 glycyltyrosine Proteins 0.000 description 24
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 23
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 23
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 23
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 23
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 23
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 23
- HOLJKDOBVJDHCA-DCAQKATOSA-N Met-His-Cys Chemical compound N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(O)=O HOLJKDOBVJDHCA-DCAQKATOSA-N 0.000 description 23
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 23
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 23
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 23
- DOFAQXCYFQKSHT-SRVKXCTJSA-N Val-Pro-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DOFAQXCYFQKSHT-SRVKXCTJSA-N 0.000 description 23
- MIIVFRCYJABHTQ-ONGXEEELSA-N Gly-Leu-Val Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O MIIVFRCYJABHTQ-ONGXEEELSA-N 0.000 description 22
- LKJCZEPXHOIAIW-HOTGVXAUSA-N Gly-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)CN LKJCZEPXHOIAIW-HOTGVXAUSA-N 0.000 description 22
- HZYHBDVRCBDJJV-HAFWLYHUSA-N Ile-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O HZYHBDVRCBDJJV-HAFWLYHUSA-N 0.000 description 22
- ISSAURVGLGAPDK-KKUMJFAQSA-N Leu-Tyr-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O ISSAURVGLGAPDK-KKUMJFAQSA-N 0.000 description 22
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 22
- 238000009396 hybridization Methods 0.000 description 22
- 239000002609 medium Substances 0.000 description 22
- 108010025488 pinealon Proteins 0.000 description 22
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 22
- XWIBVSAEUCAAKF-GVXVVHGQSA-N Gln-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N XWIBVSAEUCAAKF-GVXVVHGQSA-N 0.000 description 21
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 21
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 21
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 21
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 21
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 21
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 21
- ZSXJENBJGRHKIG-UWVGGRQHSA-N Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UWVGGRQHSA-N 0.000 description 21
- DJIJBQYBDKGDIS-JYJNAYRXSA-N Tyr-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O DJIJBQYBDKGDIS-JYJNAYRXSA-N 0.000 description 21
- 108010056582 methionylglutamic acid Proteins 0.000 description 21
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 20
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 20
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 20
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 20
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 20
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 20
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 20
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 20
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 20
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 20
- 108010089804 glycyl-threonine Proteins 0.000 description 20
- GBSUGIXJAAKZOW-GMOBBJLQSA-N Asp-Ile-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GBSUGIXJAAKZOW-GMOBBJLQSA-N 0.000 description 19
- 241000282326 Felis catus Species 0.000 description 19
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- MMPBPRXOFJNCCN-ZEWNOJEFSA-N Phe-Tyr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MMPBPRXOFJNCCN-ZEWNOJEFSA-N 0.000 description 19
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 19
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 19
- 241000589158 Agrobacterium Species 0.000 description 18
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 18
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 18
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 18
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 18
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 18
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 18
- 108010093581 aspartyl-proline Proteins 0.000 description 18
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 18
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 17
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 17
- 230000001965 increasing effect Effects 0.000 description 17
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 16
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 16
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 16
- IIVZNQCUUMBBKF-GVXVVHGQSA-N His-Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 IIVZNQCUUMBBKF-GVXVVHGQSA-N 0.000 description 16
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 16
- AVIQBBOOTZENLH-KKUMJFAQSA-N Tyr-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AVIQBBOOTZENLH-KKUMJFAQSA-N 0.000 description 16
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 16
- 210000002257 embryonic structure Anatomy 0.000 description 16
- 241000588724 Escherichia coli Species 0.000 description 15
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 15
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 15
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 15
- 239000000523 sample Substances 0.000 description 15
- YVHCULPWZYVJEK-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-[(2-aminoacetyl)amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 YVHCULPWZYVJEK-IHRRRGAJSA-N 0.000 description 14
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 14
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 14
- MHHUEAIBJZWDBH-YUMQZZPRSA-N Gly-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN MHHUEAIBJZWDBH-YUMQZZPRSA-N 0.000 description 14
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 14
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 14
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 14
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 14
- 230000012010 growth Effects 0.000 description 14
- 108010026333 seryl-proline Proteins 0.000 description 14
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 13
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 13
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 13
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 13
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 12
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 12
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 12
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 12
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 12
- UETQMSASAVBGJY-QWRGUYRKSA-N Lys-Gly-His Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 UETQMSASAVBGJY-QWRGUYRKSA-N 0.000 description 12
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 12
- 230000035772 mutation Effects 0.000 description 12
- 238000012546 transfer Methods 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 11
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 11
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 11
- 229910021529 ammonia Inorganic materials 0.000 description 11
- 108010079547 glutamylmethionine Proteins 0.000 description 11
- 238000003752 polymerase chain reaction Methods 0.000 description 11
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 10
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 10
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 10
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 10
- 102100022874 Dexamethasone-induced Ras-related protein 1 Human genes 0.000 description 10
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 10
- QMOSCLNJVKSHHU-YUMQZZPRSA-N Glu-Met-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QMOSCLNJVKSHHU-YUMQZZPRSA-N 0.000 description 10
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 10
- 101000620808 Homo sapiens Dexamethasone-induced Ras-related protein 1 Proteins 0.000 description 10
- 101000830956 Homo sapiens Three-prime repair exonuclease 1 Proteins 0.000 description 10
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 10
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 10
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- MCDVZTRGHNXTGK-HJGDQZAQSA-N Thr-Met-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O MCDVZTRGHNXTGK-HJGDQZAQSA-N 0.000 description 10
- QPZMOUMNTGTEFR-ZKWXMUAHSA-N Val-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N QPZMOUMNTGTEFR-ZKWXMUAHSA-N 0.000 description 10
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 10
- 108010041407 alanylaspartic acid Proteins 0.000 description 10
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 9
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 9
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 9
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 9
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 9
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 9
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 238000002703 mutagenesis Methods 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- 239000002245 particle Substances 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 8
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 8
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 8
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 8
- RVGMVLVBDRQVKB-UWVGGRQHSA-N Gly-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN RVGMVLVBDRQVKB-UWVGGRQHSA-N 0.000 description 8
- BSVLMPMIXPQNKC-KBPBESRZSA-N His-Phe-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O BSVLMPMIXPQNKC-KBPBESRZSA-N 0.000 description 8
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 8
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 8
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 8
- 210000003763 chloroplast Anatomy 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 7
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 7
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 7
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 7
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 7
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 7
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 7
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 7
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 7
- KTGFOCFYOZQVRJ-ZKWXMUAHSA-N Ile-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O KTGFOCFYOZQVRJ-ZKWXMUAHSA-N 0.000 description 7
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 7
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 7
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 7
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 7
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 7
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 7
- 230000004071 biological effect Effects 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 6
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 6
- 108010076441 Ala-His-His Proteins 0.000 description 6
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 6
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 6
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 6
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 6
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 6
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 6
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 6
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 6
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 6
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 6
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 6
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 6
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 6
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 6
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 6
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 6
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 6
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 6
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 6
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 108010049041 glutamylalanine Proteins 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 229930182817 methionine Natural products 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 108010061238 threonyl-glycine Proteins 0.000 description 6
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 5
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 5
- 239000002028 Biomass Substances 0.000 description 5
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 5
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 5
- 239000005562 Glyphosate Substances 0.000 description 5
- 206010020649 Hyperkeratosis Diseases 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- AWJGUZSYVIVZGP-YUMQZZPRSA-N Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 AWJGUZSYVIVZGP-YUMQZZPRSA-N 0.000 description 5
- 108091081024 Start codon Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 235000013399 edible fruits Nutrition 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 235000013922 glutamic acid Nutrition 0.000 description 5
- 239000004220 glutamic acid Substances 0.000 description 5
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 5
- 229940097068 glyphosate Drugs 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 238000002844 melting Methods 0.000 description 5
- 230000008018 melting Effects 0.000 description 5
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 5
- 239000013600 plasmid vector Substances 0.000 description 5
- 239000013615 primer Substances 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 4
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 4
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 4
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 4
- KQBVNNAPIURMPD-PEFMBERDSA-N Asp-Ile-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KQBVNNAPIURMPD-PEFMBERDSA-N 0.000 description 4
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 4
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 4
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 4
- SCHZQZPYHBWYEQ-PEFMBERDSA-N Ile-Asn-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SCHZQZPYHBWYEQ-PEFMBERDSA-N 0.000 description 4
- BBIXOODYWPFNDT-CIUDSAMLSA-N Ile-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O BBIXOODYWPFNDT-CIUDSAMLSA-N 0.000 description 4
- 108020005350 Initiator Codon Proteins 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 4
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 4
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 4
- KRLKICLNEICJGV-STQMWFEESA-N Met-Phe-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 KRLKICLNEICJGV-STQMWFEESA-N 0.000 description 4
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 4
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 244000062793 Sorghum vulgare Species 0.000 description 4
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 4
- PDSLRCZINIDLMU-QWRGUYRKSA-N Tyr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PDSLRCZINIDLMU-QWRGUYRKSA-N 0.000 description 4
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 4
- 229930195712 glutamate Natural products 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 230000002018 overexpression Effects 0.000 description 4
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 230000000392 somatic effect Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000032258 transport Effects 0.000 description 4
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 4
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 3
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 3
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 3
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 3
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 3
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 3
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 3
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 3
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 3
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 3
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 3
- NTQDELBZOMWXRS-IWGUZYHVSA-N Asp-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O NTQDELBZOMWXRS-IWGUZYHVSA-N 0.000 description 3
- 241000701489 Cauliflower mosaic virus Species 0.000 description 3
- XZFYRXDAULDNFX-UWVGGRQHSA-N Cys-Phe Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UWVGGRQHSA-N 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 3
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 3
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 3
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 3
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 3
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 3
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 3
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 3
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 3
- 240000004658 Medicago sativa Species 0.000 description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 3
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 3
- KAKJTZWHIUWTTD-VQVTYTSYSA-N Met-Thr Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)O)C([O-])=O KAKJTZWHIUWTTD-VQVTYTSYSA-N 0.000 description 3
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 3
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 3
- AJCRQOHDLCBHFA-SRVKXCTJSA-N Pro-His-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AJCRQOHDLCBHFA-SRVKXCTJSA-N 0.000 description 3
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 3
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 3
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 3
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 3
- BXLYSRPHVMCOPS-ACZMJKKPSA-N Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO BXLYSRPHVMCOPS-ACZMJKKPSA-N 0.000 description 3
- 241000607715 Serratia marcescens Species 0.000 description 3
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 3
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- AAZOYLQUEQRUMZ-GSSVUCPTSA-N Thr-Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O AAZOYLQUEQRUMZ-GSSVUCPTSA-N 0.000 description 3
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- JFDZBHWFFUWGJE-UHFFFAOYSA-N benzonitrile Chemical compound N#CC1=CC=CC=C1 JFDZBHWFFUWGJE-UHFFFAOYSA-N 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 230000007850 degeneration Effects 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- STKYPAFSDFAEPH-LURJTMIESA-N glycylvaline Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 210000003463 organelle Anatomy 0.000 description 3
- 230000029553 photosynthesis Effects 0.000 description 3
- 238000010672 photosynthesis Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 239000012882 rooting medium Substances 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 2
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 2
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- NUHQMYUWLUSRJX-BIIVOSGPSA-N Asn-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N NUHQMYUWLUSRJX-BIIVOSGPSA-N 0.000 description 2
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 2
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 2
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 235000013162 Cocos nucifera Nutrition 0.000 description 2
- 244000060011 Cocos nucifera Species 0.000 description 2
- 244000241257 Cucumis melo Species 0.000 description 2
- WVJHEDOLHPZLRV-CIUDSAMLSA-N Cys-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N WVJHEDOLHPZLRV-CIUDSAMLSA-N 0.000 description 2
- WXOFKRKAHJQKLT-BQBZGAKWSA-N Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CS WXOFKRKAHJQKLT-BQBZGAKWSA-N 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- JHSRJMUJOGLIHK-GUBZILKMSA-N Glu-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N JHSRJMUJOGLIHK-GUBZILKMSA-N 0.000 description 2
- SITLTJHOQZFJGG-XPUUQOCRSA-N Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SITLTJHOQZFJGG-XPUUQOCRSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 2
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 2
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 2
- YJDALMUYJIENAG-QWRGUYRKSA-N Gly-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN)O YJDALMUYJIENAG-QWRGUYRKSA-N 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- NNBWMLHQXBTIIT-HVTMNAMFSA-N His-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N NNBWMLHQXBTIIT-HVTMNAMFSA-N 0.000 description 2
- ZYDYEPDFFVCUBI-SRVKXCTJSA-N His-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZYDYEPDFFVCUBI-SRVKXCTJSA-N 0.000 description 2
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 2
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 2
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 2
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- HFKJBCPRWWGPEY-BQBZGAKWSA-N L-arginyl-L-glutamic acid Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HFKJBCPRWWGPEY-BQBZGAKWSA-N 0.000 description 2
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 2
- NTISAKGPIGTIJJ-IUCAKERBSA-N Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(C)C NTISAKGPIGTIJJ-IUCAKERBSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- PBOUVYGPDSARIS-IUCAKERBSA-N Met-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C PBOUVYGPDSARIS-IUCAKERBSA-N 0.000 description 2
- NDJSSFWDYDUQID-YTWAJWBKSA-N Met-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N)O NDJSSFWDYDUQID-YTWAJWBKSA-N 0.000 description 2
- BJFJQOMZCSHBMY-YUMQZZPRSA-N Met-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O BJFJQOMZCSHBMY-YUMQZZPRSA-N 0.000 description 2
- 240000005561 Musa balbisiana Species 0.000 description 2
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 239000002033 PVDF binder Substances 0.000 description 2
- 241000364057 Peoria Species 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 2
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 2
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 2
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 2
- RYQWALWYQWBUKN-FHWLQOOXSA-N Phe-Phe-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RYQWALWYQWBUKN-FHWLQOOXSA-N 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- GLEOIKLQBZNKJZ-WDSKDSINSA-N Pro-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GLEOIKLQBZNKJZ-WDSKDSINSA-N 0.000 description 2
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 2
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- LPGSNRSLPHRNBW-AVGNSLFASA-N Pro-His-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 LPGSNRSLPHRNBW-AVGNSLFASA-N 0.000 description 2
- 241000209056 Secale Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 229940100389 Sulfonylurea Drugs 0.000 description 2
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 2
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- YTYHAYZPOARHAP-HOCLYGCPSA-N Trp-Lys-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N YTYHAYZPOARHAP-HOCLYGCPSA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 2
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 2
- QJKMCQRFHJRIPU-XDTLVQLUSA-N Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QJKMCQRFHJRIPU-XDTLVQLUSA-N 0.000 description 2
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 2
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 2
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 101150103518 bar gene Proteins 0.000 description 2
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 2
- 229960003669 carbenicillin Drugs 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 244000038559 crop plants Species 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000007824 enzymatic assay Methods 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 239000003337 fertilizer Substances 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 210000002288 golgi apparatus Anatomy 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000000749 insecticidal effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- JKQOBWVOAYFWKG-UHFFFAOYSA-N molybdenum trioxide Chemical compound O=[Mo](=O)=O JKQOBWVOAYFWKG-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000003204 osmotic effect Effects 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 230000010152 pollination Effects 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- 230000001323 posttranslational effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 229960002429 proline Drugs 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000004114 suspension culture Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- JYEUMXHLPRZUAT-UHFFFAOYSA-N 1,2,3-triazine Chemical compound C1=CN=NN=C1 JYEUMXHLPRZUAT-UHFFFAOYSA-N 0.000 description 1
- JIHQDMXYYFUGFV-UHFFFAOYSA-N 1,3,5-triazine Chemical compound C1=NC=NC=N1 JIHQDMXYYFUGFV-UHFFFAOYSA-N 0.000 description 1
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 1
- NDUPDOJHUQKPAG-UHFFFAOYSA-M 2,2-Dichloropropanoate Chemical compound CC(Cl)(Cl)C([O-])=O NDUPDOJHUQKPAG-UHFFFAOYSA-M 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- SXERGJJQSKIUIC-UHFFFAOYSA-N 2-Phenoxypropionic acid Chemical class OC(=O)C(C)OC1=CC=CC=C1 SXERGJJQSKIUIC-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 1
- GCTANJIJJROSLH-GVARAGBVSA-N Ala-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C)N GCTANJIJJROSLH-GVARAGBVSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- JTWOBPNAVBESFW-FXQIFTODSA-N Arg-Cys-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N JTWOBPNAVBESFW-FXQIFTODSA-N 0.000 description 1
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- HXWUJJADFMXNKA-BQBZGAKWSA-N Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O HXWUJJADFMXNKA-BQBZGAKWSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 1
- UEFODXNXUAVPTC-VEVYYDQMSA-N Asp-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UEFODXNXUAVPTC-VEVYYDQMSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 1
- 229920002799 BoPET Polymers 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 241000220243 Brassica sp. Species 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 241000701248 Chlorella virus Species 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- PJRXVIJAERNUIP-GSVOUGTGSA-N D-gamma-glutamyl phosphate Chemical compound OC(=O)[C@H](N)CCC(=O)OP(O)(O)=O PJRXVIJAERNUIP-GSVOUGTGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 229920002148 Gellan gum Polymers 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- MWERYIXRDZDXOA-QEWYBTABSA-N Gln-Ile-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MWERYIXRDZDXOA-QEWYBTABSA-N 0.000 description 1
- MRVYVEQPNDSWLH-XPUUQOCRSA-N Gln-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O MRVYVEQPNDSWLH-XPUUQOCRSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- JGHNIWVNCAOVRO-DCAQKATOSA-N Glu-His-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGHNIWVNCAOVRO-DCAQKATOSA-N 0.000 description 1
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- SXGAGTVDWKQYCX-BQBZGAKWSA-N Glu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O SXGAGTVDWKQYCX-BQBZGAKWSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- UPADCCSMVOQAGF-LBPRGKRZSA-N Gly-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)CN)C(O)=O)=CNC2=C1 UPADCCSMVOQAGF-LBPRGKRZSA-N 0.000 description 1
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- BXDLTKLPPKBVEL-FJXKBIBVSA-N Gly-Thr-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O BXDLTKLPPKBVEL-FJXKBIBVSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- WEIYKCOEVBUJQC-JYJNAYRXSA-N His-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WEIYKCOEVBUJQC-JYJNAYRXSA-N 0.000 description 1
- CTJHHEQNUNIYNN-SRVKXCTJSA-N His-His-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O CTJHHEQNUNIYNN-SRVKXCTJSA-N 0.000 description 1
- CTGZVVQVIBSOBB-AVGNSLFASA-N His-His-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O CTGZVVQVIBSOBB-AVGNSLFASA-N 0.000 description 1
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 1
- CNHSMSFYVARZLI-YJRXYDGGSA-N His-His-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CNHSMSFYVARZLI-YJRXYDGGSA-N 0.000 description 1
- XDIVYNSPYBLSME-DCAQKATOSA-N His-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N XDIVYNSPYBLSME-DCAQKATOSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- CGAMSLMBYJHMDY-ONGXEEELSA-N His-Val-Gly Chemical compound CC(C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N CGAMSLMBYJHMDY-ONGXEEELSA-N 0.000 description 1
- QLBXWYXMLHAREM-PYJNHQTQSA-N His-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N QLBXWYXMLHAREM-PYJNHQTQSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 244000267823 Hydrangea macrophylla Species 0.000 description 1
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- ATXGFMOBVKSOMK-PEDHHIEDSA-N Ile-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N ATXGFMOBVKSOMK-PEDHHIEDSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- UCGDDTHMMVWVMV-FSPLSTOPSA-N Ile-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(O)=O UCGDDTHMMVWVMV-FSPLSTOPSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- LRKCBIUDWAXNEG-CSMHCCOUSA-N Leu-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRKCBIUDWAXNEG-CSMHCCOUSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241000290142 Lotus berthelotii Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- JPNRPAJITHRXRH-BQBZGAKWSA-N Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O JPNRPAJITHRXRH-BQBZGAKWSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 1
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 1
- IRVONVRHHJXWTK-RWMBFGLXSA-N Met-Lys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N IRVONVRHHJXWTK-RWMBFGLXSA-N 0.000 description 1
- ZYTPOUNUXRBYGW-YUMQZZPRSA-N Met-Met Chemical compound CSCC[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CCSC ZYTPOUNUXRBYGW-YUMQZZPRSA-N 0.000 description 1
- WSPQHZOMTFFWGH-XGEHTFHBSA-N Met-Thr-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(O)=O WSPQHZOMTFFWGH-XGEHTFHBSA-N 0.000 description 1
- IHRFZLQEQVHXFA-RHYQMDGZSA-N Met-Thr-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCCN IHRFZLQEQVHXFA-RHYQMDGZSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 239000012901 Milli-Q water Substances 0.000 description 1
- 235000016462 Mimosa pudica Nutrition 0.000 description 1
- 240000001140 Mimosa pudica Species 0.000 description 1
- 239000005041 Mylar™ Substances 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 244000230712 Narcissus tazetta Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 102000004270 Peptidyl-Dipeptidase A Human genes 0.000 description 1
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- HTKNPQZCMLBOTQ-XVSYOHENSA-N Phe-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O HTKNPQZCMLBOTQ-XVSYOHENSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 1
- RFCVXVPWSPOMFJ-STQMWFEESA-N Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RFCVXVPWSPOMFJ-STQMWFEESA-N 0.000 description 1
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 1
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 102220465565 Putative uncharacterized protein OBSCN-AS1_E82D_mutation Human genes 0.000 description 1
- 101000702488 Rattus norvegicus High affinity cationic amino acid transporter 1 Proteins 0.000 description 1
- 241000208422 Rhododendron Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- HZNFKPJCGZXKIC-DCAQKATOSA-N Ser-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N HZNFKPJCGZXKIC-DCAQKATOSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- LDEBVRIURYMKQS-WISUUJSJSA-N Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO LDEBVRIURYMKQS-WISUUJSJSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 1
- 241001655322 Streptomycetales Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- CGCMNOIQVAXYMA-UNQGMJICSA-N Thr-Met-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CGCMNOIQVAXYMA-UNQGMJICSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- GFHYISDTIWZUSU-QWRGUYRKSA-N Tyr-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GFHYISDTIWZUSU-QWRGUYRKSA-N 0.000 description 1
- BARBHMSSVWPKPZ-IHRRRGAJSA-N Tyr-Asp-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BARBHMSSVWPKPZ-IHRRRGAJSA-N 0.000 description 1
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- NXPDPYYCIRDUHO-ULQDDVLXSA-N Tyr-Val-His Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 NXPDPYYCIRDUHO-ULQDDVLXSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- UPJONISHZRADBH-XPUUQOCRSA-N Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O UPJONISHZRADBH-XPUUQOCRSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 238000010876 biochemical test Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 102220415467 c.242T>C Human genes 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 229910000366 copper(II) sulfate Inorganic materials 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- ZPWVASYFFYYZEW-UHFFFAOYSA-L dipotassium hydrogen phosphate Chemical compound [K+].[K+].OP([O-])([O-])=O ZPWVASYFFYYZEW-UHFFFAOYSA-L 0.000 description 1
- 235000019797 dipotassium phosphate Nutrition 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 244000013123 dwarf bean Species 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 229930182833 estradiol Natural products 0.000 description 1
- 229960005309 estradiol Drugs 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 125000002642 gamma-glutamyl group Chemical group 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 150000002306 glutamic acid derivatives Chemical class 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 150000002307 glutamic acids Chemical class 0.000 description 1
- 150000002308 glutamine derivatives Chemical class 0.000 description 1
- 108010064177 glutamine synthetase I Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010085109 glycyl-histidyl-arginyl-proline Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 235000021331 green beans Nutrition 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000002879 macerating effect Effects 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002923 metal particle Substances 0.000 description 1
- 108010022588 methionyl-lysyl-proline Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 125000001476 phosphono group Chemical group [H]OP(*)(=O)O[H] 0.000 description 1
- 230000005097 photorespiration Effects 0.000 description 1
- 231100000208 phytotoxic Toxicity 0.000 description 1
- 230000000885 phytotoxic effect Effects 0.000 description 1
- 230000005080 plant death Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 230000001863 plant nutrition Effects 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001012 protector Effects 0.000 description 1
- 239000011546 protein dye Substances 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- -1 pyridinoxy Chemical group 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 102220313179 rs1553259785 Human genes 0.000 description 1
- 102220005514 rs3180281 Human genes 0.000 description 1
- 102220005516 rs35993097 Human genes 0.000 description 1
- 102200153918 rs41303733 Human genes 0.000 description 1
- 102220057738 rs730881360 Human genes 0.000 description 1
- 102220064016 rs797044572 Human genes 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 229910001961 silver nitrate Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- YSGSDAIMSCVPHG-UHFFFAOYSA-N valyl-methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)C(C)C YSGSDAIMSCVPHG-UHFFFAOYSA-N 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
- C12N15/8277—Phosphinotricin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
Abstract
POLINUCLEOTìDEO ISOLADO E POLIPEPTìDEO CONFERINDO RESISTêNCIA A GLUTAMINA SINTETASE E MéTODOS PARA PRODUZIR PLANTAS E CéLULAS VEGETAIS TRANSGêNICAS APRESENTANDO PRODUçãO E UTILIZAçãO DE NITROGêNIO MELHORADAS. São providos composições e métodos para conferir resistência a herbicidas e melhorar a utilização de nitrogênio de bactérias, plantas, células vegetais, tecidos e sementes. Composições compreendendo uma seqüência codificadora para um polipeptídeo que confere resistência ou tolerância a inibidores de glutamina sintetase herbicidas são providas. As sequências codificadoras podem ser usadas em construções de DNA ou cassetes de expressão para transformação e expressão em plantas. Composições também compreendem bactérias, plantas, células, tecidos e sementes vegetais transformadas. Em particular, polinucleotídeos isolados correspondendo a polinucleotídeos resistentes a inibidor de glutamina sintetase herbicida são providos. Adicionalmente, polipeptídeos correspondendo aos polinucleotídeos são englobados. Em particular, a presente invenção provê polinucleotídeos isolados compreendendo um variante de SEQ ID NO: 1, caracterizado pelo fato do polinucleotídeo variante codificar um polipeptídeo que é resistente a inibição por inibidor de glutamina sintetase herbicida.
Description
POLINUCLEOTIDEO ISOLADO E POLIPEPTIDEO CONFERINDO RESISTÊNCIA A GLUTAMINA SINTETASE E MÉTODOS PARA PRODUZIR PLANTAS E CÉLULAS VEGETAIS TRANSGÊNICAS APRESENTANDO PRODUÇÃO E UTILIZAÇÃO DE NITROGÊNIO MELHORADAS
CAMPO DA INVENÇÃO
Esta invenção está relacionada a biologia molecular vegetal, particularmente a uma nova classe de enzimas glutamina sintetases que conferem resistência a inibidores de glutamina sintetase herbicidas.
FUNDAMENTOS DA INVENÇÃO
Plantas obtêm nitrogênio de seu ambiente na forma de compostos inorgânicos, conhecidos por nitrato e amônia retirado pelas raízes, e N2 atmosférico reduzido a amônia em nódulos de raiz fixadores de nitrogênio. A primeira etapa na assimilação de nitrogênio inorgânico na forma orgânica envolve predominantemente a incorporação de amônia com glutamato para formar glutamina, catalisada pela enzima glutamina sintetase.
Diversos herbicidas funcionam inibindo glutamina sintetase vegetal. Um exemplo típico de tal composto é o análogo de ácido glutâmico, glufosinato (ou fosfinotricina) . Vários desses herbicidas inibem a glutamina sintetase presente nas plantas de cultivo, assim como em ervas daninhas, limitando, dessa forma, o uso de tais compostos como glufosinato. Como a seletividade de herbicida é importante em qualquer herbicida comercialmente útil, seria de grande interesse ser capaz de conferir resistência em plantas selecionadas para tais herbicidas não seletivos como glufosinato, assim como a outros inibidores de glutamina sintetase herbicidas.
Enzimas que são resistentes a inibidores de glutamina sintetase herbicidas são conhecidas na técnica. Metiona sulfoximina (MSO), um análogo de glutamato, é um inibidor competitivo misturado de glutamina sintetase de folha de ervilha (Leason et al. (1982) Phytochemistry 21:855). Células de alfafa resistentes a fosfinotricina foram relatadas (Newmark (1983) Nature 305:383-384). A resistência foi devido à amplificação do gene de glutamina sintetase (Donn et al. (1984) Journal of Molecular and Applied Genetics 2: 621-635). 0 gene Bar, isolado de Streptomyces hygroscopicus, codifica a enzima fosfinotricina N-acetiltransferase (PAT). Este gene pode conferir resistência a herbicidas a base de glufosinato, já que PAT desintoxifica fosfinotricina por acetilação, o que produz um composto inativo.
Genes adicionais que são resistentes a inibidores de glutamina sintetase herbicidas são necessários onde a resistência é devido a uma mutação funcional na enzima glutamina sintetase, ao invés de uma amplificação ou inativação por acetilação da enzima. SUMÁRIO DA INVENÇÃO
Composições e métodos para conferir resistência a inibidores de glutamina sintetase herbicidas em plantas, células, tecidos e sementes vegetais são providos. Em um avanço, os polinucleotideos empregados nos vários métodos e composições conferem resistência a glufosinato. Composições incluem polinucleotideos codificando polipeptideos resistentes a inibidores de glutamina sintetase herbicidas, vetores compreendendo aqueles polinucleotideos, e células hospedeiras compreendendo os vetores. Composições compreendendo uma seqüência codificadora para um polipeptideo que confere resistência ou tolerância a inibidores de glutamina sintetase herbicidas são providas. Composições compreendendo uma seqüência codificadora para um polipeptideo que resulta em utilização melhorada de nitrogênio e/ou produção intensificada em uma planta são ainda providas. As seqüências codificadoras podem ser usadas em construções de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo microorganismos e plantas. As composições também compreendem bactérias, plantas, células, tecidos e sementes vegetais transformadas.
A presente invenção provê polinucleotideos isolados compreendendo SEQ ID NO: 1, assim como variantes da seqüência de polinucleotideos apresentada em SEQ ID N0:1, incluindo SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, ou a seqüência de nucleotídeos de glutamina sintetase em um hospedeiro bacteriano, como o No. de Acesso NRRL B-30930, depositado em 8 de junho de 2006 na Autoridade Depositária Intenacional da Coleção de Culturas de Pesquisas Agrícolas (Agricultural Research Culture Collection) (NRRL) International Depository Authority, 1815 N. University Street, Peoria, Illinois 61604 USA, e os polipeptideos correspondentes àqueles polinucleotideos. Em um avanço, Os polinucleotideos da presente invenção compreendem pelo menos uma modificação entre os aminoácidos 125 a 175 ou entre os aminoácidos 200 a 250 correspondentes à SEQ ID NO: 2, ou pelo menos uma modificação que resulte na perda de um sitio de adenilação.
DESCRIÇÃO DAS FIGURAS
As Figuras IA- IC mostram um alinhamento da seqüência de nucleotídeos dos variantes resistentes a herbicidas de glutamina sintetase, incluindo pAX3421ml (SEQ ID NO:4), pAX3422m2 (SEQ ID NO:6), pAX3427m3 (SEQ ID NO:8), pAX3428m4 (SEQ ID NO: 10), pAX3430m6 (SEQ ID NO: 12), pAX3431m7 (SEQ ID NO: 14), pAX3432m8 (SEQ ID NO: 16), pAX3433m9 (SEQ ID NO: 18), pAX3434ml0 (SEQ ID N0:20), pAX3435mll (SEQ ID NO: 22) , pAX3436ml2 (SEQ ID N0:24), pAX3437ml3 (SEQ ID NO: 26) , pAX3438ml4 (SEQ ID NO:28), pAX3426ml5 (SEQ ID NO: 30) e pAX3439ml6 (SEQ ID NO: 32) com a seqüência de aminoácidos agsl de tipo selvagem (SEQ ID NO:2).
DESCRIÇÃO DETALHADA DA INVENÇÃO I. Composições
Composições e métodos para conferir resistência ou tolerância a herbicidas, particularmente resistência ou tolerância a inibidores de glutamina sintetase herbicidas, em organismos são providos. Os métodos envolvem transformar organismos com polinucleotideos codificando um gene de tolerância a herbicidas que codifica um polipeptideo que é resistente aos inibidores de glutamina sintetase herbicidas. Em um avanço, os polinucleotideos codificam um gene de tolerância a herbicidas que codifica um polipeptideo que é resistente a inibição por glufosinato. Por gene de "resistência a herbicidas" ou "tolerância a herbicidas" da invenção pretende-se a seqüência de nucleotideos apresentada em SEQ ID NO: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, ou 47 e fragmentos e variantes desses que codificam um polipeptideo de resistência ou tolerância ao inibidor de glutamina sintetase (inibidor-GS). Da mesma forma, um polipeptideo de "resistência a herbicidas" ou "tolerância a herbicidas" da invenção é um polipeptideo tendo a seqüência de aminoácidos apresentada em SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, e fragmentos e variantes desses, que conferem resistência ou tolerância ao inibidor-GS em uma célula hospedeira. A presente invenção provê polinucleotideos isolados compreendendo variantes da seqüência de polinucleotideos apresentada em SEQ ID N0:1, caracterizado pelo fato de que os variantes codificam polipeptideos que são resistentes a inibidores de glutamina sintetase herbicidas. Em um avanço, os polinucleotideos da presente invenção codificam polipeptideos que compreendem pelo menos uma modificação entre os aminoácidos 125 a 175 ou pelo menos uma modificação entre os aminoácidos 200 a 250 correspondentes a SEQ ID NO:2. Para os propósitos da presente invenção, "modificação" deve significar uma mudança na seqüência de nucleotideos que resulte em uma mudança no polipeptideo codificado. Uma modificação pode englobar também uma substituição de um aminoácido por outro aminoácido em uma seqüência polipeptidica. Por "correspondente a" pretende-se que as posições de aminoácidos mencionadas estejam relacionadas com as posições de aminoácidos designadas em SEQ ID NO:2, e que as substituições correspondentes a essas posições de aminoácidos podem ser encontradas em seqüências variantes quando essas seqüências variantes estão alinhadas com SEQ ID NO:2 usando métodos de alinhamento padrão.
Um plasmideo contendo a seqüência de nucleotideos de resistência a herbicidas da invenção foi depositado na coleção permanente da Coleção de Cultura do Serviço de Pesquisa Agrícola (Agricultural Research Service Culture Collection) , Northern Regional Research Laboratory (NRRL), 1815 North University Street, Peoria, Illinois 61604, Estados Unidos da America, em 8 de junho de 2006, e designado com o No. de Acesso B-30930. Este depósito será mantido sob os termos do Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microorganismos para os Propósitos de Procedimentos de Patentes (International Recognition of the Deposit of Microorganisms for the Purposes of Patent Procedure). Este depósito foi feito meramente como conveniência para aqueles especialistas na técnica e não é uma admissão de que um depósito é necessário sob 35 U.S.C. §112.
A definição da enzima "glutamina sintetase," ou "glutamina sintase" é funcional e inclui qualquer glutamina sintetase capaz de funcionar em um dado hospedeiro desejado, especialmente uma bactéria ou planta, para converter ácido glutâmico para glutamina. 0 termo, portanto, inclui não apenas a enzima da espécie de planta em particular envolvida na transformação, mas pode incluir glutamina sintetase de outra espécie vegetal ou microrganismos, se tal glutamina sintetase é capaz de funcionar na planta transformada ou células bacterianas.
0 termo "inibidor de glutamina sintetase herbicida" ou "inibidor de glutamina sintase herbicida" deve incluir qualquer inibidor, competitivo ou não competitivo, que diminua significativamente a atividade de glutamina sintetase de uma célula vegetal de uma determinada espécie e, como conseqüência disso, cause efeitos herbicidas na célula vegetal. Exemplos de inibidores de glutamina sintetase são glufosinato, fosfinotricina, metionina sulfoximina, assim como outros análogos de ácido glutâmico.
O termo "glufosinato" denota o composto conhecido, em sua forma biologicamente ativa. Pode estar presente em qualquer forma enantiomérica, e pode estar sozinho ou em combinação com outros compostos inertes ou ativos que não interferem com atividade de glufosinato.
A. Glutamina sintetase
Na presente invenção, a classe de enzimas que confere resistência a herbicidas é glutamina sintetase (GS). 0 termo "glutamina sintetase" ou "glutamina sintase" ou "GS", como aqui usado, refere-se tanto a glutamina sintetase nativa ou a um variante ou fragmento dessa.
Glutamina sintetase é uma enzima chave no metabolismo de nitrogênio; possui funções duplas em duas reações bioquímicas essenciais, assimilação de amônia e biossíntese de glutamina. A glutamina produzida por GS é essencial para a síntese de proteínas, e seu nitrogênio da amida é doado para sintetizar vários metabólitos essenciais.
A forma comum de GS é uma enzima duodecamérica com subunidades idênticas de aproximadamente 55 kDa, codificada por glnA. A estrutura cristal desta enzima revelou que é composta de 12 subunidades idênticas arranjadas como dois anéis hexagonais superpostos que são mantidos juntos tanto por interações hidrofóbicas e pontes de hidrogêncio entre as subunidades. (Yamashita et al. (1989) J. Biol. Chem. 264: 17681-17690). Glutamina sintetase catalisa a formação de glutamina a partir de glutamato e amônia em uma reação dependente de ATP. Ela também catalisa a transferência de gama-glutamil de glutamina para hidroxilamina produzindo gama-glutamilhidroximato (Stadtman et al. (1974) in The Enzymes (Boyer, ed.) 3:755-807 (Academic Press, New York).
A catálise de glutamina sintetase envolve a formação inicial de um intermediário gama-glutamil fosfato, seguido pelo deslocamento do grupamento fosfato ativado por amônio através da formação de um intermediário fosforilado tetraédrico. Em E. coli, os resíduos de Asp50 e Glu327 altamente conservados formam um bolso de ligação negativamente carregado que constitui o sítio de ligação de amônia (Liaw et al. (1995) Protein Sei. 4:2358-2365).
Numerosos inibidores potentes que imitam a geometria do intermediário tetraédrico são conhecidos para glutamina sintetase, incluindo glufosinato (ou fosfinotricina (PPT)) a L-metionina-DL-sulfoximida (MSX). A fosforilação de MSX e glufosinato é similar à fosforilação de glutamato na primeira etapa da reação enzimática normal de glutamina sintetase, e é necessária para que a inibição irreversível ocorra (Crespo et al. (1999) Eur. J. Biochem. 266:1202- 1209). Em plantas, a inibição de glutamina sintetase resulta em uma preparação de amônia fitotóxica e uma falta de aminoácidos essenciais, e uma inibição de fotorrespiração e fotossíntese e, por fim, morte da planta. Glufosinato é um composto natural isolado a partir de duas espécies de fungos Streptomicetos que inibe a atividade de glutamina sintetase. A aplicação de glufosinato resulta em níveis de glutamina reduzidos e um aumento correspondente em concentrações de amônia em tecidos vegetais, levando ao rompimento da membrana celular e interrupção de fotossíntese, resultando no ressecamento e morte da planta. Um número de análogos de glufosinato que inibem a glutamina sintetase vegetal é conhecido na técnica. Ver, por exemplo, Berlicki et al. (2005) J. Med. Chem. 48(20): 6340-6349 e Forlani et al. (2006) J. Agric. Food Chem. 54(3): 796-802; cada qual é aqui incorporada por referência em sua íntegra.
B. Glutamina sintetase resistente a herbicidas
Resistência a L-fosfinotricina foi relatada em células de alfafa, após uma seleção passo a passo em níveis crescentes de L-PPT, resultando na amplificação gênica (Donn et al. (1984) J. Mol. Appl. Genet. 2:621), e pela introdução em plantas de tabaco, batata e tomate, via transformação mediada por Agrobacterium do gene Bar, que codifica fosfinotricina acetiltransferase (PAT), uma enzima desintoxificadora (De Block et al. (1987) EMBOJ. 6:2513). Mutantes de enzimas glutamina sintetase vegetais que são resistentes a fosfinotricina são descritos em Patente U.S. No. 5.145.777. Esses mutantes conferem resistência pela super-expressão de glutamina sintetase. C. Atividade de glutamina sintetase
Uma variedade de métodos pode ser usada para medir a atividade de glutamina sintetase. Ver, por exemplo, Crespo et al. (1999) Eur. J. Biochem. 266:1202-1209, Gawronski et al. (2004) Anai. Biochem. 327:114-118, e Patente U.S. Nos. 5.098.838 e 5.145.777, cada qual é aqui incorporada por referência em sua integra. A atividade pode ser medida usando polipeptideos glutamina sintetase purificados, ou testando a habilidade de organismos transformados com os polinucleotideos da invenção para crescer na presença de inibidores de glutamina sintetase herbicidas.
D. Polinucleotideos isolados, e variantes e fragmentos desses
Em alguns avanços, a presente invenção compreende polinucleotideos isolados ou recombinantes codificando polipeptideos que são resistentes a inibidores de glutamina sintetase herbicidas. Um polinucleotideo ou polipeptideo "isolado" ou "purificado", ou porção biologicamente ativa, é substancialmente livre de outro material celular, ou meio de cultura quando produzido por técnicas recombinantes, ou substancialmente livre de precursores químicos ou outros químicos quando quimicamente sintetizado. Por "biologicamente ativo" pretende-se possuir a atividade biológica desejada do polipeptideo nativo, isto é, resistência a inibidores de glutamina sintetase herbicidas. Um polinucleotideo "isolado" pode ser livre de seqüências (por exemplo, seqüências codificando proteínas) que naturalmente flanqueiam o ácido nucléico (i.e., seqüências localizadas nas extremidades 5' e 3' do ácido nucléico) no DNA genômico do organismo do qual o polinucleotideo é derivado. Pra propósitos da invenção, "isolado" quando usado para referir-se a polinucleotídeos exclui cromossomos isolados. Por exemplo, em vários avanços, o polinucleotideo isolado codificando resistência a glifosato pode conter menos de cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb, ou 0,1 kb de seqüência de nucleotídeos que naturalmente flanqueiam o polinucleotideo no DNA genômico da célula da qual o polinucleotideo é derivado.
A presente invenção contempla ainda variantes e fragmentos dos polinucleotídeos aqui descritos. Um "fragmento" de um polinucleotideo pode codificar uma porção biologicamente ativa de um polipeptídeo, ou pode ser um fragmento que pode ser usado como uma sonda de hibridização ou primer de PCR usando métodos aqui descritos em outra parte. Polinucleotídeos que são fragmentos de um polinucleotideo compreendem pelo menos cerca de 15, 20, 50, 75, 100, 200, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400 nucleotídeos contíguos, ou até o número de nucleotídeos presentes em polinucleotideo de comprimento total aqui descrito. Por nucleotídeos "contíguos" entende-se que são resíduos de nucleotídeos que são imediatamente adjacentes um ao outro.
Fragmentos dos polinucleotídeos da presente invenção geralmente codificarão fragmentos de polipeptídeos que retêm a atividade biológica da proteína de comprimento total de resistência a herbicidas; i.e., resistência a inibidores de glutamina sintetase herbicidas. Por "retém a atividade de resistência a herbicidas" pretende-se que o fragmento tenha pelo menos cerca de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, ou pelo menos cerca de 80% da atividade de resistência a herbicidas da proteína de comprimento total de resistência a herbicidas aqui descrita como SEQ ID NO: 6. Métodos para medir a atividade de resistência a herbicidas são bem conhecidos na técnica. Ver, por exemplo, Patente U.S. Nos. 5.098.838 e 5.145.777, cada qual é aqui incorporada por referência em sua íntegra. Atividade pode também referir-se à atividade enzimática da enzima glutamina sintetase como aqui descrito em outra parte.
Um fragmento de um polinucleotídeo que codifica uma porção biologicamente ativa de um polipeptídeo da invenção codificará pelo menos cerca de 15, 25, 30, 50, 75, 100, 1 25, 150, 175 , 2 0 0 , 2 5 0 , 300, 350 , 400, 450 aminoácidos contíguos, ou até o número total de aminoácidos presentes em um polipeptídeo de comprimento total da invenção. A invenção também engloba polinucleotideos variantes. "Variantes" do polinucleotideo incluem aquelas seqüências que codificam os polipeptideos aqui descritos, mas que diferem conservativamente por causa da degeneração do código genético, assim como aquele que são suficientemente idênticos. 0 termo "suficientemente idêntico" deve significar um polipeptideo ou seqüência de polinucleotideos que possui pelo menos cerca de 60% ou 65% de identidade de seqüência, cerca de 70% ou 75% de identidade de seqüência, cerca de 80% ou 85% de identidade de seqüência, cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência comparado a uma seqüência referência usando um dos programas de alinhamento usando parâmetros padrão. Um especialista na técnica reconhecerá que esses valores podem ser apropriadamente ajustados para determinar a identidade correspondente de polipeptideos codificada por dois polinucleotideos . levando-se em consideração a degeneração de códons, similaridade de aminoácidos, posicionamento da fase de leitura, e similares.
Para determinar o percentual de identidade de duas seqüências de aminoácidos ou de dois polinucleotideos, as seqüências são alinhadas para propósitos de comparação ótima. O percentual de identidade entre as duas seqüências é uma função do número de posições idênticas compartilhadas pelas seqüências (i.e., percentual de identidade = número de posições idênticas/número total de posições (e.g., posições se sobrepondo) χ 100). Em um avanço, as duas seqüências são do mesmo comprimento. 0 percentual de identidade entre duas seqüências pode ser determinado usando técnicas similares àquelas descritas abaixo, permitindo ou não espaços vazios. Quando calcular o percentual de identidade, são contadas tipicamente as correspondências exatas.
A determinação do percentual de identidade entre duas seqüências pode ser conseguida usando um algoritmo matemático. Um exemplo não limitante de um algoritmo matemático utilizado para a comparação de duas seqüências é o algoritmo de Karlin and Altschul (1990) Proc. Natl. Acad. Sci. USA 87:2264, modificado como em Karlin & Altschul (1993) Proc. Natl. Acad. Sei. USA 90:5873-5877. Tal algoritmo é incorporado nos programas BLASTN e BLASTX de Altschul et al. (1990) J. Mol. Biol. 215:403. Buscas de nucleotideos BLAST podem ser realizadas com o programa BLASTN, pontuação = 100, tamanho de palavra = 12, para se obter polinucleotideos homólogos a polinucleotideos codificando resistência a herbicidas usados em métodos da invenção. Buscas BLAST de polipeptideos podem ser efetuadas com o programa BLASTX, pontuação = 50, tamanho de palavra = 3, para se obter seqüências de aminoácidos homólogas a moléculas polipeptidicas expressas usando os métodos da invenção. Para se obter alinhamentos com espaços para fins de comparação, Gapped BLAST pode ser utilizado como descrito em Altschul et al. (1997) Nucleic Acids Res. 25:3389. Alternativamente, PSI-Blast pode ser usado para efetuar uma busca iterada que detecte relações distantes entre moléculas. Ver Altschul et al. (1997) supra. Quando os programas utilizando BLAST, Gapped BLAST, e PSI-Blast, os parâmetros padrão dos respectivos programas (e.g., BLASTX e BLASTN) podem ser usados. Ver www.ncbi.nlm.nih.gov. Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de seqüências é o algoritmo de ClustalW (Higgins et al. (1994) Nucleic Acids Res. 22:4673-4680). ClustalW compara seqüências e alinha a totalidade da seqüência de aminoácidos ou de DNA e, assim, pode prover dados acerca da conservação de seqüência de toda a seqüência de aminoácidos. 0 algoritmo de ClustalW é usado em diversos pacotes de software de análise de DNA/aminoácido comercialmente disponíveis, tal como o módulo ALIGNX de Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, CA). Após o alinhamento de seqüências de aminoácidos com ClustalW, a percentual de identidade de aminoácidos pode ser avaliada. Um exemplo não limitante de um software útil para análise em alinhamentos de ClustalW é GENEDOC™. GENEDOC™ (Karl Nicholas) permite a obtenção da similaridade e identidade de aminoácidos (ou DNA) entre múltiplos polipeptídeos. Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de seqüências é o algoritmo de Myers and Miller (1988) CABIOS 4: 11-17. Tal algoritmo é incorporado no programa ALIGN (versão 2.0), que é parte do pacote de software de alinhamento de seqüências GCG. Quando utilizando o programa ALIGN para comparar seqüências de aminoácidos, uma tabela de peso de resíduos PAM 120, uma penalidade por comprimento de espaço de 12, e uma penalidade por espaço de 4 podem ser usadas.
A menos que declarado ao contrário, GAP Versão 10, que usa o algoritmo de Needleman and Wunsch (1970) J. Mol. Biol. 48 (3):443-453 é usado para determinar a identidade ou similaridade de seqüências usando os seguintes parâmetros: % identidade e % similaridade para uma seqüência de nucleotideos usando peso GAP (GAP Weight) de 50 e peso de comprimento (Length Weight) de 3, e a matriz de pontuação de nwsgapdna.cmp; % identidade ou % similaridade para uma seqüência de aminoácidos usando peso GAP de 8 e peso de comprimento de 2, e o programa de pontuação BLOSUM62. Programas equivalentes também podem ser usados. Por "programa equivalente" pretende-se qualquer programa de comparação de seqüências que, para quaisquer duas seqüências em questão, gere um alinhamento tendo correspondências de resíduos de nucleotideos idênticas e identidade de seqüência percentual idêntica quando comparado ao alinhamento correspondente gerado pelo programa GAP Version 10.
Variantes alélicos naturalmente ocorrentes podem ser identificados com o uso de técnicas de biologia molecular bem conhecidas, tal como reação de cadeia de polimerase (PCR) e técnicas de hibridização, como destacado abaixo. Polinucleotideos variantes também incluem polinucleotideos derivados sinteticamente que foram gerados, por exemplo, usando-se mutagênese sítio direcionada, mas que ainda codificam o polipeptideo tendo a atividade biológica desejada.
0 especialista na técnica irá ainda ponderar que mudanças podem ser introduzidas por mutação nos polinucleotideos da invenção, levando, dessa forma, a mudanças na seqüência de aminoácidos dos polipeptideos codificados, sem alterar a atividade biológica dos polipeptideos. Assim, polinucleotideos variantes isolados podem ser criados introduzindo um ou mais substituições, adições ou deleções de nucleotideos no polinucleotideo correspondente aqui descrito, de forma que um ou mais substituições, adições ou deleções de aminoácido sejam introduzidas no polipeptideo codificado. Mutações podem ser introduzidas por técnicas padrão, tal como mutagênese sitio direcionada e mutagênese mediada por PCR, ou técnicas de embaralhamento de genes. Tais polinucleotideos variantes são também englobados pela presente invenção.
Polinucleotideos variantes podem ser feitos introduzindo mutações randomicamente ao longo de toda ou parte da seqüência codificadora, tal como por mutagênese de saturação, e os mutantes resultantes podem ser rastreados para a habilidade de conferir atividade de resistência a herbicidas para identificar mutantes que retêm atividade. Após a mutagênese, o polipeptideo codificado pode ser expresso de forma recombinante, e a atividade do polipeptideo pode ser determinada usando técnicas de teste padrão. Procedimentos de embaralhamento de genes ou PCR sexuado (por exemplo, Smith (1994; Nature 370:324-325; Patente U.S. Nos. 5.837.458; 5.830.721; 5.811.238; e 5.733.731. cada qual é aqui incorporada por referência) podem ser usados para se identificar polinucleotideos adicionais que codificam polipeptideos que efetuam funções similares como aqueles aqui descritos (por exemplo, polipeptideos que são resistentes a inibidores de glutamina sintetase herbicidas). 0 embaralhamento de genes envolve a fragmentação aleatória de diversos DNAs mutantes, seguido por seu reagrupamento por PCR em moléculas de comprimento total. Exemplos de vários procedimentos de embaralhamento de genes incluem, mas não são limitados a, reunião seguido por tratamento com DNase, o processo de extensão alternado (STEP), e recombinação in vitro por iniciação aleatória. No método mediado por DNase, segmentos de DNA isolados a partir de um grupo de mutantes positivos são clivados em fragmentos randômicos com DNaseI e sujeitos a múltiplas rodadas de PCR com nenhum primer adicionado. Os comprimentos de fragmentos randômicos se aproximam aquele do segmento não clivado à medida que os ciclos de PCR prosseguem, resultando em mutações em diferentes clones se tornando misturados e acumulando em algumas das seqüências resultantes. Múltiplos ciclos de seleção e embaralhamento levaram à intensificação funcional de diversas enzimas (Stemmer (1994; Nature 370:389-391; Stemmer (1994) Proc. Natl. Acad. Sei. USA 91 :10747-10751; Crameri et al. (1996) Nat. Biotechnol. 14:315-319; Zhang et al. (1997) Proc. Natl. Acad. Sei. USA 94:4504-4509; e Crameri et al. (1997) Nat. Biotechnol. 15:436-438). Estratégias de mutagênese por permutação podem ser também efetuadas. Ver, por exemplo, U.S. Provisional Application No. 60/813.095, preenchida em 13 de junho de 2006, aqui incorporada por referência em sua integra. Tais procedimentos poderiam ser efetuados, por exemplo, em polinucleotídeos codificando polipeptideos que são resistentes a inibidores de glutamina sintetase herbicidas.
Em um método de hibridização, toda ou parte da seqüência de polinucleotídeos de resistência a herbicidas ou uma seqüência codificando um domínio da invenção podem ser usados para rastrear bibliotecas de cDNA ou genômico. Métodos para a construção de tais bibliotecas de cDNA ou genômico são geralmente conhecidos na técnica e são descritos em Sambrook and Russell, 2001, supra. As chamadas sondas de hiridização podem ser fragmentos de DNA genômico, fragmentos de cDNA, fragmentos de RNA, ou outros oligonucleotídeos, e podem ser rotulados com um grupamento detectável, tal como 32P, ou qualquer outro marcador detectável, tal como outros radioisótopos, um composto fluorescente, uma enzima, ou um co-fator enzimático. Sondas para hibridização podem ser feitas rotulando-se oligonucleotídeos sintéticos baseado na seqüência de nucleotídeos codificando resistência a herbicidas conhecida aqui descrita. Primers degenerados projetados com base nos resíduos de nucleotídeos ou aminoácidos conservados na seqüência de nucleotídeos ou seqüência de aminoácidos codificada podem ser adicionalmente usados. A sonda compreende tipicamente uma região de seqüência de nucleotideos que hibridiza sob condições estringentes a pelo menos cerca de 12, pelo menos cerca de 25, pelo menos cerca de 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900, 1000, 1200, ou 1400 nucleotideos consecutivos do polinucleotideo codificando resistência a herbicidas da invenção ou um fragmento ou variante desses. Métodos para a preparação de sondas para hibridização são geralmente conhecidos na técnica e são descritos em Sambrook and Russell (2001) supra, e Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York), ambas são aqui incorporadas por referência.
A hibridização de tais seqüências pode ser conduzida sob condições estringentes. Por "condições estringentes" ou "condições de hibridização estringentes" pretende-se condições sob as quais uma sonda hibridizará a sua seqüência alvo em um grau detectavelmente maior do que a outras seqüências (e.g., pelo menos 2 vezes sobre a base). Condições estringentes são dependentes de seqüência e serão diferentes em circunstâncias diferentes. Controlando a estringência das condições de hibridização e/ou lavagem, seqüências alvo que são 100% complementares à sonda podem ser identificadas (sondagem homóloga). Alternativamente, condições de estringência podem ser ajustadas para permitir alguma falta de correspondência em seqüências, de forma que níveis menores de similaridade sejam detectados (sondagem heteróloga). Geralmente, uma sonda é de menos do que cerca de 1000 nucleotideos em comprimento, ou menos do que cerca de 500 nucleotideos em comprimento.
Condições estringentes podem ser aquelas nas quais a concentração de sais é de menos do que cerca de 1,5 M de íons de Na, ou cerca de 0,01 a 1,0 M de concentração de íons de Na (ou outros sais) em pH 7,0 a 8,3 e a temperatura é de pelo menos cerca de 30 0C para sondas curtas (e.g., 10 a 50 nucleotideos) e pelo menos cerca de 60°C para sondas longas (e.g., maiores do que 50 nucleotideos). Condições estringentes podem ser também alcançadas com a adição de agentes desestabilizantes, tais como formamida. Condições exemplares de baixa estringência incluem hibridização com uma solução tampão de 30 a 35% de formamida, NaCl 1 Μ, 1 % SDS (sódio dodecil sulfato) a 37 °C, e uma lavagem em IX a 2X SSC (2OX SSC = NaCl 3,0 M / trissódio citrato 0,3 M) a 50 a 55°C. Condições exemplares de estringência moderada incluem hibridização em 40 a 45% formamida, NaCl 1,0 M, 1% SDS a 37°C, e uma lavagem em 0,5X a IX SSC a 55 a 60°C. Condições exemplares de estringência elevada incluem hibridização em 50% formamida, NaCl 1 M, 1% SDS a 37 °C, e uma lavagem em 0,1X SSC a 60 a 65°C por pelo menos 30 minutos. Opcionalmente, tampões de lavagem podem compreender cerca de 0,1% a cerca de 1% SDS. A duração de hibridização é de geralmente menos do que cerca de 2 4 horas, usualmente cerca de 4 a cerca de 12 horas. A especificidade é tipicamente a função de lavagens pós hibridização, com os fatores críticos sendo a força iônica e temperatura da solução de lavagem final. Para híbridos DNA-DNA, o ponto de fusão (Tm) pode ser aproximado a partir da equação de Meinkoth e Wahl (1984) Anal. Biochem. 138:267-284: Tm = 81,5°C + 16,6 (log M) + 0,41 (%GC) - 0,61 (% form) - 500/L; onde M é a molaridade de cátions monovalentes, %GC é a porcentagem de nucleotídeos guanosina e citosina no DNA, % form é a porcentagem de formamida na solução de hibridização, e L é o comprimento do híbrido em pares de bases. A Tm é a temperatura (sob definidas força iônica e pH) na qual 50% de uma seqüência alvo complementar hibridiza a uma sonda perfeitamente correspondente. A Tm é reduzida em cerca de 1 C para cada 1% de falta de correspondência; assim, condições de Tm, hibridização, e/ou lavagem podem ser ajustadas para hibridizar a seqüências da identidade desejada. Por exemplo, se seqüências com >90% de identidade são procuradas, a Tm pode ser diminuída em 10°C. Por exemplo, se seqüências com >90% de identidade são procuradas, a Tm pode ser diminuída em 10°C. Geralmente, condições estringentes são selecionadas para serem cerca de 5°C menores do que o ponto de fusão (Tm) para a seqüência específica e seu complemento em uma definida força iônica e pH. Contudo, condições severamente estringentes podem utilizar uma hibridização e/ou lavagem a 1, 2, 3, ou 4°C menor do que o ponto de fusão (Tm) ; condições moderadamente estringentes podem utilizar uma hibridização e/ou lavagem a 6, 7, 8, 9 ou 10°C menor do que o ponto de fusão (Tm); condições de baixa estringência podem utilizar uma hibridização e/ou lavagem a 11, 12, 13, 14, 15 ou 20°C menor do gue o ponto de fusão (Tm) . Usando a equação, condições de hibridização e lavagem, e Tm desejada, aqueles de habilidade ordinária entenderão que variações na estringência de soluções de hibridização e/ou lavagem são inerentemente descritas. Se o grau desejado de falta de correspondência resulta em uma Tm de menos do que 45°C (solução aquosa) ou 32°C (solução de formamida), a concentração de SSC pode ser aumentada de forma que uma maior temperatura possa ser usada. Um guia extensivo para a hibridização de ácidos nucléicos é encontrado em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probesf Part I, Chapter 2 (Elsevier, New York); e Ausubel, et al., eds. (1995) Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, New York). Ver, Sambrook, et al., (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York).
E. Proteínas Isoladas e Variantes e Fragmentos destas
Polipeptideos de resistência a herbicidas são também englobados na presente invenção. Um polipeptideo de resistência a herbicidas que é substancialmente livre de material celular inclui preparações de polipeptideos tendo menos do que cerca de 30%, 20%, 10%, ou 5% (por peso seco) de polipeptideo que não de resistência a herbicidas (também referido aqui como uma "proteína contaminante"). Na presente invenção, "proteína de resistência a herbicidas"· deve significar um polipeptídeo que é resistente a inibidores de glutamina sintetase herbicidas. Em alguns avanços, a proteína de resistência a herbicida confere resistência para glufosinato. Fragmentos, porções biologicamente ativas, e variantes destas também são providos, e podem ser usados para praticar os métodos da presente invenção.
"Fragmentos" de "porções biologicamente ativas" incluem fragmentos de polipeptídeos compreendendo uma porção de uma seqüência de aminoácidos codificando uma proteína de resistência a herbicidas e que retenha atividade de resistência a herbicida. Uma porção biologicamente de uma proteína de resistência a herbicidas pode ser um polipeptídeo que é, por exemplo, de 10, 25, 50, 100 ou mais aminoácidos em tamanho. Tais porções biologicamente ativas podem ser preparadas por técnicas de recombinação e avaliadas para atividade de resistência a herbicida.
Por "variantes" entende-se que são proteínas ou polipeptídeos tendo uma seqüência de aminoácido que é pelo menos de cerca de 60%, 65%, cerca de 70%, 75%, cerca de 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% idêntica a SEQ ID NO: 2, caracterizado pelo fato de que um ou mais aminoácidos correspondendo às posições 125 até 175 e/ou posições 200-250 da SEQ ID NO: 2 tenham sido modificados de tal forma que o polipeptideo é resistente ao inibidor de glutamina sintetase herbicida, ou caracterizado pelo fato de que um ou mais aminoácidos tenham sido modificados de tal forma que exista uma perda de um ou mais sítios de adenilação no polipeptideo resultante. Esta proteína pode ser alterada de diversas formas incluindo substituições, deleções, encurtamentos, e inserções de aminoácidos de um ou mais aminoácidos da SEQ ID NO:4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, ou 46, incluindo até cerca de 2, cerca de 3, cerca de 4, cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 15, cerca de 20, cerca de 25, cerca de 30, cerca de 35, cerca de 40, cerca de 45, cerca de 50, cerca de 55, cerca de 60, cerca de 65, cerca de 70, cerca de 75, cerca de 80, cerca de 85, cerca de 90, cerca de 100 ou mais substituições de aminoácidos, deleções ou inserções. Um especialista na técnica irá reconhecer que esses valores podem ser apropriadamente ajustados para determinar a identidade correspondente do polipeptideo codificado por dois polinucleotídeos levando-se em conta a degeneração de códon, a similaridade de aminoácidos, o posicionamento da fase de leitura, e similares.
Por exemplo, substituições conservadas de aminoácidos podem ser feitas em um ou mais resíduos de aminoácidos não essenciais. Um resíduo de aminoácido "não essencial" é um resíduo que pode ser modificado a partir da seqüência selvagem de um polipeptideo sem alterar a atividade biológica, enquanto que um resíduo de aminoácido "essencial" é necessário para a atividade biológica. Uma "substituição conservada de aminoácido" é uma na qual o resíduo de aminoácido é substituído por um resíduo de aminoácido tendo uma cadeia lateral similar. Famílias de resíduos de aminoácidos tendo cadeias laterais similares foram definidas na técnica. Estas famílias incluem aminoácidos com cadeias laterais básicas (por exemplo, lisina, arginina, histidina), cadeias laterais ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeias laterais sem carga (por exemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína), cadeias laterais apolares (por exemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais beta-ramifiçadas (por exemplo, treonina, valina, isoleucina) e cadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, triptofano, histidina).
Substituições de aminoácidos podem ser feitas em regiões não conservadas que retenham a função. Em geral, tais substituições não seriam feitas para resíduos de aminoácidos. conservados, ou para resíduos de aminoácidos residindo em um motivo conservado, onde tais resíduos são essenciais para a atividade do polipeptídeo. Entretanto, um especialista na técnica entenderia que variantes funcionais podem ter pequenas alterações conservativas ou não conservativas ou modificações nos resíduos conservados.
Variantes também incluem polipeptídeos codificados por um polinucleotídeo que hibridiza com o polinucleotídeo que codifica um polipeptídeo que é resistente ao inibidor glutamina sintetase herbicida, ou uma complemento desse, sob condições estringentes. Variantes incluem polipeptideos que diferem na seqüência de aminoácido devido a mutagênese. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, isto é, continuam a possuir a atividade biológica desejada da proteína nativa, que é reter a atividade de resistência a herbicidas. Métodos para medir a atividade de resistência a herbicidas são bem conhecidos na técnica. Ver, por exemplo, Patente U.S. Nos. 5.098.838 e 5.145.777, cada uma das quais é aqui incorporada por referência na sua íntegra.
Genes bacterianos muito freqüentemente possuem múltiplos códons de iniciação para metionina nas proximidades do início do quadro de iniciação de leitura. Freqüentemente, a iniciação da tradução em um ou mais destes códons de iniciação levará à geração de uma proteína funcional. Esses códons de iniciação podem incluir códons ATG. Entretanto, bactérias como Bacillus sp. também reconhecem o códon GTG como um códon de iniciação, e proteínas que iniciam a tradução em códons GTG contém uma metionina como primeiro aminoácido. Adicionalmente, não é freqüentemente determinado a priori quais desses códons são usados naturalmente na bactéria. Então, é compreendido que o uso de um desses códons alternativos de metionina pode levar à geração de variantes que conferem resistência a herbicidas. Essas proteínas de resistência a herbicidas são englobadas na presente invenção e podem ser usadas nos métodos da presente invenção. Anticorpos para os polipeptideos da presente invenção, ou para variantes ou fragmentos desses, também são englobados. Métodos para a produção de anticorpos são bem conhecidos na técnica (ver, por exemplo, Harlow and Lane (1988) Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Patente U.S. No. 4.196.265).
F. Construções de polinucleotídeos
Os polinucleotídeos empregados nos métodos e composições da invenção podem ser modificados para se obter ou aumentar a expressão nas células vegetais. Os polinucleotídeos codificando os polipeptideos da invenção podem ser providos em cassetes de expressão para expressão na planta de interesse. Um "cassete de expressão em planta" inclui uma construção de DNA que é capaz de resultar na expressão de um polinucleotídeo em uma célula vegetal. O cassete pode incluir na direção de transcrição 5'-3', uma região de iniciação transcricional (ou seja, promotor) operacionalmente ligado a um ou mais polinucleotídeos de interesse, e uma região de terminação de tradução e de trasncrição (ou seja, região de terminação) funcional em plantas. O cassete pode conter adicionalmente pelo menos um polinucleotídeo adicional para ser introduzido no organismo, como um gene marcador selecionável. Alternativamente, o(s) polinucleotídeo(s) adicional(is) pode ser provido em múltiplos cassetes de expressão. Tal cassete de expressão é provido com uma pluralidade de sítios de restrição para inserção do polinucleotídeo a estar sob regulação transcricional das regiões reguladoras.
"Heterólogo" geralmente refere-se ao polinucleotídeo ou polipeptídeo que não é endógeno da célula ou não é endógeno ao local no genoma nativo no qual está presente, e tenha sido adicionado à célula por infecção, transfecção, microinjeção, eletroporação, microprojeção, ou similares. Por "operacionalmente ligado" pretende-se uma ligação funcional entre dois polinucleotídeos. Por exemplo, quando um promotor é operacionalmente ligado a uma seqüência de DNA, a seqüência promotora inicia e medeia a transcrição da seqüência de DNA. É reconhecido que os polinucleotídeos ligados operacionalmente podem ou não ser contíguos e, onde usados para referenciar a junção de duas regiões codificadoras de polipeptídeos, os polipeptídeos são expressos na mesma fase de leitura.
0 promotor pode ser qualquer seqüência de polinucleotídeos que demonstrar atividade na célula vegetal escolhida, parte da planta, ou planta. 0 promotor pode ser nativo ou análogo, ou exógeno ou heterólogo, à planta hospedeira e/ou à seqüência de DNA da invenção. Quando um promotor é "nativo" ou "análogo" à planta hospedeira, pretende-se que este promotor seja encontrado na planta nativa na qual o promotor é introduzido. Quando o promotor é "exógeno" ou "heterólogo" à seqüência de DNA da invenção, pretende-se que o promotor não seja nativo ou naturalmente ocorrente para a seqüência de DNA a qual está operacionalmente ligado na invenção. 0 promotor pode ser induzivel ou constitutivo. Este pode ser naturalmente- ocorrente, pode ser composto de porções de vários promotores naturalmente-ocorrentes, ou pode ser parcialmente ou totalmente sintético. Uma orientação para o desenho de promotores é fornecida por estudos de estrutura de promotor, tais como os de Harley and Reynolds (1987) Nucleic Acids Res. 15: 2343-2361. Ainda, a localização do promotor em relação ao inicio da transcrição pode ser otimizada. Ver, por exemplo, Roberts et al. (1979) Proc. Natl Acad. Sei. USA, 76: 7 60-7 64. Vários promotores adequados para o uso em plantas são bem conhecidos na técnica.
Por exemplo, promotores constitutivos adequados para o uso em plantas incluem: os promotores para viroses de plantas, tais como o promotor de caulimovírus da faixa clorótica de amendoim (PClSV) (Patente U.S. No. 5.850.019); o promotor 35S de virus mosaico de couve-flor (CaMV) (Odell et al. (1985; Nature 313: 810-812); promotores dos genes da metiltransferase do virus de Chlorella (Patente U.S. No. 5.563.328) e o promotor transcrito em tamanho integral de virus mosaico da escrofulária (FMV) (Patente U.S. No. 5.378.619); os promotores de genes tais qual actina de arroz (McElroy et al. (1990) Plant Cell 2:163-171); ubiquitina (Christensen et al. (1989) Plant Mol. Biol. 12 619-632 e Christensen et al. (1992) Plant Mol. Biol. 18 675-689); pEMU (Last et al. (1991) Theor. Appl. Genet. 81 581-588); MAS (Velten et al. (19M) EMBO J. 3:2723-2730); histona Η3 de milho (Lepetit et ai. (1992) Mol. Gen. Genet. 231: 276-285 e Atanassova et ai. (1992) Plant J. 2(3): 291- 300); ALS3 de Brassica napus (PCT application WO 97/41228); e promotores de vários genes de Agrobacterium (ver Patente U.S. Nos. 4.771.002; 5.102.796; 5.182.200; è 5.428.147).
Promotores induziveis adequados para uso em plantas incluem: o promotor de sistema ACEl, o qual responde a cobre (Mett et al. (1993) PNAS 90:4567-4571); o promotor do gene In2 de milho, o qual responde a protetores de herbicida benzenosulfonamida (Hershey et al. (1991) Mol. Gen. Genetics 227:229-237 e Gatz et al. (1994) Mol. Gen. Genetics 243:32-38); e o promotor do repressor Tet de TnIO (Gatz et al. (1991) Mol. Gen. Genet. 227:229-237) . Outro promoter induzivel para uso em plantas é um que responda a um agente indutor ao qual plantas normalmente não respondem. Um exemplar de promotor induzivel deste tipo é o promotor induzivel proveniente de um gene de hormônio esteróide, o qual a atividade transcricional é induzida pelo hormônio glucocorticosteróide (Schena et al. (1991) Proc. Natl. Acad. Sei. USA 88: 10421) ou a aplicação recente de um ativador transcricional quimérico, XVE, para uso em um sistema de expressão de planta induzivel a base de um receptor de estrogênio e ativado por estradiol (Zuo et al. (2000) Plant J. 24: 265-273). Outros promotores induziveis para uso em plantas são descritos em EP 332104, PCT WO 93/21334 e PCT WO 97/06269 os quais são aqui incorporados por referência na integra. Promotores compostos de porções de outros promotores e parcialmente ou totalmente sintéticos podem também ser utilizados. Ver, por exemplo, Ni et al. (1995) Plant J. 7: 661-676 e PCT WO 95/14098 descrevendo tais promotores para uso em plantas.
0 promotor pode incluir, ou ser modificado para incluir, um ou mais elementos intensificadores. Em alguns avanços, o promotor pode incluir uma pluralidade de elementos intensificadores. Promotores contendo elementos intensificadores provêm para altos níveis de transcrição em comparação com promotores que não os incluem. Elementos intensificadores adequados para o uso em plantas incluem o elemento intensificador PClSV (Patente U.S. No. 5.850.01-9), o elemento intensificador CaMV 35S (Patente U.S. Nos. 5.106.739 e 5.164.316) e o elemento intensificador FMV (Maiti et al. (1997) Transgenic Res. 6:143-156). Ver também PCT WO 96/23898.
Freqüentemente, tais construções podem conter regiões não transcritas a 5' e 3'. Tais construções podem conter uma "seqüência sinal" ou "seqüência líder" para facilitar o transporte co-traducional ou pós-traducional do peptídeo de interesse para certas estruturas intracelulares como o cloroplasto (ou outro plastídeo), retículo endoplasmático, ou complexo de Golgi, ou para ser secretado. Por exemplo, a construção pode ser elaborada para conter um peptídeo sinal para facilitar a transferência do peptídeo para o retículo endoplasmático. Por "seqüência sinal" pretende-se uma seqüência que é sabida ou suspeita de estar na origem do transporte co-tradução ou pós-tradução do peptídeo através da membrana celular. Em eucariotos, isso envolve tipicamente secreção para o complexo de Golgi, com alguma glicosilação resultante. Por "seqüência líder" pretende-se qualquer seqüência que, quando traduzida, resulte em uma seqüência de aminoácido suficiente para engatilhar o transporte co-traducional da cadeia peptídica para uma organela sub-celular. Sendo assim, isto inclui seqüências líder direcionando o transporte e/ou glicosilação por passagem por dentro do retículo endoplasmático, passagem para vacúolos, plastídeos incluindo cloroplastos, mitocôndria, e similares. Também pode ser preferível construir o cassete de expressão em planta para conter um íntron, de forma que o processamento do íntron deste mRNA seja necessário para a expressão.
Por "região 3' não traduzida" pretende-se um polinucleotídeo localizado abaixo da seqüência codificadora. Seqüências sinal de poliadenilação e outras seqüências codificando sinais regulatórios capazes de afetar a adição de tratos de ácido poliadenilados à extremidade 3' do mRNA precursor são regiões 3' não traduzidas. Por "regiões 5' não traduzidas" pretende-se um polinucleotídeo localizado acima da seqüência codificadora.
Outros elementos não traduzidos acima ou abaixo incluem os intensificadores. Intensificadores são polinucleotídeos que agem para aumentar a expressão de uma região promotora. Intensificadores são bem conhecidos na técnica e incluem, mas não são limitados a, uma região intensificadora SV40 e o elemento intensificador 35 S. A região de terminação pode ser nativa em relação à região de iniciação de transcrição, pode ser nativa com seqüência da presente invenção, ou pode ser derivada de outra fonte. Regiões de terminação convenientes são disponíveis a partir do plasmídeo Ti de A. tumefaciens, tais como as regiões de terminação de octopina sintase e de nopalina sintase. Ver também Guerineau et al. (1991) Mol. Gen. Genet. 262: 141-144; Proudfoot (1991) Cell 64: 671 - 674; Sanfacon et al. (1991) Genes Dev. 5: 141-149; Mogen et al. (1990) Plant Cell 2: 1261-1272; Munroe et al. (1990) Gene 91: 151-158; Bailas et al. (1989) Nucleic Acids Res. 17: 7891-7903; e Joshi et al. (1987) Nucleic Aeid Res. 15: 9627-9639.
Em um aspecto da invenção, seqüências sintéticas de DNA são desenhadas para um dado polipeptídeo, tais como os polipeptídeos da invenção. A expressão da fase aberta de leitura da seqüência sintética de DNA em uma célula resulta na produção de um polipeptídeo da invenção. Seqüências de DNA sintéticas podem ser úteis para simplesmente remover sítios de restrição indesejáveis, para facilitar estratégias de clonagem de DNA, para alterar ou remover qualquer potencial bias de códon, para alterar ou aumentar o conteúdo de GC, para remover ou alterar quadros de leitura alternados, e/ou para alterar ou remover sítios de reconhecimento de splice de íntron/éxon, sítios de poliadenilação, seqüências Shine-Delgarno, elementos promotores indesejáveis e similares que possam estar presentes na seqüência de DNA nativa. Também é possível que as seqüências de DNA sintéticas possam ser utilizadas para introduzir outros melhoramentos para uma seqüência de DNA, tais como a introdução de uma seqüência de íntron, criação de uma seqüência de DNA que é expressa como proteína de fusão para seqüências com direcionamento para organelas, como peptídeos de trânsito para cloroplasto, peptídeos direcionados para apoplasto/vacúolos, ou seqüências peptídicas que resultem na retenção do peptídeo resultante no retículo endoplasmático. Genes sintéticos também podem ser sintetizados utilizando-se códons preferenciais da célula hospedeira para aumento da expressão, ou podem ser sintetizados utilizando-se códons em uma freqüência de uso preferida pelo hospedeiro. Ver, por exemplo, Campbell and Gowri (1990) Plant Physiol. 92: 1-11; Patente U.S. Nos. 6.320.100; 6.07 5.185; 5.380.831; e 5.4 36.391, U.S. Published Application Nos. 20040005600 e 20010003849, e Murray et al. (1989) Nucleic Acids Res. 17: 477-498, aqui incorporadas por referência.
Em um avanço, os polinucleotídeos de interesse são direcionados para o cloroplasto para expressão. Dessa maneira, aonde o polinucleotídeo de interesse não for diretamente inserido no cloroplasto, o cassete de expressão irá conter adicionalmente um polinucleotídeo codificando um peptídeo de trânsito para direcionar o nucleotídeo de interesse para os cloroplastos. Tais peptídeos de trânsito são conhecidos na técnica. Ver, por exemplo, Von Heijne et al. (1991) Plant Mol. Biol. Rep. 9: 104-126; Clark et al. (1989) J. Biol. Chem. 264: 17544-17550; Della-Cioppa et al. (1987) Plant Physiol. 84: 965-968; Romer et al. (1993) Biochem. Biophys. Res. Commun. 196: 1414-1421; e Shah et al. (1986) Science 233: 478-481.
Os polinucleotideos de interesse a serem direcionados para o cloroplasto podem ser otimizados para expressão no cloroplasto para dar conta de diferenças de utilização de códon entre o núcleo vegetal e esta organela. Desta maneira, os polinucleotideos de interesse podem ser sintetizados usando-se códon de preferência do cloroplasto. Ver, por exemplo, Patente U.S. No. 5.380.831, aqui incorporada como referencia.
Este cassete de expressão vegetal pode ser inserido em um vetor de transformação vegetal. Por "vetor de transformação" pretende-se uma molécula de DNA que permite que a célula seja transformada. Tais moléculas podem consistir de um ou mais cassetes de expressão, e podem ser organizadas dentro de uma ou mais moléculas de DNA vetores.
Por exemplo, vetores binários são vetores de transformação de plantas que são utilizados em dois vetores de DNA não contíguos para codificar todos os requisitos para funções eis- e trans-atuantes para transformação de células vegetais (Hellens and Mullineaux (2000) Trends in Plant Science 5: 446-451). "Vetor" refere-se a uma construcção de polinucleotídeo projetada para transferência entre diferentes células hospedeiras. "Vetor de expressão" refere-se a um vetor que tenha a habilidade de incorporar, integrar e expressar seqüências de DNA heterólogas ou fragmentos em uma célula exógena.
Vetor de transformação vegetal compreende um ou mais vetores de DNA para alcançar a transformação de plantas. Por exemplo, é uma prática comum na técnica utilizar vetores de transformação de plantas que compreendam mais de um segmento de DNA contíguo. Estes vetores são freqüentemente referidos na técnica como vetores binários.
Vetores binários, assim como vetores com plasmídeos ajudantes são mais freqüentemente usados para transformação mediada por Agrobacterium, onde o tamanho e a complexidade dos segmentos de DNA devem alcançar uma eficiência de transformação bem grande, e esta é vantajosa para separar as funções em moléculas separadas de DNA. Vetores binários tipicamente contêm um vetor plasmidial que contém as seqüências cis-atuantes requeridas para a transferência do T-DNA (tais como fronteira esquerda e fronteira direita), um marcador selecionável que é construído para ser capaz de expressar na célula vegetal, e um "polinucleotídeo de interesse" (um polinucleotídeo construído para ser capaz de expressão na célula vegetal para a qual se deseja a geração de transgênicos). Também presentes nesse vetor plasmidial estão seqüências necessárias para replicação bacteriana. As seqüências cis-atuantes são arranjadas de forma que se permita a transferência eficiente para dentro da célula vegetal e a expressão nesta. Por exemplo, a seqüência de um marcador selecionável e a seqüência de interesse são localizadas entre as fronteiras esquerda e direita. Freqüentemente, um segundo vetor plasmidial contém os fatores trans-atuantes que medeiam a transferência do T-DNA de Agrobacterium para as células vegetais. Esse plasmideo normalmente contém as funções de virulência (genes Vir) que permitem a infecção das células vegetais por Agrobacterium, e a transferência de DNA por clivagem nas seqüências das bordas e transferência mediada por vir, como é conhecido na técnica (Hellens and Mullineaux (2000) Trends in Plant Science, 5: 446-451). Diversos tipos de linhagens de Agrobacterium (por exemplo, LBA4404, GV3101, EHAlOl, EHA105, etc.) podem ser usadas para a transformação de plantas. 0 segundo vetor plasmidial não é necessário para a introdução dos polinucleotideos nas plantas por outros métodos, tais como microprojeção, microinjeção, eletroporação, glicol polietileno, etc.
G. Expressão de genes de tolerância a herbicidas e tolerância a insetos
As plantas tolerantes de inibidores de glutamina sintetase aqui descritas podem exibir, ainda, resistência ou tolerância para um ou mais herbicidas (além de inibidores GS) e/ou uma ou mais pestes tais como insetos, nematóides ou fungos. Em alguns avanços, uma ou mais das plantas descritas aqui exibem tolerância ou resistência para um ou mais herbicidas além de inibidores de GS. Um número de genes que conferem resistência a herbicida, tanto transgênicos e não transgênicos, estão disponíveis. Genes conferindo resistência a um herbicida que inibe o ponto de crescimento ou meristema, tais como uma imidazolinona ou uma sulfoniluréia podem ser adequados. Genes exemplares nesta categoria codificam para enzimas mutantes ALS e AHAS são descritos, por exemplo, na Patente U.S. Nos. 5.767.366 e 5.928.937. Patente U.S. Nos. 4.761.373 e 5.013.659 são direcionados para plantas resistentes a vários herbicidas de imidazolinona ou de sulfonamida.
Genes de resistência a glifosato, tais como genes de EPSP sintase resistente a glifosato, são particularmente úteis nos métodos e composições divulgados aqui. Ver, por exemplo, Pedido de Patente U.S. Nos. 11/500.718,
11/185.342, 11/185.560, 11/315.678, 11/312.866, 11/400.598, 11/605.824, e 11/651.752, Patente U.S. No. 4.940.835 e Patente U.S. No. 4.769.061, cada uma das quais é aqui incorporada por referência em sua integra. Patente U.S. No. 5.554.798 descreve plantas de milho transgênicas resistentes a glifosato, nas quais a resistência é conferida por um gene de 5-enolpiruvil-3-fosfochiquimato sintase (EPSP) alterado.
Genes de resistência para compostos fosfono tais como glufosinato de amônio ou fosfinotricina, e ácidos piridinoxi ou fenoxi propiônico e ciclohexonas também são adequados. Ver Pedido de patente Européia No. 0 242 24 6. Ver também, Patente U.S. Nos. 5.879.903, 5.276.268 e 5.561.236. Outros herbicidas adequados incluem estes que inibem a fotossintese, tais como uma triazina e uma benzonitrila (nitrilase) (ver Patente U.S. No. 4.810.648) assim como herbicidas tais como ácido 2,2- dicloropropiônico, setoxidim, haloxifope, herbicidas de imidazolinona, herbicidas de sulfoniluréia, herbicidas de triazolopirimidina, herbicidas de s-triazina e bromoxinil.
As proteínas inseticidas úteis para a invenção podem ser expressas em uma ou mais plantas divulgadas aqui. Genes úteis para resistência a insetos ou pestes incluem, por exemplo, genes para endotoxina codificando toxinas identificadas em organismos Bacillus. Genes codificando toxinas de Bacillus thuringiensis (Bt) de diversas subespécies têm sido clonados e clones recombinantes foram verificados como sendo tóxicos para larvas de insetos lepidópteros, díptera e coleóptera. Ver, por exemplo, Pedido de Patente U.S. Nos. 10/782.020, 10/782.141, 10/782.570, 10/783.417, 10/781.979, 10/782.096, 10/926.819, e 11/343.533, cada qual é aqui incorporada por referência em sua íntegra. Vários outros genes para delta-endotoxina tais como CrylAa, CrylAb, CrylAc, CrylB, CrylC, CrylD, CrylEa, CrylFa, Cry3A, Cry9A, Cry9C e Cry9B; assim como genes codificando proteínas inseticidas vegetativas tais como Vipl, Vip2 e Vip3) , também são úteis nos métodos e composições aqui descritos. Uma lista completa de toxinas Bt pode ser encontrada na rede mundial em www. Iifesci. Sussex. ac.uk/home/Neil_Crickmore/Bt/.
H. Plantas e partes de plantas
Por "planta" pretende-se plantas inteiras, órgãos de planta (por exemplo, folhas, caules, raízes, etc.), sementes, células vegetais, propágulos, embriões e descendentes dos mesmos. Células vegetais podem ser diferenciadas ou indiferenciadas (por exemplo, calo, de células de cultura em suspensão, protoplastos, células de folha, células de raiz, células de floema, pólen). A presente invenção pode ser usada para introdução de polinucleotideos em qualquer espécie de planta, incluindo, mas não se limitando a, monocotiledôneas e dicotiledôneas. Exemplos de plantas de interesse incluem, mas não são limitadas a, milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada, e colzas, Brassica sp., alfafa, centeio, milheto, cártamo, amendoim, batata doce, mandioca, café, coco, abacaxi, frutas citricas, cacau, chá, banana, abacate, figo, goiaba, manga, azeitona, mamão, castanhas, macadâmia, amêndoa, aveia, vegetais, plantas ornamentais, e coniferas.
Verduras incluem, mas não estão limitadas a, tomates, alface, feijão verde, feijões, ervilhas, e membros do gênero Curcumis tais como pepino, cantalupo, e meloeiro. Plantas ornamentais incluem, mas não são limitadas a, azaléia, hortênsia, hibisco, rosas, tulipas, narcisos, petúnias, cravo, bico-de-papagaio, e crisântemo. Plantas de cultivo também são de interesse, incluindo, por exemplo, milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batatas, algodão, arroz, soja, beterraba, cana- de-açúcar, tabaco, cevada, colza, etc. Esta invenção é adequada para qualquer membro de plantas da família das monocotiledôneas incluindo, mas não se limitando a, milho, arroz, cevada, aveia, trigo, sorgo, centeio, cana-de-açúcar, abacaxi, inhames, cebola, banana, coco, e tâmaras.
II. Métodos
A. Métodos para crescimento de propriedades agronomicamente importantes em plantas
Métodos para aumentar propriedades agronomicamente importantes de plantas também são providos. Esses métodos compreendem introduzir dentro de uma planta ou de uma célula vegetal uma seqüência de nucleotídeos codificando uma enzima glutamina sintetase derivada de bactéria. Por "enzima glutamina sintetase derivada de bactéria" pretende- se uma enzima glutamina sintetase isolada a partir de uma bactéria, ou um variante biologicamente ativo ou fragmento dessa. Em um avanço, a seqüência de nucleotídeos compreende uma variante da SEQ ID NO: 1, onde o polinucleotídeo variante é ao menos 80% idêntico a SEQ ID NO: 1. Em outro avanço, a seqüência de nucleotídeos compreende um polinucleotídeo tendo ao menos uma modificação entre os aminoácidos 125 a 175, ao menos uma modificação entre os aminoácidos 200 a 250 correspondendo a SEQ ID NO: 2, ou ao menos uma modificação que resulte na perda de um ou mais sítios de adenilação. Em outro avanço, o polinucleotídeo é selecionado a partir do grupo constituído da SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, ou 47. A expressão dessas enzimas em plantas resulta no aumento das capacidades da planta de assimilação e/ou utilização de nitrogênio, assim como melhoram características agronômicas tais como rendimento da planta.
Conforme definido aqui, o "rendimento" da planta refere-se à qualidade e/ou quantidade de biomassa produzida pela planta. Por "biomassa" pretende-se qualquer produto vegetal medido. Um aumento na produção de biomassa é qualquer melhoramento no rendimento do produto de planta medido. 0 método compreende introduzir dentro de uma planta de interesse um polinucleotídeo codificando uma enzima glutamina sintetase derivada de bactéria. Em um avanço, a enzima glutamina sintetase é resistente aos inibidores de glutamina sintetase herbicidas, apesar da resistência não ser necessária para se alcançar o aumento das propriedades agronômicas. Em outro avanço, a enzima glutamina sintetase aumentou a atividade enzimática relativa a uma enzima glutamina sintetase controle como definido infra.
Embora não vinculado a qualquer teoria ou mecanismo em particular, a expressão de uma enzima glutamina sintetase derivada de bactéria em uma planta pode levar a uma atividade aumentada (resultando em um aumento do rendimento e/ou utilização de nitrogênio) comparada com a glutamina sintetase derivada de planta (incluindo a glutamina sintetase endógena na qual a sintetase derivada de bactéria é expressa de maneira heteróloga) devido a mecanismos regulatórios diferentes para a GS bacteriana em comparação com a GS de plantas. A atividade enzimática da GS bacteriana é regulada de uma maneira que é diferente das enzimas GS de plantas (Moorhead and Smith (2003) Plant Physiol 133: 492-498, aqui incorporada por referência em sua integra). Em um sistema bacteriano, o status do nitrogênio na célula é sentido pela proteína PII. Sob condições de altas concentrações de nitrogênio, PII inicia uma cascata de sinalização que causa a adenilação de subunidades individuais de enzimas GS bacterianas. Adenilação de GS bacterianas causa um decréscimo na atividade enzimática. Então, a atividade enzimática de uma enzima GS bacteriana pode ser modulada pela extensão da adenilação do duodecâmero da GS. Em contraste, desde que plantas não possuem um análogo da cascata de sinalização PII, é improvável que as células vegetais causem a adenilação de uma enzima GS bacteriana.
O desenvolvimento de variedades de plantas que usam nitrogênio mais eficientemente irá reduzir a necessidade de excessivas entradas de nitrogênio, economizar o custo da produção para os fazendeiros, beneficiar os fazendeiros nos países em desenvolvimento que não têm acesso às entradas de fertilizantes, e reduzir a poluição associada com a aplicação excessiva de fertilizantes de nitrogênio. Adicionalmente, prover plantas com rendimento aumentado como resultado da atividade de glutamina sintetase melhorada possui diversas aplicações comerciais. Por exemplo, aumentar a biomassa da folha de planta pode elevar o rendimento de vegetais folhosos para consumo humano ou animal. Ademais, o aumento da biomassa foliar pode ser usado para aumentar a produção de farmacêuticos derivados de planta ou produtos industriais.
De acordo com a presente invenção, as plantas expressando glutamina sintetase derivada de bactéria podem exibir conteúdos nitrogenados aumentados, composições de aminoácidos ou proteínas alterados, características de crescimento vigoroso, rendimento vegetativo aumentado ou melhores rendimentos e qualidades de sementes. Estas plantas podem sem identificadas examinando-se qualquer dos parâmetros a seguir: 1) a taxa de crescimento, medida em termos da taxa de crescimento por peso fresco ou seco; 2) rendimento vegetativo da planta madura, em termos de peso fresco ou seco; 3) rendimento da semente ou fruta; 4) o peso da semente ou fruta; 5) o conteúdo total de nitrogênio da planta; 6) o conteúdo total de nitrogênio da fruta ou semente; 7) o conteúdo de aminoácido livre da planta; 8) o conteúdo de aminoácido livre da fruta ou semente; 9) o conteúdo de proteína total da planta; e 10) o conteúdo de proteína total da fruta ou semente. Os procedimentos e métodos para examinar estes parâmetros são bem conhecidos para aqueles especialistas na técnica. Estes métodos podem envolver testes enzimáticos e imuno-ensaios para medir os níveis de enzima/proteína; testes para medir a composição de aminoácidos, agrupamento de aminoácidos livres ou conteúdo total de nitrogênio de vários tecidos de planta; medição da taxa de crescimento em termos de peso fresco e ganho ao longo do tempo; ou medição de rendimento da planta em termos de peso seco total e/ou peso total da semente.
A medição pode ser in vitro em uma célula expressando a enzima glutamina sintetase ou no material da planta coletado a partir de uma planta expressando a enzima, ou pode ser in vivo em uma planta expressando a enzima. 0 rastreamento pode ser realizado sob condições de deficiência de nitrogênio ou sob condições não limitantes de nitrogênio. Condições de nitrogênio são descritas em relação ao nutriente nitrogenado disponível. Condições deficientes de nitrogênio incluem aquelas que fazem com que o crescimento de uma planta controle cesse ou que seja diminuído de tal forma como a reduzir significativamente o tamanho ou qualidade da planta controle. Condições não limitantes de nitrogênio incluem aquelas tendo quantidades suficientes de nutrientes nitrogenados para sustentar o crescimento saudável da planta. Condições de nitrogênio que constituem não limitantes ou deficientes são conhecidas na técnica para a maioria, se não todas, as variedades de plantas de interesse. Orientações adicionais podem ser encontradas em, por exemplo, Hewitt (1966) Sand and Water Culture Methods Used in the Study of Plant Nutrition, 2nd ed., Farnham Royal (Bucks), Commonwealth Agricultural Bureaux; e, Hewitt (1975) Plant Mineral Nutrition, London, English University Press. Para os propósitos da presente invenção, uma melhoria em qualquer das características acima é em relação ao controle do crescimento da planta ou da célula vegetal sob condições similares. Uma planta ou célula vegetal "controle" é aquela que expressa uma enzima glutamina sintetase que não é uma glutamina sintetase derivada de bactéria. Uma melhoria em qualquer um desses parâmetros pode compreender qualquer aumento incluindo, mas não se limitando a, pelo menos um amento de 1%, pelo menos um amento de 3%, pelo menos um amento de 5%, pelo menos um amento de 10%, pelo menos um amento de 20%, pelo menos de 30%, pelo menos de 50%, pelo menos de 70%, pelo menos de 100% ou um aumento maior em um ou mais desses parâmetros.
Em vários avanços, a enzima GS derivada de bactéria tem atividade enzimática melhorada quando comparada a outras enzimas glutamina sintetases derivadas de bactérias ou plantas. Uma enzima glutamina sintetase com atividade melhorada é uma que tem atividade acima da atividade da enzima AGSl divulgada aqui como SEQ ID NO: 2. Em alguns avanços, a enzima GS derivada de bactéria tem atividade melhorada devido a mutações funcionais na enzima, ao invés da super expressão da enzima em um sistema. A atividade pode ser medida por qualquer método conhecido na técnica. Ao menos que especificado de outra maneira, a enzima glutamina sintetase derivada de bactéria com a atividade melhorada é aquela que tenha atividade melhorada quando comparada à atividade da mesma ou substancialmente a mesma concentração de SEQ ID NO: 2 quando expressa em um sistema bacteriano (por exemplo, em E. coli).
B. Transformação de Planta
Métodos da invenção envolvem introduzir um ou mais polinucleotideos em uma planta. Por "introduzir" pretende- se apresentar à planta o polinucleotideo de tal maneira que este polinucleotideo ganhe acesso ao interior de uma célula de planta. Os métodos da invenção não requerem que um método particular para introdução de um polinucleotideo na planta seja usado, apenas que o polinucleotideo ganhe acesso ao inteiro de ao menos uma célula da planta.
A introdução de um polinucleotideo em células vegetais é realizada por uma das diversas técnicas conhecidas na técnica, incluindo, mas não se limitando a eletroporação ou transformação química (Ver, por exemplo, Ausubel, ed. (1994) Current Protocols in Molecular Biology (John Wiley and Sons, Inc., Indianapolis, IN). Marcadores conferindo resistência a substâncias tóxicas são úteis na identificação de células transformadas (que tenham apanhado e expressado a seqüência de polinucleotideos teste) de células não transformadas (estas não contendo ou não expressando a seqüência de polinucleotideos teste). Em um aspecto da invenção, as seqüências de polinucleotideos aqui descritas são úteis como marcadores para avaliar a introdução do DNA em células vegetais. Métodos para se detectar a presença de um transgene em uma planta, órgão de planta (por exemplo, folhas, caules, raízes, etc.), semente, célula vegetal, propágulo, embrião ou descendentes destes são bem conhecidos na técnica. "Plantas transgênicas" ou "plantas transformadas" ou plantas, células, tecidos ou sementes "transformadas de forma estável" referem-se a plantas que tenham incorporado ou integrado polinucleotideos exógenos na célula vegetal. Por "transformação estável" pretende-se que a construção de polinucleotideos introduzida em uma planta se integre no genoma dessa planta e seja capaz de ser herdada pela progênie desta.
Em geral, os métodos de transformação de plantas envolvem transferir DNA heterólogo para dentro de uma célula vegetal alvo (por exemplo, embriões imaturos ou maduros, culturas de suspensão, calo indiferenciado, protoplastos, etc.), seguido da aplicação de um limiar máximo de três vezes o nivel de seleção apropriado (dependendo do gene marcador selecionável) para se recuperar as células vegetais transformadas a partir de um grupo de massa de células não transformadas. Explantes são tipicamente transferidos para um suporte fresco do mesmo meio e cultivados rotineiramente. Subseqüentemente, as células transformadas são diferenciadas em brotos após a colocação em meio de regeneração suplementado com um nivel limite máximo do agente de seleção de três vezes (ou seja, o herbicida). Os brotos são então transferidos para um meio de enraizamento seletivo recuperar os brotos com raiz ou plântulas. As plântulas transgênicas então crescem em plantas maduras e produzem sementes férteis (por exemplo, Hiei et al. (1994) Plant J. 6: 271-282; Ishida et al. (1996) Nat. Biotechnol. 14: 745-750). Uma descrição geral de técnicas e métodos para gerar plantas transgênicas é encontrada em Ayres and Park (1994) CRC Crit. Rev. Plant Sei. 13: 219-239 e Bommineni and Jauhar (1997) Maydica 42: 107-120. Como o material transformado contém muitas células, tanto células transformadas e não transformadas estão presentes em qualquer pedaço do calo ou tecido ou grupo de células submetido a alvo. A habilidade de matar células não transformadas e permitir que as células transformadas proliferem resulta em culturas da planta transformadas. Freqüentemente, a habilidade para remoção de células não transformadas é uma limitação à recuperação rápida de células vegetais transformadas e geração com sucesso de plantas transgênicas. Métodos moleculares e bioquímicos podem ser utilizados para se confirmar a presença e integridade do polinucleotideo(s) de interesse no genoma da planta transgênica.
A geração de plantas transgênicas pode ser realizada por um dentre diversos métodos, incluindo, mas não se limitando a, introdução de DNA heterólogo por Agrobacterium em células vegetais (transformação mediada por Agrobacterium), bombardeamento de células vegetais com DNA estrangeiro heterólogo aderido a partículas, e vários outros métodos diretamente-mediados e não particulados (por exemplo, Hiei et al. (1994) Plant J. 6: 271-282; Ishida et al. (1996) Nat. Biotechnol 14: 745-750; Ayres and Park (1994) CRC Crit. Rev. Plant Sei. 13: 219-239; Bommineni and Jauhar (1997) Maydica 42: 107-120) para transferência de DNA.
Existem três métodos comuns de transformação de célula vegetal com Agrobacterium. O primeiro método é o co-cultivo de Agrobacterium com protoplastos isolados cultivados. Este método requer um sistema de cultivo estabelecido que permita o cultivo de protoplastos e a regeneração da planta a partir dos protoplastos cultivados. O segundo método é a transformação das células ou tecidos com Agrobacterium.
Esse método requer (a) que as células ou tecidos vegetais possam ser transformados por Agrobacterium e (b) que as células ou tecidos transformados possam ser induzidos a regenerar em plantas inteiras. 0 terceiro método é a transformação das sementes, ápices ou meristemas com Agrobacterium. Esse método requer micropropagação.
A eficiência de transformação por Agrobacterium pode ser intensificada através da utilização de um número de métodos conhecidos na técnica. Por exemplo, tem sido demonstrado que a inclusão de uma molécula natural de resposta a ferimento tal como acetosiringona (AS) a cultura de Agrobacterium intensifica a eficiência de transformação com Agrobacterium tumefaciens (Shahla et al. (1987) Plant Molec. Biol. 8: 291-298). Alternativamente, a eficiência de transformação pode ser aumentada ferindo-se o tecido alvo a ser transformado. 0 ferimento de um tecido de planta pode ser alcançado, por exemplo, esmurrando-se, macerando-se, bombardeando-se com microprojéteis, etc. Ver, por exemplo, Bidney et al. (1992) Plant Molec. Biol. 18: 301-313. Ainda em outros avanços, as células vegetais são transfectadas com vetores via bombardeamento de partículas (ou seja, com uma arma genética). Métodos de transferência de genes mediados por partículas são conhecidos na técnica, são disponíveis comercialmente, e incluem, mas não se limitam a, o instrumento de entrega de gene dirigido por gás descrito na Patente U.S. No. 5.584.807, todos os conteúdos da gual são aqui incorporados por referência em sua íntegra. Este método envolve revestir a seqüência de polinucleotídeos de interesse com partículas de metal pesado, e acelerar as partículas revestidas sob a pressão de gás comprimido para a distribuição ao tecido alvo.
Outros métodos de bombardeamento de partículas também são disponíveis para a introdução de seqüências de polinucleotídeos heterólogas em células vegetais. Geralmente, estes métodos envolvem depositar a seqüência do polinucleotídeo de interesse sobre a superfície de partículas pequenas, densas e de um material tal como ouro, platina, ou tungstênio. As partículas revestidas são então revestidas sobre uma superfície ainda mais rígida, tal como uma chapa de metal, ou sobre uma folha transportadora feita de um material frágil tal como Mylar. A folha revestida é então acelerada rumo ao tecido biológico alvo. O uso da folha lisa gera um espalhamento uniforme das partículas aceleradas que maximiza o número de células recebendo partículas sob condições uniformes, resultando na introdução da amostra de polinucleotideo dentro do tecido alvo.
Sinais específicos de iniciação também podem ser usados para se alcançar uma maior eficiência de tradução de seqüências codificando o polipeptídeo de interesse. Tais sinais incluem o códon de iniciação ATG e seqüências adjacentes. Em casos onde as seqüências codificando o polipeptídeo de interesse, seu códon de iniciação, e seqüências acima sejam inseridas em um vetor de expressão apropriado, nenhum sinal controle adicional para transcrição ou tradução pode ser necessário. Entretanto, em casos onde apenas a seqüência codificadora, ou uma porção dessa, é inserida, sinais controle de tradução exógenos incluindo o códon de iniciação ATG devem ser fornecidos. Ademais, o códon de iniciação deve estar posicionado na fase de leitura correta para garantir a tradução do inserto inteiro. Elementos de tradução exógenos e códons de iniciação podem ser de várias origens, tanto natural como sintético. A eficiência da expressão pode ser reforçada através da inclusão de intensificadores que sejam apropriados para o sistema celular particularmente utilizado, tal como estes descritos na literatura (Scharf et al. (1994) Results Probl Cell Differ. 20 : 125).
Células que tenham sido transformadas com um polinucleotideo codificando um domínio de polipeptídeo da invenção podem ser crescidas em plantas de acordo com caminhos convencionais. Ver, por exemplo, McCormick et al. (1986) Plant Cell Rep. 5: 81-84. Essas plantas podem então ser crescidas, e polinizadas tanto pela mesma linhagem transformada ou por diferentes linhagens, tendo o híbrido resultante a expressão constitutiva do fenótipo desejado caracteristicamente identificado. Duas ou mais gerações podem ser crescidas para garantir que a expressão do fenótipo característico desejado seja mantida e herdada de forma estável e, então, as sementes são colhidas para garantir que a expressão do fenótipo característico desejado tenha sido alcançada. Dessa maneira, a presente invenção fornece sementes transformadas (também referidas como "sementes transgênicas") tendo um polinucleotídeo codificando um domínio de polipeptídeo da invenção, por exemplo, um cassete de expressão da invenção, incorporado de forma estável dentro do genoma dessas.
C. Avaliação da Transformação da Planta
Após a introdução do DNA em células vegetais, a transformação ou integração do polinucleotídeo no genoma vegetal é confirmada por vários métodos, tais como análise de polinucleotídeos, polipeptídeos e metabólitos associados com a seqüência integrada.
Análise de PCR é um método rápido de se rastrear células, tecidos ou brotos para a presença do gene incorporado no estágio anterior, antes do transplante para o solo (Sambrook and Russell (2001) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) ). O PCR é efetuado usando-se primers de oligonucleotídeos específicos para o nucleotídeo de interesse ou no background do vetor de Agrobacteríum, etc.
A introdução de DNA pode ser confirmada por análise de Southern blot do DNA genômico (Sambrook and Russell (2001) supra). Em geral, o DNA total é extraído da célula ou organismo, digerido com enzimas de restrição apropriadas, fracionado em um gel de agarose e transferido para uma membrana de náilon ou nitrocelulose. A membrana ou "blot" é então sondada com, por exemplo, fragmento de DNA rotulado radioativamente com 32P para confirmação da integração do DNA introduzido no genoma da planta de acordo com técnicas padronizadas (Sambrook and Russell (2001) supra).
Na análise Northern, o RNA é isolado de tecidos específicos de uma célula ou organismo, fracionado em um gel de agarose com formaldeído e transferido para um filtro de náilon de acordo com procedimentos padronizados que são usados rotineiramente na técnica (Sambrook and Russell (2001) supra). A expressão de um RNA codificado pelo polinucleotídeo da presente invenção é então testada por hibridizando o filtro a uma sonda radioativa derivada da seqüência de interesse por métodos conhecidos na técnica (Sambrook and Russell (2001) supra).
Western blot, testes bioquímicos e similares podem ser conduzidos nas plantas transgênicas para se determinar a presença de um polipeptideo(s) codificado pelo polinucleotideo(s) de interesse através de procedimentos padrão (Sambrook and Russell (2001) supra) usando-se anticorpos que se liguem a um ou mais epitopos presentes no polipeptideo resistente a herbicida.
D. Métodos para controlar seletivamente as ervas daninhas em um campo de cultivo
Métodos para se controlar seletivamente as ervas daninhas em um campo contendo uma planta também são providos. Em um avanço, as sementes da planta ou as plantas são resistentes aos inibidores de glutamina sintetase herbicidas como resultado da inserção de um polinucleotideo da presente invenção dentro da raiz da planta ou da planta. Em métodos específicos, a planta é tratada com uma concentração efetiva de um herbicida, onde a aplicação de herbicidas resulta em um controle seletivo das ervas daninhas ou outras plantas não transformadas. Por "concentração efetiva" pretende-se a concentração que controle o crescimento ou espalhamento das ervas daninhas ou outra planta não transformada sem afetar significativamente as plantas resistentes a herbicidas ou as raízes dessas plantas. Então, a quantidade pode ser pequena o suficiente para simplesmente retardar ou suprimir o crescimento ou desenvolvimento, ou a quantidade pode ser grande o suficiente para destruir irreversivelmente as plantas sensíveis. Tais concentrações efetivas para os herbicidas de interesse são geralmente conhecidas na técnica. O herbicida pode ser aplicado tanto pré- ou pós emergência de acordo com técnicas usuais para aplicação do herbicida nos campos compreendendo as plantas ou sementes de plantas que tenham se tornado resistentes ao herbicida.
Os exemplos a seguir são fornecidos a titulo de ilustrações e não por meio de limitação.
EXEMPLOS EXPERIMENTAIS
Exemplo 1. Linhagens Resistentes a Glufosinato.
A linhagem bacteriana resistente a glufosinato (ATX 20345) foi isolada de uma amostra de solo através de uma suspensão de solo colocando-se aproximadamente 0,01 gramas de solo em 500 μΐ de água destilada. A suspensão de solo foi agitada, e 20 μΐ foram usados para inocular um volume de 2,5 ml de meio mínimo de cultura suplementado com 5 mM de glufosinato (Riedel-de Haen, disponível através de Sigma- Aldrich, St. Louis, MO). 0 meio mínimo contem os seguintes ingredientes (por 1 litro): 10 gramas de sacarose, 1 ml de 0,8M MgSO4, 1 ml de 0,1M CaCl2, 1 ml de metais traços, 2,38 gramas de KH2PO4, 5,64 gramas de K2HPO4. 0 pH é ajustado para 7,0, e a solução é esterilizada com filtros de 0,2 μπι. Os metais traços consistem de (por 100 ml) 0,1 g de FeSO4 7H20, 0,5 mg de CuSO4 5H20, 1,0 mg de H3BO3, 1,0 mg de MnSO4 5H20, 7,0 mg de ZnS(7H20, 1,0 mg de MoO3, 4,0 g de KCl. Nenhuma fonte adicional de nitrogênio foi fornecida no meio. As culturas foram crescidas a 21 num agitador rotativo por 3 dias e então transferidas para um meio mínimo fresco contendo 5 mM de glufosinato e incubadas a 21°C. Após 2 dias, as culturas foram usadas para inocular o meio mínimo fresco com 5 mM de glufosinato. Após 2 dias, as culturas foram plaqueadas em Luria Bertani (LB) ágar e então re-plaqueadas para isolamento. ATX 20345 foi selecionada pela sua habilidade de crescer na presença de 5 mM de glufosinato. Colônias em LB ágar são róseo- avermelhadas, elevadas, circulares, e com 1-2 mm em diâmetro. ATX20345 foi tipada por análise de ácido-graxo (conforme conhecido na técnica), e determinada como sendo uma linhagem de Serratia marcescens.
ATX 20345 foi capaz de crescer até altas densidades ópticas na presença de glufosinato sob as condições descritas acima, apesar de esta ser incapaz de crescer sob as mesmas condições na ausência de glufosinato. Estes dados sugerem que o glufosinato está fornecendo nitrogênio para a bactéria, seja na forma de uma clivagem do glufosinato para liberar uma forma usável de nitrogênio ou pela suplementação de amônia no complexo glufosinato-amônia fornecido pelo suplemento. A substituição do glufosinato por cloreto de amônia como uma fonte de nitrogênio, entretanto, permite crescimento, sugerindo que a amônia é uma fonte de nitrogênio adequada para esta linhagem. As concentrações altas (5-50 mM), ATX 20345 cresce bem até 50 mM e, de fato, parece crescer melhor em concentrações crescentes de glufosinato de 5 mM até 50 mM de glufosinato. Crescimentos acima de 50 mM não foram testados. Exemplo 2. Clonagem da glutamina sintase de ATX 20345
Para se obter o gene(s) responsável pela resistência da linhagem à glufosinato, uma biblioteca genômica de plasmideos com pequenos insertos foi preparada a partir da linhagem ATX 20345. O DNA genômico foi extraído de uma cultura fresca, crescida durante a noite em LB usando-se SDS, Iise celular com proteinase K seguida de extrações com CTAB/NaCl, fenol-clorofórmio. Digestões parciais foram realizadas no DNA genômico usando-se 0,1 unidades de Sau3A I a 37 °C por 30 minutos seguidos da adição de EDTA e incubação a 65°C por 20 minutos para travar a reação. O DNA resultante tinha aproximativamente entre 4- 12kb de tamanho. O DNA foi purificado em gel, tratado com T4 polinucleotídeo quinase, e então ligado no vetor pUC18 digerido com BamH I. Ligações foram transformadas em DH5a e plaqueadas diretamente em placas do meio mínimo M63 contendo 20mM de glufosinato, 10C^g/ml de carbenicilina, e 0,1 mM de IPTG. Após vários dias, 4 colônias apareceram, tentativamente denominadas TKHl- 4. Elas foram crescidas e o DNA plasmidial foi isolado e analisado por digestão com EcoR 1+ Hind III, e Pst I/ Sac I para se comparar os insertos. Apesar de todos os quatro clones conterem insertos, TKH2 e TKH3 foram idênticos pela análise da digestão com enzimas de restrição, e ambos continham insertos de aproximadamente 4,9 kb.
Para se determinar se algum dos quatro clones codificava a glutamina sintetase, todos foram transformados para a linhagem celular M5004 glnA- (E. coli Genetic Stock Center No. 5531, Mayer (1975) Mol. Gen. Genet. 137: 131- 142), juntamente com o vetor controle pUC 18, e plaqueadas em LB/carbenicilina. As colônias resultantes para cada transformação foram plaqueadas em placas do meio mínimo M63 com ou sem a adição de glutamina. Apenas os clones contendo uma glutamina sintetase funcional deveriam crescer na ausência de glutamina. TKH2 e TKH3 recuperaram o fenótipo glnA-, enquanto que TKHl e TKH4 não (Tabela 1). A habilidade de TKH2 e TKH3 em recuperar completamente o fenótipo glnA- demonstrou que cada uma delas contém uma glutamina sintetase funcional.
Tabela 1. Complementaçâo do fenótipo glnA- por THK2 e THK3
<table>table see original document page 62</column></row><table>
Para se reconfirmar que TKH2 e TKH3 conferem resistência a 20 mM de glufosinato, os plasmídeos purificados foram re-transformados para células DH5a. pUC18 foi re-transformado como controle negativo. As misturas da transformação foram plaqueadas diretamente em placas de M63 mínimo com ou sem 20mM de glufosinato. Enquanto que pUC18, ΤΚΗ2 e ΤΚΗ3 cresceram na ausência de glufosinato, apenas TKH2 e TKH3 cresceram na presença de glufosinato.
0 seqüenciamento do DNA plasmidial de TKH2 e TKH3 com os iniciadores Ml 3 Forward e Ml 3 Reverse, e subseqüente análise das seqüências, revelou que TKH2 e TKH3 são clones idênticos. Baseado na complementação, análise de seqüência, e demonstração da habilidade para conferir resistência à glufosinato em E. coli, nós concluímos que TKH2 e TKH3 codificam uma glutamina sintetase idêntica.
Exemplo 3. Seqüência da glutamina sintetase agsl
A seqüência de DNA do clone TKH foi determinada (aqui referida como agsl), e um quadro de iniciação de leitura com homologia para a família de glutamina sintetase foi identificado. Esta fase aberta de leitura foi amplificada por PCR usando-se polimerase de alta fidelidade (high fidelity) , e clonando-se em pUC19 para produzir pAX685. A proteína codificada (AGSl) demonstra alta identidade de aminoácidos com glutamina sintaxes de bactérias GRAM negativas, incluindo E. coli (identidade de aminoácido de 90%), Erwinia (94%), Pantoa (93%) e Yersinia (96%).
Exemplo 4. Mutagênese de glutamina sintetase agsl selvagem.
Mutantes do gene para glutamina sintetase bacteriana agsl (SEQ ID N0:1) foram criados por mutagênese dirigida por erro usando-se o kit GENEMORPH® Random Mutagenesis, e também usando-se mutagênese sítio direcionada como conhecido na técnica. Entretanto, muitos métodos são disponíveis para a criação de bibliotecas de mutantes. Os mutantes resultantes foram clonados dentro de um vetor pUC19, eletroporados tanto para células de E. coli XL-I ou DH5 alfa, e selecionadas para crescimento em meio M63+ ágar contendo antibióticos e 2, 10, ou 20 mM de glufosinato. Vinte e dois clones foram identificados como capazes de crescer em 20mM de glufosinato, e escolhidos para análises posteriores.
As seqüências dos clones resistentes a glufosinato foram determinadas. Após análise de seqüência, os clones 1 e 15; clones 2 e 3; clones 5 e 6; clones 9, 10, e 12; e os clones 16, 17, 19 e 20 foram verificados como sendo idênticos. Então, os clones 1, 3, 5, 7, 9, 12, 16, 19, e 20 não foram mais analisados.
Os clones 2, 10, 15, 17, e 21 demonstraram-se capazes de crescer no meio mínimo M63+ ágar com 2, 10, 20, 50, e 100 mM de glufosinato após eletroporação para células de E. coli DH5a.
As seqüências de DNA dos clones resistentes a glufosinato foram traduzidas, e as seqüências da proteína resultante foram alinhadas com a seqüência da proteína AGS 1 selvagem. Foram constatadas substituições de aminoácidos correspondentes às posições dos aminoácidos da AGSl selvagem (SEQ ID NO:2) nestes clones resistentes à glufosinato. Estas substituições são ilustradas na Figura 1 e incluem S2T, V39I, S54A, G56A, A72V, F80S, F81S, E82D, D102M, V125M, V150M, A151T, D166N, G168C, P185S, V207I, H212N, V214M, V214A, V214E, G218S, V222M, D264V, S276Y, G289S, I303N, R345S, K395R, A420V, R447C. De particular interesse são as mutações em torno do ácido glutâmico na posição 213, que é o sitio catalitico da glutamina sintetase. Outro grupo interessante de mutações ocorre em torno do aminoácido 150.
Tabela 2. Clones Resistentes à Glufosinato Derivados de
<table>table see original document page 65</column></row><table> <table>table see original document page 66</column></row><table>
NT= não testado
Exemplo 5. Complementação de um mutante glutamina sintase
Clones contendo agslml (pAX3421) e agslm2 (pAX3422) foram selecionados para novos trabalhos. Ambos os clones demonstraram-se capazes de complementar uma E. coli mutante em agsl com agslml crescendo em uma taxa maior do que agslm2.
Exemplo 6. Cinética de glutamina sintases resistentes a glufosinato
agslml (pAX3421) e agslm2 (pAX3422) foram subclonadas dentro do vetor de expressão em E. coli pRSFIB (Invitrogen) de forma a criar uma região N-terminal codificando uma marca {tag) de 6Xhis, purificado e cineticamente caracterizado. AGSlm2 ('pick6') teve atividade enzimática relativamente pequena em um ensaio de 5 minutos quando comparado com a AGS 1 tipo selvagem, mas pareceu chegar à atividade completa durante a noite. AGSlml ('pick 2') foi indistinguivel da enzima selvagem na ausência de glufosinato, mas demonstrou atividade na presença de ΙΟΟμΜ de glufosinato, uma concentração que inibe completamente a enzima glutamina sintetase tipo selvagem agsl.
Exemplo 7. Mutagênese de agslm2 agslm2 foi mutagenizado usando mutagênese de propensão a erro (error-prone) usando-se o kit GENEMORPH® II Random Mutagenesis kit (Stratagene) de acordo com as instruções do fabricante. O produto de PCR mutagenizado foi digerido com Sac I e Hind III, e ligado em um vetor pUC, similarmente digerido com Sac I e Hind III. As ligações foram transformadas para células de E. coli, e plaqueadas em placas de M63+ contendo antibiótico, e 125mM de glufosinato. Os clones crescendo em placas com 125mM de glufosinato foram re-testados em placas com 200mM de glufosinato, e comparados com plaqueamentos similares de agslml e agslm2. Enquanto que as células expressando AGSlml e AGSlm2 não cresceram em 200mM de glufosinato, um único clone, designado pAX3439, foi isolado por força de suas habilidades para crescer em placas com 200mM de glufosinato. A seqüência de DNA da fase de leitura de ags em pAX3439 foi seqüenciada, e o gene designado como agslmló. A seqüência de DNA de agslml6 é representada aqui como SEQ ID NO: 31, e a seqüência de aminoácido é representada aqui como SEQ ID NO: 32. AGSlml6 difere de AGSlm2 em um único aminoácido na posição H212 da proteína, que é modificado de Histidina ('H') para Asparagina ('N'), e contem um total de cinco mudanças de aminoácidos em relação à AGSl tipo selvagem (ver Figura 1 e Tabela 3). Tabela 3. Variantes de agsl
<table>table see original document page 68</column></row><table>
AGSlml6 confere a maior resistência em E. coli. Células contendo AGSlml6 são capazes de crescer em concentrações de glufosinato de até 200mM. Colônias de células contendo AGSlm2, AGSlmll, e AGSlm4 crescem mais rapidamente em 50mM de glifosato do que outras variantes, exceto AGSlml6. Exemplo 8. Variantes agslm!7, agslm!8, agslml9, agslm20, e agslm21
Baseado no conhecimento do mecanismo da reação de GS conhecido na técnica, e no alinhamento de AGSl com outras enzimas GS, pode-se prever a localização do centro de reação de GS em AGSl e variantes, agsl (ml6) foi mutagenizada na região da proteína sugerida como sendo o centro de reação de GS, e foram identificadas diversas variantes gue conferiram crescimento melhorado em placas com 225 mM de glufosinato mediante as células hospedeiras de E. coli. agslml7 (SEQ ID NO: 33) codifica a proteína AGSlml7 (SEQ ID NO:34). agslml8 (SEQ ID NO: 35) codifica a proteína AGSlml8 (SEQ ID NO: 36). agslml9 (SEQ ID NO: 37) codifica a proteína AGSlml9 (SEQ ID NO:38). agslm20 (SEQ ID NO: 39) codifica a proteína AGSlm20 (SEQ ID NO: 40) . Verificou-se que os clones expressando AGSlml7, AGSlml8, AGSlml9, ou AGSlm20 foram todos capazes de crescer em placas contendo 375mM de glufosinato, enquanto que nenhum crescimento de clones expressando AGSlml6 foi observado em placas contendo 375mM de glufosinato.
agslm21 (SEQ ID NO: 41) codifica a proteína AGSlm21 (SEQ ID NO: 42) . AGSlm21 é uma variante de AGSl que contem uma modificação de aminoácido similar à identificada em outras variantes (V214M) , assim como duas novas mutações (N160S e G167R) . Esta enzima foi expressa em E. coli, purificada, e os valores cinéticos Km (glutamato) e Ki (glufosinato) da variante foram medidos por ensaios enzimáticos. Verificou-se que a enzima mutagenizada possui resistência aumentada à glufosinato, como mostrado na Tabela a seguir.
Tabela 4. Cinética de AGSlm21
<table>table see original document page 70</column></row><table>
Exemplo 9. Remoção de sítios de adenilação de AGSl e variantes
É bem conhecido na técnica (Mehta et al. (2004) J. Biol. Chem. 279: 22477- 22482, aqui incorporado pela referência em sua íntegra) que em uma célula bacteriana, enzimas GS bacterianas são freqüentemente sujeitas a regulação negativa por adenilação de um resíduo de tirosina em particular.
agsl(ad-) (SEQ ID NO: 43) codificando a proteína AGSl(AD-) (SEQ ID NO: 44), é uma variante de agsl na qual o sítio de adenilação hipotético tenha sido removido por mutação da tirosina na posição 398 da AGS 1 para uma fenilalanina através de mutagênese sítio direcionada.
agslml7(ad-) (SEQ ID NO: 45) codificando a proteína AGSImH (AD-) (SEQ ID NO: 46), é uma variante de agslml7 na qual o sítio de adenililação putativo foi removido por mutação da tirosina na posição 398 da AGSl para uma fenilalanina através de mutagênese sítio dirigida.
A enzima inalterada (AGSl) foi comparada com AGSl(AD-) e AGSlml7(AD-) através da realização de ensaios enzimáticos em ambas as enzimas seguido de purificação a partir de E. colí. A enzima glutamina sintetase de E. coli (GlnA) também foi testada. Os valores cinéticos obtidos para cada enzima são demonstrados na Tabela 5 abaixo.
Tabela 5. Cinética de AGSl (AD-)
<table>table see original document page 71</column></row><table>
Exemplo 10. Clones resistentes a glufosinato são mutados perto do sítio ativo.
Um número surpreendente de variantes, e todos dentre os clones mais resistentes, continham mutações no sítio ativo da sintetase. Os dois ácidos glutâmicos no centro catalítico (correspondendo às posições 213 e 221 de AGS1, SEQ ID NO: 2) são chave para a atividade da glutamina sintetase. A valina na posição 214 é variada em 13 das variantes, e pode ser mutada para metionina (M) , alanina (A) , serina (S), histidina (H) e ácido glutâmico (E) . Três variantes adicionais, incluindo AGSlml6, têm resíduos modificados nessa região.
Exemplo 11 Identificação de novas enzimas glutamina sintetase que são resistentes à glutamina sintetase herbicida.
Usando-se os métodos da invenção, pode-se identificar outras glutamina sintetases resistentes a herbicida pesquisando-se as bases de dados contendo enzimas glutamina sintetase, e/ou alinhando-se as seqüências de aminoácido das enzimas glutamina sintetase e analisando-se para ao menos uma substituição de aminoácido dentro das posições correspondentes as posições 125 até 175 da SEQ ID NO: 2 ou entre as posições 200 e 250 da SEQ ID NO: 2. É sabido que alguma modificação destas regiões é tolerada na natureza sem perturbar a natureza da resistência a herbicida conferida por estas regiões, e são, portanto equivalentes às seqüências listadas aqui. Portanto, é reconhecido que as enzimas que possuem cerca de 80%, cerca de 85%, cerca de 90%, cerca de 95%, 96%, 97%, 98% ou 99% de homologia à polipeptídeos da invenção podem conferir resistência a inibidores de glutamina sintetase herbicidas.
Exemplo 12. Transformação de planta por bombardeamento de partículas. Espigas de milho são mais bem colhidas entre 8-12 dias após a polinização. Os embriões são isolados a partir das espigas, e aqueles embriões de 0,8-1,5 mm de tamanho são usados preferencialmente na transformação. Os embriões são plaqueados com o lado do escutelo para cima em um meio de incubação adequado, tal como o meio DN62A5S (3,98 g/L de Sais N6; 1 ml/L (de estoque IOOOx) de Vitaminas N6; 800 mg/L de L-Asparagina; 100 mg/L de Mio-inositol; 1,4 g/L de L-Prolina/ 100 mg/L de Casaminoácidos; 50 g/L de sacarose; 1 ml/L (de estoque 1 mg/ml) 2,4-D). Entretanto, outros meios e sais que não DN62A5S são adequados e são conhecidos na técnica. Os embriões são incubados durante a noite a 25°C no escuro. Entretanto, não é necessário por si, incubar os embriões durante a noite.
Os explantes resultantes são transferidos para malha quadrada (30-40 por placa), transferidos sobre meio osmótico por cerca de 30-45 minutos, e então transferidos para uma placa de bombardeamento ver, por exemplo, Publicação do PCT No. W0/0138514 e Patente U.S. No. 5.240.842).
As construções de DNA projetadas para expressar enzimas glutamina sintetase da presente invenção em células vegetais são aceleradas para dentro do tecido da planta usando-se um acelerador de feixe de aerosol, utilizando-se as condições essencialmente como descrito na Publicação do PCT No. WO/0138514. Após o bombardeamento os embriões são incubados por cerca de 30 min em meio osmótico, e colocados sobre o meio de incubação durante a noite a 25cC no escuro. Para se evitar explantes indevidamente danificados, eles são incubados por ao menos 24 horas antes da transferência para o meio de recuperação. Os embriões são então espalhados sobre meio de período de recuperação, por cerca de 5 dias, 25°C no escuro, e então transferidos para um meio de seleção. Os explantes são incubados em meio de seleção por até oito semanas, dependendo da natureza e das características da seleção particularmente utilizada. Após o período de seleção, o calo resultante é transferido para o meio de maturação do embrião até que se observe a formação dos embriões somáticos maduros. Os embriões somáticos maduros resultantes são então colocados sob luz baixa, e o processo de regeneração é iniciado por métodos conhecidos na técnica. Os brotos resultantes são deixados para enraizar no meio de enraizamento, e as plantas resultantes são transferidas para potes de viveiro e propagadas como plantas transgênicas. As plantas são analisadas para resistência melhorada para inibidores de glutamina sintetase herbicídas.
Materiais Meio DN62A5S
<table>table see original document page 75</column></row><table>
Ajustar o pH da solução para pH 5,8 com IN K0H/1N KCl, adicionar Gelrite (Sigma) para 3g/L, e autoclavar. Após resfriar para 50°C, adicionar 2 ml/L de uma solução estoque de nitrato de prata 5 mg/ml (Phytotechnology Labs). A receita rende cerca de 20 placas.
Exemplo 13. Transformação de células vegetais por
Transformação mediada por Agrobacterium
As espigas são mais bem colhidas entre 8-12 dias após a polinização. Os embriões são isolados de espigas, e aqueles embriões com 0,8-1,5 mm de tamanho são preferidos para uso na transformação. Os embriões são plaqueados com o lado do escutelo para cima em um meio de incubação adequado, e incubados durante a noite a 25°C no escuro. Entretanto, não é necessário por si se incubar os embriões durante a noite. Os embriões são postos em contato com uma linhagem de Agrobacterium contendo os vetores apropriados tendo uma seqüência da presente invenção para transferência mediada por plasmideo Ti por cerca de 5-10 min, e então plaqueados sobre meio de co-cultivo por cerca de 3 dias (25°C no escuro). Após co-cultivo, os explantes são transferidos para um meio de período de recuperação por cerca de cinco dias (a 25°C no escuro). Os explantes são incubados no meio seletivo por até oito semanas, dependendo da natureza e características da seleção utilizada em particular. Após o período de seleção, o calo resultante é transferido para o meio de maturação de embrião, até se observar a formação de embriões somáticos maduros. Os embriões somáticos maduros resultantes são então colocados sob luz baixa, e o processo de regeneração é iniciado conforme conhecido na técnica. Os brotos resultantes são deixados para enraizar no meio de enraizamento, e as plantas resultantes são transferidas para potes de viveiro e propagadas como plantas transgênicas.
Exemplo 14. Plantas transgênicas expressando AGSlml6
synagslml6 (SEQ ID NO: 47) é uma seqüência de DNA alternada que codifica a proteína AGSlmló (SEQ ID NO:32). synagslmlô foi clonada dentro de um vetor de lançamento para guiar a super-expressão de AGSlml6 em milho. 0 vetor dispõe a super-expressão de synagslml6 sob o controle do promotor Trp5 (US application 11/377.318, preenchida em 16 de março de 2006 e aqui incorporada por referência em sua integra).
Nove plantas de milho transgênicas contendo agslml6 foram geradas. A expressão da proteína AGSIml6 foi confirmada por Western blot para cada um destes eventos.
Como controles, seis eventos que não continham agslmló foram gerados. A eficiência de utilização de nitrogênio foi avaliada para estes eventos através da determinação do conteúdo protéico das amostras das folhas isoladas das plantas do T0 após quatro semanas de crescimento na estufa.
As proteínas presentes nas amostras de folhas foram quantificadas como segue: Cinqüenta miligramas de material de folha (peso fresco, sem nervura central) foram liofilizados para determinação do peso seco. O tecido de folha desidratado foi então macerado na presença de água Milli Q fresca usando-se um MiniBeadbeater-96™ e esferas de aço inoxidável de 2.3 mm. O tecido de folha macerado foi filtrado através de um filtro de Fluoreto de Polivinilideno de 0.45 μm (PVDF). O corante Bio-Rad Protein Dye foi adicionado às amostras de folha diluídas na água, e o método de Bradford foi realizado e lido no espectrofotômetro no comprimento de 595nm contra marcadores de proteína internos incluídos no método. As concentrações de proteína solúvel foram divididas pelo peso seco de cada amostra para se obter a massa protéica por unidade de peso seco. Surpreendentemente, demonstrou-se que as plantas contendo agslmlô possuíam uma média 24% maior de conteúdo protéico do que as plantas controle que não continham agslmlô.
Tabela 6. Proteína aumentada em plantas com AGSlml6
<table>table see original document page 78</column></row><table> Todas as publicações e aplicações de patentes mencionadas na especificação são indicativas do nivel de conhecimento daqueles especialistas na técnica a qual esta invenção pertence. Todas as publicações e aplicações de patentes são aqui incorporadas por referência na mesma extensão como se cada publicação ou aplicação de patente individual fosse especificamente e individualmente indicada para serem incorporadas por referência.
Apesar de a invenção precedente ter sido descrita em algum detalhe por meio de ilustração e exemplo para fins de clareza de entendimento, será óbvio que certas alterações e modificações podem ser praticadas no escopo das reivindicações em anexo. LISTAGEM DE SEQÜÊNCIAS
<110> Depositante: Athenix Corporation
Nicholas B. Duck Todd K. Hinson Vadim Beilinson Laura Cooper Schouten Daniel John Tomso
<120> Titulo da Invenção: Glutamina Sintetases Bacterianas e Métodos de Uso
<130> Referência do documento: 45600/329367
<150> Número do Documento de Prioridade: 60/812.000
<151> Data de Depósito do Documento de Prioridade: 08-06-2006
<160> Quantidade de SEQ ID NOs.: 47
<170> Software: FastSEQ for Windows Version 4.0
<210> SEQ ID NO: 1 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Serratia marcescens
<220> Características:
<221> Nome/Chave: CDS
<222> Localização: (1)... (1410)
<400> Seqüência: 1
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125 cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa gtg gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
1152 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 2 <211> Comprimento: 4 69 <212> Tipo: PRT
<213> Organismo: Serratia marcescens <400> Seqüência: 2
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Met Pro Met Ser
Gly Gly 290 His Ala 305
Lys Arg
Ala Arg
Lys Ala
Tyr Leu 370 Asn Lys 385
Pro Pro
Glu Ala
Gly Val
Glu Glu 450 Leu Tyr 465
Lys Pro 260 Leu Ser 275
Leu Ser
Lys Ala
Leu Val
Asn Arg 340 Arg Arg 355
Cys Phe
Ile His
Glu Glu
Met Ala 420 Phe Thr 435
Met Asp Tyr Ser
Asn Val Ala 245
Met Phe Gly
Lys Asn Gly
Glu Thr Ala 295
Ile Asn Ala
310 Pro Gly Tyr 325
Ser Ala Ser
Ile Glu Ala
Ala Ala Leu 375
Pro Gly Asp
390 Glu Ala Glu 405
Ala Leu Asn
Asp Asp Ala
Arg Val Arg 455
Val
His Ala
Asp Asn 265 Thr Asn 280
Leu Phe
Leu Ala
Glu Ala
Ile Arg 345 Arg Phe 360
Leu Met
Ala Met
Ile Pro
Glu Asp 425 Ile Asp 440
Met Thr
Phe Gly 250
Gly Ser
Leu Phe
Tyr Ile
Asn Pro 315 Pro Val 330
Ile Pro
Pro Asp
Ala Gly
Asp Lys 395 Lys Val 410
Arg Glu Ala Tyr Pro His
Lys Thr Ala
Gly Met His 270
Ala Gly Asp 285
Gly Gly Ile 300
Thr Thr Asn
Met Leu Ala
Val Val Ala 350
Pro Ala Ala
365 Leu Asp Gly 380
Asn Leu Tyr
Ala Gly Ser
Phe Leu Thr 430
Ile Glu Leu
445 Pro Val Glu 460
Thr 255 Cys
Lys
Ile
Ser
Tyr 335 Ser
Asn
Ile
Asp
Leu 415 Arg
Arg
Phe
Phe
His
Tyr
Lys
Tyr 320 Ser
Pro
Pro
Ile
Leu 400 Asp
Gly
Lys
Glu
<210> SEQ ID NO: 3 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 3
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag ata aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Ile Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa atg gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 8 64
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
1008 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 4 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGSlMl
<400> Seqüência: 4
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Ile Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 5 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm2
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 5
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 15 10 15 ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 4 80
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa gtg gcg acc gcc agt cag aac gaa gtg gea acc 672
Ala His His His Glu Val Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gea cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270 atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate aac aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro,
355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc act gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 6 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M2
<400> Seqüência: 6 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Val Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 7 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm3
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 7
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gag gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
ttc gac gaa cct acg ctg ate att cgc tgt gac att etc gag ccg ggc 288
Phe Asp Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205 gcg cac cac cac gaa gcg gcg acc gcc ggt cag aac gaa gtg gca acc 672
Ala His His His Glu Ala Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 8 64
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tet gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 8 <211> Comprimento: 4 69 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras : Informações :: AGS1M3 <400> Seqüência: 8 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Asp Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Ala Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 9 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm4
<221> Nome/Chave: CDS
<222> Localização: (1)...(141Q)
<400> Seqüência: 9
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg cag ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg acg ate gac gat ate gaa ggc gcc tgg aac
480 Ile Arg Gly Ser His Val Thr Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tct tcg cag gat ctg 576 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac cac gaa atg gcg acc gcc ggt cag aac gaa gtg gca acc 672 Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tac aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864 Met Ser Leu Tyr Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 ccg ccg gaa gaa gaa Pro Pro Glu Glu Glu 405
gag gcg atg gcc gcg Glu Ala Met Ala Ala 420
ggc gtg ttc acc gac Gly Val Phe Thr Asp 435
gaa gag atg gac cgc Glu Glu Met Asp Arg 450
ctg tac tac age gtc Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 10 <211> Comprimento: <212> Tipo: PRT <213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M4
<400> Seqüência: : 10 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Thr Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248 Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 410 415
ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296 Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 425 430
gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344 Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 440 445
gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Val Arg Met Thr Pro His Pro Val Glu Phe Glu 455 460
taa 1410
*
469 Met Ser
Gly Gly 290 His Ala 305
Lys Arg
Ala Arg
Lys Ala
Tyr Leu 370 Asn Lys 385
Pro Pro
Glu Ala
Gly Val
Glu Glu 450 Leu Tyr 465
260 Leu Tyr 275
Leu Ser
Lys Ala
Leu Val
Asn Arg 340 Arg Arg 355
Cys Phe
Ile His
Glu Glu
Met Ala 420 Phe Thr 435
Met Asp Tyr Ser
Lys Asn Gly
Glu Thr Ala 295
Ile Asn Ala
310 Pro Gly Tyr 325
Ser Ala Ser
Ile Glu Ala
Ala Ala Leu 375
Pro Gly Asp
390 Glu Ala Glu 405
Ala Leu Asn
Asp Asp Ala
Arg Val Arg 455
Val
265 Thr Asn Leu 280
Leu Phe Tyr
Leu Ala Asn
Glu Ala Pro 330
Ile Arg Ile
345 Arg Phe Pro 360
Leu Met Ala
Ala Met Asp
Ile Pro Lys 410
Glu Asp Arg
425 Ile Asp Ala 440
Met Thr Pro
Phe Ala
Ile Gly 300 Pro Thr 315
Val Met
Pro Val
Asp Pro
Gly Leu 380 Lys Asn 395
Val Ala
Glu Phe
Tyr Ile
His Pro 460
270 Gly Asp 285
Gly Ile
Thr Asn
Leu Ala
Val Ala 350 Ala Ala 365
Asp Gly
Leu Tyr
Gly Ser
Leu Thr 430 Glu Leu 445
Val Glu
Lys
Ile
Ser
Tyr 335 Ser
Asn
Ile
Asp
Leu 415 Arg
Arg
Phe
Tyr
Lys
Tyr 320 Ser
Pro
Pro
Ile
Leu 400 Asp
Gly
Lys
Glu
<210> SEQ ID NO: 11 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm6
<221> Nome/Chave: CDS
<222> Localização: (1)... (1410)
<400> Seqüência: 11
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att etc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly acc atg caa Thr Met Gln
gaa gac ttc Glu Asp Phe 115
cca gag cct Pro Glu Pro 130
ate cgc ggt Ile Arg Gly 145
tcc ggc aca Ser Gly Thr
aaa ggc ggt Lys Gly Gly
cgt tcc acc Arg Ser Thr 195
gcg cac cac Ala His His 210
cgc ttc aac Arg Phe Asn 225
tac gtg gtg Tyr Val Val
atg ccg aag Met Pro Lys
atg tcg ctg Met Ser Leu 275
ggc ggc ctg Gly Gly Leu 290
cac gcc aag His Ala Lys 305
aaa cgt ctg Lys Arg Leu
gcc cgt aac
85
ggc tac gat Gly Tyr Asp 100
ctg cgc tcc Leu Arg Ser
gag ttc ttc Glu Phe Phe
tcc cac gtg Ser His Val 150
aaa tac gac Lys Tyr Asp 165
tac ttc ccg Tyr Phe Pro 180
atg tgt ctg Met Cys Leu
cac gaa gtg His Glu Val
acc atg acc Thr Met Thr 230
cac aac gtg His Asn Val 245
ccc atg ttc Pro Met Phe 260
tcc aag aac Ser Lys Asn
tet gaa acc Ser Glu Thr
gcg ate aac Ala Ile Asn 310
gtg cca ggc Val Pro Gly 325
cgc tcc gcg
cgc gac ccg Arg Asp Pro 105
tcc ggc ate Ser Gly Ile 120
ctg ttc gac Leu Phe Asp 135
gcg ate gac Ala Ile Asp
ggc ggc aac Gly Gly Asn
gtt cca ccg Val Pro Pro 185
acc atg gaa Thr Met Glu 200
gcg acc gcc Ala Thr Ala 215
aag aaa gcc Lys Lys Ala
gcg cac gcc Ala His Ala
ggc gtc aac Gly Val Asn 265
ggc acc aac Gly Thr Asn 280
gea ctg ttc Ala Leu Phe 295
gcg ctg gcc Ala Leu Ala
tac gaa gcg Tyr Glu Ala
tcc ate agt'
90
cgt tcc ate Arg Ser Ile
gcg gac acc Ala Asp Thr
gac ate cgc Asp Ile Arg 140
gat ate gaa Asp Ile Glu 155
aaa ggc cac Lys Gly His 170
gtc gac tet Val Asp Ser
gag atg ggc Glu Met Gly
ggt cag aac Gly Gln Asn 220
gac gaa att Asp Glu Ile 235
ttc ggt aaa Phe Gly Lys 250
ggt tcc ggc Gly Ser Gly
ctg ttc gcc Leu Phe Ala
tac ate ggc Tyr Ile Gly 300
aac cca acc Asn Pro Thr 315
ccg gtg atg Pro Val Met 330
ate ccg gtg
95
tcc aaa cgc Ser Lys Arg 110
gtg ctg ttc Val Leu Phe 125
ttc ggc age Phe Gly Ser
ggc gcc tgg Gly Ala Trp
cgt ccg gcg Arg Pro Ala 175
tcg cag gat Ser Gln Asp 190
ctg gtg gtt Leu Val Val 205
gaa atg gea Glu Met Ala
cag ate tat Gln Ile Tyr
acc gcg acc Thr Ala Thr 255
atg cac tgc Met His Cys 270
ggc gac aaa Gly Asp Lys 285
ggt ate ate Gly Ile Ile
acc aac tcg Thr Asn Ser
ctg gct tac Leu Ala Tyr 335
gtc gcc age
gcc 336 Ala
ggg 384 Gly
age 432 Ser
aac 480 Asn 160
gtg 528 Val
ctg 576 Leu
gaa 624 Glu
acc 672 Thr
aag 720
Lys
240
ttc 768 Phe
cac 816 His
tac 864 Tyr
aag 912 Lys
tac 960
Tyr
320
tcc 1008 Ser
ccg 1056 Ala Arg Asn Arg Ser Ala Ser Ile Ser Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 12 <211> Comprimento: 4 69 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M6
<400> Seqüência: 12
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu 20 Arg Phe Thr Asp Thr 25 Lys Gly Lys Glu Gln 30 His Val Thr Ile Pro 35 Ala His Gln Val Asn 40 Ala Asp Phe Phe Glu 45 Glu Gly Lys Met Phe 50 Asp Gly Ser Ser Ile 55 Gly Gly Trp Lys Gly 60 Ile Asn Glu Ser Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr 85 Leu Ile Ile Arg Cys 90 Asp Ile Leu Glu Pro 95 Gly Thr Met Gln Gly 100 Tyr Asp Arg Asp Pro 105 Arg Ser Ile Ser Lys 110 Arg Ala Glu Asp Phe 115 Leu Arg Ser Ser Gly 120 Ile Ala Asp Thr Val 125 Leu Phe Gly Pro Glu 130 Pro Glu Phe Phe Leu 135 Phe Asp Asp Ile Arg 140 Phe Gly Ser Ser Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Met Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Val Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Ser Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val 465 <210> SEQ ID NO: : 13 <211> Comprimento: 1410 <212> Tipo: DNA <213> Organismo : Seqüência Artificial <220> Características: <223> Outras Informações: agslm7 <221> Nome/Chave: CDS <222> Localização: (1) · ..(1410) <400> Seqüência : 13 atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 ttc gta gac ctg cgt ttc act gac a cc aag ggt aag gaa cag cac gtg Phe Val Asp Leu o η Arg Phe Thr Asp Thr O C Lys Gly Lys Glu Gln ι η His Val act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att etc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggt age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cat gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc tgc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Cys Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tpt tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa atg gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg cct gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac Ala Arg Asn
aaa gcg cgc Lys Ala Arg 355
tac ctg tgc Tyr Leu Cys 370
aac aag ate Asn Lys Ile 385
ccg ccg gaa Pro Pro Glu
gag gcg atg Glu Ala Met
ggc gtg ttc Gly Val Phe 435
gaa gag atg Glu Glu Met 450
ctg tac tac Leu Tyr Tyr 465
cgc tcc gcg Arg Ser Ala 340
cgc ate gaa Arg Ile Glu
ttc CfCC CJCH
Phe Ala Ala
cac cct ggc His Pro Gly 390
gaa gaa gcc Glu Glu Ala 405
gcc gcg ctg Ala Ala Leu 420
acc gac gat Thr Asp Asp
gac cgc gtt Asp Arg Val
age gtc taa Ser Val *
tcc ate cgt Ser Ile Arg 345
gcc cgc ttc Ala Arg Phe 360
ctg ctg atg Leu Leu Met 375
gac gcc atg Asp Ala Met
gag ate cca Glu Ile Pro
aac gaa gac Asn Glu Asp 425
gcg ate gat Ala Ile Asp 440
cgc atg acg Arg Met Thr 455
ate ccg gtg Ile Pro Val
ccg gat ccg Pro Asp Pro
rrr·^· r^ /~r η
■a —
Ala Gly Leu 380
gac aga aac Asp Arg Asn 395
aaa gtg gcc Lys Val Ala 410
cgc gag ttc Arg Glu Phe
gcc tac ate Ala Tyr Ile
cca cac ccg Pro His Pro 460
gtc gcc age
Val Ala Ser 350
gcg gct aac
Ala Ala Asn 365
ÇâC Cj Cj C α lC
Asp Gly Ile
ctg tac gac Leu Tyr Asp
ggc tcg ctg Gly Ser Leu 415
ctg acc cgc Leu Thr Arg 430
gaa ctg cgc Glu Leu Arg 445
gtc gag ttc Val Glu Phe
ccg 1056 Pro
cca 1104 Pro
~ -i -t c o
Cl l- X -L Z
Ile
ctg 1200
Leu
400
gac 1248 Asp
ggc 1296 Gly
aaa 1344 Lys
gaa 1392 Glu
1410
<210> SEQ ID NO: 14
<211> Comprimento: 469
<212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M7
<400> Seqüência: 14
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Cys Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 onn í. U U ΟΛΕ Zw^ Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Arg Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 15 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: agslm8
<221> Nome/Chave: CDS
<222> Localização: (1)... (1410)
<400> Seqüência: 15
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser Rn RR cn
J J DD \j
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac cac gaa gtg gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate agt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Ser Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg tgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Cys Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val * 465
<210> SEQ ID NO: 16 <211> Comprimento: 4 69 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M8
<400> Seqüência: 16 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Tnr Leu Ile Ile Arg Cys Asp Ile Leu ^ t.. VJ _L U Pro r* Ί . . o j- y 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Ser Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405
Glu Ala Met Ala Ala 420
Gly Val Phe Thr Asp 435
Glu Glu Met Asp Arg 450
Leu Tyr Tyr Ser Val 465
410
Leu Asn Glu Asp Arg Glu 425
Asp Ala Ile Asp Ala Tyr 440
Val Arg Met Thr Pro His 455
415
Phe Leu Thr Arg Gly 430
Ile Glu Leu Cys Lys 445
Pro Val Glu Phe Glu 460
<210> SEQ ID NO: 17 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm9
<221> Nome/Chave: CDS
<222> Localização: (1).. . (1410)
<4Q0> Seqüência: 17
atg acc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Thr Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gtc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Val Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tct tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa gtg gcg acc gcc ggt cag aac gaa gtg gca acc 672
Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Gly Gly 290 His Ala 305
Lys Arg
Ala Arg
Lys Ala
Tyr Leu 370 Asn Lys 385
Pro Pro
Glu Ala
Gly Val
Glu Glu 450 Leu Tyr 465
Leu Ser Glu Thr Lys Ala Leu Val
Asn Arg 340 Arg Arg 355
Cys Phe
Ile His
Glu Glu
Met Ala 420 Phe Thr 435
Met Asp Tyr Ser
Ile Asn 310 Pro Gly 325
Ser Ala
Ile Glu
Ala Ala
Pro Gly 390 Glu Ala 405
Ala Leu Asp Asp Arg Val Val
Ala 295 Ala
Tyr
Ser
Ala
Leu 375 Asp
Glu
Asn
Ala
Arg 455
Leu Phe Tyr Ile Leu Ala Glu Ala
Ile Arg 345 Arg Phe 360
Leu Met
Ala Met
Ile Pro
Glu Asp 425 Ile Asp 440
Met Thr
Asn Pro 315 Pro Val 330
Ile Pro
Pro Asp
Ala Gly
Asp Lys 395 Lys Val 410
Arg Glu Ala Tyr Pro His
Gly Gly 300
Thr Thr
Met Leu
Val Val
Pro Ala 365 Leu Asp 380
Asn Leu
Ala Gly
Phe Leu
Ile Glu 445 Pro Val 460
Ile Ile Lys
Asn Ser Tyr 320
Ala Tyr Ser 335
Ala Ser Pro 350
Ala Asn Pro
Gly Ile Ile
Tyr Asp Leu 400
Ser Leu Asp 415
Thr Arg Gly 430
Leu Arg Lys Glu Phe Glu
<210> SEQ ID NO: 19 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslmlO
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 19
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att etc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc
336 Thr Met Gln
gaa gac ttc Glu Asp Phe 115
cca gag cct Pro Glu Pro 130
ate cgc ggt Ile Arg Gly 145
tcc ggc aca Ser Gly Thr
aaa ggc ggt Lys Gly Gly
cgt tcc acc Arg Ser Thr 195
gcg cac cac Ala His His 210
cgc ttc aac Arg Phe Asn 225
tac gtg gtg Tyr Val Val
atg ccg aag Met Pro Lys
atg tcg ctg Met Ser Leu 275
ggc ggc ctg Gly Gly Leu 290
cac gcc aag His Ala Lys 305
aaa cgt ctg Lys Arg Leu
gcc cgt aac Ala Arg Asn
Gly Tyr Asp 100
ctg cgc tcc Leu Arg Ser
gag ttc ttc Glu Phe Phe
tcc cac atg Ser His Met 150
aaa tac gac Lys Tyr Asp 165
tac ttc ccg Tyr Phe Pro 180
atg tgt ctg Met Cys Leu
cac gaa gtg His Glu Val
acc atg acc Thr Met Thr 230
cac aac gtg His Asn Val 245
ccc atg ttc Pro Met Phe 260
tcc aag aac Ser Lys Asn
tet gaa acc Ser Glu Thr
gcg ate aac Ala Ile Asn 310
gtg cca ggc Val Pro Gly 325
cgc tcc gcg Arg Ser Ala 340
Arg Asp Pro 105
tcc ggc ate Ser Gly Ile 120
ctg ttc gac Leu Phe Asp 135
gcg ate gac Ala Ile Asp
ggc ggc aac Gly Gly Asn
gtt cca ccg Val Pro Pro 185
acc atg gaa Thr Met Glu 200
gcg acc gcc Ala Thr Ala 215
aag aaa gcc Lys Lys Ala
gcg cac gcc Ala His Ala
ggc gac aac Gly Asp Asn 265
ggc acc aac Gly Thr Asn 280
gea ctg ttc Ala Leu Phe 295
gcg ctg gcc Ala Leu Ala
tac gaa gcg Tyr Glu Ala
tcc ate cgt Ser Ile Arg 345
Arg Ser Ile
gcg gac acc Ala Asp Thr
gac ate cgc Asp Ile Arg 140
gat ate gaa Asp Ile Glu 155
aaa ggc cac Lys Gly His 170
gtc gac tet Val Asp Ser
gag atg ggc Glu Met Gly
ggt cag aac Gly Gln Asn 220
gac gaa att Asp Glu Ile 235
ttc ggt aaa Phe Gly Lys 250
ggt tcc ggc Gly Ser Gly
ctg ttc gcc Leu Phe Ala
tac ate ggc Tyr Ile Gly 300
aac ccg acc Asn Pro Thr 315
ccg gtg atg Pro Val Met 330
ate ccg gtg Ile Pro Val
Ser Lys Arg 110
gtg ctg ttc Val Leu Phe 125
ttc ggc age Phe Gly Ser
ggc gcc tgg Gly Ala Trp
cgt ccg gcg Arg Pro Ala 175
tcg cag gat Ser Gln Asp 190
ctg gtg gtt Leu Val Val 205
gaa gtg gea Glu Val Ala
cag ate tat Gln Ile Tyr
acc gcg acc Thr Ala Thr 255
atg cac tgc Met His Cys 270
ggc gac aaa Gly Asp Lys 285
ggt ate ate Gly Ile Ile
acc aac tcg Thr Asn Ser
ctg gct tac Leu Ala Tyr 335
gtc gcc age Val Ala Ser 350
Ala
ggg 384 Gly
age 432 Ser
aac 480 Asn 160
gtg 528 Val
ctg 576 Leu
gaa 624 Glu
acc 672 Thr
aag 720
Lys
240
ttc 768 Phe
cac 816 His
tac 864 Tyr
aag 912 Lys
tac 960
Tyr
320
tcc 1008 Ser
ccg 1056 Pro aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tat gac ctg 1200 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 12 96 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 20 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M10
<400> Seqüência: ; 20 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Met Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 o c r\ Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val 4 65 <210> SEQ ID NO: : 21 <211> Comprimento: 1410 <212> Tipo: DNA <213> Organismo: : Seqüência Artificial <220> Características: <223> Outras Informações: agslmll <221> Nome/Chave: CDS <222> Localização: (1) ·. ..(1410) <400> Seqüência: : 21 atg tcc gct gaa cac gtt ttg acg atg CtC aat gag cat gaa gtg aaa Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tct ate gct ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Ala Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tct tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa gag gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Glu Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 7 68
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc cta tct gaa acc gea ctg ttc tac ate ggc ggt ate att aag
912 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gat aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cat ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 22 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGSIMll
<400> Seqüência: 22
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Ala Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 ■ 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Glu Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Ara Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tw1- Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 23
<211> Comprimento: 1410
<212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml2 <221> Nome/Chave: CDS
<222> Localização: (1) . .. (1410)
<400> Seqüência: 23
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gat ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg att gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Ile Glu
195 200 205
gcg cac cac cac gaa atg gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro '
355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465 <210> SEQ ID NO: 24 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M12
<400> Seqüência: 24
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Ile Glu
195 200 205
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp 435
Glu Glu Met Asp Arg Val 450
Leu Tyr Tyr Ser Val 465
Ala Ile Asp Ala Tyr 440
Arg Met Thr Pro His 455
Ile Glu Leu Arg Lys 445
Pro Val Glu Phe Glu 460
<210> SEQ ID NO: 25 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml3
<221> Nome/Chave: CDS
<222> Localização: (1) ... (1410)
<400> Seqüência: 25
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac aat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asn Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc atg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Met Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tct tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac cac gaa atg gcg acc gcc ggt cag aac gaa gtg gca acc 672
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
J^1 245 250 255
W
m
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
1296 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgt aaa 1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 26 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGSIMl3
<400> Seqüência: 26 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asn Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Met Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310
Lys Arg Leu Val Pro Gly 325
Ala Arg Asn Arg Ser Ala 340
Lys Ala Arg Arg Ile Glu 355
Tyr Leu Cys Phe Ala Ala 370
Asn Lys Ile His Pro Gly 385 390
Pro Pro Glu Glu Glu Ala 405
Glu Ala Met Ala Ala Leu 420
Gly Val Phe Thr Asp Asp 435
Glu Glu Met Asp Arg Val 450
Leu Tyr Tyr Ser Val 465
315
Tyr Glu Ala Pro Val 330
Ser Ile Arg Ile Pro 345
Ala Arg Phe Pro Asp 360
Leu Leu Met Ala Gly 375
Asp Ala Met Asp Lys 395
Glu Ile Pro Lys Val 410
Asn Glu Asp Arg Glu 425
Ala Ile Asp Ala Tyr 440
Arg Met Thr Pro His 455
320
Met Leu Ala Tyr Ser 335
Val Val Ala Ser Pro 350
Pro Ala Ala Asn Pro 365
Leu Asp Gly Ile Ile 380
Asn Leu Tyr Asp Leu 400
Ala Gly Ser Leu Asp 415
Phe Leu Thr Arg Gly 430
Ile Glu Leu Arg Lys 445
Pro Val Glu Phe Glu 460
<210> SEQ ID NO: 27 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml4
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 27
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 4 8
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att etc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 gaa gac ttc Glu Asp Phe 115
cca gag cct Pro Glu Pro 130
ate cgc ggt Ile Arg Gly 145
tcc ggc aca Ser Gly Thr
aaa ggc ggt Lys Gly Gly
cgt tcc acc Arg Ser Thr 195
gcg cac cac Ala His His 210
cgc ttc aac Arg Phe Asn 225
tac gtg gtg Tyr Val Val
atg ccg aag Met Pro Lys
atg tcg ctg Met Ser Leu 275
age ggc ctg Ser Gly Leu 290
cac gcc aag His Ala Lys 305
aaa cgt ctg Lys Arg Leu
gcc cgt aac Ala Arg Asn
aaa gcg cgc Lys Ala Arg 355
ctg cgc tcc Leu Arg Ser
gag ttc ttc Glu Phe Phe
tcc cac atg
Ser His Met 150
aaa tac aac Lys Tyr Asn 165
tac ttc ccg
Tyr Phe Pro 180
atg tgt ctg
Met Cys Leu
cac gaa atg His Glu Met
acc atg acc Thr Met Thr 230
cac aac gtg His Asn Val 245
ccc atg ttc Pro Met Phe 260
tcc aag aac Ser Lys Asn
tet gaa acc Ser Glu Thr
gcg ate aac Ala Ile Asn 310
gtg cca ggc Val Pro Gly 325
cgc tcc gcg Arg Ser Ala 340
cgc ate gaa Arg Ile Glu
tcc ggc ate Ser Gly Ile 120
ctg ttc gac Leu Phe Asp 135
gcg ate gac Ala Ile Asp
ggc ggc aac Gly Gly Asn
gtt cca ccg Val Pro Pro 185
acc atg gaa Thr Met Glu 200
gcg acc gcc Ala Thr Ala 215
aag aaa gcc Lys Lys Ala
gcg cac gcc Ala His Ala
ggc gac aac Gly Asp Asn 265
ggc acc aac Gly Thr Asn 280
gea ctg ttc Ala Leu Phe 295
gcg ctg gcc Ala Leu Ala
tac gaa gcg Tyr Glu Ala
tcc ate cgt Ser Ile Arg 345
gcc cgc ttc Ala Arg Phe 360
gcg gac acc Ala Asp Thr
gac ate cgc Asp Ile Arg 140
gat ate gaa Asp Ile Glu 155
aaa ggc cac Lys Gly His 170
gtc gac tet Val Asp Ser
gag atg ggc Glu Met Gly
ggt cag aac Gly Gln Asn 220
gac gaa att Asp Glu Ile 235
ttc ggt aaa Phe Gly Lys 250
ggt tcc ggc Gly Ser Gly
ctg ttc gcc Leu Phe Ala
tac ate ggc Tyr Ile Gly 300
aac ccg acc Asn Pro Thr 315
ccg gtg atg Pro Val Met 330
ate ccg gtg Ile Pro Val
cct gat ccg Pro Asp Pro
gtg ctg ttc Val Leu Phe 125
ttc ggc age Phe Gly Ser
ggc gcc tgg Gly Ala Trp
cgt ccg gcg Arg Pro Ala 175
tcg cag gat Ser Gln Asp 190
ctg gtg gtt Leu Val Val 205
gaa gtg gea Glu Val Ala
cag ate tat Gln Ile Tyr
acc gcg acc Thr Ala Thr 255
atg cac tgc Met His Cys 270
ggc gac aaa Gly Asp Lys 285
ggt ate ate Gly Ile Ile
acc aac tcg Thr Asn Ser
ctg gct tac Leu Ala Tyr 335
gtc gcc age Val Ala Ser 350
gcg gct aac Ala Ala Asn 365
ggg 384 Gly
age 432 Ser
aac 480 Asn 160
gtg 528 Val
ctg 576 Leu
gaa 624 Glu
acc 672 Thr
aag 720
Lys
240
ttc 768 Phe
cac 816 His
tac 864 Tyr
aag 912 Lys
tac 960
Tyr
320
tcc 1008 Ser
ccg 1056 Pro
cca 1104 Pro tat ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ceg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gtc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Val Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
m
<210> SEQ ID NO: 28 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M14
<400> Seqüência: 28
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Met Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asn Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Ser Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
Tyr Leu Cys Pne Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
Glu Ala Met Val Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
Leu Tyr Tyr Ser Val 465
<220> Características:
<223> Outras Informações: agslml5
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 29
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc gct ate ggt ggt tgg aag ggc ate aac gaa tet 192
<210> SEQ ID NO: 29 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial Met Phe Asp Gly Ser Ala Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gat ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gta gcg ate gac gat ate gaa ggc gcc tgg aac 480 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gea cac cac cac gaa gtg gcg acc gcc ggt cag aac gaa gtg gea acc 672 Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate ate aag 912 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gea ctg cta atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
^Pi aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg igcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
I
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 30 <211> Comprimento: 4 69 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M15
<400> Seqüência: 30
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ala Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val
465
<210> SEQ ID NO: 31
<211> Comprimento: 1410
<212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml6
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410) <400> Seqüência: 31
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 14 4
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288 Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro. Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576 Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac aac gaa gtg gcg acc gcc agt cag aac gaa gtg gea acc 672 Ala His His Asn Glu Val Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gea cac gcc ttc ggt aaa acc gcg acc ttc 768 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate aac aag 912 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys 290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc act gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 32 <211> Comprimento: 4 69 <212> Tipo: PRT <213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGSIMl6
<400> Seqüência: 32
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp -I- Ί ^ J-±G Ax y Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His Asn Glu Val Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 33 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml7
<221> Nome/Chave: CDS
<222> Localização: {1) ... (1410)
<400> Seqüência: 33
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288 Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576 Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac acc gag gca gcg acc gct age cag aac gaa gtg gea acc 672
Ala His His Thr Glu Ala Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gca cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 8 64
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tet gaa acc gca ctg ttc tac ate ggc ggt ate aac aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc act gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa
1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 34 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M17
<400> Seqüência: 34
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His Thr Glu Ala Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser 340
Lys Ala Arg Arg Ile 355
Tyr Leu Cys Phe Ala 370
Asn Lys Ile His Pro 385
Pro Pro Glu Glu Glu 405
Glu Ala Met Ala Ala 420
Gly Val Phe Thr Asp 435
Glu Glu Met Asp Arg 450
Leu Tyr Tyr Ser Val 465
Ala Ser Ile Arg Ile Pro 345
Glu Ala Arg Phe Pro Asp 360
Ala Leu Leu Met Ala Gly 375
Gly Asp Ala Met Asp Lys 390 395
Ala Glu Ile Pro Lys Val 410
Leu Asn Glu Asp Arg Glu 425
Asp Ala Ile Asp Ala Tyr 440
Val Arg Met Thr Pro His 455
Val Val Ala Ser Pro 350
Pro Ala Ala Asn Pro 365
Leu Asp Gly Ile Ile 380
Asn Leu Tyr Asp Leu 400
Ala Gly Ser Leu Asp 415
Phe Leu Thr Arg Gly 430
Ile Glu Leu Arg Lys 445
Pro Val Glu Phe Glu 460
<210> SEQ ID NO: 35 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Següência Artificial
<220> Características:
<223> Outras Informações: agslml8
<221> Nome/Chave: CDS
<222> Localização: (1) ... (1410)
<400> Seqüência: 35
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125 cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 4 80
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac acg gaa tcc gcg acc gct age cag aac gaa gtg gea acc 672
Ala His His Thr Glu Ser Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gea cac gcc ttc ggt aaa acc gcg acc ttc 7 68
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate aac aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
1152 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ceg gaa Pro Pro Glu
gag gcg atg Glu Ala Met
ggc gtg ttc Gly Val Phe 435
gaa gag atg Glu Glu Met 450
ctg tac tac Leu Tyr Tyr 465
gaa gaa gcc Glu Glu Ala 405
gcc gcg ctg Ala Ala Leu 420
act gac gat Thr Asp Asp
gac cgc gtt Asp Arg Val
age gtc taa Ser Val *
gag ate cca Glu Ile Pro
aac gaa gac Asn Glu Asp 425
gcg ate gat Ala Ile Asp 440
cgc atg acg Arg Met Thr 455
aaa gtg gcc Lys Val Ala 410
cgc gag ttc Arg Glu Phe
gcc tac ate Ala Tyr Ile
cca cac ccg Pro His Pro 460
ggc tcg ctg Gly Ser Leu 415
ctg acc cgc Leu Thr Arg 430
gaa ctg cgc Glu Leu Arg 445
gtc gag ttc Val Glu Phe
gac 1248 Asp
ggc 1296 Gly
aaa 1344 Lys
gaa 1392 Glu
1410
<210> SEQ ID NO: 36 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M18
<400> Seqüência: 36
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80 Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His Thr Glu Ser Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 37 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslml9
<221> Nome/Chave: CDS
<222> Localização: (1)..-(1410)
<400> Seqüência: 37
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet 'ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60 gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 4 32
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
gcg cac cac tcc gag gcc gcg acc gct age cag aac gaa gtg gea acc 672
Ala His His Ser Glu Ala Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gea cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate aac aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320 aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 124 8
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc act gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 38 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGSIMl9
<400> Seqüência: 38
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140 Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160 Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175 Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205 Ala His His Ser Glu Ala Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys 290 295 300 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335 Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro 340 345 350 Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460 Leu Tyr Tyr Ser Val
465
<210> SEQ ID NO: 39 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm20
<221> Nome/Chave: CDS
<222> Localização: (1) ... (1410)
<400> Seqüência: 39
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac atg gag cat gcg acc gct age cag aac gaa gtg gea acc 672
Ala His His Met Glu His Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gea cac gcc ttc ggt aaa acc gcg acc ttc 768 Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255 atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
ggc ggc ctg tct gaa acc gca ctg ttc tac ate ggc ggt ate aac aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc act gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val
465
<210> SEQ ID NO: 40 <211> Comprimento: 4 69 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características: <223> Outras Informações: AGS1M20 <400> Seqüência: 40
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His Met Glu His Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu 385 390 395 400
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
Leu Tyr Tyr Ser Val 465 <210> SEQ ID NO: 41 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agslm21
<221> Nome/Chave: CDS
<222> Localização: (1)...{1410)
<400> Seqüência: 41
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys 1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg age 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Ser
145 150 155 160
tcc ggc aca aaa tac gac aga ggc aac aaa ggc cac cgt ccg gcg gtg 528 Ser Gly Thr Lys Tyr Asp Arg Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624 Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac cac gaa atg gcg acc gcc ggt cag aac gaa gtg gca acc 672
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tet gaa acc gca ctg ttc tac ate ggc ggt ate ate aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr
305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gca ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg tac gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Tyr Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445 gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 42 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGS1M21
<400> Seqüência: 42
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Tnr Ile Pro Aia His Gin Vai Asn Ala Asp Pne Pne Glu Glu Giy Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Ser 145 150 155 160
Ser Gly Thr Lys Tyr Asp Arg Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His His Glu Met Ala Thr Ala Gly Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360
Tyr Leu Cys Phe Ala Ala Leu Leu
370 375
Asn Lys Ile His Pro Gly Asp Ala 385 390
Pro Pro Glu Glu Glu Ala Glu Ile 405
Glu Ala Met Ala Ala Leu Asn Glu 420
Gly Val Phe Thr Asp Asp Ala Ile 435 440
Glu Glu Met Asp Arg Val Arg Met
450 455
Leu Tyr Tyr Ser Val 465
365
Met Ala Gly Leu Asp Gly Ile Ile 380
Met Asp Lys Asn Leu Tyr Asp Leu 395 400
Pro Lys Val Ala Gly Ser Leu Asp
410 415
Asp Arg Glu Phe Leu Thr Arg Gly 425 430
Asp Ala Tyr Ile Glu Leu Arg Lys 445
Thr Pro His Pro Val Glu Phe Glu 460
<210> SEQ ID NO: 43 <211> Comprimento: 1543 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: agsl(ad-)
<221> Nome/Chave: CDS
<222> Localização: (1)...(1410)
<400> Seqüência: 43
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48 Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96 Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val 20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144 Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys 35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192 Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
ttc gaa gaa cct acg ctg ate att cgc tgt gac att etc gag ccg ggc 288 Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly 85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336 Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg ctg ttc ggg 384 Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432 Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val 165 170 175
aaa ggc ggt tac ttc ccg gtt cca ccg gtc gac tet tcg cag gat ctg 57 6
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac cac gaa gtg gcg acc gcc ggt cag aac gaa gtg gea acc 672
Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
tac gtg gtg cac aac gtg gcg cac gcc ttc ggt aaa acc gcg acc ttc 7 68
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe 245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864 Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate ate aag 912 Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys 290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008 Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser 325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro 355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152 Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile 370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg ttc gac ctg
1200 Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Phe Asp Leu 385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248 Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp 405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296 Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly 420 425 430
ggc gtg ttc acc gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344 Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys 435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392 Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu 450 455 460
ctg tac tac age gtc taa gccctacccg cgccgtctgc aaaggcggac 1440
Leu Tyr Tyr Ser Val *
465
ggcgcccaca attttctgca ggtcgacaag cttgcggccg cactcgagtc tggtaaagaa 1500 accgctgctg cgaaatttga acgccagcac atggactcgt cta 1543
<210> SEQ ID NO: 44 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AGSl(AD-)
<400> Seqüência: 44
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Phe Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala
100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Pro Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His His Glu Val Ala Thr Ala Gly Gln Asn Glu Val Ala Thr 210 215 220 Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Ile Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Phe Asp Leu 385 390 395 400
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
Glu Alá Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 45 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: agslml7(ad-)
<221> Nome/Chave: CDS
<222> Localização: (1). . . (1410)
<400> Seqüência: 45
atg tcc gct gaa cac gtt ttg acg atg ctg aat gag cat gaa gtg aaa 48
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
1 5 10 15
ttc gta gac ctg cgt ttc act gac acc aag ggt aag gaa cag cac gtg 96
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
act ate ccg gct cac cag gta aac gcc gac ttc ttc gaa gaa ggt aaa 144
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
atg ttt gac ggc tcc tet ate ggt ggt tgg aag ggc ate aac gaa tet 192
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser 50 55 60
gac atg gtg ctg atg ccg gac gcc age acg gcg gtt ctg gat ccg ttc 240 Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe
65 70 75 80
tcc gaa gaa cct acg ctg ate att cgc tgt gac att ctc gag ccg ggc 288
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
acc atg caa ggc tac gat cgc gac ccg cgt tcc ate tcc aaa cgc gcc 336
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
gaa gac ttc ctg cgc tcc tcc ggc ate gcg gac acc gtg Ctg ttc ggg 384
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly 115 120 125
cca gag cct gag ttc ttc ctg ttc gac gac ate cgc ttc ggc age age 432
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser 130 135 140
ate cgc ggt tcc cac gtg gcg ate gac gat ate gaa ggc gcc tgg aac 480
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn
145 150 155 160
tcc ggc aca aaa tac gac ggc ggc aac aaa ggc cac cgt ccg gcg gtg 528
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
aaa ggc ggt tac ttc ccg gtt cca tcg gtc gac tet tcg cag gat ctg 576
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu 180 185 190
cgt tcc acc atg tgt ctg acc atg gaa gag atg ggc ctg gtg gtt gaa 624
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu 195 200 205
gcg cac cac acc gag gea gcg acc gct age cag aac gaa gtg gea acc 672
Ala His His Thr Glu Ala Ala Thr Ala Ser Gln Asn Glu Val Ala Thr 210 215 220
cgc ttc aac acc atg acc aag aaa gcc gac gaa att cag ate tat aag 720
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys
225 230 235 240
tac gtg gtg cac aac gtg gea cac gcc ttc ggt aaa acc gcg acc ttc 768
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
atg ccg aag ccc atg ttc ggc gac aac ggt tcc ggc atg cac tgc cac 816
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His 260 265 270
atg tcg ctg tcc aag aac ggc acc aac ctg ttc gcc ggc gac aaa tac 864
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr 275 280 285
ggc ggc ctg tet gaa acc gea ctg ttc tac ate ggc ggt ate aac aag 912
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys 290 295 300
cac gcc aag gcg ate aac gcg ctg gcc aac ccg acc acc aac tcg tac 960 His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320 aaa cgt ctg gtg cca ggc tac gaa gcg ccg gtg atg ctg gct tac tcc 1008
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
gcc cgt aac cgc tcc gcg tcc ate cgt ate ccg gtg gtc gcc age ccg 1056
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 ' 350
aaa gcg cgc cgc ate gaa gcc cgc ttc ccg gat ccg gcg gct aac cca 1104
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
tac ctg tgc ttc gcc gea ctg ctg atg gcc ggc ctg gac ggc ate ate 1152
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
aac aag ate cac cct ggc gac gcc atg gac aaa aac ctg ttc gac ctg 1200
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Phe Asp Leu
385 390 395 400
ccg ccg gaa gaa gaa gcc gag ate cca aaa gtg gcc ggc tcg ctg gac 1248
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
gag gcg atg gcc gcg ctg aac gaa gac cgc gag ttc ctg acc cgc ggc 1296
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
ggc gtg ttc act gac gat gcg ate gat gcc tac ate gaa ctg cgc aaa 1344
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
gaa gag atg gac cgc gtt cgc atg acg cca cac ccg gtc gag ttc gaa 1392
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
ctg tac tac age gtc taa 1410
Leu Tyr Tyr Ser Val *
465
<210> SEQ ID NO: 46 <211> Comprimento: 469 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: AGS1M17(AD-)
<400> Seqüência: 46
Met Ser Ala Glu His Val Leu Thr Met Leu Asn Glu His Glu Val Lys
15 10 15
Phe Val Asp Leu Arg Phe Thr Asp Thr Lys Gly Lys Glu Gln His Val
20 25 30
Thr Ile Pro Ala His Gln Val Asn Ala Asp Phe Phe Glu Glu Gly Lys
35 40 45
Met Phe Asp Gly Ser Ser Ile Gly Gly Trp Lys Gly Ile Asn Glu Ser
50 55 60
Asp Met Val Leu Met Pro Asp Ala Ser Thr Ala Val Leu Asp Pro Phe 65 70 75 80
Ser Glu Glu Pro Thr Leu Ile Ile Arg Cys Asp Ile Leu Glu Pro Gly
85 90 95
Thr Met Gln Gly Tyr Asp Arg Asp Pro Arg Ser Ile Ser Lys Arg Ala 100 105 110
Glu Asp Phe Leu Arg Ser Ser Gly Ile Ala Asp Thr Val Leu Phe Gly
115 120 125
Pro Glu Pro Glu Phe Phe Leu Phe Asp Asp Ile Arg Phe Gly Ser Ser
130 135 140
Ile Arg Gly Ser His Val Ala Ile Asp Asp Ile Glu Gly Ala Trp Asn 145 150 155 160
Ser Gly Thr Lys Tyr Asp Gly Gly Asn Lys Gly His Arg Pro Ala Val
165 170 175
Lys Gly Gly Tyr Phe Pro Val Pro Ser Val Asp Ser Ser Gln Asp Leu
180 185 190
Arg Ser Thr Met Cys Leu Thr Met Glu Glu Met Gly Leu Val Val Glu
195 200 205
Ala His His Thr Glu Ala Ala Thr Ala Ser Gln Asn Glu Val Ala Thr
210 215 220
Arg Phe Asn Thr Met Thr Lys Lys Ala Asp Glu Ile Gln Ile Tyr Lys 225 230 235 240
Tyr Val Val His Asn Val Ala His Ala Phe Gly Lys Thr Ala Thr Phe
245 250 255
Met Pro Lys Pro Met Phe Gly Asp Asn Gly Ser Gly Met His Cys His
260 265 270
Met Ser Leu Ser Lys Asn Gly Thr Asn Leu Phe Ala Gly Asp Lys Tyr
275 280 285
Gly Gly Leu Ser Glu Thr Ala Leu Phe Tyr Ile Gly Gly Ile Asn Lys
290 295 300
His Ala Lys Ala Ile Asn Ala Leu Ala Asn Pro Thr Thr Asn Ser Tyr 305 310 315 320
Lys Arg Leu Val Pro Gly Tyr Glu Ala Pro Val Met Leu Ala Tyr Ser
325 330 335
Ala Arg Asn Arg Ser Ala Ser Ile Arg Ile Pro Val Val Ala Ser Pro
340 345 350
Lys Ala Arg Arg Ile Glu Ala Arg Phe Pro Asp Pro Ala Ala Asn Pro
355 360 365
Tyr Leu Cys Phe Ala Ala Leu Leu Met Ala Gly Leu Asp Gly Ile Ile
370 375 380
Asn Lys Ile His Pro Gly Asp Ala Met Asp Lys Asn Leu Phe Asp Leu 385 390 395 400
Pro Pro Glu Glu Glu Ala Glu Ile Pro Lys Val Ala Gly Ser Leu Asp
405 410 415
Glu Ala Met Ala Ala Leu Asn Glu Asp Arg Glu Phe Leu Thr Arg Gly
420 425 430
Gly Val Phe Thr Asp Asp Ala Ile Asp Ala Tyr Ile Glu Leu Arg Lys
435 440 445
Glu Glu Met Asp Arg Val Arg Met Thr Pro His Pro Val Glu Phe Glu
450 455 460
Leu Tyr Tyr Ser Val 465
<210> SEQ ID NO: 47 <211> Comprimento: 1410 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: synagslml6
<400> Seqüência: 47
atgtcagcag agcatgtgct caccatgctg aatgagcatg aggtgaagtt cgtggacctc 60
cgcttcaccg acaccaaggg caaggagcag catgtcacca tccctgctca tcaagtcaac 120
gccgacttct ttgaagaagg caagatgttt gatggaagct caattggagg atggaagggc 180
atcaatgaga gcgacatggt gctgatgcca gatgcttcga cggcggtgct ggaccccttc 240
tcagaagaac caacattgat catcagatgt gacatcctgg agcctggcac catgcaaggc 300 tatgatcgag atccaagaag catcagcaag cgcgccgagg acttcttgag gagcagcggc 360
atcgccgaca ccgtgctctt cgggccggag ccggagttct tcctcttcga cgacatcaga 420
tttggatcaa gcatcagagg aagtcatgtg gccatcgacg acattgaagg agcatggaac 480
agcggcacca agtacgacgg cggcaacaag ggccaccggc cggcggtgaa gggcggctac 540
ttcccggtgc cgtcggtgga cagcagccaa gatttgagga gcaccatgtg cctcacaatg 600
gaggagatgg ggctggtggt ggaagctcat cacaacgagg tggcgacggc atcacaaaat 660
gaggtggcaa caaggttcaa caccatgacc aagaaggctg atgagatcca gatctacaag 720
tatgtggtgc acaatgttgc tcatgccttc ggcaagacgg ccaccttcat gcccaagcca 780
atgttcggcg acaatggaag cggcatgcac tgccacatga gcttgagcaa gaatggcacc 840
aacctatttg ctggagacaa gtacggcggc ctttctgaga cggcgctctt ctacatcggc 900
ggcatcaaca agcatgccaa ggccatcaac gcgctggcca accccaccac caacagctac 960
aagaggctgg tgcctggata tgaggcgccg gtgatgctgg catattcagc aaggaacagg 1020
agcgcctcca tcaggattcc tgtggtggcc tcgcccaagg caagaagaat tgaagcaaga 1080
tttccagatc ccgccgccaa cccttattta tgcttcgccg cgctgctgat ggccggcctg 1140
gatggcatca tcaacaagat ccatcctgga gatgcaatgg acaagaacct ctacgacctg 1200
ccgccagaag aagaagctga gatccccaag gtggctggat cattggatga agcaatggcg 1260
gcgctcaatg aagatcgaga gttcctcacc cgcggcggcg tcttcactga tgatgccatc 1320
gacgcctaca tcgagctgag gaaggaggag atggacaggg tgaggatgac gccgcacccg 1380
gtggagtttg agctctacta ctccgtgtaa 1410
Claims (66)
1. Polinucleotídeo isolado compreendendo um variante de SEQ ID NO: 1, caracterizado pelo fato de que dito polinucleotídeo variante é pelo menos 80% idêntico a SEQ ID NO: 1 e codifica um polipeptídeo que é resistente a inibição por inibidor de glutamina sintetase herbicida.
2. Polinucleotídeo isolado de acordo com a reivindicação 1, caracterizado pelo fato de que dito polipeptídeo compreende pelo menos uma modificação entre os aminoácidos - 125 a 175 ou pelo menos uma modificação entre os aminoácidos 200 a 250 correspondentes a SEQ ID NO:2.
3. Polinucleotídeo isolado de acordo com a reivindicação 2, caracterizado pelo fato de que é selecionado do grupo consistindo de SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, - 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 47, ou a seqüência de nucleotídeos de resistência a herbicidas do inserto de DNA do plasmídeo depositado como No. de Acesso NRRL B-30930.
4. Polinucleotídeo isolado de acordo com a reivindicação 1, caracterizado pelo fato de que dito polinucleotídeo codifica um polipeptídeo tendo pelo menos uma modificação que resulta na perda de um sítio de adenilação em dito polipeptídeo.
5. Polinucleotideo isolado de acordo com a reivindicação -4, caracterizado pelo fato de que é selecionado do grupo consistindo de SEQ ID NO:43 e 45.
6. Polinucleotideo isolado de acordo com a reivindicação -1, caracterizado pelo fato de que dito inibidor de glutamina sintetase herbicida compreende glufosinato.
7. Polinucleotideo isolado de acordo com a reivindicação -1, caracterizado pelo fato de que dito polinucleotídeo é uma seqüência sintética que foi projetada para expressão em uma planta.
8. Polinucleotídeo isolado caracterizado por ser de SEQ ID NO: 1.
9. Vetor caracterizado por compreender o polinucleotídeo de acordo com a reivindicação 1.
10. Vetor de acordo com a reivindicação 9, caracterizado por compreender, ainda, um polinucleotideo codificando um polipeptideo heterólogo.
11. Célula hospedeira caracterizada por conter o vetor de acordo com a reivindicação 9.
12. Célula hospedeira de acordo com a reivindicação 11, caracterizada por ser uma célula hospedeira bacteriana.
13. Célula hospedeira de acordo com a reivindicação 11, caracterizada por ser uma célula vegetal.
14. Planta transgênica caracterizada por compreender a célula hospedeira de acordo com a reivindicação 9.
15. Planta de acordo com a reivindicação 14, caracterizada por compreender, ainda, um ou mais de um polinucleotideo codificando um gene de tolerância a herbicidas ou um polinucleotideo codificando um gene de tolerância a insetos.
16. Planta de acordo com a reivindicação 15, caracterizada pelo fato de que dito gene de tolerância a herbicidas é um gene de EPSP sintase.
17. Planta de acordo com a reivindicação 15, caracterizada pelo fato de que dito gene de tolerância a insetos é uma endotoxina.
18. Planta de acordo com a reivindicação 14, caracterizada pelo fato de que dita planta é selecionada do grupo consistindo em milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada e colza.
19. Semente transformada caracterizada por compreender o polinucleotideo de acordo com a reivindicação 1.
20. Polipeptideo isolado compreendendo um variante de SEQ ID NO: 2, caracterizado pelo fato de que dito polipeptideo variante é pelo menos 80% idêntico a SEQ ID NO: 2 e é resistente a inibição por inibidor de glutamina sintetase herbicida.
21. Polipeptídeo isolado de acordo com a reivindicação 20, caracterizado pelo fato de que dito polipeptídeo compreende pelo menos uma modificação entre os aminoácidos 125 a 175 ou pelo menos uma modificação entre os aminoácidos 200 a 250 correspondentes a SEQ ID NO:2.
22. Polipeptídeo isolado de acordo com a reivindicação 19, caracterizado por ser selecionado do grupo consistindo em SEQ ID NOS: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, -28, 30, 32, 34, 36, 38, 40, 42, ou um polipeptídeo que é codificado pela seqüência de nucleotídeos de resistência a herbicidas do inserto de DNA do plasmídeo depositado como No. de Acesso NRRL B- 30930.
23. Polipeptídeo isolado de acordo com a reivindicação 20, caracterizado pelo fato de que dito polipeptídeo compreende pelo menos uma modificação que resulta na perda de um sítio de adenilação em dito polipeptídeo.
24. Polipeptídeo isolado de acordo com a reivindicação 23, caracterizado por ser selecionado do grupo consistindo em SEQ ID NO:44 e 46.
25. Polipeptideo isolado de acordo com a reivindicação 22, caracterizado pelo fato de que dito inibidor de glutamina sintetase herbicida compreende glufosinato.
26. Polipeptideo de acordo com a reivindicação 23, caracterizado por compreender, ainda, uma seqüência de aminoácidos heteróloga.
27. Polipeptideo isolado caracterizado por ser de SEQ ID NO: 2.
28. Método para conferir resistência a inibidores herbicidas de glutamina sintetase em uma planta caracterizado por compreender transformar dita planta com um polinucleotideo compreendendo um variante de SEQ ID NO: -1, em que dito polinucleotideo variante é pelo menos 80% idêntico a SEQ ID N0:1 e codifica um polipeptideo que é resistente a inibição por inibidor de glutamina sintetase herbicida, e regenerar uma planta transformada.
29. Método de acordo com a reivindicação 28, caracterizado pelo fato de que dito polipeptideo compreende pelo menos uma modificação entre os aminoácidos 125 a 175 ou pelo menos uma modificação entre os aminoácidos 200 to 250 correspondentes a SEQ ID NO:2.
30. Método de acordo com a reivindicação 29, caracterizado pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, - 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, ou 47.
31. Método de acordo com a reivindicação 28, caracterizado pelo fato de que dito polinucleotideo codifica um polipeptideo tendo pelo menos uma modificação que resulta na perda de um sitio de adenilação em dito polipeptideo.
32. Método de acordo com a reivindicação 31, caracterizado pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NO:43 e 45.
33. Método de acordo com a reivindicação 28, caracterizado pelo fato de que dito inibidor de glutamina sintetase herbicida compreende glufosinato.
34. Método de acordo com a reivindicação 28, caracterizado pelo fato de que dito método compreende ainda a transformação de dita planta com um ou mais de um polinucleotideo codificando um gene de tolerância a herbicidas ou um polinucleotideo codificando um gene de tolerância a insetos.
35. Método de acordo com a reivindicação 34, caracterizado pelo fato de que dito gene de tolerância a herbicidas é um gene de EPSP sintase.
36. Método de acordo com a reivindicação 34, caracterizado pelo fato de que dito gene de tolerância a insetos é uma endotoxina.
37. Planta caracterizada por ter estavelmente incorporada em seu genoma uma construção de DNA compreendendo um polinucleotideo compreendendo um variante de SEQ ID NO: 1 , em que dito polinucleotideo variante é pelo menos 80% idêntico a SEQ ID N0:1 e codifica um polipeptideo que é resistente a inibição por inibidor de glutamina sintetase herbicida.
38. Planta de acordo com a reivindicação 37, caracterizada pelo fato de que dito polipeptideo compreende pelo menos uma modificação entre os aminoácidos 125 a 17 5 ou pelo menos uma modificação entre os aminoácidos 200 a 250 correspondentes a SEQ ID NO: 2.
39. Planta de acordo com a reivindicação 38, caracterizada pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, -17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, ou 47.
40. Planta de acordo com a reivindicação 37, caracterizada pelo fato de que dito polinucleotideo codifica um polipeptideo tendo pelo menos uma modificação que resulta na perda de um sitio de adenilação em dito polipeptideo.
41. Planta de acordo com a reivindicação 40, caracterizada pelo fato de que dito polinucleotideo é selecionado do grupo consistindo em SEQ ID NO:43 e 45.
42. Planta de acordo com a reivindicação 37, caracterizada pelo fato de que dito inibidor de glutamina sintetase herbicida compreende glufosinato.
43. Planta de acordo com a reivindicação 37, caracterizada pelo fato de que dita planta é uma célula vegetal.
44. Planta de acordo com a reivindicação 37, caracterizada pelo fato de compreender, ainda, um ou mais de um polinucleotideo codificando um gene de tolerância a herbicidas ou um polinucleotideo codificando um gene de tolerância a insetos.
45. Planta de acordo com a reivindicação 44, caracterizada pelo fato de que dito gene de tolerância a herbicidas é um gene de EPSP sintase.
46. Planta de acordo com a reivindicação 44, caracterizada pelo fato de que dito gene de tolerância a insetos é uma endotoxina.
47. Planta de acordo com a reivindicação 37, caracterizada pelo fato de que dita planta é selecionada do grupo consistindo de milho, sorgo, trigo, girassol, tomate, cruciferas, pimentas batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada e colza.
48. Método para controlar seletivamente ervas daninhas em um campo contendo uma planta tendo sementes plantadas ou plantas, caracterizado por compreender as etapas de: a) plantar as sementes ou plantas que são resistentes a inibidor de glutamina sintetase herbicida como resultado de um polinucleotideo compreendendo um variante de SEQ ID NO: 1 sendo inserido na semente ou planta, caracterizado pelo fato de que dito polinucleotideo variante é pelo menos 80% idêntico a SEQ ID NO:l e codifica um polipeptideo que é resistente a inibição por inibidor de glutamina sintetase herbicida; e, b) aplicar às plantas e ervas daninhas em um campo, uma concentração efetiva de um inibidor de glutamina sintetase herbicida para controlar ervas daninhas sem afetar significativamente as plantas.
49. Método de acordo com a reivindicação 48, caracterizado °pelo fato de que dito polipeptideo compreende pelo menos uma modificação entre os aminoácidos 125 a 175 ou pelo menos uma modificação entre os aminoácidos 200 a 250 correspondentes a SEQ ID NO: 2.
50. Método de acordo com a reivindicação 4 9, caracterizado pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, -17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, ou 47.
51. Método de acordo com a reivindicação 48, caracterizado pelo fato de que dito polinucleotideo codifica um polipeptideo tendo pelo menos uma modificação que resulta na perda de um sitio de adenilação em dito polipeptideo.
52. Método de acordo com a reivindicação 51, caracterizado pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NO:43 e 45.
53. Método de acordo com a reivindicação 50, caracterizado pelo fato de que dito inibidor de glutamina sintetase herbicida compreende glufosinato.
54. Método de acordo com a reivindicação 48, caracterizado pelo fato de que dita planta ou semente compreende ainda um ou mais de um polinucleotideo codificando um gene de tolerância a herbicidas ou uma polinucleotideo codificando um gene de tolerância a insetos.
55. Método de acordo com a reivindicação 54, caracterizado pelo fato de que dito gene de tolerância a herbicidas é um gene de EPSP sintase.
56. Método de acordo com a reivindicação 54, caracterizado pelo fato de que dito gene de tolerância a insetos é uma endotoxina.
57. Método para melhorar a produção em uma planta caracterizado pelo fato de que compreende introduzir, em dita planta, um polinucleotideo codificando uma enzima glutamina sintetase derivada de uma bactéria.
58. Método de acordo com a reivindicação 57, caracterizado pelo fato de que dito polinucleotideo compreende um variante de SEQ ID N0:1, caracterizado pelo fato de que dito polinucleotideo variante é pelo menos 80% idêntico a SEQ ID NO: 1 e codifica um polipeptideo que é resistente a inibição por inibidor de glutamina sintetase herbicida.
59. Método de acordo com a reivindicação 58, caracterizado pelo fato de que dito polinucleotideo compreende um polinucleotideo selecionado do grupo consistindo de SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, -31, 33, 35, 37, 39, 41, 47, ou a seqüência de nucleotideos de resistência a herbicidas do inserto de DNA do plasmideo depositado como No. de Acesso NRRL B-30930.
60. Método de acordo com a reivindicação 57, caracterizado pelo fato de que dito polinucleotideo codifica a polipeptideo tendo pelo menos uma modificação que resulta na perda de um sitio de adenilação in dito polipeptideo.
61. Método de acordo com a reivindicação 60, caracterizado pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NO:43 e 45.
62. Método para melhorar a utilização de nitrogênio em uma planta caracterizado pelo fato de que compreende introduzir, em dita planta, um polinucleotideo codificando uma enzima glutamina sintetase derivada de uma bactéria.
63. Método de acordo com a reivindicação 62, caracterizado pelo fato de que dito polinucleotideo compreende um variante de SEQ ID NO: 1, caracterizado pelo fato de que dito polinucleotideo variante é pelo menos 80% idêntico a SEQ ID NO: Ie codifica um polipeptideo que é resistente a inibição por inibidor de glutamina sintetase herbicida.
64. Método de acordo com a reivindicação 63, caracterizado pelo fato de que dito polinucleotideo compreende um polinucleotideo selecionado do grupo consistindo de SEQ ID NOS: 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, -31, 33, 35, 37, 39, 41, 43, 45, 47, ou a seqüência de nucleotideos de resistência a herbicidas do inserto de DNA do plasmideo depositado como No. de Acesso NRRL B-30930.
65. Método de acordo com a reivindicação 62, caracterizado pelo fato de que dito polinucleotideo codifica um polipeptideo tendo pelo menos uma modificação que resulta na perda de um sitio de adenilação in dito polipeptideo.
66. Método de acordo com a reivindicação 65, caracterizado pelo fato de que dito polinucleotideo é selecionado do grupo consistindo de SEQ ID NO:43 e 45.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US81200006P | 2006-06-08 | 2006-06-08 | |
| US60/812,000 | 2006-06-08 | ||
| PCT/US2007/070690 WO2007146767A2 (en) | 2006-06-08 | 2007-06-08 | Bacterial glutamine synthetases and methods of use |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0711953A2 true BRPI0711953A2 (pt) | 2012-01-17 |
Family
ID=38832699
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0711953-4A BRPI0711953A2 (pt) | 2006-06-08 | 2007-06-08 | polinucleotìdeo isolado e polipeptìdeo conferindo resistência a glutamina sintetase e métodos para produzir plantas e células vegetais transgênicas apresentando produção e utilização de nitrogênio melhoradas |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US7910805B2 (pt) |
| EP (1) | EP2024494B1 (pt) |
| AR (1) | AR061314A1 (pt) |
| BR (1) | BRPI0711953A2 (pt) |
| ES (1) | ES2418843T3 (pt) |
| ME (1) | MEP88108A (pt) |
| WO (1) | WO2007146767A2 (pt) |
Families Citing this family (55)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8097712B2 (en) | 2007-11-07 | 2012-01-17 | Beelogics Inc. | Compositions for conferring tolerance to viral disease in social insects, and the use thereof |
| US8962584B2 (en) | 2009-10-14 | 2015-02-24 | Yissum Research Development Company Of The Hebrew University Of Jerusalem, Ltd. | Compositions for controlling Varroa mites in bees |
| EP2525658B1 (de) | 2010-01-22 | 2017-03-01 | Bayer Intellectual Property GmbH | Akarizide und/oder insektizide wirkstoffkombinationen |
| ES2641642T3 (es) | 2010-03-08 | 2017-11-10 | Monsanto Technology Llc | Moléculas de polinucleótido para regulación génica en plantas |
| AU2011264075B2 (en) | 2010-06-09 | 2015-01-29 | Bayer Cropscience Nv | Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering |
| US9593317B2 (en) | 2010-06-09 | 2017-03-14 | Bayer Cropscience Nv | Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering |
| EP2640706B1 (en) | 2010-11-15 | 2017-03-01 | Bayer Intellectual Property GmbH | N-aryl pyrazole(thio)carboxamides |
| US9265252B2 (en) | 2011-08-10 | 2016-02-23 | Bayer Intellectual Property Gmbh | Active compound combinations comprising specific tetramic acid derivatives |
| CN103890181A (zh) | 2011-08-22 | 2014-06-25 | 拜尔作物科学公司 | 修饰植物基因组的方法和手段 |
| MX361938B (es) | 2011-09-13 | 2018-12-19 | Monsanto Technology Llc | Métodos y composiciones para el control de malezas. |
| CA2848695A1 (en) | 2011-09-13 | 2013-03-21 | Monsanto Technology Llc | Methods and composition for weed control comprising inhibiting ppg oxidase |
| EP3382027A3 (en) | 2011-09-13 | 2018-10-31 | Monsanto Technology LLC | Methods and compositions for weed control |
| US10829828B2 (en) | 2011-09-13 | 2020-11-10 | Monsanto Technology Llc | Methods and compositions for weed control |
| US10806146B2 (en) | 2011-09-13 | 2020-10-20 | Monsanto Technology Llc | Methods and compositions for weed control |
| US9840715B1 (en) | 2011-09-13 | 2017-12-12 | Monsanto Technology Llc | Methods and compositions for delaying senescence and improving disease tolerance and yield in plants |
| US10760086B2 (en) | 2011-09-13 | 2020-09-01 | Monsanto Technology Llc | Methods and compositions for weed control |
| WO2013040057A1 (en) | 2011-09-13 | 2013-03-21 | Monsanto Technology Llc | Methods and compositions for weed control |
| US9920326B1 (en) | 2011-09-14 | 2018-03-20 | Monsanto Technology Llc | Methods and compositions for increasing invertase activity in plants |
| AU2013254857B2 (en) | 2012-04-23 | 2018-04-26 | Bayer Cropscience Nv | Targeted genome engineering in plants |
| MX360866B (es) | 2012-05-24 | 2018-11-09 | A B Seeds Ltd | Composiciones y métodos para silenciar la expresión genética. |
| CA2888264A1 (en) | 2012-10-18 | 2014-04-24 | Monsanto Technology Llc | Methods and compositions for plant pest control |
| BR112015014307A2 (pt) | 2012-12-19 | 2017-07-11 | Bayer Cropscience Ag | difluorometil-nicotínico- tetrahidronaftil carboxamidas |
| US10683505B2 (en) | 2013-01-01 | 2020-06-16 | Monsanto Technology Llc | Methods of introducing dsRNA to plant seeds for modulating gene expression |
| UY35252A (es) | 2013-01-01 | 2014-07-31 | Seeds Ltd Ab | MÉTODOS PARA INTRODUCIR dsRNA EN SEMILLAS DE PLANTAS PARA MODULAR LA EXPRESIÓN GENÉTICA |
| US10000767B2 (en) | 2013-01-28 | 2018-06-19 | Monsanto Technology Llc | Methods and compositions for plant pest control |
| BR112015023051A2 (pt) | 2013-03-13 | 2017-11-14 | Monsanto Technology Llc | método para controle de ervas daninhas, composição herbicida, cassete de expressão microbiano e método de produção de polinucleotídeo |
| US10612019B2 (en) | 2013-03-13 | 2020-04-07 | Monsanto Technology Llc | Methods and compositions for weed control |
| US20140283211A1 (en) | 2013-03-14 | 2014-09-18 | Monsanto Technology Llc | Methods and Compositions for Plant Pest Control |
| US10568328B2 (en) | 2013-03-15 | 2020-02-25 | Monsanto Technology Llc | Methods and compositions for weed control |
| EP3030663B1 (en) | 2013-07-19 | 2019-09-04 | Monsanto Technology LLC | Compositions and methods for controlling leptinotarsa |
| US9850496B2 (en) | 2013-07-19 | 2017-12-26 | Monsanto Technology Llc | Compositions and methods for controlling Leptinotarsa |
| AU2014341879B2 (en) | 2013-11-04 | 2020-07-23 | Greenlight Biosciences, Inc. | Compositions and methods for controlling arthropod parasite and pest infestations |
| UA119253C2 (uk) | 2013-12-10 | 2019-05-27 | Біолоджикс, Інк. | Спосіб боротьби із вірусом у кліща varroa та у бджіл |
| WO2015108982A2 (en) | 2014-01-15 | 2015-07-23 | Monsanto Technology Llc | Methods and compositions for weed control using epsps polynucleotides |
| WO2015153339A2 (en) | 2014-04-01 | 2015-10-08 | Monsanto Technology Llc | Compositions and methods for controlling insect pests |
| CN106795515B (zh) | 2014-06-23 | 2021-06-08 | 孟山都技术公司 | 用于经由rna干扰调控基因表达的组合物和方法 |
| US11807857B2 (en) | 2014-06-25 | 2023-11-07 | Monsanto Technology Llc | Methods and compositions for delivering nucleic acids to plant cells and regulating gene expression |
| CN106604993A (zh) | 2014-07-29 | 2017-04-26 | 孟山都技术公司 | 用于控制昆虫害虫的组合物和方法 |
| CN108064288B (zh) | 2015-01-22 | 2021-11-26 | 孟山都技术公司 | 用于控制叶甲属的组合物和方法 |
| CN107531676A (zh) | 2015-04-13 | 2018-01-02 | 拜耳作物科学股份公司 | N‑环烷基‑n‑(双杂环基亚乙基)‑(硫代)羧酰胺衍生物 |
| EP3302053B1 (en) | 2015-06-02 | 2021-03-17 | Monsanto Technology LLC | Compositions and methods for delivery of a polynucleotide into a plant |
| WO2016196782A1 (en) | 2015-06-03 | 2016-12-08 | Monsanto Technology Llc | Methods and compositions for introducing nucleic acids into plants |
| CA3012607A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Crispr enzymes and systems |
| WO2017132330A1 (en) | 2016-01-26 | 2017-08-03 | Monsanto Technology Llc | Compositions and methods for controlling insect pests |
| WO2018064208A1 (en) | 2016-09-28 | 2018-04-05 | The Broad Institute, Inc. | Systematic screening and mapping of regulatory elements in non-coding genomic regions, methods, compositions, and applications thereof |
| US11591601B2 (en) | 2017-05-05 | 2023-02-28 | The Broad Institute, Inc. | Methods for identification and modification of lncRNA associated with target genotypes and phenotypes |
| EP3625342B1 (en) | 2017-05-18 | 2022-08-24 | The Broad Institute, Inc. | Systems, methods, and compositions for targeted nucleic acid editing |
| CN107523576B (zh) * | 2017-10-19 | 2023-02-03 | 上海市农业科学院 | 氧化木糖无色杆菌谷氨酰胺合成酶基因及其应用 |
| US10968257B2 (en) | 2018-04-03 | 2021-04-06 | The Broad Institute, Inc. | Target recognition motifs and uses thereof |
| CN112574967B (zh) * | 2020-12-31 | 2023-08-01 | 四川天豫兴禾生物科技有限公司 | 植物来源的具有草铵膦抗性的谷氨酰胺合成酶突变体、核酸分子以及应用 |
| CN113736757B (zh) * | 2021-09-15 | 2023-12-15 | 四川天豫兴禾生物科技有限公司 | 一种具有草铵膦抗性的谷氨酰胺合成酶突变体、核酸分子及应用 |
| CN114058600B (zh) * | 2021-11-16 | 2023-12-08 | 四川天豫兴禾生物科技有限公司 | 一种具有草铵膦抗性的谷氨酰胺合成酶突变体及其应用 |
| CA3252382A1 (en) * | 2022-03-23 | 2023-09-28 | Boehringer Ingelheim International Gmbh | NEW VARIANTS OF GLUTAMINE SYNTHETASE AS A SELECTION MARKER |
| CN114774375B (zh) * | 2022-04-25 | 2024-04-19 | 四川天豫兴禾生物科技有限公司 | 一种获得具有草铵膦抗性的蛋白的方法及谷氨酰胺合成酶突变体 |
| CN114807064B (zh) * | 2022-06-06 | 2024-04-19 | 四川天豫兴禾生物科技有限公司 | 一种获得具有草铵膦抗性的蛋白的方法及其突变体 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5145777A (en) * | 1984-10-01 | 1992-09-08 | The General Hospital Corporation | Plant cells resistant to herbicidal glutamine synthetase inhibitors |
| ATE57390T1 (de) * | 1986-03-11 | 1990-10-15 | Plant Genetic Systems Nv | Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen. |
| US5098838A (en) * | 1986-09-15 | 1992-03-24 | The General Hospital Corporation | Expression of wild type and mutant glutamine synthetase in foreign hosts |
| US5955651A (en) * | 1989-05-03 | 1999-09-21 | New York University | Transgenic plants that exhibit enhanced nitrogen assimilation |
| US5739082A (en) * | 1990-02-02 | 1998-04-14 | Hoechst Schering Agrevo Gmbh | Method of improving the yield of herbicide-resistant crop plants |
| US6107547A (en) * | 1993-10-06 | 2000-08-22 | New York University | Transgenic plants that exhibit enhanced nitrogen assimilation |
| US20030041357A1 (en) * | 1996-11-07 | 2003-02-27 | Zeneca Limited | Herbicide resistant plants |
| US7041814B1 (en) * | 1998-02-18 | 2006-05-09 | Genome Therapeutics Corporation | Nucleic acid and amino acid sequences relating to Enterobacter cloacae for diagnostics and therapeutics |
-
2007
- 2007-06-08 AR ARP070102519A patent/AR061314A1/es unknown
- 2007-06-08 BR BRPI0711953-4A patent/BRPI0711953A2/pt not_active IP Right Cessation
- 2007-06-08 ES ES07798273T patent/ES2418843T3/es active Active
- 2007-06-08 US US11/760,602 patent/US7910805B2/en active Active
- 2007-06-08 EP EP07798273.4A patent/EP2024494B1/en active Active
- 2007-06-08 WO PCT/US2007/070690 patent/WO2007146767A2/en not_active Ceased
- 2007-06-08 ME MEP-881/08A patent/MEP88108A/xx unknown
-
2011
- 2011-02-15 US US13/027,666 patent/US8101389B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US8101389B2 (en) | 2012-01-24 |
| US20110136200A1 (en) | 2011-06-09 |
| ES2418843T3 (es) | 2013-08-16 |
| WO2007146767A8 (en) | 2008-02-14 |
| WO2007146767A2 (en) | 2007-12-21 |
| US20090018016A1 (en) | 2009-01-15 |
| MEP88108A (en) | 2011-12-20 |
| AR061314A1 (es) | 2008-08-20 |
| US7910805B2 (en) | 2011-03-22 |
| WO2007146767A3 (en) | 2008-04-17 |
| EP2024494A2 (en) | 2009-02-18 |
| EP2024494B1 (en) | 2013-04-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2418843T3 (es) | Glutamina sintetasas bacterianas y métodos de uso | |
| AU2007347119B2 (en) | Improved GRG23 EPSP synthases: compositions and methods of use | |
| US7960616B2 (en) | Directed evolution of GRG31 EPSP synthase enzyme | |
| AU2007223364B2 (en) | Methods and compositions for improved enzyme activity in transgenic plant | |
| BRPI0713039A2 (pt) | molécula de ácido nucléico e polipeptìdeo isolados, vetor, célula hospedeira, planta e semente transgênicas e métodos para produzir um polipeptìdeo com atividade de resistência a herbicidas, para conferir resistência a um herbicida em uma planta e para gerar um polinucleotìdeo variante de um polinucleotìdeo parental grg33, grg35, grg37, grg38, grg39, ou grgr50. | |
| BRPI0619092A2 (pt) | molécula de ácido nucléico isolada, polipetptìdeo isolado, vetor, célula hospedeira, planta transgênica, semente, método para produzir polipeptìdeo com atividade de resistência à herbicidas, método para conferir resistência à herbicida para planta, método para medir à liberação de fosfato por enzima | |
| ES2364988T3 (es) | Grg23 epsp sintasas mejoradas: composiciones y métodos de uso. | |
| WO2008105905A2 (en) | Methods and compositions for improved enzyme activity in transgenic plants | |
| BRPI0719672B1 (pt) | Isolated polyopeptide isolated, method for producing a polympeptide with resistance activity to herbicides, method for confering resistance to a herbicide in a plant, plant, method for enhancing vigor or yield of a plant, a method for confering glyphosate resistance to a plant | |
| HK1134108B (en) | Improved grg23 epsp synthases: compositions and methods of use |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE A 11A ANUIDADE. |
|
| B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |