BRPI0718977A2 - Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico - Google Patents
Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico Download PDFInfo
- Publication number
- BRPI0718977A2 BRPI0718977A2 BRPI0718977-0A BRPI0718977A BRPI0718977A2 BR PI0718977 A2 BRPI0718977 A2 BR PI0718977A2 BR PI0718977 A BRPI0718977 A BR PI0718977A BR PI0718977 A2 BRPI0718977 A2 BR PI0718977A2
- Authority
- BR
- Brazil
- Prior art keywords
- plant
- nucleic acid
- polypeptide
- acid sequence
- plants
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims description 605
- 238000000034 method Methods 0.000 title claims description 401
- 102000039446 nucleic acids Human genes 0.000 title claims description 216
- 108020004707 nucleic acids Proteins 0.000 title claims description 216
- 230000001965 increasing effect Effects 0.000 title claims description 179
- 230000009261 transgenic effect Effects 0.000 title claims description 55
- 238000004519 manufacturing process Methods 0.000 title claims description 21
- 238000010276 construction Methods 0.000 title claims description 20
- 241000196324 Embryophyta Species 0.000 claims description 720
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 351
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 350
- 229920001184 polypeptide Polymers 0.000 claims description 343
- 108090000623 proteins and genes Proteins 0.000 claims description 306
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 231
- 230000014509 gene expression Effects 0.000 claims description 182
- 210000004027 cell Anatomy 0.000 claims description 130
- 210000004899 c-terminal region Anatomy 0.000 claims description 83
- 240000007594 Oryza sativa Species 0.000 claims description 46
- 235000013339 cereals Nutrition 0.000 claims description 46
- 235000007164 Oryza sativa Nutrition 0.000 claims description 39
- 235000009566 rice Nutrition 0.000 claims description 38
- 238000003306 harvesting Methods 0.000 claims description 36
- 230000008635 plant growth Effects 0.000 claims description 30
- 240000008042 Zea mays Species 0.000 claims description 29
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 25
- 238000002741 site-directed mutagenesis Methods 0.000 claims description 23
- 238000011161 development Methods 0.000 claims description 19
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 17
- 239000002253 acid Substances 0.000 claims description 15
- 108700019146 Transgenes Proteins 0.000 claims description 14
- 244000038559 crop plants Species 0.000 claims description 14
- 240000005979 Hordeum vulgare Species 0.000 claims description 12
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 12
- 241000219195 Arabidopsis thaliana Species 0.000 claims description 10
- 244000062793 Sorghum vulgare Species 0.000 claims description 10
- 230000001174 ascending effect Effects 0.000 claims description 10
- 238000012225 targeting induced local lesions in genomes Methods 0.000 claims description 10
- 235000021307 Triticum Nutrition 0.000 claims description 9
- 241000209510 Liliopsida Species 0.000 claims description 8
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 8
- 238000002744 homologous recombination Methods 0.000 claims description 8
- 230000006801 homologous recombination Effects 0.000 claims description 8
- 235000009973 maize Nutrition 0.000 claims description 8
- 244000075850 Avena orientalis Species 0.000 claims description 7
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 7
- 238000001994 activation Methods 0.000 claims description 7
- 235000007319 Avena orientalis Nutrition 0.000 claims description 6
- 101150104463 GOS2 gene Proteins 0.000 claims description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 5
- 230000008121 plant development Effects 0.000 claims description 5
- 230000001737 promoting effect Effects 0.000 claims description 5
- 230000005030 transcription termination Effects 0.000 claims description 5
- 235000007238 Secale cereale Nutrition 0.000 claims description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 4
- 235000019713 millet Nutrition 0.000 claims description 4
- 239000003147 molecular marker Substances 0.000 claims description 4
- 241000219193 Brassicaceae Species 0.000 claims description 3
- 244000082988 Secale cereale Species 0.000 claims 1
- 240000006394 Sorghum bicolor Species 0.000 claims 1
- 244000098338 Triticum aestivum Species 0.000 claims 1
- 238000009616 inductively coupled plasma Methods 0.000 description 125
- 235000010384 tocopherol Nutrition 0.000 description 125
- 235000019731 tricalcium phosphate Nutrition 0.000 description 125
- 102000004169 proteins and genes Human genes 0.000 description 110
- 235000018102 proteins Nutrition 0.000 description 104
- 101100167641 Arabidopsis thaliana CLV1 gene Proteins 0.000 description 82
- 230000012010 growth Effects 0.000 description 79
- 125000003729 nucleotide group Chemical group 0.000 description 74
- 239000002773 nucleotide Substances 0.000 description 71
- 125000003275 alpha amino acid group Chemical group 0.000 description 67
- 230000035882 stress Effects 0.000 description 67
- 101100219392 Caenorhabditis elegans cah-3 gene Proteins 0.000 description 62
- 230000002068 genetic effect Effects 0.000 description 57
- 210000001519 tissue Anatomy 0.000 description 56
- 230000009466 transformation Effects 0.000 description 41
- 235000001014 amino acid Nutrition 0.000 description 40
- 230000000694 effects Effects 0.000 description 40
- 239000003550 marker Substances 0.000 description 40
- 238000013507 mapping Methods 0.000 description 39
- 108020004999 messenger RNA Proteins 0.000 description 39
- 108020004414 DNA Proteins 0.000 description 38
- 238000009396 hybridization Methods 0.000 description 34
- 150000001413 amino acids Chemical class 0.000 description 32
- 230000008827 biological function Effects 0.000 description 32
- 239000013598 vector Substances 0.000 description 30
- 108091026890 Coding region Proteins 0.000 description 26
- 230000001105 regulatory effect Effects 0.000 description 26
- 239000002028 Biomass Substances 0.000 description 25
- 230000001976 improved effect Effects 0.000 description 25
- 102000003846 Carbonic anhydrases Human genes 0.000 description 24
- 108090000209 Carbonic anhydrases Proteins 0.000 description 24
- 230000000692 anti-sense effect Effects 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 22
- 210000000056 organ Anatomy 0.000 description 21
- 230000035897 transcription Effects 0.000 description 21
- 238000013518 transcription Methods 0.000 description 21
- 238000006467 substitution reaction Methods 0.000 description 20
- 108700008625 Reporter Genes Proteins 0.000 description 19
- 238000009395 breeding Methods 0.000 description 18
- 230000001488 breeding effect Effects 0.000 description 18
- 239000003623 enhancer Substances 0.000 description 18
- 101100211779 Arabidopsis thaliana LRR-RLK gene Proteins 0.000 description 17
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 17
- 235000005822 corn Nutrition 0.000 description 17
- 238000009331 sowing Methods 0.000 description 17
- 241000219194 Arabidopsis Species 0.000 description 16
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 16
- 230000036579 abiotic stress Effects 0.000 description 16
- 239000000523 sample Substances 0.000 description 16
- 230000014616 translation Effects 0.000 description 16
- 238000012217 deletion Methods 0.000 description 15
- 230000037430 deletion Effects 0.000 description 15
- 230000018109 developmental process Effects 0.000 description 15
- 230000002708 enhancing effect Effects 0.000 description 15
- 239000000203 mixture Substances 0.000 description 15
- 238000009739 binding Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 230000027455 binding Effects 0.000 description 13
- 230000007613 environmental effect Effects 0.000 description 13
- 230000036542 oxidative stress Effects 0.000 description 13
- 230000009467 reduction Effects 0.000 description 13
- 238000012546 transfer Methods 0.000 description 13
- 238000013519 translation Methods 0.000 description 13
- 108700028369 Alleles Proteins 0.000 description 12
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 12
- 230000030279 gene silencing Effects 0.000 description 12
- 108091000080 Phosphotransferase Proteins 0.000 description 11
- 108700001094 Plant Genes Proteins 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 210000004901 leucine-rich repeat Anatomy 0.000 description 11
- 102000020233 phosphotransferase Human genes 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 241000894007 species Species 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 230000002411 adverse Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 210000001161 mammalian embryo Anatomy 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- 102100026189 Beta-galactosidase Human genes 0.000 description 9
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 9
- 102000053187 Glucuronidase Human genes 0.000 description 9
- 108010060309 Glucuronidase Proteins 0.000 description 9
- 235000010469 Glycine max Nutrition 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 230000003321 amplification Effects 0.000 description 9
- 108010005774 beta-Galactosidase Proteins 0.000 description 9
- 230000004071 biological effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000002703 mutagenesis Methods 0.000 description 9
- 231100000350 mutagenesis Toxicity 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 238000003199 nucleic acid amplification method Methods 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- 230000002103 transcriptional effect Effects 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- 108090000994 Catalytic RNA Proteins 0.000 description 8
- 102000053642 Catalytic RNA Human genes 0.000 description 8
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 8
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 8
- 235000002595 Solanum tuberosum Nutrition 0.000 description 8
- 244000061456 Solanum tuberosum Species 0.000 description 8
- 241000209140 Triticum Species 0.000 description 8
- 229910002092 carbon dioxide Inorganic materials 0.000 description 8
- -1 epitope Tag · 100 Proteins 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 108091092562 ribozyme Proteins 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 108020005345 3' Untranslated Regions Proteins 0.000 description 7
- 240000002791 Brassica napus Species 0.000 description 7
- 244000068988 Glycine max Species 0.000 description 7
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 7
- 240000003768 Solanum lycopersicum Species 0.000 description 7
- 241000700605 Viruses Species 0.000 description 7
- 150000007513 acids Chemical class 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000004883 computer application Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 230000008641 drought stress Effects 0.000 description 7
- 230000008030 elimination Effects 0.000 description 7
- 238000003379 elimination reaction Methods 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 238000012226 gene silencing method Methods 0.000 description 7
- 239000003921 oil Substances 0.000 description 7
- 235000019198 oils Nutrition 0.000 description 7
- 230000002018 overexpression Effects 0.000 description 7
- 230000008488 polyadenylation Effects 0.000 description 7
- 102000054765 polymorphisms of proteins Human genes 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 6
- 108020003589 5' Untranslated Regions Proteins 0.000 description 6
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 6
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 6
- 108700011259 MicroRNAs Proteins 0.000 description 6
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 238000002105 Southern blotting Methods 0.000 description 6
- 230000004790 biotic stress Effects 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 239000002853 nucleic acid probe Substances 0.000 description 6
- 230000008723 osmotic stress Effects 0.000 description 6
- 210000002706 plastid Anatomy 0.000 description 6
- 230000000644 propagated effect Effects 0.000 description 6
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- 230000000087 stabilizing effect Effects 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 5
- 235000006008 Brassica napus var napus Nutrition 0.000 description 5
- 240000000385 Brassica napus var. napus Species 0.000 description 5
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 241000219823 Medicago Species 0.000 description 5
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 244000061176 Nicotiana tabacum Species 0.000 description 5
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 210000000172 cytosol Anatomy 0.000 description 5
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 230000006303 immediate early viral mRNA transcription Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 230000003584 silencer Effects 0.000 description 5
- 210000000130 stem cell Anatomy 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 108020004463 18S ribosomal RNA Proteins 0.000 description 4
- 108091026821 Artificial microRNA Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 108010068370 Glutens Proteins 0.000 description 4
- 244000020551 Helianthus annuus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 238000000636 Northern blotting Methods 0.000 description 4
- 101000813258 Paspalum notatum Expansin-B Proteins 0.000 description 4
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 4
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 108010050181 aleurone Proteins 0.000 description 4
- 239000000074 antisense oligonucleotide Substances 0.000 description 4
- 238000012230 antisense oligonucleotides Methods 0.000 description 4
- 230000019522 cellular metabolic process Effects 0.000 description 4
- 231100000045 chemical toxicity Toxicity 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000010217 densitometric analysis Methods 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 108010058731 nopaline synthase Proteins 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 230000029553 photosynthesis Effects 0.000 description 4
- 238000010672 photosynthesis Methods 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 235000012015 potatoes Nutrition 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 230000008117 seed development Effects 0.000 description 4
- 238000005204 segregation Methods 0.000 description 4
- 230000019491 signal transduction Effects 0.000 description 4
- 229910052710 silicon Inorganic materials 0.000 description 4
- 239000010703 silicon Substances 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000008107 starch Substances 0.000 description 4
- 230000000638 stimulation Effects 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 108700026220 vif Genes Proteins 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 208000005156 Dehydration Diseases 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 3
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- 241000209056 Secale Species 0.000 description 3
- 101710172711 Structural protein Proteins 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 239000003963 antioxidant agent Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005422 blasting Methods 0.000 description 3
- 230000005779 cell damage Effects 0.000 description 3
- 230000036755 cellular response Effects 0.000 description 3
- 230000005754 cellular signaling Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000009402 cross-breeding Methods 0.000 description 3
- 239000012297 crystallization seed Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000014113 dietary fatty acids Nutrition 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 230000006353 environmental stress Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 239000003925 fat Substances 0.000 description 3
- 235000019197 fats Nutrition 0.000 description 3
- 229930195729 fatty acid Natural products 0.000 description 3
- 239000000194 fatty acid Substances 0.000 description 3
- 150000004665 fatty acids Chemical class 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 238000011049 filling Methods 0.000 description 3
- 239000004459 forage Substances 0.000 description 3
- 230000008014 freezing Effects 0.000 description 3
- 238000007710 freezing Methods 0.000 description 3
- 238000012252 genetic analysis Methods 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 238000011331 genomic analysis Methods 0.000 description 3
- 230000035784 germination Effects 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 230000013632 homeostatic process Effects 0.000 description 3
- 238000007901 in situ hybridization Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 238000009399 inbreeding Methods 0.000 description 3
- 239000003999 initiator Substances 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000002262 irrigation Effects 0.000 description 3
- 238000003973 irrigation Methods 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000000442 meristematic effect Effects 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 231100000219 mutagenic Toxicity 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000012474 protein marker Substances 0.000 description 3
- 108010048762 protochlorophyllide reductase Proteins 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000013077 scoring method Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000005562 seed maturation Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 239000007921 spray Substances 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000001954 sterilising effect Effects 0.000 description 3
- 238000004659 sterilization and disinfection Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 108010068307 Alpha-Globulins Proteins 0.000 description 2
- 102000002572 Alpha-Globulins Human genes 0.000 description 2
- 101100167643 Arabidopsis thaliana CLV3 gene Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 102000005600 Cathepsins Human genes 0.000 description 2
- 108010084457 Cathepsins Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 244000127993 Elaeis melanococca Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 101001059454 Homo sapiens Serine/threonine-protein kinase MARK2 Proteins 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 2
- 241000227653 Lycopersicon Species 0.000 description 2
- 235000002262 Lycopersicon Nutrition 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 241000208133 Nicotiana plumbaginifolia Species 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 102100028904 Serine/threonine-protein kinase MARK2 Human genes 0.000 description 2
- 235000002634 Solanum Nutrition 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000001944 accentuation Effects 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000035578 autophosphorylation Effects 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 229960001948 caffeine Drugs 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-N carbonic acid Chemical compound OC(O)=O BVKZGUZCCUSVTD-UHFFFAOYSA-N 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 230000001010 compromised effect Effects 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- BABWHSBPEIVBBZ-UHFFFAOYSA-N diazete Chemical compound C1=CN=N1 BABWHSBPEIVBBZ-UHFFFAOYSA-N 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000004005 microsphere Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 235000021232 nutrient availability Nutrition 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000009394 selective breeding Methods 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000009105 vegetative growth Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- MWMOPIVLTLEUJO-UHFFFAOYSA-N 2-oxopropanoic acid;phosphoric acid Chemical compound OP(O)(O)=O.CC(=O)C(O)=O MWMOPIVLTLEUJO-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- WFPZSXYXPSUOPY-ROYWQJLOSA-N ADP alpha-D-glucoside Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=CN=C(C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O WFPZSXYXPSUOPY-ROYWQJLOSA-N 0.000 description 1
- WFPZSXYXPSUOPY-UHFFFAOYSA-N ADP-mannose Natural products C1=NC=2C(N)=NC=NC=2N1C(C(C1O)O)OC1COP(O)(=O)OP(O)(=O)OC1OC(CO)C(O)C(O)C1O WFPZSXYXPSUOPY-UHFFFAOYSA-N 0.000 description 1
- 241001075517 Abelmoschus Species 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241001539917 Actina Species 0.000 description 1
- 241000219068 Actinidia Species 0.000 description 1
- 235000011624 Agave sisalana Nutrition 0.000 description 1
- 244000198134 Agave sisalana Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241000209136 Agropyron Species 0.000 description 1
- 240000007241 Agrostis stolonifera Species 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 241000234282 Allium Species 0.000 description 1
- 241000219318 Amaranthus Species 0.000 description 1
- 241000380131 Ammophila arenaria Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 244000296825 Amygdalus nana Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 235000007755 Annona Nutrition 0.000 description 1
- 235000011518 Annona purpurea Nutrition 0.000 description 1
- 240000006199 Annona purpurea Species 0.000 description 1
- 235000002764 Apium graveolens Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 241001605719 Appias drusilla Species 0.000 description 1
- 108700025465 Arabidopsis PYK10 Proteins 0.000 description 1
- 101100167642 Arabidopsis thaliana CLV2 gene Proteins 0.000 description 1
- 101100500204 Arabidopsis thaliana DTX19 gene Proteins 0.000 description 1
- 101100072743 Arabidopsis thaliana IP5P7 gene Proteins 0.000 description 1
- 101100478627 Arabidopsis thaliana S-ACP-DES2 gene Proteins 0.000 description 1
- 101100206190 Arabidopsis thaliana TCP20 gene Proteins 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 235000009393 Avena byzantina Nutrition 0.000 description 1
- 235000007320 Avena fatua Nutrition 0.000 description 1
- 241000209764 Avena fatua Species 0.000 description 1
- 235000018410 Avena fatua var sativa Nutrition 0.000 description 1
- 235000009123 Avena hybrida Nutrition 0.000 description 1
- 240000000372 Avena hybrida Species 0.000 description 1
- 235000014417 Averrhoa Nutrition 0.000 description 1
- 241001072280 Averrhoa Species 0.000 description 1
- 241000209128 Bambusa Species 0.000 description 1
- 241000219164 Bertholletia Species 0.000 description 1
- 235000012284 Bertholletia excelsa Nutrition 0.000 description 1
- 244000205479 Bertholletia excelsa Species 0.000 description 1
- 235000021533 Beta vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 235000004480 Bombax malabaricum Nutrition 0.000 description 1
- 101100001366 Brassica napus BTG-26 gene Proteins 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000008635 Cadaba farinosa Nutrition 0.000 description 1
- 241000628166 Cadaba farinosa Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 244000052707 Camellia sinensis Species 0.000 description 1
- 244000292211 Canna coccinea Species 0.000 description 1
- 235000005273 Canna coccinea Nutrition 0.000 description 1
- 235000008697 Cannabis sativa Nutrition 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 241000973255 Carex elata Species 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 240000004927 Carissa macrocarpa Species 0.000 description 1
- 235000001479 Carissa macrocarpa Nutrition 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241000723418 Carya Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 101001026137 Cavia porcellus Glutathione S-transferase A Proteins 0.000 description 1
- 244000146553 Ceiba pentandra Species 0.000 description 1
- 235000003301 Ceiba pentandra Nutrition 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 241001148660 Cenchrus sp. Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 241000195587 Chlamydomonadaceae Species 0.000 description 1
- 240000006740 Cichorium endivia Species 0.000 description 1
- 235000018536 Cichorium endivia Nutrition 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000009831 Citrullus lanatus Nutrition 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000737241 Cocos Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241000723377 Coffea Species 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 241000723382 Corylus Species 0.000 description 1
- 235000014493 Crataegus Nutrition 0.000 description 1
- 241001092040 Crataegus Species 0.000 description 1
- 235000015655 Crocus sativus Nutrition 0.000 description 1
- 244000124209 Crocus sativus Species 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 244000024469 Cucumis prophetarum Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 108050006400 Cyclin Proteins 0.000 description 1
- 235000003198 Cynara Nutrition 0.000 description 1
- 241000208947 Cynara Species 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 241000522190 Desmodium Species 0.000 description 1
- 102000040623 Dicer family Human genes 0.000 description 1
- 108091070648 Dicer family Proteins 0.000 description 1
- 235000000522 Dimocarpus Nutrition 0.000 description 1
- 241000613447 Dimocarpus Species 0.000 description 1
- 241000234273 Dioscorea Species 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 241000723267 Diospyros Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 235000018060 Elaeis melanococca Nutrition 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241001092070 Eriobotrya Species 0.000 description 1
- 101000933461 Escherichia coli (strain K12) Beta-glucuronidase Proteins 0.000 description 1
- 244000080545 Eucalyptus sp Species 0.000 description 1
- 235000006914 Eucalyptus sp Nutrition 0.000 description 1
- 235000013420 Eugenia uniflora Nutrition 0.000 description 1
- 240000003813 Eugenia uniflora Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 241001070947 Fagus Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 235000008730 Ficus carica Nutrition 0.000 description 1
- 244000025361 Ficus carica Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 235000017317 Fortunella Nutrition 0.000 description 1
- 241000220223 Fragaria Species 0.000 description 1
- 101001026109 Gallus gallus Glutathione S-transferase Proteins 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- 244000194101 Ginkgo biloba Species 0.000 description 1
- 108010061711 Gliadin Proteins 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- 108700023224 Glucose-1-phosphate adenylyltransferases Proteins 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 108050002220 Green fluorescent protein, GFP Proteins 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101150105462 HIS6 gene Proteins 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 108010066161 Helianthus annuus oleosin Proteins 0.000 description 1
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 1
- 235000002941 Hemerocallis fulva Nutrition 0.000 description 1
- 240000009206 Hemerocallis fulva Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001130308 Homo sapiens Ras-related protein Rab-21 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 101150053510 ITR1 gene Proteins 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 235000021506 Ipomoea Nutrition 0.000 description 1
- 241000207783 Ipomoea Species 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- 241000758789 Juglans Species 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 241000219729 Lathyrus Species 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000219743 Lotus Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 235000003956 Luffa Nutrition 0.000 description 1
- 244000050983 Luffa operculata Species 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 241000605547 Luzula sylvatica Species 0.000 description 1
- 241000219816 Macrotyloma Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 240000003394 Malpighia glabra Species 0.000 description 1
- 235000014837 Malpighia glabra Nutrition 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 235000000889 Mammea americana Nutrition 0.000 description 1
- 240000005984 Mammea americana Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 241000213996 Melilotus Species 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 235000009815 Momordica Nutrition 0.000 description 1
- 241000218984 Momordica Species 0.000 description 1
- 240000000249 Morus alba Species 0.000 description 1
- 235000008708 Morus alba Nutrition 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 241001230286 Narenga Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 244000183278 Nephelium litchi Species 0.000 description 1
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 1
- 101000598243 Nicotiana tabacum Probable aquaporin TIP-type RB7-18C Proteins 0.000 description 1
- 101000655028 Nicotiana tabacum Probable aquaporin TIP-type RB7-5A Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241000795633 Olea <sea slug> Species 0.000 description 1
- 240000001439 Opuntia Species 0.000 description 1
- 241001446528 Ornithopus Species 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 240000001516 Oryza latifolia Species 0.000 description 1
- 108700025855 Oryza sativa oleosin Proteins 0.000 description 1
- 101100235056 Oryza sativa subsp. japonica LEA14 gene Proteins 0.000 description 1
- 101100082494 Oryza sativa subsp. japonica PCF1 gene Proteins 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 241000208317 Petroselinum Species 0.000 description 1
- 241000745991 Phalaris Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- 102000016462 Phosphate Transport Proteins Human genes 0.000 description 1
- 108010092528 Phosphate Transport Proteins Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 241000219843 Pisum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 102100036691 Proliferating cell nuclear antigen Human genes 0.000 description 1
- 241001494501 Prosopis <angiosperm> Species 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102000020146 Rab21 Human genes 0.000 description 1
- 241001506137 Rapa Species 0.000 description 1
- 235000019057 Raphanus caudatus Nutrition 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000011380 Raphanus sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 235000009411 Rheum rhabarbarum Nutrition 0.000 description 1
- 244000193032 Rheum rhaponticum Species 0.000 description 1
- 235000011483 Ribes Nutrition 0.000 description 1
- 241000220483 Ribes Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 241001092459 Rubus Species 0.000 description 1
- 101150038966 SAD2 gene Proteins 0.000 description 1
- 108091006597 SLC15A4 Proteins 0.000 description 1
- 101100045761 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TFC4 gene Proteins 0.000 description 1
- 241000921305 Salix sp. Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 241000228160 Secale cereale x Triticum aestivum Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 235000009367 Sesamum alatum Nutrition 0.000 description 1
- 240000000452 Sesamum alatum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 241000220261 Sinapis Species 0.000 description 1
- 244000244100 Solanum integrifolium Species 0.000 description 1
- 235000000099 Solanum integrifolium Nutrition 0.000 description 1
- 101001116809 Solanum tuberosum Patatin group M-1 Proteins 0.000 description 1
- 102100021484 Solute carrier family 15 member 4 Human genes 0.000 description 1
- 241000251131 Sphyrna Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 244000045719 Syzygium Species 0.000 description 1
- 235000012096 Syzygium samarangense Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 241000736851 Tagetes Species 0.000 description 1
- 235000004298 Tamarindus indica Nutrition 0.000 description 1
- 240000004584 Tamarindus indica Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102100036407 Thioredoxin Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- 235000004424 Tropaeolum majus Nutrition 0.000 description 1
- 240000001260 Tropaeolum majus Species 0.000 description 1
- 235000018946 Tropaeolum minus Nutrition 0.000 description 1
- 240000008573 Tropaeolum minus Species 0.000 description 1
- UIRVSEPRMWDVEW-RNXOBYDBSA-N Trp-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N UIRVSEPRMWDVEW-RNXOBYDBSA-N 0.000 description 1
- 101710162629 Trypsin inhibitor Proteins 0.000 description 1
- 229940122618 Trypsin inhibitor Drugs 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- 241000219873 Vicia Species 0.000 description 1
- 241000405217 Viola <butterfly> Species 0.000 description 1
- 241001464837 Viridiplantae Species 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 241001478412 Zizania palustris Species 0.000 description 1
- 241001247821 Ziziphus Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000000433 anti-nutritional effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 239000001387 apium graveolens Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 238000009362 arboriculture Methods 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 238000000211 autoradiogram Methods 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 208000036815 beta tubulin Diseases 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 101150095417 cah-3 gene Proteins 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 235000019577 caloric intake Nutrition 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 108700021031 cdc Genes Proteins 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000001407 cinnamomum spp. Substances 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 230000004665 defense response Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 238000005734 heterodimerization reaction Methods 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 238000003898 horticulture Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000000021 kinase assay Methods 0.000 description 1
- 230000014634 leaf senescence Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 210000000473 mesophyll cell Anatomy 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 235000015816 nutrient absorption Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000005305 organ development Effects 0.000 description 1
- 239000010815 organic waste Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 230000005097 photorespiration Effects 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 230000010152 pollination Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 239000002510 pyrogen Substances 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 210000000614 rib Anatomy 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000021749 root development Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000004460 silage Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 108010043083 storage protein activator Proteins 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 101150056627 tcp gene Proteins 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000028604 virus induced gene silencing Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8222—Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
- C12N15/8223—Vegetative tissue-specific promoters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
Description
"MÉTODO PARA AUMENTAR RENDIMENTO DE SEMENTES EM PLANTAS EM RELAÇÃO ÀS PLANTAS DE CONTROLE, CONSTRUÇÃO, USO DA MESMA, PLANTA, PARTE DE PLANTA OU CÉLULA DE PLANTA, MÉTODO PARA A PRODUÇÃO DE UMA PLANTA TRANSGÊNICA TENDO RENDIMENTO AUMENTADO DE SEMENTES EM RELAÇÃO ÀS PLANTAS DE CONTROLE, PLANTA TRANSGÊNICA, PARTES COLHÍVEIS DE UMA PLANTA, PRODUTOS, E, USO DE UM ÁCIDO NUCLEICO"
A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar várias características relacionadas ao rendimento economicamente importantes em plantas. Mais especificamente, a presente invenção se relaciona a um método para melhorar várias características relacionadas ao rendimento economicamente importantes em plantas em relação às plantas de controle, aumentando expressão em uma planta de uma seqüência de ácido nucleico codificando um Polipeptídeo que Aumenta Rendimento (YEP). O YEP pode ser um polipeptídeo TCP de Classe I ou um CAH3 ou um ÇlavataJ. (CLVl) com um domínio C-terminal não funcional. A presente invenção também se relaciona a plantas tendo expressão aumentada de uma seqüência de ácido nucleico codificando um YEP, cujas plantas têm características relacionadas ao rendimento melhoradas em plantas em relação às plantas de controle. A invenção também fornece construções úteis nos métodos da invenção.
A sempre crescente população mundial e a oferta minguante de terra arável disponível para agricultura impulsionam pesquisa para aumentar a eficiência de agricultura. Meios convencionais para reprodução de planta e horticulturas utilizam técnicas de melhoramento seletivo para identificar plantas tendo características desejáveis. Entretanto, tais técnicas de melhoramento seletivo têm diversas desvantagens, quer dizer que estas técnicas são tipicamente de trabalho intensivo e resultam em plantas que freqüentemente contêm componentes genéticos heterogêneos que podem nem sempre resultar na característica desejável sendo passada adiante a partir de plantas parentais. Avanços em biologia molecular permitiram ao ser humano modificar o germoplasma de animais e plantas. Engenharia genética de plantas exige o isolamento e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a subseqüente introdução de tal material genético em uma planta. Tal tecnologia tem a capacidade de gerar cultivos ou plantas tendo várias características econômicas, agronômicas ou horticulturas melhoradas.
Uma característica de particular interesse econômico é
rendimento aumentado. Rendimento normalmente é definido como o rendimento mensurável de valor econômico de um cultivo. Isto pode ser definido em termos de quantidade e/ou qualidade. Rendimento é diretamente dependente de diversos fatores, por exemplo, o número e tamanho dos órgãos, arquitetura de planta (por exemplo, o número de galhos), rendimento de sementes, senescência foliar e mais. Desenvolvimento de raiz, absorção de nutrientes, tolerância a estresse e vigor inicial também podem ser fatores importantes para determinar rendimento. Aperfeiçoar os fatores mencionados acima pode, portanto, contribuir para aumentar rendimento de cultivo. A capacidade de aumentar rendimento de planta teria muitas
aplicações em áreas tais como agricultura, incluindo na produção de plantas ornamentais, arboricultura, horticultura e silvicultura. Aumentar rendimento também pode encontrar uso na produção de algas para uso em biorreatores (para a produção biotecnológica de substâncias tais como produtos farmacêuticos, anticorpos ou vacinas, ou para a bioconversão de resíduo orgânico) e outras tais áreas.
Dependendo do uso final, a modificação de certas características relacionadas ao rendimento pode ser favorecida sobre outras. Por exemplo, para aplicações tal como produção de forragem ou madeira, ou recurso de biocombustível, um aumento nas partes vegetativas de uma planta pode ser desejável, e para aplicações tal como produção de trigo, amido ou óleo, um aumento em parâmetros de semente pode ser particularmente desejável. Mesmo entre os parâmetros de semente, alguns podem ser favorecidos sobre outros, dependendo da aplicação. Vários mecanismos podem contribuir para aumentar rendimento de sementes, quer isto seja na forma de tamanho de semente aumentado ou número de sementes aumentado.
Rendimento de sementes é uma característica particularmente importante, uma vez que as sementes de muitas plantas são importantes para nutrição humana e animal. Cultivos tal como, milho, arroz, trigo, canola e soja respondem por mais da metade do consumo calórico humano total, quer através de consumo direto das próprias sementes ou através de consumo de produtos de carne criados com sementes processadas. Elas também são uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais. Sementes contêm um embrião (a fonte de novas partes aéreas e raízes) e um endosperma (a fonte de nutrientes para crescimento de embrião durante germinação e durante crescimento inicial de plântulas). O desenvolvimento de uma semente envolve muitos genes, e requer a transferência de metabólitos das raízes, talos, folhas e caules para a semente em crescimento. O endosperma, em particular, assimila os precursores metabólicos de carboidratos, óleos e proteínas e sintetiza estes em macromoléculas de armazenamento para preencher o grão.
Outra importante característica para muitas cultivos é vigor inicial. Melhorar vigor inicial é um importante objetivo de programas modernos de melhoramento de arroz tanto em cultivares de arroz temperadas como tropicais. Raízes longas são importantes para ancoramento apropriado ao solo em arroz semeado em água. Onde arroz é semeado diretamente em campos alagados, e onde plantas devem emergir rapidamente através de água, partes aéreas maiores estão associadas com vigor. Onde sementeira em sulcos é praticada, mesocótilos e coleóptilos maiores são importantes para boa emergência de plântula. A capacidade de manipular vigor inicial em plantas seria de grande importância em agricultura. Por exemplo, vigor inicial fraco tem sido uma limitação para a introdução de híbridos de milho (.Zea mays L.)
baseados em germoplasma de Cinturão do Milho no Atlântico Europeu.
Uma característica importante adicional é aquela de tolerância melhorada a estresse abiótico. Estresse abiótico é uma causa primária de perda de cultivo ao redor do mundo, reduzindo produções médias para a maioria das principais cultivares em mais do que 50% (Wang et al., Planta (2003) 218: 1-14). Estresses abióticos podem ser causados por seca, salinidade, extremos de temperatura, toxicidade química e estresse oxidativo. A capacidade de melhorar tolerância de planta a estresse abiótico seria de grande vantagem econômica para fazendeiros ao redor do mundo e iria permitir o cultivo de cultivos durante condições adversas e em territórios onde cultivo de cultivos não pode ser possível de outra maneira.
Outra característica economicamente importante é aquela de biomassa aumentada. Biomassa de planta é rendimento para cultivos de forragem como alfafa, milho de silagem e feno. Muitos substitutos para rendimento foram usados em cultivos de grãos. Importantes entre estes são estimativas de tamanho de planta. Tamanho de planta pode ser medido de muitas maneiras dependendo de espécie e estágio de desenvolvimento, mas inclui peso seco total de planta, peso seco de parte aérea, peso fresco de parte aérea, área foliar, volume de caule, altura da planta, diâmetro da roseta, comprimento de folha, comprimento de raiz, massa de raiz, número de rebentos e número de folhas. Muitas espécies mantêm uma proporção conservativa entre o tamanho de diferentes partes da planta em um dado estágio de desenvolvimento. Estas relações alométricas são usadas para extrapolar a partir de uma destas medidas de tamanho para outra (e.g. Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Tamanho de planta em um estágio de desenvolvimento inicial tipicamente irá se correlacionar com tamanho de planta posterior em desenvolvimento. Uma planta maior com uma área foliar maior tipicamente pode absorver mais luz e dióxido de carbono do que uma planta menor e, portanto provavelmente irá ganhar um peso maior durante o mesmo período (Fasoula & Tollenaar 2005 Maydica 50:39). Isto é em adição à continuação potencial da vantagem microambiental ou genética que a planta teve para atingir o maior tamanho inicialmente. Existe um forte componente genético para tamanho de planta e taxa de crescimento (e.g. ter Steege et al 2005 Plant Physiology 139:1078), e assim para uma variedade de diversos genótipos tamanho de planta em uma condição ambiental é provável de se correlacionar com tamanho em outra (Hittalmani et al 2003 Theoretical Applied Genetics 107:679). Desta maneira um ambiente padrão é usado como um substituto para ambientes diversos e dinâmicos encontrados em diferentes localizações e tempos por cultivos no campo.
índice de colheita, a proporção de rendimento de sementes sobre peso seco de parte aérea, é relativamente estável em muitas condições ambientais e assim como uma correlação robusta entre tamanho de planta e rendimento de grãos pode ser freqüentemente obtida (e.g. Rebetzke et al 2002 Crop Science 42:739). Estes processos são intrinsecamente ligados pelo fato da maioria de biomassa de grãos ser dependente de produtividade fotossintética atual ou armazenada pelas folhas e caule da planta (Gardener et al 1985 Physiology of Crop Plants. Iowa State University Press, pp68-73). Portanto, selecionar para tamanho de planta, mesmo em estágios iniciais de desenvolvimento, foi usado como um indicador para rendimento futuro potencial (e.g. Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Ao testar para o impacto de diferenças genéticas em tolerância a estresse, a capacidade de padronizar propriedades do solo, temperatura, água e disponibilidade de nutrientes e intensidade luminosa é uma vantagem intrínseca de ambientes de estufa ou câmara de crescimento de planta comparados com o campo. Entretanto, limitações artificiais em rendimento devido à fraca polinização devido à ausência de vento ou insetos, ou espaço insuficiente para raiz madura ou crescimento de dossel, podem restringir o uso destes ambientes controlados para testar diferenças de rendimento. Portanto, medidas de tamanho de planta em desenvolvimento inicial, em condições padronizadas em uma câmara de crescimento ou estufa, são práticas padrão para fornecer indicação de vantagens genéticas potenciais para rendimento.
Uma abordagem para aumentar rendimento (rendimento e/ou
biomassa de sementes) em plantas pode ser através de modificação dos mecanismos de crescimento inerentes de uma planta, tal como o ciclo celular ou várias vias de sinalização envolvidas em crescimento de planta ou em mecanismos de defesa. Foi descoberto agora que várias características relacionadas ao
rendimento podem ser melhoradas em plantas modulando expressão em uma planta de um ácido nucleico codificando um Polipeptídeo que Aumenta Rendimento (YEP) em uma planta, caracterizado pelo fato de que o YEP é ou um polipeptídeo TCP de Classe I ou um CAH3 ou um Clavatal (CLVl) com um domínio C-terminal não funcional. INTRODUÇÃO TCP
Fatores de transcrição normalmente são definidos como proteínas que mostram afinidade de ligação de DNA específica de seqüência e que são capazes de ativar e/ou reprimir transcrição. O genoma de Arabidopsis thaliana codifica para pelo menos 1533 reguladores transcricionais, respondendo por -5,9% de seu número total estimado de genes (Riechmann et al. (2000) Science 290: 2105-2109). A família TCP de fatores de transcrição é nomeada depois de seus primeiros membros caracterizados (teosinte- branchedl (TB 1), çycloidea (CYC) e fator PCNA (PCF); Cubas P et al. (1999) Plant J 18(2): 215-22). Em Arabidopsis thaliana, mais do que 20 membros dos polipeptídeos de família TCP foram identificados, e classificados baseado em similaridade de seqüência no domínio TCP em fatores de transcrição de Classe I (também chamado Grupo I ou grupo PCF) que regulam positivamente expressão gênica, e fatores de transcrição de Classe II (também chamado Grupo II ou grupo CYC-TB1) que regulam negativamente proliferação. Todos os fatores de transcrição TCP são caracterizados por um Hélice-Alça-Hélice básico (bHLH) não canônico previsto, que é requerido tanto para ligação de DNA como homo e heterodimerização (veja Cubas et al. acima).
Um polipeptídeo TCP de Classe I, AtTCP20 (também chamado ortólogo PCF1), se liga ao promotor de genes de ciclo celular e proteína ribossômica, como relatado em Li et al. (2005) PNAS 102(36): 12978-83). Pedido de Patente Internacional W00036124 fornece uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I (chamado VBDBP) e a seqüência de polipeptídeos correspondente. Vetores de expressão e plantas transgênicas compreendendo a seqüência de ácido nucleico VBDBP mencionada acima são descritos. Em Pedido de Patente Internacional W02004031349, plantas transgênicas de Arabidopsis thaliana superexpressando (usando um promotor 3 5CaMV) uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I (chamado G193 8) são caracterizadas. Taxa de crescimento de planta e desenvolvimento retardado são observados. CAH3
Anidrase carbônica catalisa a reação reversível H2CO3 Δ H2O + CO2. Há 3 classes de anidrases carbônicas (alfa, beta e gama), não relacionadas filogeneticamente, mas compartilhando algumas similaridades no sítio ativo. Em plantas, todas as três classes existem. Anidrases carbônicas estão presentes em cloroplastos, mitocôndrias (principalmente classe gama) e citosol, e podem representar até 2% do total de proteínas solúveis em folhas. Anidrase carbônica é importante para assegurar fotossíntese eficiente mantendo concentração de CO2 em células em um nível adequado. Sabe-se que em pressão atmosférica de O2 e CO2, ribulose bisfosfato carboxilase (Rubisco) funciona em 30% de sua capacidade total, portanto existe interesse em melhorar o mecanismo de absorção de CO2 em plantas. Expressão de anidrase carbônica é co-regulada com a expressão de Rubisco, e plantas geralmente mantêm uma proporção constante de anidrase carbônica versus Rubisco. Além disso, é relatado que anidrase carbônica também pode limitar fotorrespiração fornecendo esqueletos de C para assimilação de nitrogênio em certas condições. Em plantas com um tipo C3 de fotossíntese, a maior parte da atividade de anidrase carbônica é localizada para o estroma dos cloroplastos de mesófilo, ao passo que em plantas C4, a maior parte da anidrase carbônica é encontrada no citoplasma de células de mesófilo.
A idéia de usar anidrase carbônica para aumentar assimilação de CO2 foi formulada muitas vezes. Em Patente Internacional 9511979, é postulado que transformando uma planta monocotiledônea com uma anidrase carbônica de uma planta monocotiledônea a capacidade de fixação de dióxido de carbono seria melhorada e iria resultar em crescimento de planta acelerado. Outros documentos descrevem métodos para mimetizar uma fotossíntese tipo C4 em plantas C3 com isso melhorando a eficiência de fotossíntese (por exemplo, Patente Norte-Americana 6.610.913, Patente Norte-Americana 6.831.217 ou Patente Norte-Americana 20030233670). Nestas abordagens, uma via tipo C4 é introduzida em plantas C3 introduzindo e expressando uma combinação de várias atividades enzimáticas (tal como fosfoenolpiruvato carboxilase (PEPC) ou piruvato ortofosfato diquinase (PPDK)) de plantas C4 para aumentar fixação de CO2; expressão destes genes está sob controle de seqüências reguladoras de C4, tipicamente seus promotores nativos. Embora previsto, estas tentativas ainda não resultaram em plantas com rendimento
aumentado.
CLAVATA
Receptores do tipo quinase com repetições ricas em leucina (LRR-RLKs) são polipeptídeos envolvidos em duas funções biológicas em plantas, i.e., crescimento e desenvolvimento por um lado, e resposta de defesa pelo outro. LRR-RLKs são polipeptídeos transmembrana envolvidos em transdução de sinal, com de término N a término C: (i) um peptídeo sinal para direcionamento subcelular de ER; (ii) um domínio de receptor extracelular para perceber sinais; (iii) um domínio transmembrana; e (iv) um domínio de serina/treonina quinase intracelular citoplasmático que pode fosforilar proteínas alvo posteriores, ser fosforilado por si mesmo (autofosforilação) ou por outras quinases, ou ser desfosforilado por fosfatases.
LRR-RLKs compreendem o maior grupo dentro da superfamília de quinase tipo receptor (RLK) de plantas, e o genoma de Arabidopsis sozinho contém por volta de 200 genes de LRR-RLK. Membros desta família foram categorizados em subfamílias baseado tanto na identidade dos domínios extracelulares como nas relações filogenéticas entre os domínios de quinase de membros da subfamília (Shiu & Bleecker (2001) Proc Natl Acad Sc USA 98(19): 10763-10768). A subfamília LRR XI compreende um dos LRR-RLK mais estudados, ClavataI (CLV1; Leyser et al., (2002) Development 116:397-403), envolvido no controle de tamanho de parte aérea, inflorescência, e meristema floral.
O meristema apical de parte aérea pode iniciar órgãos e meristemas secundários ao longo da vida de uma planta. Algumas células localizadas na zona central do meristema atuam como células-tronco pluripotentes. Elas se dividem lentamente, com isso deslocando células filhas para a periferia onde elas eventualmente se tornam incorporadas em primórdios de órgãos e se diferenciam. A manutenção de um meristema funcional requer coordenação entre a perda de células-tronco do meristema através de diferenciação e substituição de células através de divisão. Em Arabidopsis, os genes de Clavata (CLV1, CLV2, e CLV3) podem desempenhar um papel crítico neste processo, limitando o tamanho do conjunto de células-tronco nestes meristemas.
Clavatal mutantes foram identificados em Arabidopsis (Leyser et al. veja acima; Clark et al., (1993) Development 119: 397-418; Diévart et al., (2003) Plant Cell 15: 1198-1211), em arroz (Suzaki et al., (2004) Development 131: 5649-5657), e em milho (Bommert et al., (2004) Development 132: 1235-1245). Todos os mutantes presentes em alargamento dos meristemas aéreos de todos os tipos (vegetativo, inflorescência, floral) devido à acumulação ectópica de células-tronco, freqüentemente levando a filotaxia anormal, fasciação de inflorescência e órgãos extraflorais e verticilos. Esta severidade fenotípica varia entre os diferentes mutantes de Arabidopsis, os alelos mais fracos apresentando apenas um pequeno aumento em número de células-tronco, ao passo que os alelos mais fortes têm mais do que 1000 vezes mais células-tronco comparados com o tipo selvagem (Dievart et al., (2004) supra). O número de carpelos formados por flor e o grau de crescimento dos verticilos ectópicos são indicadores sensíveis de severidade de mutante clvl (Clarke et al., (1993) Development 119: 397-418). Dois mutantes fracos de Arabidopsis, clvl-6 e clvl-7, contêm lesões depois do domínio transmembrana, deixando a possibilidade de que os polipeptídeos que estes alelos codificam sejam na verdade expressos e localizados na membrana plasmática (Clarke et al., (1993) supra). Plantas transgênicas de Arabidopsis expressando a seqüência
de ácido nucleico codificando o polipeptídeo CLVl de comprimento completo sob o controle do promotor ERECTA (ER; para ampla expressão dentro dos meristemas e primórdio de órgão em desenvolvimento) não apresentam um meristema rompido (Clarke et al., (1993) supra). Patente Norte-Americana concedida 5.859.338 sustenta uma seqüência de ácido nucleico isolado codificando uma proteína Clavatal, e seqüências modificadas de ácidos nucleicos codificando uma proteína Clavatal modificada, e descreve vetores de expressão compreendendo as seqüências isoladas de ácidos nucleicos mencionadas acima, e plantas e células de planta compreendendo as seqüências isoladas de ácidos nucleicos mencionadas acima. Definições
Polipeptídeo(s)/Proteína(s) Os termos "polipeptídeo" e "proteína" são usados
permutavelmente neste lugar e se referem a aminoácidos em uma forma polimérica de qualquer comprimento, unidos por ligações peptídicas. Polinucleotídeo(sVÁcido(s) nucleicofsVSeqüênciafs) de ácidos nucleicos/seqüênciafs) de nucleotídeos Os termos "polinucleotídeo(s)", "seqüência(s) de ácidos
nucleicos", "seqüência(s) de nucleotídeos", "ácido(s) nucleico(s)", "molécula de ácido nucleico" são usados permutavelmente neste lugar e se referem a nucleotídeos, ou ribonucleotídeos ou desoxirribonucleotídeos ou uma combinação de ambos, em uma forma polimérica não ramificada de qualquer comprimento.
Seqüência de codificação
Uma "seqüência de codificação" é uma seqüência de ácido nucleico, que é transcrita em mRNA e/ou traduzida em um polipeptídeo quando colocada sob o controle de seqüências reguladoras apropriadas. Os limites da seqüência de codificação são determinados por um códon de início de tradução no término 5' e um códon de parada de tradução no término 3'. Uma seqüência de codificação pode incluir, mas não é limitada a mRNA, cDNA, seqüências de ácidos nucleicos recombinantes ou DNA genômico, quer com ou sem. Plantais) de controle
A escolha de plantas de controle adequadas é uma parte de rotina de uma estrutura experimental e pode incluir plantas tipo selvagem correspondentes ou plantas correspondentes sem o gene de interesse. A planta de controle é tipicamente da mesma espécie de planta ou mesmo da mesma variedade do que a planta a ser verificada. A planta de controle também pode ser um nulizigoto da planta a ser verificada. Nulizigotos são indivíduos carecendo do transgene por segregação. Uma "planta de controle" como usado neste lugar se refere não apenas a plantas inteiras, mas também a partes de planta, incluindo sementes e partes de sementes. Homólogo(s)
"Homólogos" de uma proteína abrangem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácidos em relação à proteína não modificada em questão e tendo atividade biológica e funcional similar à proteína não modificada da qual eles são derivados.
Uma deleção se refere à remoção de um ou mais aminoácidos de uma proteína.
Uma inserção se refere a um ou mais resíduos de aminoácidos sendo introduzidos em um sítio pré-determinado em uma proteína. Inserções podem compreender fusões N-terminais e/ou C-terminais assim como inserções intra-seqüência de aminoácidos únicos ou múltiplos. Geralmente, inserções dentro da seqüência de aminoácidos serão menores do que fusões N- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos de proteínas ou peptídeos de fusão N- ou C-terminais incluem o domínio de ligação ou domínio de ativação de um ativador transcricional como usado no sistema de dois híbridos de levedura, proteínas de revestimento de fago, etiqueta de (histidina)-ó, etiqueta de glutationa S-transferase, proteína A, proteína de ligação de maltose, dihidrofolato redutase, epítopo Etiqueta· 100, epítopo c-myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligação calmodulina), epítopo HA, epítopo de proteína C e epítopo VSV.
Uma substituição se refere à substituição de aminoácidos da proteína por outros aminoácidos tendo propriedades similares (tal como hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou quebrar estruturas α-helicoidais ou estruturas de folha β). Substituições de aminoácidos tipicamente são de resíduos únicos, mas podem ser agrupadas dependendo de restrições funcionais colocadas no polipeptídeo; inserções normalmente serão da ordem de cerca de 1 a 10 resíduos de aminoácidos. As substituições de aminoácidos são preferivelmente as substituições de aminoácidos conservativas. Tabelas de Substituição Conservativa são bem conhecidas na arte (veja, por exemplo, Creighton (1984) Proteins. W.H. Freeman and Company e Tabela 1 abaixo).
Tabela 1: Exemplos de substituições conservadas de aminoácidos
Resíduo Substituições Conservativas Resíduo Substituições Conservativas Ala Ser Leu lie; Val Arg Lys Lys Arg; Gln Asn Gln; His Met Leu; Ile Asp Glu Phe Met; Leu; Tyr GIn Asn Ser Thr; Gly Cys Ser Thr Ser; Val Glu Asp Trp Tyr Gly Pro Tyr Trp; Phe His Asn; Gln Val lie; Leu Ile Leu, Val
Substituições, deleções e/ou inserções de aminoácidos podem
ser prontamente feitas usando técnicas de peptídeo sintético bem conhecidas na arte, tal como síntese de peptídeo em fase sólida e os semelhantes, ou por manipulação de DNA recombinante. Métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na arte. Por exemplo, técnicas para fazer mutações por substituição em sítios pré-determinados em DNA são bem conhecidas por aqueles versados na arte e incluem mutagênese M13, mutagênese in vitro T7-Gen (USB, Cleveland, OH), mutagênese dirigida por sítio QuickChange (Stratagene, San Diego, CA), mutagênese dirigida por sítio mediada por PCR ou outros protocolos de mutagênese dirigida por sítio. Derivados
"Derivados" incluem peptídeos, oligopeptídeos, polipeptídeos que, comparados com a seqüência de aminoácidos da forma naturalmente ocorrente da proteína, tal como a proteína de interesse, podem compreender substituições de aminoácidos com resíduos de aminoácidos não naturalmente ocorrentes, ou adições de resíduos de aminoácidos não naturalmente ocorrentes. "Derivados" de uma proteína também abrangem peptídeos, oligopeptídeos, polipeptídeos que compreendem resíduos de aminoácidos naturalmente ocorrentes alterados (glicosilados, acilados, prenilados, fosforilados, miristoilados, sulfatados etc.) ou resíduos de aminoácidos não naturalmente alterados comparado com a seqüência de aminoácidos de uma forma naturalmente ocorrente do polipeptídeo. Um derivado também pode compreender um ou mais substituintes ou adições de não aminoácidos comparado com a seqüência de aminoácidos da qual ele é derivado, por exemplo, uma molécula repórter ou outro ligante, covalentemente ou não covalentemente ligado à seqüência de aminoácidos, tal como uma molécula repórter que é ligada para facilitar sua detecção, e resíduos de aminoácidos não naturalmente ocorrentes em relação à seqüência de aminoácidos de uma proteína não naturalmente ocorrente. Além disso, "derivados" também incluem fusões da forma naturalmente ocorrente da proteína com peptídeos de identificação tal como FLAG, HIS6 ou tiorredoxina (para uma revisão de peptídeos de identificação, veja Terpe, Appl. Microbiol. Biotechnol. 60, 523- 533,2003).
Ortólogo(s)/Parálogo(s)
Ortólogos e parálogos abrangem conceitos evolutivos usados para descrever as relações ancestrais de genes. Parálogos são genes dentro da mesma espécie que se originaram através de duplicação de um gene ancestral; ortólogos são genes de organismos diferentes que se originaram através de especiação, e também são derivados de um gene ancestral comum. Domínio
O termo "domínio" se refere a um conjunto de aminoácidos conservados em posições específicas ao longo de um alinhamento de seqüências de proteínas evolutivamente relacionadas. Enquanto que aminoácidos em outras posições podem variar entre homólogos, aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que provavelmente são essenciais na estrutura, estabilidade ou função de uma proteína. Identificados por seu alto grau de conservação em seqüências alinhadas de uma família de homólogos de proteína, eles podem ser usados como identificadores para determinar se qualquer polipeptídeo em questão pertence a uma família de polipeptídeo previamente identificada. Motivo/Seqüência consenso/Assinatura O termo "motivo" ou "seqüência consenso" ou "assinatura" se
refere a uma região conservada curta na seqüência de proteínas evolutivamente relacionadas. Motivos freqüentemente são partes altamente conservadas de domínios, mas também podem incluir apenas parte do domínio, ou estarem localizados fora de domínio conservado (se todos os aminoácidos do motivo caem fora de um domínio definido). Hibridização
O termo "hibridização" como definido neste lugar é um processo caracterizado pelo fato de que seqüências de nucleotídeos complementares substancialmente homólogas se anelam uma a outra. O processo de hibridização pode ocorrer inteiramente em solução, i.e. ambos os ácidos nucleicos complementares estão em solução. O processo de hibridização também pode ocorrer com um dos ácidos nucleicos complementares imobilizado a uma matriz tal como microesferas magnéticas, microesferas de Sepharose ou qualquer outra resina. O processo de hibridização, além disso, pode ocorrer com um dos ácidos nucleicos complementares imobilizado a um suporte sólido tal como uma membrana de nitrocelulose ou de náilon ou imobilizado por e.g. fotolitografia a, por exemplo, um suporte de vidro silicioso (o último conhecido como arranjos ou microarranjos de ácido nucleico ou como chips de ácido nucleico). A fim de permitir que hibridização ocorra, as moléculas de ácidos nucleicos geralmente são termicamente ou quimicamente desnaturadas para derreter uma dupla fita em duas fitas simples e/ou para remover estruturas em grampo ou outras estruturas secundárias de ácidos nucleicos de fita simples. O termo "estringência" se refere às condições nas quais uma
hibridização ocorre. A estringência de hibridização é influenciada por condições tal como temperatura, concentração salina, força iônica e composição de tampão de hibridização. Geralmente, condições de baixa estringência são selecionadas para ser cerca de 3 0°C menores do que o ponto de fusão térmica (Tm) para a seqüência específica em uma força iônica e pH definidos. Condições de média estringência são quando a temperatura é 20°C abaixo de Tm, e condições de alta estringência são quando a temperatura é 10°C abaixo de Tm. Condições de hibridização de alta estringência tipicamente são usadas para isolar seqüências hibridizantes que têm alta similaridade de seqüência com a seqüência de ácido nucleico alvo. Entretanto, ácidos nucleicos podem desviar em seqüência e ainda codificar um polipeptídeo substancialmente idêntico, devido à degenerescência do código genético. Portanto condições de hibridização de média estringência podem ser algumas vezes necessárias para identificar tais moléculas de ácidos nucleicos. A Tm é a temperatura em força iônica e pH definidos, na qual
50% da seqüência alvo hibridiza com uma sonda perfeitamente compatível. A Tm é dependente das condições de solução e da composição de base e comprimento da sonda. Por exemplo, seqüências maiores hibridizam especificamente em temperaturas superiores. A taxa máxima de hibridização é obtida a partir de cerca de 16°C até 32°C abaixo de Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre as duas fitas de ácidos nucleicos com isso promovendo formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4M (para concentrações maiores, este efeito pode ser ignorado). Formamida reduz a temperatura de fusão de duplexos DNA-DNA e DNA-RNA com 0,6 a 0,7°C para cada formamida percentual, e adição de 50% de formamida permite que hibridização seja realizada a 30 a 45°C, embora a taxa de hibridização seja diminuída. Pareamento incorreto de bases reduz a taxa de hibridização e a estabilidade térmica dos duplexos. Em média e para sondas grandes, a Tm diminui cerca de 1°C por % de pareamento incorreto de bases. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:
1) Híbridos de DNA-DNA (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm= 81,5°C + 16,6xlogio[Na+]a + 0,41x%[G/Cb] - SOOx^]"1 - 0,6 lx% formamida
2) Híbridos de DNA-RNA ou RNA-RNA:
Tm= 79,8 + 18,5 (logio[Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2
- 820/Lc
3) Híbridos de oligo-DNA ou oligo-RNAd:
Para <20 nucleotídeos: Tm= 2 (In)
Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)
a ou para outro cátion monovalente, mas apenas acurado no intervalo 0,01-0,4 M.
b apenas acurado para %GC no intervalo de 30% a 75%.
0 L = comprimento de duplex em pares de bases.
d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador = 2x(no. de G/C)+(no. de A/T).
Ligação não específica pode ser controlada usando qualquer uma das diversas técnicas conhecidas tal como, por exemplo, bloqueando a membrana com soluções contendo proteína, adições de RNA, DNA, e SDS heterólogo ao tampão de hibridização, e tratamento com Rnase. Para sondas não homólogas, uma série de hibridizações podem ser realizadas variando um de (i) diminuindo progressivamente a temperatura de anelamento (por exemplo, de 68°C para 42°C) ou (ii) diminuindo progressivamente a concentração de formamida (por exemplo, de 50% para 0%). O artesão versado está ciente de vários parâmetros que podem ser alterados durante hibridização e que irão ou manter ou mudar as condições de estringência. Além das condições de hibridização, especificidade de
hibridização tipicamente também depende da função de lavagens pós hibridização. Para remover antecedentes resultando de hibridização não específica, amostras são lavadas com soluções salinas diluídas. Fatores críticos de tais lavagens incluem a força iônica e temperatura da solução de lavagem final: quanto menor a concentração salina e maior a temperatura de lavagem, maior é a estringência da lavagem. Condições de lavagem são tipicamente realizadas em ou abaixo de estringência de hibridização. Uma hibridização positiva gera um sinal que é pelo menos duas vezes aquele do antecedente. Geralmente, condições estringentes adequadas para ensaios de hibridização de ácidos nucleicos ou procedimentos de detecção de amplificação de gene são como apresentados acima. Condições mais ou menos estringentes também podem ser selecionadas. O artesão versado está ciente de vários parâmetros que podem ser alterados durante lavagem e que irão ou manter ou mudar as condições de estringência. Por exemplo, condições de hibridização de alta estringência
típicas para híbridos de DNA maiores do que 50 nucleotídeos abrangem hibridização a 65°C em Ix SSC ou a 42°C em Ix SSC e 50% formamida, seguido por lavagem a 65°C em 0,3x SSC. Exemplos de condições de hibridização de média estringência para híbridos de DNA maiores do que 50 nucleotídeos abrangem hibridização a 50°C em 4x SSC ou a 40°C em 6x SSC e 50% fonnamida, seguido por lavagem a 50°C em 2x SSC. O comprimento do híbrido é o comprimento antecipado para o ácido nucleico hibridizante. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento de híbrido pode ser determinado alinhando as seqüências e identificando as regiões conservadas descritas neste lugar. IxSSC é 0,15M de NaCl e 15mM de citrato de sódio; a solução de hibridização e soluções de lavagem podem incluir adicionalmente 5 χ de reagente de Denhardt, 0,5-1,0% de SDS, 100 μg/ml de DNA de esperma de salmão fragmentado desnaturado, 0,5% de piro fosfato de sódio.
Para os propósitos de definir o nível de estringência, referência pode ser feita a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York ou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 e atualizações anuais). Variante de união
O termo "variante de união" como usado neste lugar abrange variantes de uma seqüência de ácido nucleico nas quais íntrons e/ou éxons selecionados foram cortados, substituídos, deslocados ou adicionados, ou nas quais íntrons foram encurtados ou alongados. Tais variantes serão umas nas quais a atividade biológica da proteína é substancialmente mantida; isto pode ser atingido mantendo seletivamente segmentos funcionais da proteína. Tais variantes de união podem ser encontradas na natureza ou podem ser feitas pelo homem. Métodos para predizer e isolar tais variantes de união são bem conhecidos na arte (veja, por exemplo, Foissac and Schiex, BMC Bioinformatics. 2005; 6: 25). Variante alélica
Alelos ou variantes alélicas são formas alternativas de um dado gene, localizados na mesma posição cromossômica. Variantes alélicas abrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos. Embaralhamento de gene/Evolução dirigida
Embaralhamento de gene ou evolução dirigida consiste de repetições de embaralhamento de DNA seguido por triagem e/ou seleção apropriada para gerar variantes de ácidos nucleicos ou porções destes codificando proteínas tendo uma atividade biológica modificada (Castle et al., (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).
Elemento regulador/Seqüência de controle/Promotor
Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados permutavelmente neste lugar e devem ser adotados em um amplo contexto para se referir a seqüências reguladoras de ácidos nucleicos capazes de efetuar expressão das seqüências aos quais eles são ligados. Seqüências de controle podem ser promotores, acentuadores, silenciadores, seqüências intrônicas, regiões 3'UTR e/ou 5'UTR e/ou elementos estabilizantes de RNA.
O termo "promotor" tipicamente se refere a uma seqüência de controle de ácido nucleico localizada antes do início transcricional de um gene e que está envolvida em reconhecimento e ligação de RNA polimerase e outras proteínas, com isso dirigindo transcrição de um ácido nucleico operacionalmente ligado. Abrangidas pelos termos mencionados acima são seqüências reguladoras transcricionais derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para iniciação acurada de transcrição, com ou sem uma seqüência de caixa CCAAT) e elementos reguladores adicionais (i.e. seqüências situadas acima dos promotores gênicos, acentuadores e silenciadores) que alteram expressão gênica em resposta a desenvolvimento e/ou estímulos externos, ou de uma maneira tecido específica. Também incluída dentro do termo é uma seqüência reguladora transcricional de um gene procariótico clássico, em cujo caso ela pode incluir uma seqüência de caixa -35 e/ou seqüências reguladoras transcricionais de caixa -10. O termo "elemento regulador" também abrange uma molécula de fusão sintética ou derivado que confere, ativa ou acentua expressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.
Um "promotor de planta" compreende elementos reguladores, que mediam a expressão de um segmento de seqüência de codificação em células de planta. Por conseguinte, um promotor de planta não precisa ser de origem de planta, mas pode se originar de vírus ou microorganismos, por exemplo, de vírus que atacam células de planta. O "promotor de planta" também pode se originar de uma célula de planta, e.g. da planta que é transformada com a seqüência de ácido nucleico a ser expressa no processo inventivo e descrito neste lugar. Isto também se aplica a outros sinais reguladores "de planta", tal como terminadores "de planta". Os promotores antes das seqüências de nucleotídeos úteis nos métodos da presente invenção podem ser modificados por uma ou mais substituição(ões), inserção(ões) e/ou deleção(ões) de nucleotídeos sem interferir na funcionalidade ou atividade de qualquer dos promotores, o quadro aberto de leitura (ORF) ou a região reguladora 3' tal como terminadores ou outras regiões reguladoras 3' que estão localizadas fora do ORF. Além disso, é possível que a atividade dos promotores seja aumentada por modificação de sua seqüência, ou que eles sejam completamente substituídos por promotores mais ativos, mesmo promotores de organismos heterólogos. Para expressão em plantas, a molécula de ácido nucleico, como descrito acima, deve ser operacionalmente ligada a ou compreender um promotor adequado que expressa o gene no momento certo e com o padrão de expressão espacial requerido. Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como rRNA de 18S, usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por "promotor fraco" é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por "nível baixo" é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos a cerca de 1/500.0000 transcritos por célula. Inversamente, um "promotor forte" dirige expressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1.000 transcritos por célula. Operacionalmente ligado
O termo "operacionalmente ligado" como usado neste lugar se refere a uma ligação funcional entre a seqüência de promotor e o gene de interesse, de forma que a seqüência de promotor é capaz de iniciar transcrição do gene de interesse. Promotor constitutivo
Um "promotor constitutivo" se refere a um promotor que é transcricionalmente ativo durante a maioria, mas não necessariamente todas, fases de crescimento e desenvolvimento e na maioria das condições ambientais, em pelo menos uma célula, tecido ou órgão. Tabela 2 abaixo fornece exemplos de promotores constitutivos.
Tabela 2a: Exemplos de promotores constitutivos
Fonte Gênica Referência Actina McElroy et al, Plant Cell, 2: 163-171, 1990 HMGP Patente Internacional 2004/070039 CAMV 35S Odell et al, Nature, 313:810-812, 1985 CaMV 19S Nilsson et al., Physiol. Plant. 100:456-462, 1997 GOS2 de Pater et al, Plant J Nov;2(6):837-44, 1992, Patente Internacional 2004/065596 Ubiquitina Christensen et al, Plant Mol. Biof 18: 675-689, 1992 Cielofilina de arroz Buchholz et al, Plant Mol Biol. 25(5): 837-43, 1994 Histona H3 de milho Lepetit et al, Mof Gen. Genet. 231:276-285, 1992 Histona H3 de alfafa Wu et al. Plant Mof Biol. 11:641 -649, 1988 Aetina 2 Anetaf Plant J. 10(1); 107-121, 1996 34S FMV Sanger et af, Plant. Mof Biol., 14, 1990: 433-443 Subunidade pequena de rubisco Patente Norte-Americana 4.962.028 OCS Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553 SADl Jain et af, Crop Science, 39 (6), 1999: 1696 SAD2 Jain et af, Crop Science, 39 (6), 1999: 1696 nos Shaw et af (1984) Nucleic Acids Res. 12(20):7831-7846 V-ATPase Patente Internacional 01/14572 Super promotor Patente Internacional 95/14098 Proteínas G-box Patente Internacional 94/12015
Promotor ubíquo
Um promotor ubíquo é ativo em substancialmente todos os
tecidos ou células de um organismo.
Promotor regulado por desenvolvimento
Um promotor regulado por desenvolvimento é ativo durante certos estágios de desenvolvimento ou em partes da planta que passam por mudanças evolutivas. Promotor induzível
Um promotor induzível tem início de transcrição induzido ou 10
15
aumentado em resposta a um estímulo químico (para uma revisão veja Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental ou físico, ou pode ser "induzível por estresse", i.e. ativado quando uma planta é exposta a várias condições de estresse, ou um "induzível por patógeno" i.e. ativado quando uma planta é exposta à exposição a vários patógenos. Promotor Órgão específico/Tecido específico
Um promotor órgão específico ou tecido específico é um que é capaz de iniciar preferencialmente transcrição em certos órgãos ou tecidos, tal como as folhas, raízes, tecido de semente etc. Por exemplo, um "promotor raiz específico" é um promotor que é transcricionalmente ativo predominantemente em raízes de planta, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta. Promotores capaz de iniciar transcrição em certas células apenas são referidos neste lugar como "célula específicos".
Exemplos de promotores raiz específicos são listados em Tabela 2b abaixo:
Tabela 2b: Exemplos de promotores raiz específicos _
Fonte Gênica
RCc3
Arabidopsis PHT1
Referência
Plant Mol Biol. 1995 Jan;27(2):237-48
Kovama et ai., 2005; Mudge et al. (2002, Plant J. 31:341)
Transportador de fosfato de Medicago
Xiao et al., 2006
Arabidopsis PyklO
Nitz et al. (2001) Plant Sci 161(2): 337-346
Genes exprimíveis em raiz
Gene induzível por auxina de tabaco
Tingey et al., EMBO J. 6: 1, 1987.
Van der Zaal et al., Plant Mol. Biol. 16, 983, 1991.
β-tubulina
Genes específicos de raiz de tabaco
Oppenheimer, et al., Gene 63: 87, 1988.
Conkling, et al., Plant Physiol. 93: 1203, 1990.
Gene Gl-3b de B. napus
Patente Norte-Americana No. 5.401.836
SbPRPl
Suzuki et al., Plant Mol. Biol. 21: 109-119, 1993.
LRXl
Baumberger et al. 2001, Genes & Dev. 15:1128
BTG-26 de Brassica napus
Patente Norte-Americana 20050044585
LeAMTl (tomate)
Lauter et al. (1996, PNAS 3:8139)
TheLeNRTl-I (tomate)
Lauter et al. (1996, PNAS 3:8139)
Gene de patatina classe I (batata) KDC1 (Daucus carota)_
Liu et al., Plant Mol. Biol. 153:386-395, 1991.
Downey et al. (2000, J. Biol. Chem. 275:39420)
Gene TobRB7
W Song (1997) PhD Thesis, North Carolina State University, Raleigh, NC USA_
OsRAB5a (arroz)
Wang et al. 2002, Plant Sei. 163:273
ALF5 (Arabidopsis)
Diener et al. (2001, Plant Cell 13:1625)
NRT2;lNp (N. plumbaginifolia)
Quesada et al. (1997, Plant Mol. Biol. 34:265) Um promotor semente específico é transcricionalmente ativo predominantemente em tecido de semente, mas não necessariamente em tecido de semente (em casos de expressão evasiva). O promotor semente específico pode estar ativo durante desenvolvimento de semente e/ou durante germinação. O promotor semente específico pode ser endosperma e/ou aleurona e/ou embrião específico. Exemplos de promotores semente específicos (endosperma/aleurona/embrião específicos) são mostrados em Tabelas 2c-f abaixo. Exemplos adicionais de promotores semente específicos são dados em Qing Qu e Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004), cuja descrição é incorporada por referência neste lugar como se completamente apresentada.
Tabela 2c: Exemplos de promotores semente específicos
Fonte Gênica Referência Genes semente específicos Simon et al., Plant Mol. Biol. 5: 191, 1985; Scofield et al., J. Biol. Chem. 262: 12202, 1987.; Baszczynski et al., Plant Mol. Biol. 14: 633, 1990. Albumina de castanha do Pará Pearson et al., Plant Mol. Biol. 18: 235-245, 1992. legumina Ellis et al., Plant Mol. Biol. 10: 203-214, 1988. glutelina (arroz) Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986; Takaiwa et al., FEBS Letts. 221: 43-47, 1987. zeína Matzke et al Plant Mol Biol, 14(3):323-32 1990 napA Stalberg et al, Planta 199: 515-519, 1996. LMW e HMW glutenina-1 de trigo Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989 SPA de trigo Albani et al, Plant Cell, 9: 171-184, 1997 a, β, γ-gliadinas de trigo EMBO J. 3:1409-15, 1984 Promotor Itrl de cevada Diaz et al. (1995) Mol Gen Genet 248(5):592-8 Hordeína B1, C, D de cevada Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996 DOF de cevada Mena et al, The Plant Journal, 116(1): 53-62, 1998 blz2 Patente Européia 99106056.7 Promotor sintético Vicente-Carbajosaetal., Plant J. 13: 629-640, 1998. prolamina NRP33 de arroz Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 a-globulina Glb-I de arroz Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 OSHl de arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117-8122, 1996 α-globulina REB/OHP-1 de arroz Nakase et al. Plant Mol. Biol. 33: 513-522, 1997 ADP-glicose pirofosforilase de arroz Trans Res 6:157-68, 1997 Família gênica ESR de milho PlantJ 12:235-46, 1997 α-cafirina de sorgo DeRose et al., Plant Mol. Biol 32:1029-35, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 Oleosina de arroz Wu et al, J. Biochem. 123:386, 1998 Oleosina de girassol Cummins et al., Plant Mol. Biol. 19: 873-876, 1992 PROOl 17, proteína ribossômica 40 S putativa de arroz Patente Internacional 2004/070039 PROO136, alanina aminotransferase de arroz Não publicado PROO147, inibidor de tripsina ITRl (cevada) Não publicado PROO151, WSI18 de arroz Patente Internacional 2004/070039 PROO175, RAB21 de arroz Patente Internacional 2004/070039 PR0005 Patente Internacional 2004/070039 PR00095 Patente Internacional 2004/070039 α-amilase (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Aead Sci USA 88:7266-7270, 1991 Gene de catepsina tipo β Cejudo et al, Plant Mol Biol 20:849-856, 1992 Ltp2 de cevada Kalla et al., Plant J. 6:849-60, 1994 Chi26 Leah et al., Plant J. 4:579-89, 1994 B-Peru de milho Selingeretal., Genetics 149;1125-38,1998
Tabela 2d: Exemplos de promotores endosperma específicos:
Fonte Gênica
Referência
glutelina (arroz)
Takaiwa et al. (1986) Mol Gen Genet 208:15-22; Takaiwa et al. (1987) FEBS Letts. 221:43-47
zeina
Matzke etal., (1990) PlantMol Biol 14(3): 323-32
LMW e HMW glutenina-1 de trigo_
Colot et al. (1989) Mol Gen Genet 216:81-90, Anderson et al. (1989) NAR 17:461-2_
SPA de trigo
Albani et al. (1997) Plant Cell 9:171-184
gliadinas de trigo
Rafalski et al. (1984) EMBO 3:1409-15
promotor Itrl de cevada
Diaz et al. (1995) Mol Gen Genet 248(5):592-8
Hordeína B1, C, D de cevada
Cho et al. (1999) Theor Appl Genet 98:1253-62; Muller et al. (1993) Plant J 4:343-55; Sorenson et al. (1996) Mol Gen Genet 250:750-60_
DOF de cevada
Mena etal, (1998) PlantJ 116(1): 53-62
blz2
Onate et al. (1999) J Biol Chem 274(14):9175-82
Promotor sintético
Vicente-Carbajosa et al. (1998) Plant J 13:629-640
prolamina NRP33 de arroz
Wu et al, (1998) Plant Cell Physiol 39(8) 885-889
globulina Glb-I de arroz
Wu et al. (1998) Plant Cell Physiol 39(8) 885-889
globulina REB/OHP-1 de arroz
ADP-glicose pirofosforilase de arroz
Nakase etal. (1997) PlantMolec Biol 33: 513-522
Família gênica ESR de milho
Russell et al. (1997) Trans Res 6:157-68
cafirina de sorgo
Opsahl-Ferstad et al. (1997) Plant J 12:235-46
DeRose etal. (1996) PlantMol Biol 32:1029-35
Tabela 2e: Exemplos de promotores embrião específicos:
Fonte Gênica Referência OSHl de arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117-8122, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 PROOl 51 Patente Internacional 2004/070039 PROO175 Patente Internacional 2004/070039 PR0005 Patente Internacional 2004/070039 PR00095 Patente Internacional 2004/070039
Tabela 2f: Exemplos de promotores aleurona específicos:
Fonte Gênica Referência α-amilase (Amy32b) Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 Gene de catepsina tipo β Cejudo et al, PIant Mol Biol 20:849-856, 1992 Ltp2 de cevada Kalla et al., PIant J. 6:849-60, 1994 Chi26 Leahetal., Plant J. 4:579-89, 1994 B-Peru de milho Selinger et al., Genetics 149;1125-38,1998 Um promotor tecido verde específico como definido neste lugar é um promotor que é transcricionalmente ativo predominantemente em tecido verde, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta.
Exemplos de promotores tecido verde específicos que podem ser usados para realizar os métodos da invenção são mostrados em Tabela 2g abaixo.
Tabela 2g: Exemplos de promotores tecido verde específicos
Gene Expressão Referência Ortofosfato diquinase de milho Folha específica Fukavama et al., 2001 Fosfoenolpiruvato carboxilase de milho Folha específica Kausch et al., 2001 Fosfoenolpiruvato carboxilase de arroz Folha específica Liu et al., 2003 Rubisco de subunidade pequena de arroz Folha específica Nomura et al., 2000 beta expansina EXBP9 de arroz Parte aérea específica Patente Internacional 2004/070039 Rubisco de subunidade pequena de guandu Folha específica Panguluri et al., 2005 RBCS3A de ervilha Folha específica
Outro exemplo de um promotor tecido específico é um
promotor meristema específico, que é transcricionalmente ativo predominantemente em tecido meristemático, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta.
Exemplos de promotores meristema verde específicos que podem ser usados para realizar os métodos da invenção são mostrados em Tabela 2h abaixo. Tabela 2h: Exemplos de promotores meristema específicos
Fonte gênica Padrão de expressão Referência OSHl de arroz Meristema apical de parte aérea, de estágio de embrião globular até estágio de plântula Sato et al. (1996) Proc. Natl. Acad. Sei. USA, 93: 8117-8122 Metalotioneína de arroz Meristema específica BAD87835.1 WAKl & WAK 2 Meristemas apicais de partes aéreas e raízes, e em folhas em expansão e sépalas Wagner & Kohorn (2001) Plant Cell 13(2): 303-318
Terminador
O termo "terminador" abrange uma seqüência de controle que é uma seqüência de DNA na extremidade de uma unidade transcricional que sinaliza processamento 3' e poliadenilação de um transcrito primário e término de transcrição. O terminador pode ser derivado do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. O terminador a ser adicionado pode ser derivado, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico. Modulação
O termo "modulação" significa em relação à expressão ou expressão gênica, um processo no qual o nível de expressão é alterado por expressão gênica em comparação com a planta de controle, o nível de expressão é aumentado pode ser aumentado ou diminuído. A expressão original não modulada pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com subseqüente tradução. O termo "modular a atividade" deve significar qualquer mudança da expressão das seqüências de ácidos nucleicos inventivas ou proteínas codificadas, que leva ao rendimento aumentado e/ou crescimento aumentado das plantas. Expressão
O termo "expressão" ou "expressão gênica" significa a transcrição de um gene específico ou genes específicos ou construções genéticas específicas. O termo "expressão" ou "expressão gênica" em particular significa a transcrição de um gene ou genes ou construção genética em RNA estrutural (rRNA, tRNA) ou mRNA com ou sem subseqüente tradução do ultimo em uma proteína. O processo inclui transcrição de DNA e processamento do produto de mRNA resultante. Expressão aumentada/superexpressão
O termo "expressão aumentada" ou "superexpressão" como usado neste lugar significa qualquer forma de expressão que é adicional ao nível de expressão original de tipo selvagem.
Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou acentuadores podem ser introduzidos em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico codificando o polipeptídeo de interesse. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte-Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula de planta na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.
Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico.
Uma seqüência intrônica também pode ser adicionada à região 5' não traduzida (UTR) ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de expressão de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral veja: The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Gene endógeno
Referência neste lugar a um gene "endógeno" se refere não apenas ao gene em questão como encontrado em uma planta em sua forma natural (i.e., sem haver qualquer intervenção humana), mas também se refere ao mesmo gene (ou um ácido nucleico/gene substancialmente homólogo) em uma forma isolada subseqüentemente (re)introduzido em uma planta (um transgene). Por exemplo, uma planta transgênica contendo um tal transgene pode confrontar uma redução substancial da expressão de transgene e/ou redução substancial de expressão do gene endógeno. O gene isolado pode ser isolado de um organismo ou pode ser fabricado pelo homem, por exemplo, por síntese química. Expressão diminuída
Referência neste lugar a "expressão diminuída" ou "redução ou eliminação substancial" de expressão é adotada para significar uma diminuição em expressão de gene endógeno e/ou níveis de polipeptídeo e/ou atividade de polipeptídeo em relação às plantas de controle. A redução ou eliminação substancial é em ordem crescente de preferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%, 80%, 85%, 90%, ou 95%, 96%, 97%, 98%, 99% ou mais reduzida comparada com aquela de plantas de controle.
Para a redução ou eliminação substancial de expressão um gene endógeno em uma planta, um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácido nucleico é requerido. A fim de realizar silenciamento gênico, isto pode ser tão pouco quanto 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 ou menos nucleotídeos, alternativamente isto pode ser tanto quanto o gene inteiro (incluindo a 5' e/ou 3' UTR, ou em parte ou inteira). O trecho de nucleotídeos substancialmente contíguos pode ser derivado do ácido nucleico codificando a proteína de interesse (gene alvo), ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse. Preferivelmente, o trecho de nucleotídeos substancialmente contíguos é capaz de formar ligações de hidrogênio com o gene alvo (ou fita sentido ou antisentido), mais preferivelmente, o trecho de nucleotídeos substancialmente contíguos tem, em ordem crescente de preferência, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100%) de identidade de seqüência com o gene alvo (ou fita sentido ou antisentido). Uma seqüência de ácido nucleico codificando um polipeptídeo (funcional) não é um requerimento para os vários métodos discutidos neste lugar para a redução ou eliminação substancial de expressão de um gene endógeno.
Esta redução ou eliminação substancial de expressão pode ser atingida usando ferramentas e técnicas de rotina. Um método preferido para a redução ou eliminação substancial de expressão de gene endógeno é introduzir e expressar em uma planta uma construção genética na qual o ácido nucleico (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo de qualquer uma das proteínas de interesse) é clonado como uma repetição invertida (em parte ou completamente), separada por um espaçador (DNA não codificante).
Em um tal método preferido, expressão do gene endógeno é reduzida ou substancialmente eliminada através de silenciamento mediado por RNA usando uma repetição invertida de um ácido nucleico ou uma parte deste (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse), preferivelmente capaz de formar uma estrutura em forma de grampo. A repetição invertida é clonada em um vetor de expressão compreendendo seqüências de controle. Uma seqüência de ácido nucleico de DNA não codificante (um espaçador, por exemplo, um fragmento de região de acoplamento de matriz (MAR), um íntron, um poliligante, etc.) está localizado entre os dois ácidos nucleicos invertidos formando a repetição invertida. Depois de transcrição da repetição invertida, um RNA quimérico com uma estrutura auto-complementar é formado (parcial ou completo). Esta estrutura de RNA dupla fita é referida como o RNA em forma de grampo (hpRNA). O hpRNA é processado pela planta em siRNAs que são incorporados em um complexo de silenciamento induzido por RNA (RISC). O RISC adicionalmente cliva os transcritos de mRNA, com isso reduzindo substancialmente o número de transcritos de mRNA a serem traduzidos em polipeptídeos. Para detalhes gerais adicionais veja, por exemplo, Grierson et al. (1998) Patente Internacional 98/53083; Waterhouse et al. (1999) Patente Internacional 99/53050).
Desempenho dos métodos da invenção não se fia em introduzir e expressar em uma planta uma construção genética na qual o ácido nucleico é clonado como uma repetição invertida, mas qualquer um ou mais de diversos métodos bem conhecidos de "silenciamento gênico" podem ser usados para atingir os mesmos efeitos.
Um tal método para a redução de expressão de gene endógeno é silenciamento mediado por RNA de expressão gênica (regulação de forma negativa). Silenciamento neste caso é desencadeado em uma planta por uma seqüência de RNA dupla fita (dsRNA) que é substancialmente similar ao gene endógeno alvo. Este dsRNA é adicionalmente processado pela planta em cerca de 20 a cerca de 26 nucleotídeos chamados RNAs de interferência curtos (siRNAs). Os siRNAs são incorporados em um complexo de silenciamento induzido por RNA (RISC) que cliva o transcrito de mRNA do gene endógeno alvo, com isso reduzindo substancialmente o número de transcritos de mRNA a serem traduzidos em um polipeptídeo. Preferivelmente, a seqüência de RNA dupla fita corresponde a um gene alvo.
Outro exemplo de um método de silenciamento de RNA envolve a introdução de seqüências de ácidos nucleicos ou partes destas (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse) em uma orientação sentido em uma planta. "Orientação sentido" se refere a uma seqüência de DNA que é homóloga a um transcrito de mRNA deste. Deve ser introduzida em uma planta, portanto, pelo menos uma cópia da seqüência de ácido nucleico. A seqüência de ácido nucleico adicional irá reduzir expressão do gene endógeno, gerando um fenômeno conhecido como co-supressão. A redução de expressão gênica será mais pronunciada se diversas cópias adicionais de uma seqüência de ácido nucleico são introduzidas na planta, pois existe uma correlação positiva entre altos níveis de transcrito e o desencadeamento de co-supressão.
Outro exemplo de um método de silenciamento de RNA envolve o uso de seqüências de ácidos nucleicos antisentido. Uma seqüência de ácido nucleico "antisentido" compreende uma seqüência de nucleotídeos que é complementar a uma seqüência de ácido nucleico "sentido" codificando uma proteína, i.e. complementar à fita de codificação de uma molécula de cDNA dupla fita ou complementar a uma seqüência de transcrito de mRNA. A seqüência de ácido nucleico antisentido preferivelmente é complementar ao gene endógeno a ser silenciado. A complementaridade pode estar localizada na "região de codificação" e/ou na "região não codificante" de um gene. O termo "região de codificação" se refere a uma região da seqüência de nucleotídeos compreendendo códons que são traduzidos em resíduos de aminoácidos. O termo "região não codificante" se refere a seqüências 5' e 3' que flanqueiam a região de codificação que são transcritas, mas não traduzidas em aminoácidos (também referidas como regiões 5' e 3' não traduzidas).
Seqüências de ácidos nucleicos antisentido podem ser construídas de acordo com as regras de pareamento de bases de Watson e Crick. A seqüência de ácido nucleico antisentido pode ser complementar à seqüência de ácido nucleico inteira (neste caso um trecho de nucleotídeos substancialmente contíguos derivado do gene de interesse, ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse), mas também pode ser um oligonucleotídeo que é antisentido para apenas uma parte da seqüência de ácido nucleico (incluindo a UTR 5' e 3' de mRNA). Por exemplo, a seqüência de oligonucleotídeos antisentido pode ser complementar à região circundando o sítio de início de tradução de um transcrito de mRNA codificando um polipeptídeo. O comprimento de uma seqüência de oligonucleotídeos antisentido adequada é conhecido na arte e pode começar de cerca de 50, 45, 40, 35, 30, 25, 20, 15 ou nucleotídeos de comprimento ou menos. Uma seqüência de ácido nucleico antisentido de acordo com a invenção pode ser construída usando reações de síntese química e ligação enzimática usando métodos conhecidos na arte. Por exemplo, uma seqüência de ácido nucleico antisentido (e.g., uma seqüência de oligonucleotídeos antisentido) pode ser quimicamente sintetizada usando nucleotídeos naturalmente ocorrentes ou nucleotídeos modificados de forma variada construídos para aumentar a estabilidade biológica das moléculas ou para aumentar a estabilidade física do duplex formado entre as seqüências de ácidos nucleicos antisentido e sentido, e.g., derivados de fosforotioato e nucleotídeos substituídos com acridina podem ser usados. Exemplos de nucleotídeos modificados que podem ser usados para gerar as seqüências de ácidos nucleicos antisentido são bem conhecidos na arte. Modificações conhecidas de nucleotídeos incluem metilação, ciclização e 'caps' e substituição de um ou mais dos nucleotídeos naturalmente ocorrentes por um análogo tal como inosina. Outras modificações de nucleotídeos são bem conhecidas na arte.
A seqüência de ácido nucleico antisentido pode ser produzida biologicamente usando um vetor de expressão no qual uma seqüência de ácido nucleico foi subclonada em uma orientação antisentido (i.e., RNA transcrito a partir do ácido nucleico inserido será de uma orientação antisentido para um ácido nucleico alvo de interesse). Preferivelmente, produção de seqüências de ácidos nucleicos antisentido em plantas ocorre por meio de uma construção de ácido nucleico estavelmente integrada compreendendo um promotor, um oligonucleotídeo antisentido operacionalmente ligado, e um terminador.
As moléculas de ácido nucleico usadas para silenciamento nos métodos da invenção (quer introduzidas em uma planta ou geradas in situ) hibridizam com ou se ligam a transcritos de mRNA e/ou DNA genômico codificando um polipeptídeo para com isso inibir expressão da proteína, e.g., inibindo transcrição e/ou tradução. A hibridização pode ser por complementaridade convencional de nucleotídeos para formar um duplex estável, ou, por exemplo, no caso de uma seqüência de ácido nucleico antisentido que se liga a duplexos de DNA, através de interações específicas na principal fenda da dupla hélice. Seqüências de ácidos nucleicos antisentido podem ser introduzidas em uma planta por transformação ou injeção direta em um sítio de tecido específico. Alternativamente, seqüências de ácidos nucleicos antisentido podem ser modificadas para direcionar células selecionadas e então sistemicamente administradas. Por exemplo, para administração sistêmica, seqüências de ácidos nucleicos antisentido podem ser modificadas de forma que elas se liguem especificamente a receptores ou antígenos expressos em uma superfície celular selecionada, e.g., ligando a seqüência de ácido nucleico antisentido a peptídeos ou anticorpos que se ligam a receptores ou antígenos de superfície celular. As seqüências de ácidos nucleicos antisentido também podem ser liberadas para células usando os vetores descritos neste lugar.
De acordo com um aspecto adicional, a seqüência de ácido nucleico antisentido é uma seqüência de ácido nucleico α-anomérica. Uma seqüência de ácido nucleico α-anomérica forma híbridos dupla fita específicos com RNA complementar nos quais, ao contrário das unidades b usuais, as fitas correm paralelas uma a outra (Gaultier et al. (1987) Nucl Ac Res 15: 6625-6641). A seqüência de ácido nucleico antisentido também pode compreender um 2'-o-metilribonucleotídeo (Inoue et al. (1987) Nucl Ac Res 15, 6131-6148) ou um análogo quimérico de RNA-DNA (Inoue et al. (1987) FEBS Lett. 215, 327-330).
A redução ou eliminação substancial de expressão de gene endógeno também pode ser realizada usando ribozimas. Ribozimas são moléculas catalíticas de RNA com atividade de ribonuclease que são capazes de clivar uma seqüência de ácido nucleico de fita simples, tal como um mRNA, ao qual elas têm uma região complementar. Assim, ribozimas (e.g., ribozimas cabeça-de-martelo (descritas em Haselhoff and Gerlach (1988) Nature 334, 585-591) podem ser usadas para clivar cataliticamente transcritos de mRNA codificando um polipeptídeo, com isso reduzindo substancialmente o número de transcritos de mRNA a serem traduzidos em um polipeptídeo. Uma ribozima tendo especificidade para uma seqüência de ácido nucleico pode ser construída (veja, por exemplo: Cech et al. Patente Norte-Americana No. 4.987.071; e Cech et al. Patente Norte-Americana No. 5.116.742). Alternativamente, transcritos de mRNA correspondendo a uma seqüência de ácido nucleico podem ser usados para selecionar um RNA catalítico tendo uma atividade específica de ribonuclease a partir de um conjunto de moléculas de RNA (Bartel and Szostak (1993) Science 261, 1411-1418). O uso de ribozimas para silenciamento de genes em plantas é conhecido na arte (e.g., Atkins et al. (1994) Patente Internacional 94/00012; Lenne et al. (1995) Patente Internacional 95/03404; Lutziger et al. (2000) Patente Internacional 00/00619; Prinsen et al. (1997) Patente Internacional 97/13865 e Scott et al. (1997) Patente Internacional 97/38116).
Silenciamento gênico também pode ser atingido por mutagênese por inserção (por exemplo, inserção de T-DNA ou inserção de transposon) ou por estratégias como descrito por, entre outros, Angell and Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS Patente Internacional 98/36083), ou Baulcombe (Patente Internacional 99/15682).
Silenciamento gênico também pode ocorrer se existe uma mutação em um gene endógeno e/ou uma mutação em um gene/ácido nucleico isolado subseqüentemente introduzido em uma planta. A redução ou eliminação substancial pode ser causada por um polipeptídeo não funcional. Por exemplo, o polipeptídeo pode ser ligar a várias proteínas de interação; uma ou mais mutação(ões) e/ou truncamento(s) pode(m), portanto, fornecer um polipeptídeo que ainda é capaz de se ligar a proteínas de interação (tal como proteínas receptoras), mas que não pode exibir sua função normal (tal como ligante de sinalização).
Uma abordagem adicional para silenciamento gênico é direcionar seqüências de ácidos nucleicos complementares à região reguladora do gene (e.g., o promotor e/ou acentuadores) para formar estruturas de tripla hélice que previnem transcrição do gene em células alvo. Veja Helene, C., Anticancer Drug Res. 6, 569-84, 1991; Helene et al., Ann. N.Y. Acad. Sei. 660, 27-36 1992; e Maher, L.J. Bioassays 14, 807-15, 1992.
Outros métodos, tal como o uso de anticorpos dirigidos a um polipeptídeo endógeno para inibir sua função em planta, ou interferência na via de sinalização na qual um polipeptídeo está envolvido, serão bem conhecidos por alguém versado. Em particular, pode ser contemplado que moléculas fabricadas podem ser úteis para inibir a função biológica de um polipeptídeo alvo, ou para interferir na via de sinalização na qual o polipeptídeo alvo está envolvido.
Alternativamente, um programa de triagem pode ser ajustado para identificar em uma população de planta variantes naturais de um gene, cujas variantes codificam polipeptídeos com atividade reduzida. Tais variantes naturais também podem ser usadas, por exemplo, para realizar recombinação homóloga.
MicroRNAs (miRNAs) artificiais e/ou naturais podem ser usados para nocautear expressão gênica e/ou tradução de mRNA. miRNAs endógenos são RNAs pequenos de fita simples de tipicamente 19-24 nucleotídeos de comprimento. Eles funcionam primariamente para regular expressão gênica e/ ou tradução de mRNA. A maioria de microRNAs (miRNAs) de plantas tem complementaridade perfeita ou quase perfeita com suas seqüências alvo. Entretanto, há alvos naturais com até cinco pareamentos errôneos. Eles são processados a partir de RNAs não codificantes maiores com estruturas reversas características por RNases de dupla fita específicas da família Dicer. Mediante processamento, eles são incorporados no complexo de silenciamento induzido por RNA (RISC) se ligando a seu componente principal, uma proteína Argonauta. MiRNAs servem como os componentes de especificidade de RISC, uma vez que eles pareiam bases com ácidos nucleicos alvo, principalmente mRNAs, no citoplasma. Eventos reguladores subseqüentes incluem clivagem de mRNA alvo e destruição e/ou inibição transducional. Efeitos de superexpressão de miRNA são assim freqüentemente refletidos em níveis diminuídos de mRNA de genes alvo.
MicroRNAs artificiais (amiRNAs), os quais são tipicamente de 21 nucleotídeos de comprimento, podem ser geneticamente manipulados especificamente para regular negativamente expressão gênica de um ou múltiplos genes de interesse. Determinantes de seleção de alvo de microRNA de planta são bem conhecidos na arte. Parâmetros empíricos para reconhecimento de alvo foram definidos e podem ser usados para auxiliar a concepção de amiRNAs específicos, (Schwab et al., Dev. Cell 8, 517-527, 2005). Ferramentas convenientes para concepção e geração de amiRNAs e seus precursores também estão disponíveis para o público (Schwab et al., Plant Cell 18, 1121-1133,2006).
Para desempenho ótimo, as técnicas de silenciamento gênico usadas para reduzir expressão em uma planta de um gene endógeno requerem o uso de seqüências de ácidos nucleicos de plantas monocotiledôneas para transformação de plantas monocotiledôneas, e de plantas dicotiledôneas para transformação de plantas dicotiledôneas. Preferivelmente, uma seqüência de ácido nucleico de qualquer dada espécie de planta é introduzida naquela mesma espécie. Por exemplo, uma seqüência de ácido nucleico de arroz é transformada em uma planta de arroz. Entretanto, não é um requerimento absoluto que a seqüência de ácido nucleico a ser introduzida se origine da mesma espécie de planta que a planta na qual ela será introduzida. E suficiente que exista uma homologia substancial entre o gene endógeno alvo e o ácido nucleico a ser introduzido.
São descritos acima exemplos de vários métodos para a redução ou eliminação substancial de expressão em uma planta de um gene endógeno. Uma pessoa versada na arte deve ser prontamente capaz de adaptar os métodos mencionados acima para silenciamento de forma a atingir redução de expressão de um gene endógeno em uma planta inteira ou em partes desta através do uso de um promotor apropriado, por exemplo. Marcador selecionável (geneVGene repórter
"Marcador selecionável", "gene marcador selecionável" ou "gene repórter" inclui qualquer gene que confere um fenótipo em uma célula na qual ele é expresso para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Estes genes marcadores possibilitam a identificação de uma transferência bem sucedida das moléculas de ácido nucleico através de uma série de princípios diferentes. Marcadores adequados podem ser selecionados a partir de marcadores que conferem resistência a antibiótico ou herbicida, que introduzem uma nova característica metabólica ou que permitem seleção visual. Exemplos de genes marcadores selecionáveis incluem genes conferindo resistência a antibióticos (tal como nptll que fosforila neomicina e canamicina, ou hpt, fosforilando higromicina, ou genes conferindo resistência a, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina), a herbicidas (por exemplo, bar que fornece resistência a Basta®; aroA ou gox fornecendo resistência contra glifosato, ou os genes conferindo resistência a, por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou genes que fornecem uma característica metabólica (tal como manA que permite que plantas usem manose como única fonte de carbono ou xilose isomerase para a utilização de xilose, ou marcadores antinutritivos tal como a resistência a 2- deoxiglicose). Expressão de genes marcadores visuais resulta na formação de cor (por exemplo, β-glucuronidase, GUS ou β-galactosidase com seus substratos coloridos, por exemplo, X-Gal), luminescência (tal como o sistema de luciferina/luciferase) ou fluorescência (Proteína Fluorescente Verde, GFP, e derivados deste). Esta lista representa apenas um pequeno número de possíveis marcadores. O trabalhador versado é familiar com tais marcadores. Diferentes marcadores são preferidos, dependendo do organismo e do método de seleção.
Sabe-se que mediante integração estável ou transiente de ácidos nucleicos em células de planta, apenas uma minoria das células absorve o DNA exógeno e, se desejado, o integra em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar estes integrantes, um gene codificando para um marcador selecionável (tal como aqueles descritos acima) normalmente é introduzido nas células hospedeiras junto com o gene de interesse. Estes marcadores podem ser, por exemplo, usados em mutantes nos quais estes genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, moléculas de ácido nucleico codificando um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência codificando os polipeptídeos da invenção ou usados nos métodos da invenção, ou ainda em um vetor separado. Células que foram estavelmente transfectadas com o ácido nucleico introduzido podem ser identificadas, por exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem ao passo que as outras células morrem).
Uma vez que os genes marcadores, particularmente genes para resistência a antibióticos e herbicidas, não são mais requeridos ou são indesejados na célula hospedeira transgênica uma vez os ácidos nucleicos tenham sido introduzidos com sucesso, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que possibilitam a remoção ou excisão destes genes marcadores. Um tal método é o que é conhecido como co-transformação. O método de co-transformação emprega dois vetores simultaneamente para a transformação, um vetor carregando o ácido nucleico de acordo com a invenção e um segundo carregando o(s) gene(s) marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes), ambos os vetores. Em caso de transformação com Agrobactérias, os transformantes normalmente recebem apenas uma parte do vetor, i.e. a seqüência flanqueada pelo T-DNA, que normalmente representa a gaveta de expressão. Os genes marcadores podem ser subseqüentemente removidos da planta transformada realizando cruzamentos. Em outro método, genes marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecida como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico conferindo expressão de uma transposase, transientemente ou estavelmente. Em alguns casos (aprox. 10%), o transposon pula fora do genoma da célula hospedeira uma vez que transformação tenha ocorrido com sucesso e é perdido. Em diversos casos adicionais, o transposon pula para uma localização diferente. Nestes casos o gene marcador deve ser eliminado realizando cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tornam possível, ou facilitam, a detecção de tais eventos. Um método vantajoso adicional se fia no que é conhecido como sistemas de recombinação; cuja vantagem é de que eliminação por cruzamento pode ser dispensada. O sistema mais conhecido deste tipo é o que é conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene marcador está integrado entre as seqüências IoxP, ele é removido uma vez que transformação tenha ocorrido com sucesso, por expressão da recombinase. Sistemas de recombinação adicionais são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio específica no genoma de planta das seqüências de ácidos nucleicos de acordo com a invenção é possível. Naturalmente, estes métodos também podem ser aplicados a microorganismos tal como levedura, fungos ou bactérias. Transgênico/Transgene/Recombinante
Para os propósitos da invenção, "transgênico", "transgene" ou "recombinante" significa com relação a, por exemplo, uma seqüência de ácido nucleico, uma gaveta de expressão, construção gênica ou um vetor compreendendo a seqüência de ácido nucleico ou um organismo transformado com as seqüências de ácidos nucleicos, gavetas de expressão ou vetores de acordo com a invenção, todas estas construções causadas por métodos recombinantes nos quais ou (a) as seqüências de ácidos nucleicos codificando proteínas úteis nos métodos da invenção, ou
(b) seqüência(s) de controle genético que é(são) operacionalmente ligada(s) com a seqüência de ácido nucleico de acordo com
a invenção, por exemplo, um promotor, ou
(c) a) e b)
não estão localizadas em seu ambiente genético natural ou foram modificadas por métodos recombinantes, sendo possível para a modificação tomar a forma de, por exemplo, uma substituição, adição, deleção, inversão ou inserção de um ou mais resíduos de nucleotídeos. O ambiente genético natural é entendido como significando o locus genômico ou cromossômico natural na planta original ou a presença em uma biblioteca genômica. No caso de uma biblioteca genômica, o ambiente genético natural da seqüência de ácido nucleico é preferivelmente mantido, pelo menos em parte. O ambiente flanqueia a seqüência de ácido nucleico pelo menos em um lado e tem um comprimento de seqüência de pelo menos 50 bp, preferivelmente pelo menos 500 bp, especialmente preferivelmente pelo menos 1000 bp, mais preferivelmente pelo menos 5000 bp. Uma gaveta de expressão naturalmente ocorrente - por exemplo, a combinação naturalmente ocorrente do promotor natural das seqüências de ácidos nucleicos com a seqüência de ácido nucleico correspondente codificando um polipeptídeo útil nos métodos da presente invenção, como definido acima - se torna uma gaveta de expressão transgênica quando esta gaveta de expressão é modificada por métodos não naturais, sintéticos ("artificiais") tal como, por exemplo, tratamento mutagênico. Métodos adequados são descritos, por exemplo, em Patente Norte-Americana 5.565.350 ou Patente Internacional 00/15815.
Uma planta transgênica para os propósitos da invenção é assim entendida como significando, como acima, que os ácidos nucleicos usados no método da invenção não estão em seu locus natural no genoma de dita planta, sendo possível para os ácidos nucleicos serem expressos homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, enquanto os ácidos nucleicos de acordo com a invenção ou usados no método inventivo estão em sua posição natural no genoma de uma planta, a seqüência foi modificada com relação à seqüência natural, e/ou que as seqüências reguladoras das seqüências naturais foram modificadas. Transgênica é preferivelmente entendido como significando a expressão dos ácidos nucleicos de acordo com a invenção em um locus não natural no genoma, i.e. expressão homóloga ou, preferivelmente, heteróloga dos ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar. Transformação
O termo "introdução" ou "transformação" como referido neste lugar abrange a transferência de um polinucleotídeo exógeno para uma célula hospedeira, independente do método usado para transferência. Tecido de planta capaz de subseqüente propagação clonal pode ser transformado, quer por organogênese ou embriogênese, com uma construção genética da presente invenção e uma planta inteira regenerada a partir daí. O tecido particular escolhido irá variar dependendo dos sistemas de propagação clonal disponíveis para, e melhor adequados para, a espécie particular sendo transformada. Alvos de tecido exemplares incluem discos foliares, pólen, embriões, cotilédones, hipocótilos, megagametófitos, tecido de calo, tecido meristemático existente (e.g., meristema apical, gemas axilares, e meristemas de raiz), e tecido de meristema induzido (e.g., meristema de cotilédone e meristema de hipocótilo). O polinucleotídeo pode ser transientemente ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Alternativamente, ele pode ser integrado no genoma hospedeiro. A célula de planta transformada resultante pode então ser usada para regenerar uma planta transformada de uma maneira conhecida por pessoas versadas na arte.
A transferência de genes exógenos para o genoma de uma planta é chamada transformação. Transformação de espécies de planta é agora uma técnica bastante rotineira. Vantajosamente, qualquer dos diversos métodos de transformação pode ser usado para introduzir o gene de interesse em uma célula ancestral adequada. Os métodos descritos para a transformação e regeneração de plantas a partir de tecidos de planta ou células de planta podem ser utilizados para transformação transiente ou estável. Métodos de transformação incluem o uso de lipossomos, eletroporação, produtos químicos que aumentam absorção de DNA livre, injeção do DNA diretamente na planta, bombardeamento por pistola de partícula, transformação usando vírus ou pólen e microprojeção. Métodos podem ser selecionados a partir do método de cálcio/polietilenoglicol para protoplastos (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099- 1102); microinjeção em material de planta (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeamento de partícula revestida de DNA ou RNA (Klein TM et al., (1987) Nature 327: 70) infecção com (não integrativa) vírus e os semelhantes. Plantas transgênicas, incluindo plantas de cultivo transgênicas, preferivelmente são produzidas através de transformação mediada por Agrobacterium. Um método de transformação vantajoso é a transformação in planta. Para esta finalidade, é possível, por exemplo, permitir que as agrobactérias atuem em grãos de planta ou inocular o meristema de planta com agrobactérias. Provou-se particularmente adequado em conformidade com a invenção permitir que uma suspensão de agrobactérias transformadas atue na planta intacta ou pelo menos nos primórdios florais. A planta é subseqüentemente cultivada até que as sementes da planta tratada sejam obtidas (Clough and Bent, Plant J. (1998) 16, 735-743). Métodos para transformação mediada por Agrobacterium de arroz incluem métodos bem conhecidos para transformação de arroz, tal como aqueles descritos em qualquer dos seguintes: pedido da Patente Européia EP 1198985 Al, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), cujas descrições são incorporadas por referência neste lugar como se completamente apresentadas. No caso de transformação de milho, o método preferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et al. (Plant Physiol 129(1): 13-22, 2002), cujas descrições são incorporadas por referência neste lugar como se completamente apresentadas. Ditos métodos são adicionalmente descritos como forma de exemplo em B. Jenes et al., Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção a ser expressa é preferivelmente clonada em um vetor, que é adequado para transformar Agrobacterium tumefaciens, por exemplo, pBinl9 (Bevan et al., Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um tal vetor podem ser então usadas de uma maneira conhecida para a transformação de plantas, tal como plantas usadas como um modelo, como Arabidopsis (Arabidopsis thaliana está dentro do escopo da presente invenção não considerada como uma planta de cultivo), ou plantas de cultivo tal como, como forma de exemplo, plantas de tabaco, por exemplo, imergindo folhas machucadas ou folhas picadas em uma solução agrobacteriana e então as cultivando em meio adequado. A transformação de plantas por meio de Agrobaeterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer em Nucl. Acid Res. (1988) 16, 9877 ou é conhecida entre outras maneiras a partir de F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38. Em adição à transformação de células somáticas, que então têm que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas de planta e em particular aquelas células que se desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento de planta natural, gerando plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas a partir das plantas em desenvolvimento das quais uma certa proporção é transformada e assim transgênica [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. Métodos alternativos são baseados na remoção repetida das inflorescências e incubação do sítio de excisão no centro da roseta com agrobactérias transformadas, através do que sementes transformadas podem da mesma maneira ser obtidas em um momento posterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Entretanto, um método especialmente efetivo é o método de infiltração a vácuo com suas modificações tal como o método de "botão floral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso do método de "botão floral" o tecido floral em desenvolvimento é incubado brevemente com uma suspensão agrobacteriana tratada com surfactante [Clough, SJ and Bent, AF (1998). The Plant J. 16, 735-743]. Uma certa proporção de sementes transgênicas são coletadas em ambos os casos, e estas sementes podem ser distinguidas de sementes não transgênicas cultivando nas condições seletivas descritas acima. Em adição, a transformação estável de plastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmente reduzindo ou eliminando o risco de fluxo de transgene através de pólen na maioria das cultivos. A transformação do genoma de cloroplasto geralmente é atingida por um processo que foi esquematicamente apresentado em Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente as seqüências a serem transformadas são clonadas junto com um gene marcador selecionável entre seqüências flanqueadoras homólogas ao genoma de cloroplasto. Estas seqüências flanqueadoras homólogas dirigem integração sítio específica no plastoma. Transformação plastidial foi descrita para muitas espécies de plantas diferentes e uma visão geral é dada em Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28. Progresso biotecnológico adicional foi recentemente relatado em forma de transformantes de plastídeos livres de marcador, que podem ser produzidos por um gene marcador co-integrado transiente (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
Identificação por ativação de T-DNA
Identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), envolve inserção de T-DNA, normalmente contendo um promotor (também pode ser um acentuador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb antes ou depois da região de codificação de um gene em uma configuração de forma que o promotor dirige expressão do gene dirigido. Tipicamente, regulação de expressão do gene dirigido por seu promotor natural é interrompida e o gene cai sob o controle do promotor recentemente introduzido. O promotor é tipicamente embebido em um T-DNA. Este T-DNA é aleatoriamente inserido no genoma de planta, por exemplo, através de infecção por Agrobacterium e leva a expressão modificada de genes perto do T-DNA inserido. As plantas transgênicas resultantes mostram fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.
TILLING O termo “TILLING” é uma abreviação de “Lesões Locais Induzidas Dirigidas em Genomas” e se refere a uma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicos codificando proteínas com expressão e/ou atividade modificada. TILLING também permite seleção de plantas carregando tais variantes mutantes. Estas variantes mutantes podem exibir expressão modificada, ou em força ou em localização ou em momento (se as mutações afetam o promotor, por exemplo). Estas variantes mutantes podem exibir atividade maior do que aquela exibida pelo gene em sua forma natural. TILLING combina mutagênese de alta densidade IO com métodos de triagem rápida. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e combinação de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e anelamento para permitir formação de heteroduplexos; (e) DHPLC, onde a presença de um heteroduplex em uma combinação é detectada como um pico extra no cromatograma; (f) identificação do mutante individual; e (g) seqüenciamento do produto de PCR mutante. Métodos para TILLING são bem conhecidos na arte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50).
Recombinação homóloga
Recombinação homóloga permite introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciências biológicas para organismos inferiores tal como levedura ou o musgo Physcomitrella. Métodos para realizar recombinação homóloga em plantas foram descritos não apenas para plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84), mas também para plantas de cultivo, por exemplo, 5 arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida and Terada (2004) Curr Opin Biotech 15(2): 132-8), e há métodos que geralmente são aplicáveis independente do organismo alvo (Miller et al, Nature Biotechnol. 25, 778-785, 2007).
Rendimento
O termo “rendimento” em geral significa uma rendimento
mensurável de valor econômico, tipicamente relacionada a um cultivo especificado, a uma área, e a um período de tempo. Partes de planta individuais contribuem diretamente para rendimento baseado em seu número, tamanho e/ou peso, ou a rendimento atual é a rendimento por metro quadrado 15 para um cultivo e ano, que é determinada dividindo rendimento total (inclui tanto produção coletada como avaliada) por metros quadrados plantados. O termo “rendimento” de uma planta pode se referir à biomassa vegetativa (biomassa de raiz e/ou parte aérea), a órgãos reprodutivos, e/ou a propágulos (tal como sementes) de tal planta.
Vigor inicial
Vigor inicial se refere a crescimento bem equilibrado saudável ativo especialmente durante estágios iniciais de crescimento de planta, e pode resultar de aptidão de planta aumentada devido a, por exemplo, as plantas serem melhor adaptadas a seu ambiente (i.e. aperfeiçoando o uso de recursos 25 energéticos e particionamento entre parte aérea e raiz). Plantas tendo vigor inicial também mostram uma sobrevivência de plântula aumentada e um melhor estabelecimento do cultivo, o que freqüentemente resulta em campos altamente uniformes (com o cultivo crescendo de maneira uniforme, i.e. com a maioria das plantas atingindo os vários estágios de desenvolvimento substancialmente ao mesmo tempo), e freqüentemente rendimento melhor e maior. Portanto, vigor inicial pode ser determinado medindo vários fatores, tal como peso de mil sementes, porcentagem de germinação, porcentagem de emergência, crescimento de plântula, altura de plântula, comprimento de raiz, 5 biomassa de raiz e parte aérea e muito mais.
Aumento/Melhora/Acentuação
Os termos “aumento”, “melhora” ou “acentuação” são permutáveis e devem significar no sentido do pedido pelo menos uns 3%, 4%, 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, 10 mais preferivelmente 25%, 30%, 35% ou 40% mais rendimento e/ou crescimento em comparação com plantas de controle como definido neste lugar.
Rendimento de sementes
Rendimento aumentado de sementes pode ser manifestado como um ou mais dos seguintes: a) um aumento em biomassa de semente (peso total de semente) que pode ser em uma base de semente individual e/ou por planta e/ou por metro quadrado; b) número aumentado de flores por planta; c) número aumentado de grãos (cheios); d) taxa aumentada de enchimento de grãos (que é expressa como a proporção entre o número de grãos cheios dividido pelo número total de grãos); e) índice de colheita aumentado, que é expresso como proporção do rendimento de partes colhíveis, tal como sementes, dividida pela biomassa total; e f) Peso de Mil Sementes (TKW) aumentado, que é extrapolado a partir do número de grãos cheios contados e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado, e também pode resultar de um aumento em tamanho de embrião e/ou endosperma.
Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente. Além disso, um aumento em rendimento de sementes também pode ser manifestado como um aumento em área de semente e/ou comprimento de semente e/ou largura de semente e/ou perímetro de semente. Rendimento aumentada também pode resultar em arquitetura modificada, ou pode ocorrer por causa de arquitetura modificada. índice Verde
O “índice verde” como usado neste lugar é calculado a partir de imagens digitais de plantas. Para cada pixel pertencendo ao objeto de planta na imagem, a proporção do valor de verde versus o valor de vermelho (no modelo RGB para codificar cor) é calculada. O índice verde é expresso como a porcentagem de pixéis para a qual a proporção de verde para vermelho excede um dado limiar. Em condições normais de crescimento, em condições de crescimento com estresse salino, e em condições de crescimento com disponibilidade reduzida de nutrientes, o índice verde de plantas é medido no último tratamento de imagens antes de florescimento. Em contraste, em condições de crescimento com estresse por seca, o índice verde de plantas é medido no primeiro tratamento de imagens depois de seca.
Planta
O termo “planta” como usado neste lugar abrange plantas inteiras, ancestrais e progênie das plantas e partes de planta, incluindo sementes, partes aéreas, caules, folhas, raízes (incluindo tubérculos), flores, e tecidos e órgãos, caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse. O termo “planta” também abrange células de planta, cultivos em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen e micrósporos, de novo caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse.
Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, cultivos alimentares, árvores ou arbustos selecionados a partir da lista compreendendo Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, 5 Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagus offieinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa earambola, Bambusa sp., Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassiea spp. (e.g. Brassiea napus, Brassiea rapa ssp. [canola, colza, nabo]), Cadaba farinosa, 10 Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceibapentandra, Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus sp., Coriandrum sativum, Corylus spp., 15 Crataegus spp., Crocus sativus, Cucurbita spp., Cucumis spp., Cynara spp., Daueus carota, Desmodium spp., Dimocarpus longart, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (e.g. Elaeis guineensis, Elaeis oleifera), Eleusine coracana, Erianthus sp., Eriobotrya japoniea, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, 20 Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. (e.g. Glycine max, Soja hispida ou Soja max), Gossypium hirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (e.g. Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens eulinaris, Linum usitatissimum, Litchi 25 chinensis, Lotus spp., Luffa aeutangula, Lupinus spp., Luzula sylvatica, Lycopersicon spp. (e.g. Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon pyrifomie), Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Miseanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nieotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (e.g. Oryza sativa, Oryza latifolia), Panieum miliaeeum, Panieum virgatum, Passifora edulis, Pastinaea sativa, Pennisetum sp., Persea spp., Petroselinum erispum, Phalaris arundinaeea, Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Puniea granatum, Pyrus eommunis, Quereus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Rieinus eommunis, Rubus spp., Saceharum spp., Salix sp., Sambueus spp., Seeale eereale, Sesamum spp., Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium ou Solanum lyeopersicum), Sorghum bieolor, Spinaeia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Tritieum spp. (e.g. Tritieum aestivum, Tritieum durum, Tritieum turgidum, Tritieum hybernum, Tritieum maeha, Tritieum sativum ou Tritieum vulgare), Tropaeolum minus, Tropaeolum majus, Vaeeinium spp., Vicia spp., Vigna spp., Viola odor ata, Vitis spp., Zea mays, Zizaniapalustris, Ziziphus spp., entre outras.
Descrição detalhada da invenção TCP de Classe I
Surpreendentemente, foi descoberto agora que aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um YEP, cujo YEP é um polipeptídeo TCP de Classe I, gera plantas tendo rendimento aumentado de sementes em relação às plantas de controle. O tipo particular de polipeptídeos TCP de Classe I adequado para aumentar o rendimento de sementes em plantas é descrito em detalhe abaixo.
A presente invenção fornece um método para aumentar rendimento de sementes em plantas em relação às plantas de controle, compreendendo aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um polipeptídeo TCP de Classe I. No contexto desta forma de realização, qualquer referência a um “polipeptídeo útil nos métodos da invenção” é adotada para significar um polipeptídeo TCP de Classe I como definido neste lugar. Qualquer referência daqui por diante a uma “seqüência de ácido nucleico útil nos métodos da invenção” é adotada para significar uma seqüência de ácido nucleico capaz de codificar um tal polipeptídeo TCP de Classe I.
Os termos “polipeptídeo” e “proteína” são usados permutavelmente neste lugar e se referem a aminoácidos em uma forma polimérica de qualquer comprimento. Os termos também são definidos na seção “Definições” neste lugar. Os termos “polinucleotídeo(s)”, “seqüência(s) de ácidos nucleicos”, “seqüência(s) de nucleotídeos” também são definidos na seção “Definições” neste lugar
O aumento em rendimento de sementes atingido realizando os métodos da invenção é um aumento em relação às plantas de controle. O termo “plantas de controle” é definido na seção “Definições” neste lugar.
Um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I útil nos métodos da invenção como definido abaixo.
A seqüência de ácido nucleico a ser introduzida em uma planta (e, portanto útil para realizar os métodos da invenção) é qualquer seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I, daqui por diante também chamada “seqüência de ácido nucleico de TCP de Classe I” ou “gene de TCP de Classe I”. Um “polipeptídeo TCP de Classe I” como definido neste lugar se refere a um polipeptídeo compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%), 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65.
A presença de um domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) foi determinada como mostrado em Exemplos 2, 3, 4, e 5. O cálculo de identidade percentual de aminoácidos de SEQ ID NO: 66 com o domínio conservado de TCP de polipeptídeos TCP de Classe I úteis para realizar os métodos da invenção é mostrado em Exemplo 3 (Tabela BI).
Dentro do motivo 1 consenso C-terminal como representado por SEQ ID: 65, pode haver uma ou mais mudanças conservativas em qualquer posição, e/ou uma, duas ou três mudança(s) não conservativa(s) em qualquer posição. A presença deste motivo foi determinada como mostrado em Exemplo 2. Por “C-terminal” é pretendido neste lugar a metade da seqüência de polipeptídeo compreendendo o término carbóxi (C) (a outra metade compreendendo o término amino (N)). Por “motivo 1 consenso C- terminal” é neste lugar adotado para significar que o motivo 1 consenso é compreendido com a metade C-terminal da seqüência de polipeptídeo.
Adicionalmente, o polipeptídeo TCP de Classe I pode compreender uma região rica em HQ (H sendo histidina, Q glutamina), entre o motivo 1 conservado C-terminal e a extremidade C-terminal do polipeptídeo. A região rica em HQ compreende pelo menos quatro, preferivelmente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais ou de apenas resíduos de H, ou de apenas resíduos de Q, ou de uma combinação de resíduos de H e Q (em qualquer proporção). A presença deste motivo foi determinada como descrito em Exemplos 2 e 4. Por “extremidade C-terminal“ do polipeptídeo neste lugar é adotado para significar o último resíduo de aminoácido da seqüência de polipeptídeo.
Alternativamente ou adicionalmente, um “polipeptídeo TCP de Classe I” como definido neste lugar se refere a qualquer seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP.
Uma pessoa versada na arte pode determinar prontamente se qualquer seqüência de polipeptídeo em questão cai dentro da definição de um “polipeptídeo TCP de Classe I” usando técnicas conhecidas e aplicativo computacional para a criação de uma tal árvore filogenética, tal como um pacote GCG, EBI ou CLUSTAL, usando parâmetros padrão. Qualquer agrupamento de seqüências dentro do ciado compreendendo SEQ ID NO: 2 (circundada em Fig. 1) deve ser considerado como caindo dentro da definição mencionada acima de um polipeptídeo TCP de Classe I, e deve ser considerado adequado para uso nos métodos da invenção.
Exemplos de polipeptídeos úteis nos métodos da invenção e seqüências de ácidos nucleicos codificando os mesmos são como dado abaixo em Tabela A de Exemplo 1.
Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1, o termo “homólogo” sendo como definido na seção “Definições” neste lugar.
Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídeos dados em Tabela A de Exemplo I. O termo “Derivados” é como definido na seção “Definições” neste lugar.
A invenção é ilustrada transformando plantas com a seqüência de ácido nucleico de Arabidopsis thaliana representada por SEQ ID NO: 1, codificando a seqüência de polipeptídeo de SEQ ID NO: 2, entretanto desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizados usando qualquer seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I útil nos métodos da invenção como definido neste lugar, incluindo ortólogos e parálogos, tal como qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1.
As seqüências de polipeptídeos dadas em Tabela A de Exemplo 1 podem ser consideradas como sendo ortólogos e parálogos do polipeptídeo TCP de Classe I representado por SEQ ID NO: 2. Os termos “Ortólogos” e “parálogos” são como definido neste lugar.
Ortólogos e parálogos podem ser facilmente encontrados realizando uma assim chamada busca blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo, usando qualquer das seqüências listadas em Tabela A de Exemplo 1) contra qualquer banco de dados de seqüências, tal como o banco de dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência de polipeptídeo. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: I ou SEQ ID NO: 2, o segundo BLAST deve, portanto, ser contra seqüências de Arabidopsis thalianà). Os resultados do primeiro e segundo BLAST são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retomo então idealmente resulta na seqüência de consulta como maior acerto; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retomo na seqüência de consulta estando entre os maiores acertos.
Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). Computação do valor E é bem conhecida na arte. Em adição a valores E, comparações também são pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos.
Tabela A de Exemplo 1 fornece exemplos de ortólogos e parálogos do polipeptídeo TCP de Classe I representado por SEQ ID NO 2. Ortólogos e parálogos adicionais podem ser prontamente identificados usando o procedimento BLAST descrito acima. Os métodos da invenção podem ser vantajosamente realizados usando qualquer seqüência de ácido nucleico codificando qualquer dos polipeptídeos TCP de Classe I como dado em Tabela A ou ortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima.
Os polipeptídeos da invenção são identificáveis pela presença de um domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) (mostrado em Figura 3A). O termo “domínio” é como definido na seção “Definições” neste lugar.
O termo “motivo”, ou “seqüência consenso”, ou “assinatura” é como definido na seção “Definições” neste lugar.
Também existem bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleie Aeids Res 30, 242-244, InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proeeedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para análise em silício de seqüências protéicas está disponível no servidor de proteômica ExPASY (hospedado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)).
Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos, ortólogos e parálogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.).
5 Edição manual secundária pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar seqüências de comprimento completo para a identificação de homólogos, domínios específicos (tal como
o domínio conservado de TCP, ou um dos motivos definidos acima) também 10 podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo em Exemplo 3 como uma porcentagem foram determinados ao longo da seqüência inteira de ácidos nucleicos ou de polipeptídeos (Tabela B), e/ou ao longo de domínios selecionados ou motivo(s) conservado(s) (Tabela BI), usando os programas mencionados acima usando os parâmetros padrão.
Além disso, a presença de regiões ricas em aminoácidos
específicos (tal como a região HQ) pode ser identificada usando algoritmos computacionais ou simplesmente por inspeção visual. Para o anterior, composição primária de aminoácidos (em %) para determinar se uma região de polipeptídeo é rica em aminoácidos específicos pode ser calculada usando 20 programas de aplicativos computacionais do servidor ExPASy, em particular a ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: the proteomics server for in-depth protein knowledge and analysis. Nucleic Acids Res 31:3784-3788). A composição do polipeptídeo de interesse pode ser então comparada com a composição média de aminoácidos (em %) no banco de 25 dados Swiss-Prot Protein Sequence. Por exemplo, neste banco de dados, o conteúdo médio de histidina é de 2,27%, o conteúdo médio de glutamina é de 3,93%. Uma região de polipeptídeo é rica em um aminoácido específico se o conteúdo daquele aminoácido específico naquele domínio está acima da composição media do aminoácido (em %) no banco de dados Swiss-Prot Protein Sequence. Uma região rica em HQ, portanto, tem ou um conteúdo de H acima de 2,27%, e/ou um conteúdo de G acima de 3,93%. Para o último, inspeção visual do alinhamento múltiplo de seqüências de polipeptídeos TCP de Classe I de Tabela A, mostra uma região rica em HQ (H sendo histidina, Q 5 glutamina), entre o motivo 1 conservado C-terminal e a extremidade C- terminal dos polipeptídeos. A região rica em HQ compreende pelo menos quatro, preferivelmente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 ou mais ou de apenas resíduos de H, ou de apenas resíduos de Q, ou de uma combinação de resíduos de H e Q (em qualquer proporção). A presença deste 10 motivo foi determinada como mostrado em Exemplos 2 e 4.
Além disso, polipeptídeos TCP de Classe I (pelo menos em sua forma nativa) tipicamente têm atividade de DNA. Detalhes adicionais sobre verificação para esta atividade específica de ligação de DNA são fornecidos em Exemplo 6.
Seqüências de ácidos nucleicos codificando polipeptídeos TCP
de Classe I úteis nos métodos da invenção não precisam ser seqüências de ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. Exemplos de seqüências de ácidos nucleicos 20 adequadas para uso para realizar os métodos da invenção incluem as seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, mas não são limitadas àquelas seqüências. Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluem porções de seqüências de ácidos 25 nucleicos codificando um polipeptídeo TCP de Classe 1, seqüências de ácidos nucleicos hibridizando com seqüências de ácidos nucleicos codificando um TCP de Classe I, variantes de união de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I, variantes alélicas de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I, variantes de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I que são obtidas por embaralhamento de gene, ou variantes de seqüências de ácidos nucleicos codificando um polipeptídeo TCP de Classe I que são obtidas por mutagênese dirigida por sítio. Os termos porção, seqüência hibridizante, variante de união, variante alélica, variante obtida por embaralhamento de gene, e variante obtida por mutagênese dirigida por sítio serão descritos agora e também são definidos na seção “Definições” neste lugar.
De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou uma porção de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1.
Porções úteis nos métodos da invenção codificam um polipeptídeo caindo dentro da definição de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar e tendo substancialmente a mesma atividade biológica que as seqüências de polipeptídeos dadas em Tabela A de Exemplo 1. Preferivelmente, a porção é uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo I. A porção é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1. Preferivelmente, a porção codifica uma seqüência de polipeptídeo TCP de Classe 1 compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%), 80%), 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a porção codifica uma seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a porção é uma porção da seqüência de ácido nucleico de SEQ ID NO: 1.
Uma porção de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar pode ser preparada, por exemplo, fazendo uma ou mais deleções à seqüência de ácido nucleico. As porções podem ser usadas em forma isolada ou elas podem ser fusionadas com outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir um polipeptídeo que combina diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de polipeptídeo TCP de Classe I.
Outra variante de ácido nucleico útil nos métodos da invenção é uma seqüência de ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar, ou com uma porção como definido neste lugar.
De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou com uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das 5 seqüências de polipeptídeos dadas em Tabela A de Exemplo 1.
Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo tendo um domínio conservado de TCP (veja o alinhamento de Fig. 2) e tendo substancialmente a mesma atividade biológica que o polipeptídeo TCP de Classe I representado por qualquer uma das 10 seqüências de polipeptídeos dadas em Tabela A de Exemplo I. A seqüência hibridizante é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 15 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou com uma porção de qualquer uma destas 20 seqüências, uma porção sendo como definido acima. Ainda preferivelmente, a seqüência hibridizante codifica uma seqüência de polipeptídeo TCP de Classe
I compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP 25 (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência hibridizante codifica uma seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a seqüência hibridizante é capaz de hibridizar com uma seqüência de ácido nucleico como representado por SEQ ID NO: 1 ou com uma porção deste.
O termo “hibridização” é como definido neste lugar.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de união codificando um polipeptídeo TCP de Classe I como definido acima. O termo “variante de união” é como definido na seção “Definições” neste lugar.
De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma variante de união de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou uma variante de união de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1.
Preferivelmente, a seqüência de polipeptídeo TCP de Classe I codificada pela variante de união compreende de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%), 95%) ou 98%> ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C- terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela variante de união codifica uma seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 (circundada em Fig. 1) ao invés de com qualquer outro ciado de TCP. Variantes de união mais preferidas são variantes de união de uma seqüência de ácido nucleico representada por SEQ ID NO: 1 ou uma variante de união de uma seqüência 5 de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2.
Outra variante de ácido nucleico útil para realizar os métodos da invenção é uma variante alélica de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima. O termo “variante alélica” é como definido na seção “Definições” neste lugar. As 10 variantes alélicas úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica que o polipeptídeo TCP de Classe I de SEQ ID NO: 2.
De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir 15 e expressar em uma planta uma variante alélica de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de 20 Exemplo 1.
Preferivelmente, a seqüência de polipeptídeo TCP de Classe I codificada pela variante alélica compreende de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98%o ou mais identidade de seqüência com o domínio conservado de 25 TCP (compreendendo um FIélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela variante de união, quando usada na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo representada por SEQ ID NO: 2 (circundada em Fig. 2) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 1 ou uma variante 5 alélica de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2.
Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de gene. Embaralhamento de gene ou evolução dirigida é definido na seção “Definições” neste lugar.
De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo 15 introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1, cuja seqüência de variante de ácido nucleico é obtida por embaralhamento de gene.
Preferivelmente, a seqüência de ácido nucleico variante obtida 20 por embaralhamento de gene codifica uma seqüência de polipeptídeo compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado 25 por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela seqüência de ácido nucleico variante obtida por embaralhamento de gene, quando usada na construção de uma árvore filogenética de TCP tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo representada por SEQ ID NO: 2 (circundada em Fig. 2) ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a seqüência de ácido nucleico variante obtida por embaralhamento de gene é uma variante de 5 SEQ ID NO: 1 ou uma variante de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2, obtida por embaralhamento de gene.
Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese dirigida por sítio. Diversos métodos estão disponíveis para atingir mutagênese dirigida por sítio, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
De acordo com a presente invenção, é fornecido um método para aumentar rendimento de sementes em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de 15 ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas em Tabela A de Exemplo 1, cuja seqüência de ácido nucleico variante é obtida por mutagênese dirigida por 20 sítio.
Preferivelmente, a seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio codifica uma seqüência de polipeptídeo TCP de Classe I compreendendo de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou 25 mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQ ID: 65. Alternativamente ou adicionalmente, a seqüência de polipeptídeo codificada pela seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio, quando usada na construção de uma árvore filogenética de TCP tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo representada por SEQ ID NO: 2 ao invés de com qualquer outro ciado de TCP. Mais preferivelmente, a seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio é uma variante de SEQ ID NO: 1 ou uma variante de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 2, obtida por mutagênese dirigida por sítio.
As seguintes variantes de ácidos nucleicos codificando um polipeptídeo TCP de Classe I são exemplos de variantes adequadas para praticar os métodos da invenção:
(i) uma porção de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I;
(ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe i;
(iii)uma variante de união de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I;
(iv) uma variante alélica de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I;
(v) uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I obtida por embaralhamento de gene;
(vi) uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I obtida por mutagênese dirigida por sítio.
Seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I podem ser derivadas de qualquer fonte natural ou artificial. A seqüência de ácido nucleico pode ser modificada a partir de sua forma nativa em composição e/ou ambiente genômico através de deliberada manipulação humana. Preferivelmente a seqüência de ácido nucleico codificando o polipeptídeo TCP de Classe I é de uma planta, ainda preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente a seqüência de ácido nucleico é de Arabidopsis thaliana.
Qualquer referência neste lugar a um polipeptídeo TCP de Classe I é, portanto, adotada para significar um polipeptídeo TCP de Classe I como definido acima. Qualquer seqüência de ácido nucleico codificando um tal polipeptídeo TCP de Classe I é adequada para uso para realizar os métodos da invenção.
A presente invenção também abrange plantas ou partes destas (incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima.
A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de ácidos nucleicos úteis nos métodos de acordo com a invenção, em uma planta. As construções genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção gênica como definido neste lugar nos métodos da invenção.
Mais especificamente, a presente invenção fornece uma construção compreendendo
(a) seqüência de ácido nucleico codificando polipeptídeo TCP de Classe I como definido acima;
(b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácido nucleico de (a); e opcionalmente
(c) uma seqüência de término de transcrição.
Uma construção preferida é uma onde a seqüência de controle é um promotor constitutivo, preferivelmente um promotor GOS2. A invenção também fomece plantas, partes de planta, ou células de planta transformadas com uma construção como definido acima.
Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., uma seqüência de ácido nucleico codificando um 5 polipeptídeo TCP de Classe I como definido neste lugar. O artesão versado está ciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a 10 um promotor). Os termos “elemento regulador”, “seqüência de controle” e “promotor” são como definidos na seção “Definições” neste lugar. O termo “operacionalmente ligado” é como definido na seção “Definições”.
Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão de a seqüência de ácido nucleico. O termo “promotor” e “Promotor de planta” são definidos na seção “Definições” neste lugar e diversos exemplos de promotores também são descritos.
Preferivelmente o promotor é derivado de uma planta, mais preferivelmente uma planta monocotiledônea.
O promotor pode ser um promotor constitutivo. Adicionalmente ou alternativamente, o promotor pode ser um promotor órgão-específico ou tecido-específico.
Em uma forma de realização, a seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I é operacionalmente ligada a um promotor constitutivo, o termo “promotor constitutivo” é como definido na 25 seção “Definições” neste lugar. Um promotor constitutivo é um que também é substancialmente expresso ubiquamente. Preferivelmente o promotor constitutivo é derivado de uma planta, mais preferivelmente uma planta monocotiledônea. Ainda preferivelmente o promotor constitutivo é um promotor GOS2 (de arroz), por exemplo, como representado por uma seqüência de ácido nucleico substancialmente similar a SEQ ID NO: 67, mais preferivelmente o promotor constitutivo é como representado por SEQ ID NO: 67. Deve ser claro que a aplicabilidade da presente invenção não é restrita à seqüência de ácido nucleico como representado por SEQ ID NO: 1, 5 nem é a aplicabilidade da invenção restrita a expressão de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I quando dirigida por um promotor GOS2. Exemplos de outros promotores constitutivos que também podem ser usados para dirigir expressão de uma seqüência de ácido nucleico codificando um. polipeptídeo TCP de Classe I são mostrados na 10 seção “Definições” neste lugar.
Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do 15 gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de 20 referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA da seqüência de ácido nucleico usada nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como 18S rRNA, 25 usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor” fraco é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou a cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por 5 célula.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. O termo “terminador” é como definido na seção “Definições” neste lugar. Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como 10 transducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras que podem ser adequadas para uso para realizar a invenção. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.
Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico até 1000 vezes (Buchman and Berg, Mol. Cell biol. 8:4395- 4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal estimulação intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral, veja The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.
As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitadas a, a fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estas seqüências de ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os termos “marcador selecionável”, “gene marcador selecionável” ou “gene repórter” são definidos na seção “Definições” neste lugar.
A invenção também fornece um método para a produção de plantas transgênicas tendo rendimento aumentado de sementes em relação às plantas de controle, compreendendo introdução e expressão em uma planta de qualquer seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima.
Os termos “transgênico”, “transgene” ou “recombinante” são como definido neste lugar
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo rendimento aumentado de sementes em relação às plantas de controle, cujo método compreende:
(i) introduzir e expressar em uma planta ou célula de planta uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I; e
(ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta.
A seqüência de ácido nucleico pode ser introduzida diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De 5 acordo com uma característica preferida da presente invenção, a seqüência de ácido nucleico é preferivelmente introduzida em uma planta por transformação.
O termo “introdução” ou “transformação” é definido na seção “Definições” neste lugar.
As células de planta geneticamente modificadas podem ser
regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Geralmente depois de transformação, células de planta ou
agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o
material de planta obtido na transformação é, como uma regra, sujeito a condições seletivas de forma que plantas transformadas podem ser distinguidas de plantas não transformadas. Por exemplo, as sementes obtidas da maneira descrita acima podem ser plantadas e, depois de um período inicial de crescimento, sujeitas a uma seleção adequada por pulverização.
Uma possibilidade adicional consiste em cultivar as sementes, se apropriado depois de esterilização, em placas de ágar usando um agente de seleção adequado de forma que apenas as sementes transformadas podem crescer até plantas. Alternativamente, as plantas transformadas são triadas para a presença de um marcador selecionável tal como aqueles descritos acima. Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo, usando análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas por uma variedade de maneiras, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser autofecundada e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 então podem ser adicionalmente propagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e.g., todas as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes de planta e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo uma seqüência isolada de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido acima. Células hospedeiras preferidas de acordo com a invenção são células de planta.
5 Plantas hospedeiras para as seqüências de ácidos nucleicos ou
o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.
A invenção também se estende a partes colhíveis de uma 10 planta tal como, mas não limitado a sementes, folhas, frutos, flores, caules, rizomas, raízes, tubérculos e bulbos. A invenção, além disso, se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.
Métodos para aumentar expressão de seqüências de ácidos
nucleicos ou genes, ou produtos de gene, são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Seqüências isoladas de ácidos nucleicos que servem como elementos promotores ou 20 acentuadores podem ser introduzidas em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte- Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores 25 isolados podem ser introduzidos em uma célula de planta na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.
O termo “expressão” ou “expressão gênica” é como definido na seção “Definições” neste lugar. O termo “aumentar expressão” deve significar um aumento da expressão da seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I, cujo aumento em expressão leva ao rendimento aumentado de sementes das plantas em relação às plantas de controle. Preferivelmente, o aumento em expressão da seqüência de ácido nucleico é 1,25, 1,5, 1,75, 2, 5, 7,5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais vezes a expressão da seqüência endógena de ácido nucleico de planta codificando um polipeptídeo TCP de Classe I como definido acima.
Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3’ de uma região de codificação de um polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. A seqüência de extremidade 3’ a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico.
Uma seqüência intrônica também pode ser adicionada como
descrito acima.
Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA.
Como mencionado acima, um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I; entretanto os efeitos de realizar o método, i.e. aumentar rendimento de sementes também pode ser atingidos usando outras técnicas bem conhecidas. Uma descrição de algumas destas técnicas seguirá agora.
Uma tal técnica é identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), que é descrita na seção “Definições” neste lugar.
Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Dirigidas em Genomas). Veja a seção “Definições” neste lugar para uma descrição de esta técnica.
Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga, que é descrita na seção “Definições” neste lugar.
Desempenho dos métodos da invenção Iead to um aumento em rendimento de sementes em relação às plantas de controle. O termo “rendimento de sementes” é definido na seção “Definições” neste lugar. Os termos “aumento”, “acentua” ou “melhora” também são definidos na seção “Definições”.
Rendimento aumentado de sementes pode se manifestar como um ou mais dos seguintes:
(i) rendimento de sementes total aumentado, o que inclui um aumento em biomassa de semente (peso de semente) e que pode ser um aumento no peso de semente por planta ou em uma base de semente individual;
(ii) número aumentado de panículas por planta
(iii) número aumentado de flores (“floretes”) por panícula
(iv) taxa de enchimento de grãos aumentada
(v) número aumentado de grãos (cheios);
(vi) tamanho aumentado de semente (comprimento, área de largura, perímetro), o que também pode influenciar a composição de sementes;
(vii) volume aumentado de semente, o que também pode influenciar a composição de sementes; (viii) índice de colheita aumentado, que é expresso como uma proporção da rendimento de partes colhíveis, tal como sementes, sobre a biomassa total; e
(ix) Peso de Mil Sementes (TKW) aumentado, que é 5 extrapolado a partir do número de grãos cheios contados e seu peso total. Um
TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado. Um TKW aumentado pode resultar de um aumento em tamanho de embrião e/ou tamanho de endosperma.
Um aumento em tamanho de semente, volume de semente, área de semente, perímetro de semente, largura de semente ou comprimento de semente pode ser devido a um aumento em partes específicas de uma semente, por exemplo, devido a um aumento no tamanho do embrião e/ou endosperma e/ou aleurona e/ou escutelo, ou outras partes de uma semente.
Em particular, rendimento aumentado de sementes é selecionado a partir de um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; e (iii) TKW aumentado.
Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente, o que também pode influenciar a composição de sementes (incluindo teor total e/ou composição de óleos, proteínas e carboidratos).
Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de fileiras, número de 25 sementes por fileira, peso de semente, Peso de Mil Sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos 5 (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), aumento em Peso de Mil Sementes, entre outros.
Uma vez que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado de sementes, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos 10 parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um 15 ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento 20 e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode permitir vigor melhorado. Taxa de crescimento aumentada pode 25 ocorrer durante desenvolvimento de semente (taxa de crescimento reprodutivo), enquanto que a taxa de crescimento vegetativo não é modificada ou até reduzida. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de 5 arroz adicionais todas dentro de um período de cultivo convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies de planta diferentes. Tempos de colheita adicionais do mesmo porta-enxerto no caso de algumas plantas de cultivo também podem ser possíveis. Alterar o ciclo de colheita de 10 uma planta pode levar a um aumento em produção anual de biomassa por acre (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma 15 vez que as limitações territoriais para cultivar um cultivo freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de 20 crescimento, tais parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90%> de seu tamanho máximo), entre outros.
De acordo com uma característica preferida da presente invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa 25 de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas em relação às plantas de controle, cujo método compreende aumentar expressão em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I como definido neste lugar. Preferivelmente, a taxa de crescimento aumentada ocorre durante desenvolvimento de semente (taxa de crescimento reprodutivo), a taxa de crescimento vegetativo sendo não modificada ou até reduzida.
Um aumento em rendimento e/ou taxa de crescimento ocorre quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%), 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas de cultivo cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido à seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados em condições sem estresse ou em condições de seca branda para gerar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade de planta.
5 Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol. (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou 10 salinização são manifestadas primariamente como estresse osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses 15 ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, regulagem positiva de antioxidantes, acumulação de solutos compatíveis e suspensão de crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. 20 Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadas em condições sem estresse ou em condições de seca branda com rendimento aumentado em relação às plantas de controle adequadas cultivadas em 25 condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda, cujo método compreende aumentar expressão em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I. Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. O termo “planta” é como definido na seção “Definições” neste lugar. Também são descritas plantas que são particularmente úteis nos métodos da invenção.
De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Exemplos de plantas de cultivo incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia.
A presente invenção também abrange uso de seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I como descrito neste lugar e uso destes polipeptídeos TCP de Classe I para aumentar rendimento de sementes em plantas. Preferivelmente, rendimento aumentado de sementes é selecionada a partir de um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.
Seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I descritos neste lugar, ou os próprios polipeptídeos TCP de Classe I, podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene codificando polipeptídeo TCP de Classe I. As seqüências de ácidos nucleicos/genes, ou os próprios polipeptídeos TCP de Classe I podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo rendimento aumentado de sementes como definido acima nos métodos da invenção.
Variantes alélicas de uma seqüência de ácido nucleico/gene codificando um polipeptídeo TCP de Classe I também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento inutagênico das plantas, usando, por exemplo, mutagênese EMS;
5 alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram rendimento aumentado. Seleção 10 tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, 15 para fazer uma combinação de características fenotípicas interessantes.
Seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I também podem ser usadas como sondas para mapear geneticamente e fisicamente os genes dos quais elas são uma parte de, e como marcadores para características ligadas a tais genes. Tal informação pode ser 20 útil em reprodução de planta a fim de desenvolver linhagens com fenótipos desejados. Tal uso de seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. As seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I podem ser usadas como 25 marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de planta digerido por restrição podem ser sondados com as seqüências de ácidos nucleicos codificando polipeptídeos TCP de Classe I. Os padrões de bandeamento resultantes podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em adição, as seqüências de ácidos nucleicos podem ser usadas para sondar Southern blots 5 contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição da seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I no mapa genético previamente obtido usando 10 esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes de planta para uso em mapeamento genético é descrita em Bematzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones específicos de cDNA usando a metodologia 15 descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por versados na arte.
As sondas de ácido nucleico também podem ser usadas para
mapeamento físico (i.e., alocação de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleico 25 podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores. Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando as seqüências de ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo rendimento aumentado de sementes, como descrito acima. Estas características também podem ser combinadas com outras características economicamente vantajosas, tal como características acentuadoras de rendimento, tolerância a outros estresses abióticos e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.
Descrição detalhada da invenção CAH3
Surpreendentemente, foi descoberto agora que modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo YEP gera plantas tendo características relacionadas ao rendimento melhoradas sem efeitos em biomassa vegetativa, em relação às plantas de controle, caracterizado pelo fato de que o YEP é um CAH3. A classe 5 particular de polipeptídeos CAH3 adequados para melhorar características relacionadas ao rendimento em plantas é descrita em detalhe abaixo.
A presente invenção fornece um método para melhorar características relacionadas ao rendimento em plantas em relação às plantas de controle, compreendendo modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo CAH3. O termo “planta de controle” é como definido na seção “Definições” neste lugar.
No contexto da forma de realização se referindo a CAH3, qualquer referência daqui por diante a uma “proteína útil nos métodos da invenção” é adotada para significar um polipeptídeo CAH3 como definido 15 neste lugar. Qualquer referência daqui por diante a um “ácido nucleico útil nos métodos da invenção” é adotada para significar um ácido nucleico capaz de codificar um tal polipeptídeo CAH3. Os termos “polipeptídeo” e “proteína” são como definidos na seção “Definições” neste lugar. Os termos “polinucleotídeo(s)”, “seqüência(s) de ácidos nucleicos”, “seqüência(s) de 20 nucleotídeos” são como definidos na seção “Definições” neste lugar.
Um método preferido para modular (preferivelmente, aumentar) expressão de um ácido nucleico codificando uma proteína útil nos métodos da invenção é introduzir e expressar em uma planta um ácido nucleico codificando uma proteína útil nos métodos da invenção como definido abaixo.
O ácido nucleico a ser introduzido em uma planta (e, portanto útil para realizar os métodos da invenção) é qualquer ácido nucleico codificando o tipo de proteína que será agora descrito, daqui por diante também chamado “ácido nucleico CAH3” ou “gene CAH3”. Um polipeptídeo “CAH3” como definido neste lugar se refere a qualquer proteína tendo atividade de anidrase carbônica (EC 4.2.1.1). Anidrase carbônica também é conhecida como carbonato desidratase (nome aceito de acordo com Nomenclatura de Enzima de IUBMB), anidrase, carbonato anidrase, anidrase de ácido carbônico, carboxianidrase, e anidrase carbônica A. Métodos para ensaiar atividade enzimática de anidrase carbônica são conhecidos na arte; veja a Seção de Exemplos para detalhes adicionais.
Preferivelmente, a seqüência de aminoácidos da anidrase carbônica útil nos métodos da presente invenção compreende um ou mais dos seguintes motivos:
Motivo 1: (S/T)E(H/N)X(L/I/V/M)XXXX(F/Y/L/H)XX(E/D) X(H/Q)(L/I/V/M/F/A)(L/I/V/M/F/A) (SEQ ID NO: 203).
Preferivelmente, X em posição 4 em motivo 1 é um de: T, S, E, F, A, H, L; X em posição 6 preferivelmente é um de: N, D, S, Η, A, Μ; X em posição 7 preferivelmente é N ou G; X em posição 8 preferivelmente é um de: K, R, T, Q, E, V, A, K; X em posição 9 é preferivelmente um de: R, K, Q, L, Η, I, S; X em posição 11 preferivelmente é um de: V, A, D, N, P; X em posição 12 preferivelmente é um de: L, Μ, A; X em posição 14 é preferivelmente um de Q, E, L, A, V. Ainda preferivelmente, o resíduo em posição 16 é um de M, L, ou V; o resíduo em posição 17 é L ou V. Mais preferivelmente, a seqüência de motivo 1 é SEHAMDGRRYAMEAHLV.
Motivo 2: (L/N/Y/M/T/F/A/R)(A/V/S)V(V/I/L/T)(A/T/G/S) (F/V/I/L/S/T)(L/F/V/M) (SEQ ID NO: 204).
Preferivelmente, motivo 2 tem a seqüência (L/F/A/R)(A/V/S)V(V/I/L/T)(A/G/S)(F/V/I/L/T)(L/F/V/M). Mais
preferivelmente, motivo 2 tem a seqüência LAVLGIM.
Motivo 3: (Y/F) (Y/F/V/G/ A) (R/E/G/T /H) (Y/F )XG S (L/F/Y) T(T/V/A)PPC(S/T/G/D/A)(E/Q)(N/G/D/R) (SEQ ID NO: 205)
Preferivelmente, X é um de L, I, T, R, M, G, A, D, E, P. Mais preferivelmente, motivo 3 tem a seqüência FVHYPGSLTTPPCSEG. Preferivelmente, o polipeptídeo “CAH3” como definido neste lugar se refere a uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7 A, tende a se agrupar com a classe de polipeptídeos CAH3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 ao invés de com a classe beta ou gama.
Uma pessoa versada na arte pode determinar prontamente se qualquer seqüência de aminoácidos em questão cai dentro da definição de um polipeptídeo “CAH3” usando técnicas conhecidas e aplicativo computacional para a criação de uma tal árvore filogenética, tal como um pacote GCG, EBI ou CLUSTAL, usando parâmetros padrão. Qualquer agrupamento de seqüências dentro do grupo compreendendo SEQ ID NO: 81 deve ser considerado como caindo dentro da definição mencionada acima de um polipeptídeo CAH3, e deve ser considerado adequado para uso nos métodos da invenção.
Exemplos de proteínas úteis nos métodos da invenção e ácidos nucleicos codificando as mesmas são como dado abaixo em Tabela B na Seção de Exemplos.
Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de aminoácidos dadas em Tabela B. “Homólogos” de uma proteína são como definidos na seção “Definições” neste lugar.
Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídeos dados em Tabela B neste lugar ou ortólogos ou parálogos de qualquer das SEQ ID NOs mencionadas acima. “Derivados” são definidos na seção “Definições” neste lugar.
A invenção é ilustrada transformando plantas com a seqüência de ácido nucleico de Chlamydomonas reinhardtii representada por SEQ ID NO: 80, codificando a seqüência de polipeptídeo de SEQ ID NO: 81, entretanto desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizados usando qualquer ácido nucleico codificando uma proteína útil nos métodos da invenção como 5 definido neste lugar, incluindo ortólogos e parálogos, tal como qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B neste lugar.
As seqüências de aminoácidos dadas em Tabela B de Exemplo
14 podem ser consideradas como sendo ortólogos e parálogos do polipeptídeo CAH3 representado por SEQ ID NO: 81. Ortólogos e parálogos são como definidos na seção “Definições” neste lugar.
Ortólogos e parálogos podem ser facilmente encontrados realizando uma assim chamada busca blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo, usando qualquer das seqüências listadas em Tabela B 15 neste lugar) contra qualquer banco de dados de seqüências, tal como o banco de dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré- determinados padrão) ao iniciar de uma seqüência protéica. Os resultados de 20 BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: 80 ou SEQ ID NO: 81, o segundo BLAST deve, portanto, ser contra 25 seqüências de Chlamydomonas reinhardtii). Os resultados do primeiro e segundo BLAST são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retorno então idealmente resulta na seqüência de consulta como maior acerto; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retorno na seqüência de consulta estando entre os maiores acertos.
Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). Computação do valor E é bem conhecida na arte. Em adição a valores E, comparações também são pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos.
Tabela B neste lugar fornece exemplos de ortólogos e parálogos da proteína CAH3 representada por SEQ ID NO 81. Ortólogos e parálogos adicionais podem ser prontamente identificados usando o procedimento BLAST descrito acima.
As proteínas da invenção são identificáveis pela presença do domínio conservado de anidrase carbônica (entrada Pfam PFOO194, InterPro IPROOl 148) (mostrado em Figura 6) e/ou por um dos motivos listados acima. O termo “domínio” é definido na seção “Definições” neste lugar. Veja a seção “Definições” para uma definição do termo “motivo” ou “seqüência consenso” ou “assinatura”.
Também existem bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244, InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., 5 Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para análise em silício de seqüências protéicas está disponível no servidor de proteômica ExPASY (hospedado pelo Swiss Institute of Bioinformatics 10 (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)).
Domínios também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos 15 incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) 20 calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento 25 de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Edição manual secundária pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar 5 seqüências de comprimento completo para a identificação de homólogos, domínios específicos (tal como um domínio de anidrase carbônica, ou um dos motivos definidos acima) também podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo na Seção de Exemplos como uma porcentagem foram determinados ao longo da seqüência inteira de ácidos 10 nucleicos ou de aminoácidos, e/ou ao longo de domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrão.
Além disso, proteínas CAH3 (pelo menos em sua forma nativa) tipicamente têm atividade de anidrase carbônica. Ensaios para
anidrase carbônica são bem conhecidos na arte e incluem ensaios titrimétricos e ensaios espectrofotométricos, veja, por exemplo, Karlsson et al. (Plant Physiol. 109: 533-539, 1995). Detalhes adicionais são fornecidos na Seção de Exemplos.
Ácidos nucleicos codificando proteínas úteis nos métodos da 20 invenção não precisam ser ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. Exemplos de ácidos nucleicos adequados para uso para realizar os métodos da invenção incluem as seqüências de ácidos nucleicos dadas em Tabela B neste lugar, 25 mas não são limitadas àquelas seqüências. Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluem porções de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, ácidos nucleicos hibridizando com ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes de união de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes alélicas de ácidos nucleicos codificando uma proteína útil nos métodos da invenção e variantes de ácidos nucleicos codificando uma proteína útil nos métodos da invenção que são obtidas por embaralhamento de gene. Os termos porção, seqüência hibridizante, variante de união, variante alélica e embaralhamento de gene serão descritos agora e também são definidos na seção “Definições” neste lugar.
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B neste lugar, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela B.
Porções úteis nos métodos da invenção codificam um polipeptídeo caindo dentro da definição de um ácido nucleico codificando uma proteína útil nos métodos da invenção como definido neste lugar e tendo substancialmente a mesma atividade biológica que as seqüências de aminoácidos dadas em Tabela B. Preferivelmente, a porção é uma porção de qualquer um dos ácidos nucleicos dados em Tabela B. A porção é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B. Mais preferivelmente a porção é uma porção do ácido nucleico de SEQ ID NO: 80. Preferivelmente, a porção codifica uma seqüência de aminoácidos compreendendo (qualquer um ou mais de) domínio de anidrase carbônica como definido neste lugar. Preferivelmente, a porção codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo 5 de proteínas CAH3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.
Uma porção de um ácido nucleico codificando uma proteína CAH3 como definido neste lugar pode ser preparada, por exemplo, fazendo uma ou mais deleções ao ácido nucleico. As porções podem ser usadas em 10 forma isolada ou elas podem ser fusionadas com outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de proteína 15 CAH3.
Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com um ácido nucleico codificando uma proteína CAH3 como definido neste lugar, ou com 20 uma porção como definido neste lugar. O termo “hibridização” é como definido na seção “Definições” neste lugar.
Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo tendo um domínio de anidrase carbônica (veja o alinhamento de Fig. 7) e tendo substancialmente a mesma atividade biológica 25 que a proteína CAH3 representada por qualquer uma das seqüências de aminoácidos dadas em Tabela B. A seqüência hibridizante é tipicamente de pelo menos 600 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 700 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 800 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 900 nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com qualquer um dos 5 ácidos nucleicos dados em Tabela B, ou com uma porção de qualquer uma destas seqüências, uma porção sendo como definido acima. Mais preferivelmente, a seqüência hibridizante é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 80 ou com uma porção deste. Preferivelmente, a seqüência hibridizante codifica uma seqüência de 10 aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência hibridizante codifica uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAH3 alfa compreendendo a seqüência de 15 aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico 20 capaz de hibridizar com qualquer um dos ácidos nucleicos dados na Tabela B, ou compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B.
Outra variante de ácido nucleico útil nos métodos da invenção
é uma variante de união codificando uma proteína CAH3 como definido acima. O termo “variante de união” sendo como definido neste lugar
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de união de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B, ou uma variante de união de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas 5 em Tabela B.
Variantes de união preferidas são variantes de união de um ácido nucleico representado por SEQ ID NO: 80 ou uma variante de união de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 81. Preferivelmente, a seqüência de aminoácidos codificada pela variante de 10 união compreende qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência de aminoácidos codificada pela variante de união, quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAH3 alfa compreendendo a seqüência de 15 aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.
Outra variante de ácido nucleico útil para realizar os métodos da invenção é uma variante alélica de um ácido nucleico codificando uma proteína CAH3 como definido acima. O termo “variante alélica” é como 20 definido neste lugar. As variantes alélicas úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica que a proteína CAH3 de SEQ ID NO: 81.
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, 25 compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados em Tabela B, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela B. Preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 80 ou uma variante alélica de um ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 81. Preferivelmente, a seqüência de aminoácidos codificada pela variante alélica compreende qualquer um ou 5 mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência de aminoácidos codificada pela variante alélica, quando usada na construção de uma árvore filogenética de CAH3, tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAH3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 10 ao invés de com qualquer outro grupo.
Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de gene. Embaralhamento de gene ou evolução dirigida é como definido neste lugar
De acordo com a presente invenção, é fornecido um método
para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela B, ou compreendendo introduzir e expressar em uma planta uma variante de um 20 ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela B, cujo ácido nucleico variante é obtido por embaralhamento de gene.
Preferivelmente, o ácido nucleico variante obtido por embaralhamento de gene codifica uma seqüência de aminoácidos 25 compreendendo qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência codificada de aminoácidos pelo ácido nucleico variante obtido por embaralhamento de gene, quando usada na construção de uma árvore filogenética de CAFI3 tal como aquela descrita em Fig. 7, tende a se agrupar com o grupo de proteínas CAFI3 alfa compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 81 ao invés de com qualquer outro grupo.
Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese dirigida por sítio. Diversos métodos estão disponíveis 5 para atingir mutagênese dirigida por sítio, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos codificando proteínas CAH3 podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente 10 genômico através de deliberada manipulação humana. Preferivelmente o ácido nucleico codificando CAH3 é de uma planta, ainda preferivelmente de uma alga, mais preferivelmente da família Chlamydomonadaceae, mais preferivelmente o ácido nucleico é de Chlamydomonas reinhardtii.
Qualquer referência neste lugar a uma proteína CAH3 é, portanto, adotada para significar uma proteína CAH3 como definido acima. Qualquer ácido nucleico codificando uma tal proteína CAH3 é adequado para uso para realizar os métodos da invenção.
A presente invenção também abrange plantas ou partes destas (incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico codificando uma proteína CAH3 como definido acima.
A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de ácidos nucleicos úteis nos métodos de acordo com a invenção, em uma planta. As construções 25 genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção gênica como definido neste lugar nos métodos da invenção. Mais especificamente, a presente invenção fornece uma construção compreendendo
(a) ácido nucleico codificando proteína CAH3 como definido
acima;
(b) uma ou mais seqüências de controle capazes de dirigir
expressão da seqüência de ácido nucleico de (a); e opcionalmente (c) uma seqüência de término de transcrição.
Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., um ácido nucleico codificando um polipeptídeo 10 CAH3 como definido neste lugar. O artesão versado está ciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos “elemento 15 regulador”, “seqüência de controle” e “promotor” são como definidos na seção “Definições” neste lugar. O termo “operacionalmente ligado” também é definido neste lugar.
Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão da seqüência de ácido nucleico. O termo “promotor” e 20 “Promotor de planta” são definidos na seção “Definições” neste lugar. O promotor pode ser um promotor constitutivo, como definido neste lugar. Alternativamente, o promotor pode ser um promotor induzível, também definido neste lugar. Adicionalmente ou alternativamente, o promotor pode ser um promotor órgão-específico ou tecido-específico, como definido neste 25 lugar.
Preferivelmente, o ácido nucleico CAH3 ou variante deste é operacionalmente ligado a um promotor específico de tecido verde jovem. Um promotor específico de tecido verde jovem como definido neste lugar é um promotor que é transcricionalmente ativo predominantemente em tecido verde jovem, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes de planta. O promotor específico de tecido verde jovem é preferivelmente um promotor de protoclorofilida redutase (PcR), mais preferivelmente o promotor de protoclorofilida redutase representado por uma seqüência de ácido nucleico substancialmente similar a SEQ ID NO: 206, mais preferivelmente o promotor é como representado por SEQ ID NO: 206.
Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico codificando CAH3 representado por SEQ ID NO: 80, nem é a aplicabilidade da invenção restrita a expressão de um tal ácido nucleico codificando CAH3 quando dirigida por um promotor de protoclorofilida redutase. Exemplos de outros promotores específicos de tecido verde jovem que também podem ser usados para realizar os métodos da invenção são mostrados em Tabela 2g na seção “Definições” neste lugar.
Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como 18S rRNA, usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor” fraco é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido 5 em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por célula.
Opcionalmente, uma ou mais seqüências terminadoras podem
ser usadas na construção introduzida em uma planta, o termo “terminador” sendo como definido neste lugar. Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como transducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras 15 que podem ser adequadas para uso para realizar a invenção. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.
Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a 20 quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico até 1000 vezes (Buchman and Berg, Mol. Cell Biol. 8:4395- 4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal estimulação 25 intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral, veja The Maize Handbook, Chapter 1 16, Freeling and Walbot, Eds., Springer, N.Y. (1994). Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.
As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitados a, a fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Veja seção “Definições” neste lugar para uma definição dos termos “marcador selecionável”, “gene marcador selecionável” ou “gene repórter”.
A invenção também fornece um método para a produção de plantas transgênicas tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle, compreendendo introdução e expressão em uma planta de qualquer ácido nucleico codificando uma proteína CAH3 como definido acima.
Para os propósitos da invenção, "transgênico", “transgene” ou “recombinante” são como definidos neste lugar na seção “Definições”. Uma “planta transgênica” é como definido na seção “Definições” neste lugar.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo rendimento aumentado, cujo método compreende: (i) introduzir e expressar em uma planta ou célula de planta um ácido nucleico CAH3 ou variante deste; e
(ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta.
O ácido nucleico pode ser introduzido diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.
O termo “introdução” ou “transformação” como referido neste lugar é como definido na seção “Definições”. As células de planta geneticamente modificadas podem ser regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hõfgen and Willmitzer.
Geralmente depois de transformação, células de planta ou agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material de planta obtido na transformação é, como uma regra, sujeito a condições seletivas de forma que plantas transformadas podem ser distinguidas de plantas não transformadas. Por exemplo, as sementes obtidas da maneira descrita acima podem ser plantadas e, depois de um período inicial de crescimento, sujeitas a uma seleção adequada por pulverização. Uma possibilidade adicional consiste em cultivar as sementes, se apropriado depois de esterilização, em placas de ágar usando um agente de seleção adequado de forma que apenas as sementes transformadas podem crescer até plantas. Alternativamente, as plantas transformadas são triadas para a presença de um marcador selecionável tal como aqueles descritos acima.
Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo, usando 5 análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas por
uma variedade de maneiras, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser autofecundada e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 então 15 podem ser adicionalmente propagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e.g., todas 20 as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer dos métodos descritos neste lugar, 25 e a todas as partes de planta e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um ácido nucleico isolado codificando uma proteína CAH3 como definido acima.
Células hospedeiras preferidas de acordo com a invenção são células de planta.
Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.
A invenção também se estende a partes colhíveis de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores, caules, rizomas, raízes, tubérculos e bulbos. A invenção, além disso, se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte 15 colhível de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Os termos “expressão aumentada/superexpressão” são como definidos neste lugar.
Como mencionado acima, um método preferido para modular
(preferivelmente, aumentar) expressão de um ácido nucleico codificando uma proteína CAH3 é introduzir e expressar em uma planta um ácido nucleico codificando uma proteína CAH3; entretanto os efeitos de realizar o método, i.e. melhorar características relacionadas ao rendimento também pode ser 25 atingido usando outras técnicas bem conhecidas. Uma descrição de algumas destas técnicas seguirá agora.
Uma tal técnica é identificação por ativação de T-DNA, que é detalhada na seção “Definições” neste lugar. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Dirigidas em Genomas), também detalhada na seção “Definições” neste lugar.
Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga, que também é detalhada na seção 5 “Definições” neste lugar.
Referência neste lugar a características relacionadas ao rendimento melhoradas é adotada para significar um aumento em biomassa (peso) de uma ou mais partes de uma planta, o que pode incluir partes (aptas para corte) acima do solo e/ou partes (aptas para corte) abaixo do solo. Em 10 particular, tais partes colhíveis são sementes, e desempenho dos métodos da invenção resulta em plantas tendo rendimento aumentado de sementes em relação ao rendimento de sementes de plantas de controle adequadas.
O termo “rendimento” e “rendimento de sementes” são definidos na seção “Definições” neste lugar. Os termos “aumento”, “acentua” ou “melhora” também são definidos neste lugar.
Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de fileiras, número de 20 sementes por fileira, peso de semente, Peso de Mil Sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais 25 dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), aumento em Peso de Mil Sementes, entre outros.
Uma vez que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode permitir vigor melhorado. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes da mesma espécie de planta (por exemplo, semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de arroz adicionais todas dentro de um período de cultivo convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies de planta diferentes (por exemplo, a semeadura e colheita de plantas de milho seguido por, por exemplo, a semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo porta-enxerto no caso de algumas plantas de cultivo também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento em produção anual 5 de biomassa por acre (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma vez que as limitações territoriais para 10 cultivar um cultivo freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de crescimento, tais 15 parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% de seu tamanho máximo), entre outros.
De acordo com uma característica preferida da presente invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa 20 de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, cujo método compreende modular expressão, preferivelmente aumentar expressão, em uma planta de um ácido nucleico codificando uma proteína CAH3 como definido neste lugar.
Um aumento em rendimento e/ou taxa de crescimento ocorre
quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas de cultivo cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido á seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos. Em particular, os métodos da presente invenção podem ser
realizados em condições sem estresse ou em condições de seca branda para gerar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e 25 moleculares que afetam adversamente crescimento e produtividade de planta. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, 5 salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, regulagem positiva de antioxidantes, acumulação de solutos compatíveis e suspensão de 10 crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadas 15 em condições sem estresse ou em condições de seca branda rendimento aumentado em relação às plantas de controle adequadas cultivadas em condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda, cujo método 20 compreende aumentar expressão em uma planta de um ácido nucleico codificando um polipeptídeo CAH3.
Em uma forma de realização preferida da invenção, o aumento em rendimento e/ou taxa de crescimento ocorre de acordo com os métodos da presente invenção em condições sem estresse.
Os métodos da invenção são vantajosamente aplicáveis a
qualquer planta, o termo “planta” é definido neste lugar e exemplos de plantas úteis nos métodos da invenção também são fornecidos.
De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. E’xemplos de plantas de cultivo incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia.
A presente invenção também abrange uso de ácidos nucleicos codificando a proteína CAH3 descrita neste lugar e uso destas proteínas CAH3 para melhorar características relacionadas ao rendimento em plantas.
Ácidos nucleicos codificando a proteína CAH3 descrita neste lugar, ou as próprias proteínas CAH3, podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene codificando CAH3. Os ácidos nucleicos/genes, ou as próprias proteínas CAH3 podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo características relacionadas ao rendimento melhoradas como definido acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene codificando proteína CAH3 também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando, por exemplo, mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram rendimento aumentado. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
5 Ácidos nucleicos codificando proteínas CAH3 também podem
ser usados como sondas para mapear geneticamente e fisicamente os genes dos quais elas são uma parte de, e como marcadores para características ligadas a tais genes. Tal informação pode ser útil em reprodução de planta a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos 10 nucleicos codificando proteína CAH3 requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificando proteína CAH3 podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A 15 Laboratory Manual) de DNA genômico de planta digerido por restrição podem ser sondados com os ácidos nucleicos codificando proteína CAH3. Os padrões de bandeamento resultantes podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Em 20 adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico codificando proteína CAH3 25 no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes de planta para uso em mapeamento genético é descrita em Bematzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones específicos de cDNA usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por versados na arte.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., alocação de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de 5 ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo características relacionadas ao rendimento melhoradas, como descrito acima. Estas características também podem ser combinadas com 10 outras características economicamente vantajosas, tal como características acentuadoras de rendimento adicionais, tolerância a outros estresses abióticos e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.
Descrição detalhada da invenção CLAVATA
Surpreendentemente, foi descoberto agora que aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um YEP, cujo YEP é um polipeptídeo com um domínio C-terminal não funcional, gera plantas tendo características relacionadas ao rendimento melhoradas em 20 relação às plantas de controle. A classe particular de polipeptídeos CLVl adequados para interromper a função biológica do domínio C-terminal para o propósito de melhorar características relacionadas ao rendimento em plantas em relação às plantas de controle é descrito em detalhe abaixo.
A presente invenção fornece um método para melhorar 25 características relacionadas ao rendimento em plantas em relação às plantas de controle, compreendendo aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional. O termo “planta de controle” é como definido na seção “Definições” neste lugar. Qualquer referência daqui por diante a uma “proteína útil nos métodos da invenção” é adotada para significar um polipeptídeo CLVl com um domínio C-terminal não funcional como definido neste lugar. Qualquer referência daqui por diante a uma “seqüência de ácido nucleico útil nos métodos da invenção” é adotada para significar uma seqüência de ácido nucleico capaz de codificar um tal polipeptídeo CLV1 com um domínio C- terminal não funcional. Os termos “polipeptídeo” e “proteína” são como definidos neste lugar e os termos “polinucleotídeo(s)”, “seqüência(s) de ácidos nucleicos”, “seqüência(s) de nucleotídeos” também são definidos na seção “Definições” neste lugar.
Um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional, é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido abaixo.
A seqüência de ácido nucleico a ser introduzida em uma planta (e, portanto útil para realizar os métodos da invenção) é qualquer seqüência de ácido nucleico codificando o tipo de polipeptídeo que será agora descrito.
Polipeptídeos CLV1 são bem conhecidos na arte e são facilmente identificáveis pela presença de término N a término C de: (i) um peptídeo sinal para direcionamento subcelular de ER; (ii) um domínio LRR extracelular compreendendo 20, 21, ou 22 LRRs; (iii) um domínio transmembrana; e (iv) um domínio intracelular de serina/treonina quinase (veja Figuras IOa e 11, e Exemplo 28). Além disso, um polipeptídeo CLVl pode compreender adicionalmente uma seqüência de aminoácidos com 50%, 60%, 70%, 80%, 90%, 95%, 98% ou mais identidade com SEQ ID NO: 212 (Exemplo 27).
Adicionalmente, um polipeptídeo CLVl pode compreender de término N a término C um ou ambos de: (i) Motivo 1 como representado por SEQ ID NO: 237; ou (ii) Motivo 2 como representado por SEQ ID NO: 238. Preferivelmente Motivo 1 e Motivo 2 são compreendidos entre o peptídeo sinal e o domínio LRR. A presença de Motivo 1 e Motivo 2 foi determinada como descrito em Exemplo 26.
5 Os aminoácidos mais conservados dentro de motivo 1 são
LXDW, e dentro de motivo 2 XHCXFXGVXCD (onde X é um subconjunto especificado de aminoácidos diferindo para cada posição, como apresentado em SEQ ID NO: 237 e SEQ ID NO: 238). Dentro de Motivo 1 e Motivo 2, são permitidas uma ou mais mudança conservativa em qualquer posição. 10 Alternativamente ou adicionalmente, dentro de Motivo 1 é permitida uma mudança não conservativa em qualquer posição, dentro de Motivo 2 são permitidas uma, duas ou três mudança(s) não conservativa(s) em qualquer posição.
Alternativamente ou adicionalmente, um polipeptídeo CLVl 15 como definido neste lugar se refere a qualquer polipeptídeo que quando usado na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de 20 polipeptídeos LRR-RLK.
Uma pessoa versada na arte pode determinar prontamente se qualquer seqüência de aminoácidos em questão cai dentro da definição de um polipeptídeo “CLV1” usando técnicas conhecidas e aplicativo computacional para a criação de uma tal árvore filogenética, tal como um pacote GCG, EBI 25 ou CLUSTAL, usando parâmetros padrão. Qualquer agrupamento de seqüências de aminoácidos dentro do grupo compreendendo SEQ ID NO: 212 deve ser considerado como caindo dentro da definição mencionada acima de um polipeptídeo CLV1, e deve ser considerado adequado para uso nos métodos da invenção. Tais métodos são descritos em Exemplo 25. Qualquer polipeptídeo CLVl é tomado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal deste polipeptídeo CLV1. Tais métodos (para interromper a função biológica) são bem conhecidos na arte e incluem: remoção, substituição e/ou inserção de 5 aminoácidos do domínio C-terminal do polipeptídeo CLV1. Exemplos de tais métodos são descritos em Exemplo 31. Um ou mais aminoácido(s) do domínio C-terminal de um polipeptídeo CLVl pode(m) ser removido(s), substituído(s) e/ou inserido(s).
Para os propósitos deste pedido, o domínio C-terminal de um polipeptídeo CLVl é adotada para significar a seqüência de aminoácidos seguindo a seqüência de aminoácidos codificando o domínio transmembrana (de término N a término C) (veja Figuras 10 e 11), e compreende: (i) o domínio de quinase; e (ii) um ou mais aminoácido(s) fosforilatável(eis).
Um exemplo de um polipeptídeo CLV1 tendo um domínio Ο- Ι 5 terminal não funcional é o polipeptídeo representado por SEQ ID NO: 210, com seqüência codificante de ácido nucleico representada por SEQ ID NO: 209. A seqüência de aminoácidos começando o resíduo de Arg (R) do motivo RLL de subdomínio IV de quinase (veja Figura 11) e terminando no término C do polipeptídeo CLVl de comprimento completo (como representado por 20 SEQ ID NO: 212) foi removida.
Exemplos de polipeptídeos CLVl são dados em Tabela C na Seção de Exemplos neste lugar; estas seqüências são tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo, por exemplo, usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de aminoácidos dadas em Tabela C neste lugar, o termo “Homólogos” sendo como definido neste lugar.
Também úteis nos métodos da invenção são derivados de qualquer um dos polipeptídeos dados em Tabela C ou ortólogos ou parálogos de qualquer das SEQ ID NOs dadas em Tabela C. “Derivados” também são definidos neste lugar.
A invenção é ilustrada transformando plantas com a seqüência de ácido nucleico de Arabidopsis thaliana representada por SEQ ID NO: 209 (compreendida em SEQ ID NO: 211), codificando a seqüência de polipeptídeo de SEQ ID NO: 210 (compreendida em SEQ ID NO: 212), entretanto desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizados usando qualquer seqüência de ácido nucleico codificando um polipeptídeo CLVl tendo um domínio C-terminal não funcional como definido neste lugar, incluindo ortólogos e parálogos, tal como qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C de Exemplo 25, tendo um domínio C-terminal não funcional, por exemplo, usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
As seqüências de aminoácidos dadas em Tabela C neste lugar podem ser consideradas como sendo ortólogos e parálogos do polipeptídeo CLVl representado por SEQ ID NO: 212. Ortólogos e parálogos sendo como definidos neste lugar.
Ortólogos e parálogos podem ser facilmente encontrados
realizando uma assim chamada busca blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo, usando qualquer das seqüências listadas em Tabela C) contra qualquer banco de dados de seqüências, tal como o banco de dados 25 publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência protéica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: 211 ou SEQ ID NO: 212, o segundo BLAST deve, portanto, ser contra seqüências de Arabidopsis). Os resultados do primeiro e segundo BLAST são então comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retomo então idealmente resulta na seqüência de consulta como maior acerto; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retomo na seqüência de consulta estando entre os maiores acertos.
Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). Computação do valor E é bem conhecida na arte. Em adição a valores E, comparações também são pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos. Seqüências assim identificadas podem ser subseqüentemente tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo, por exemplo, usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
Tabela C de Exemplo 25 fornece exemplos de ortólogos e parálogos do polipeptídeo CLVl representado por SEQ ID NO 212. Ortólogos e parálogos adicionais podem ser prontamente identificados usando o procedimento BLAST descrito acima. Seqüências assim identificadas são subseqüentemente tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo, por exemplo, 5 usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
As proteínas da invenção são identificáveis pela presença de domínios específicos, o termo “domínio” sendo como definido neste lugar. O termo “motivo” ou “seqüência consenso” ou “assinatura” também é definido neste lugar.
Também existem bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), 15 Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., 20 Nucl. Acids. Res. 32:D134-D137, (2004), ou PFam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para análise em silício de seqüências protéicas está disponível no servidor de proteômica ExPASY (hospedado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomies server for in-depth protein 25 knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Em Exemplo 28, são listados os números de acesso de entrada dos diferentes domínios identificados realizando uma tal análise. Por exemplo, uma repetição rica em leucina tem um número de acesso de InterPro IPROO1611, um número de acesso de Prints PROOO19, e um número de acesso de PFam PF00560. O domínio LRR compreende 20, 21 ou 22 tais repetições ricas em leucina (LRR)s. O domínio de quinase é identificado por número de acesso de InterPro IPR000719, um número de acesso de PFam PF00069, um número de acesso de Prosite PS50011 e um número de acesso de ProDom PD000001.
5 Em adição, o sítio ativo de domínio de quinase também é identificado, como IPR008271. Mutação(ões) dentro deste sítio pode(m) ser introduzida(s) para abolir (ou reduzir) atividade de quinase, que é um método de interromper a função biológica o domínio C-terminal de um polipeptídeo CVLl útil para realizar os métodos da invenção.
Algoritmos de aplicativos computacionais estão disponíveis
para predizer localização subcelular de um polipeptídeo, ou para predizer a presença de domínios transmembrana. Em Exemplo 30, o algoritmo TargetP 1.1 e o algoritmo TMFIMM2.0 são respectivamente usados para predizer que o polipeptídeo CLVl como representado por SEQ ID NO: 212 15 apresente em seu término N um peptídeo sinal para direcionamento de ER (retículo endoplasmático), e compreenda um domínio transmembrana (através da membrana plasmática). Além disso, o algoritmo TMHMM2.0 prediz que o domínio LRR esteja localizado fora da célula (para atuar como um receptor extracelular), ao passo que o domínio de quinase esteja localizado dentro da 20 célula (para atuar como um transdutor de sinal).
Domínios e motivos também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o 25 algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Edição manual secundária pode ser realizada para aperfeiçoar alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar seqüências de comprimento completo para a identificação de homólogos, domínios específicos (tal como o domínio LRR ou o domínio de quinase, ou um dos motivos definidos neste lugar) também podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo em Exemplo 3 como uma porcentagem foram determinados ao longo da seqüência inteira de ácidos nucleicos ou de aminoácidos, e/ou ao longo de domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrão. Preferivelmente, um polipeptídeo CLVl tem 50%, 60%, 70%), 80%), 90%o, 95%, 98% ou mais identidade de seqüência de aminoácidos com SEQ ID NO: 212 (Exemplo 27). Depois de sua identificação, um polipeptídeo CLVl é tornado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo como descrito neste lugar.
Em algumas instâncias, parâmetros padrão podem ser ajustados para modificar a estringência da busca. Por exemplo usando BLAST, o limiar de signifícâneia estatística (chamado valor “esperado”) para relatar pareamentos contra seqüências de banco de dados pode ser aumentado para mostrar pareamentos menos estringentes. Desta maneira, pequenos pareamentos praticamente exatos podem ser identificados. Motivo 1 como representado por SEQ ID NO: 237 e Motivo 2 como representado por SEQ ID NO: 238 ambos compreendidos em polipeptídeos CLVl úteis nos métodos da invenção podem ser identificados desta maneira (Figura 11, Exemplo 26). Preferivelmente Motivo 1 e Motivo 2 são compreendidos entre o peptídeo sinal e o domínio LRR.
Os aminoácidos mais conservados dentro de motivo 1 são LXDW, e dentro de motivo 2 XHCXFXGVXCD (onde X é um subconjunto especificado de aminoácidos diferindo para cada posição, como apresentado em SEQ ID NO: 237 e SEQ ID NO: 238). Dentro de Motivo 1 e Motivo 2, são permitidas uma ou mais mudança conservativa em qualquer posição. Alternativamente ou adicionalmente, dentro de motivo 1 é permitida uma mudança não conservativa em qualquer posição, dentro de motivo 2 são permitidas uma, duas ou três mudança(s) não conservativa(s) em qualquer posição.
Polipeptídeos CLVl em sua forma nativa tipicamente têm atividade de quinase e são capazes de autofosforilação. Ensaios de quinase são facilmente realizados e são bem conhecidos na arte. Além disso, polipeptídeos CLVl são capazes de interagir com outros polipeptídeos in planta (CLV3, KAPP e mais) e in vitro (tal como com KAPP em um ensaio de dois híbridos em levedura; Trotochaud et al. (1999) Plant Cell 11, 393- 406). Depois de sua identificação, um polipeptídeo CLVl é tornado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo. Detalhes adicionais são fornecidos em Exemplo 31.
Seqüências de ácidos nucleicos codificando proteínas úteis nos métodos da invenção não precisam ser seqüências de ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. Exemplos de seqüências de ácidos nucleicos adequadas para uso para realizar os métodos da invenção incluem as seqüências de ácidos 5 nucleicos dadas em Tabela C, mas não são limitadas àquelas seqüências. Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes de ácidos nucleicos incluem porções de seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, seqüências de ácidos nucleicos hibridizando com 10 seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes de união de seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção, variantes alélicas de seqüências de ácidos nucleicos codificando uma proteína útil nos métodos da invenção e variantes de seqüências de ácidos nucleicos codificando uma proteína útil nos 15 métodos da invenção que são obtidas por embaralhamento de gene. Os termos porção, seqüência hibridizante, variante de união, variante alélica, variante obtida por embaralhamento de gene, e variante obtida por mutagênese dirigida por sítio serão descritos agora.
De acordo com a presente invenção, é fornecido um método 20 para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou uma porção de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela 25 C de Exemplo 25. Depois de sua identificação, um polipeptídeo CLVl é tomado útil nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo.
Porções úteis nos métodos da invenção codificam um polipeptídeo caindo dentro da definição de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido neste lugar. A porção tipicamente carece da seqüência de ácido nucleico codificando o domínio C-terminal ou partes deste (de término N a término C, a seqüência de ácido nucleico depois da seqüência 5 de ácido nucleico codificando o domínio transmembrana). Preferivelmente, a porção é uma porção de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C de Exemplo 25. Mais preferivelmente, a porção é uma porção da seqüência de ácido nucleico de SEQ ID NO: 211. Mais preferivelmente, a porção é como representado por SEQ ID NO: 209.
Uma porção de uma seqüência de ácido nucleico codificando
um polipeptídeo CLVl com um domínio C-terminal não funcional como definido neste lugar pode ser preparada, por exemplo, fazendo uma ou mais deleções à seqüência de ácido nucleico. As porções podem ser usadas em forma isolada ou elas podem ser fusionadas a outras seqüências de 15 codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combine diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de polipeptídeo CLV1.
Outra variante de ácido nucleico útil nos métodos da invenção
é uma seqüência de ácido nucleico capaz de hibridizar, em condições de reduzida estringência, preferivelmente em condições estringentes, com uma seqüência de ácido nucleico codificando um polipeptídeo CLVl como definido neste lugar, ou com uma porção como definido neste lugar. O termo “hibridização” é como definido neste lugar.
Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo CLVl como representado por qualquer uma das seqüências de aminoácidos dadas em Tabela C de Exemplo 25. A seqüência hibridizante é tipicamente de pelo menos 500 ou 1000 nucleotídeos consecutivos de comprimento, preferivelmente pelo menos 1500 ou 2000 nucleotídeos consecutivos de comprimento, mais preferivelmente pelo menos 2500 nucleotídeos consecutivos de comprimento e mais preferivelmente pelo menos 2900 nucleotídeos consecutivos de comprimento, os nucleotídeos 5 consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C. Preferivelmente, a seqüência hibridizante é uma que é capaz de hibridizar com qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou com uma porção de qualquer uma destas seqüências, uma porção sendo como definido acima. Mais preferivelmente, a seqüência 10 hibridizante é capaz de hibridizar com uma seqüência de ácido nucleico como representado por SEQ ID NO: 211 ou com uma porção desta. Preferivelmente, a seqüência hibridizante codifica uma seqüência de aminoácidos compreendendo qualquer um ou mais dos motivos ou domínios como definido neste lugar. Preferivelmente, a seqüência hibridizante codifica 15 uma seqüência de aminoácidos que quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. 20 Tais seqüências hibridizantes são úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
De acordo com a presente invenção, é fornecido um método 25 para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar com qualquer uma das seqüências de ácidos nucleicos dados na Tabela C, ou compreendendo introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C. Tais seqüências hibridizantes são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo 5 codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
Outra variante de ácido nucleico útil nos métodos da invenção é uma variante de união codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional. O termo “variante de união” sendo como definido neste lugar.
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de união de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou 15 uma variante de união de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C. Tais variantes de união são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C- terminal do polipeptídeo codificado, por exemplo usando qualquer dos 20 métodos (para interromper a função biológica) discutidos neste lugar.
Variantes de união preferidas são variantes de união de uma seqüência de ácido nucleico representada por SEQ ID NO: 211 ou uma variante de união de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 212. Preferivelmente, a seqüência de 25 aminoácidos codificada pela variante de união, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes de união são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
5 Outra variante de ácido nucleico útil para realizar os métodos
da invenção é uma variante alélica de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional. Alelos ou variantes alélicas são formas alternativas de um dado gene, localizadas na mesma posição cromossômica. Variantes alélicas existem 10 na natureza, e abrangido dentro dos métodos da presente invenção é o uso destes alelos naturais. Variantes alélicas abrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de 15 seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos.
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de 20 qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou compreendendo introduzir e expressar em uma planta uma variante alélica de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C. Tais variantes alélicas são tomadas úteis nos métodos da invenção 25 rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
Preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 211 ou uma variante alélica de uma seqüência de ácido nucleico codificando um ortólogo ou parálogo de SEQ ID NO: 212. Preferivelmente, a seqüência de aminoácidos codificada pela variante alélica, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo 5 a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes alélicas são tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a 10 função biológica) discutidos neste lugar.
Uma variante de ácido nucleico adicional útil nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de gene. Embaralhamento de gene ou evolução dirigida também podem ser usados para gerar variantes de seqüências de ácidos nucleicos codificando um 15 polipeptídeo CLVl com um domínio C-terminal não funcional. Isto consiste de repetições de embaralhamento de DNA seguido por triagem e/ou seleção apropriada para gerar variantes de seqüências de ácidos nucleicos ou porções destas codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima (Castle et al., (2004) Science 304(5674): 20 1151-4; PatentesNorte-Americanas 5.811.238 e 6.395.547).
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou 25 compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C, cuja seqüência de variante de ácido nucleico é obtida por embaralhamento de gene.
Preferivelmente, a seqüência de aminoácidos codificada pela seqüência de ácido nucleico variante obtida por embaralhamento de gene, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes obtidas por embaralhamento de gene são tomadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese dirigida por sítio. Diversos métodos estão disponíveis para atingir mutagênese dirigida por sítio, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds). Alvos de mutagênese dirigida por sítio com o objetivo de gerar variantes de seqüência de ácido nucleico codificando um polipeptídeo CLYl com um domínio C-terminal não funcional, são descritos em Exemplo 31.
De acordo com a presente invenção, é fornecido um método para melhorar características relacionadas ao rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela C, ou compreendendo introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácidos dadas em Tabela C, cuja seqüência de ácido nucleico variante é obtida por mutagênese dirigida por sítio.
Preferivelmente, a seqüência de aminoácidos codificada pela seqüência de ácido nucleico variante obtida por mutagênese dirigida por sítio, quando usada na construção de uma árvore filogenética de LRR-RLK, tal como aquela descrita em Fig. 10b, tende a se agrupar com o grupo de polipeptídeos compreendendo a seqüência de aminoácidos representada por SEQ ID NO: 212 (representada por um parêntese) ao invés de com qualquer outro grupo de polipeptídeos LRR-RLK. Tais variantes obtidas por 5 mutagênese dirigida por sítio são tornadas úteis nos métodos da invenção rompendo a função biológica do domínio C-terminal do polipeptídeo codificado, por exemplo usando qualquer dos métodos (para interromper a função biológica) discutidos neste lugar.
As seguintes variantes de ácidos nucleicos codificando um polipeptídeo CLVl com um domínio C-terminal não funcional, são exemplos de variantes adequadas para praticar os métodos da invenção:
(i) uma porção de uma seqüência de ácido nucleico codificando um CLV1; ou
(ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico codificando um polipeptídeo CLV1; ou
(iii)uma variante de união de uma seqüência de ácido nucleico codificando um polipeptídeo CLV1; ou
(iv) uma variante alélica de uma seqüência de ácido nucleico codificando um CLV1; ou
(v) uma seqüência de ácido nucleico codificando um
polipeptídeo CLV1 obtida por embaralhamento de gene; ou
(vi) uma seqüência de ácido nucleico codificando um polipeptídeo CLVl obtida por mutagênese dirigida por sítio;
caracterizado pelo fato de que a seqüência de ácido nucleico em (i) a (vi) codifica um polipeptídeo CLVl com um domínio não funcional.
Seqüências de ácidos nucleicos codificando um polipeptídeo CLVl com um domínio C-terminal não funcional podem ser derivadas de qualquer fonte natural ou artificial. A seqüência de ácido nucleico pode ser modificada a partir de sua forma nativa em composição e/ou ambiente genômico através de deliberada manipulação humana. Preferivelmente uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional é de uma planta, ainda preferivelmente de uma dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente a seqüência de ácido nucleico é de Arabidopsis thaliana.
Qualquer referência neste lugar a um polipeptídeo CLV1 com um domínio C-terminal não funcional é portanto adotada para significar um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido acima. Qualquer seqüência de ácido nucleico codificando um tal polipeptídeo 10 CLVl com um domínio C-terminal não funcional é adequada para uso para realizar os métodos da invenção.
A presente invenção também abrange plantas ou partes destas (incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima.
A invenção também fornece construções genéticas e vetores para facilitar introdução e/ou expressão das seqüências de ácidos nucleicos úteis nos métodos de acordo com a invenção, em uma planta. As construções 20 genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fornece uso de uma construção como definido neste lugar nos métodos da invenção.
Mais especificamente, a presente invenção fornece uma
construção compreendendo
(a) uma seqüência de ácido nucleico codificando polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima;
(b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácido nucleico de (a); e opcionalmente
(c) uma seqüência de término de transcrição.
Em uma forma de realização, a seqüência de controle de uma construção é um promotor tecido específico para expressão em tecidos jovens em expansão. Um exemplo de um promotor tecido específico para expressão em tecidos jovens em expansão é o promotor de beta-expansina.
Plantas são transformadas com um vetor compreendendo a seqüência de interesse (i.e., uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido 10 neste lugar. O artesão versado está ciente dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos “elemento regulador”, “seqüência de 15 controle” e “promotor” são como definidos neste lugar. O termo “operacionalmente ligado” também é definido neste lugar.
Vantajosamente, qualquer tipo de promotor pode ser usado para dirigir expressão da seqüência de ácido nucleico. O temo “promotor” e “Promotor de planta” são como definidos neste lugar.
O promotor pode ser um promotor constitutivo, como definido
neste lugar. Alternativamente, o promotor pode ser um promotor induzível, como definido neste lugar. Adicionalmente ou alternativamente, o promotor pode ser um promotor órgão-específico ou tecido-específico, como definido neste lugar.
Em uma forma de realização, uma seqüência de ácido
nucleico codificando polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima, tal como a seqüência de ácido nucleico como representada por SEQ ID NO: 209, é operacionalmente ligada a um promotor capaz de expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão, ou no meristema apical. Preferivelmente, o promotor capaz de expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão tem um perfil de expressão comparável com um promotor de beta-expansina. Mais especificamente, o promotor capaz de 5 expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão é um promotor capaz de dirigir expressão na zona de expansão celular de uma parte aérea ou raiz. Mais preferivelmente, o promotor capaz de expressar preferencialmente a seqüência de ácido nucleico em tecidos jovens em expansão é o promotor de beta-expansina (SEQ ID NO: 241).
Para a identificação de promotores funcionalmente
equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado por exemplo ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos 15 adequados incluem por exemplo beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). 20 Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA da seqüência de ácido nucleico usada nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como 18S rRNA, usando métodos conhecidos na arte, tal como Northern blotting com análise 25 densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor” fraco é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou a cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por célula.
5 Opcionalmente, uma ou mais seqüências terminadoras podem
ser usadas na construção introduzida em uma planta, o termo “terminador” sendo como definido neste lugar. Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como transducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras 10 que podem ser adequadas para uso para realizar a invenção. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.
Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a 15 quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de transcrição tanto em construções de planta como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico até 1000 vezes (Buchman and Berg, Mol. Cell Biol. 8:4395- 4405 (1988); Callis et al., Genes Dev. 1:1183-1200 (1987)). Tal estimulação 20 intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5’ da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral, veja The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Outras seqüências de controle (além de promotor, acentuador,
silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte. As construções genéticas da invenção podem incluir adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não são limitados a, a fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estas seqüências de ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Veja a seção “Definições” neste lugar para uma descrição dos termos “marcador selecionável”, “gene marcador selecionável” ou “gene repórter”.
A invenção também fornece um método para a produção de plantas transgênicas tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle, compreendendo introdução e expressão em uma planta de qualquer seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional como definido acima. Os significados de termos “transgênico”, “transgene” ou “recombinante” são definidos neste lugar.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo características relacionadas ao rendimento melhoradas, cujo método compreende:
(i) introduzir e expressar em uma planta ou célula de planta uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional, ou variante deste; e
(ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta. A seqüência de ácido nucleico pode ser introduzida diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, a seqüência de ácido nucleico é preferivelmente introduzida em uma planta por transformação. O termo “introdução” ou “transformação” é como definido neste lugar.
As células de planta geneticamente modificadas podem ser regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung and R. Wu, Potrykus ou Hofgen and Willmitzer.
Geralmente depois de transformação, células de planta ou agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material de planta obtido na transformação é, como uma regra, sujeito a condições seletivas de forma que plantas transformadas podem ser distinguidas de plantas não transformadas. Por exemplo, as sementes obtidas da maneira descrita acima podem ser plantadas e, depois de um período inicial de crescimento, sujeitas a uma seleção adequada por pulverização. Uma possibilidade adicional consiste em cultivar as sementes, se apropriado depois de esterilização, em placas de ágar usando um agente de seleção adequado de forma que apenas as sementes transformadas podem crescer até plantas. Alternativamente, as plantas transformadas são triadas para a presença de um marcador selecionável tal como aqueles descritos acima.
Seguindo transferência de DNA e regeneração, plantas putativamente transformadas podem ser avaliadas, por exemplo usando análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas por uma variedade de maneiras, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser autofecundada e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 então podem ser adicionalmente propagadas através de técnicas clássicas de melhoramento.
Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e.g., todas as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer dos métodos descritos neste lugar, e a todas as partes de planta e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo uma seqüência isolada de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional como definido acima. Células hospedeiras preferidas de acordo com a invenção são células de planta.
Plantas hospedeiras para as seqüências de ácidos nucleicos ou o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.
Uma planta para os propósitos da invenção é assim entendida como significando, como acima, que as seqüências de ácidos nucleicos usadas no método da invenção não estão em seu locus natural no genoma de dita planta, sendo possível para as seqüências de ácidos nucleicos serem expressas homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, embora as seqüências de ácidos nucleicos de acordo com a invenção ou usadas no método inventivo estejam em sua posição natural no genoma de uma planta, a seqüência foi modificada em relação à seqüência natural, e/ou que as seqüências reguladoras das seqüências naturais foram modificadas. Transgênica é preferivelmente entendida como significando a expressão das seqüências de ácidos nucleicos de acordo com a invenção em um locus não natural no genoma, i.e. expressão homóloga ou, preferivelmente, heteróloga das seqüências de ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar.
A invenção também se estende a partes colhíveis de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores, caules, rizomas, raízes, tubérculos e bulbos. A invenção além disso se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.
Métodos para aumentar expressão de seqüências de ácidos nucleicos ou genes, ou produtos de gene, são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Seqüências isoladas de ácidos nucleicos que servem como elementos promotores ou acentuadores podem ser introduzidas em uma posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente Norte- Americana No. 5.565.350; Zarling et al., PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula de planta na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.
Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3’ de uma região de codificação de um polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes de planta, ou de T-DNA. A seqüência de extremidade 3’ a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, ou menos preferivelmente de qualquer outro gene eucariótico.
Uma seqüência intrônica também pode ser adicionada como
descrito acima.
Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3’UTR e/ou 5’UTR) podem ser proteína e/ou elementos estabilizantes de RNA.
Como mencionado acima, um método preferido para aumentar expressão de uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional é introduzir e expressar em uma planta uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional; entretanto os efeitos de realizar o método, i.e. melhorar características relacionadas ao rendimento também pode ser atingido usando outras técnicas bem conhecidas. Exemplos de tais técnicas incluem identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), como descrito na seção “Definições” neste lugar. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Dirigidas em Genomas). Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga. Para detalhes destas técnicas, veja a seção “Definições” neste lugar.
Referência neste lugar a características relacionadas ao rendimento melhoradas é adotada para significar um aumento em biomassa (peso) de uma ou mais partes de uma planta, o que pode incluir partes (aptas para corte) acima do solo e/ou partes (aptas para corte) abaixo do solo.
Em particular, tais partes colhíveis são sementes, e desempenho dos métodos da invenção resulta em plantas tendo rendimento aumentado de sementes em relação ao rendimento de sementes de plantas de controle adequadas.
Os termos “rendimento” e “rendimento de sementes” são como definidos na seção “Definições” neste lugar. Os termos “aumento”, “melhorar” ou “melhora” também são descritos neste lugar.
Rendimento aumentado de sementes pode se manifestar como um ou mais dos seguintes:
(i) rendimento de sementes total aumentado, o que inclui um aumento em biomassa de semente (peso de semente) e que pode ser um aumento no peso de semente por planta ou em uma base de semente individual;
(ii) número aumentado de panículas por planta
(iii)número aumentado de flores (“floretes”) por panícula
(iv) taxa de enchimento de grãos aumentada
(v) número aumentado de grãos (cheios);
(vi) tamanho aumentado de semente (comprimento, área de largura, perímetro), o que também pode influenciar a composição de sementes;
(vii) volume aumentado de semente, o que também pode influenciar a composição de sementes;
(viii) índice de colheita aumentado, que é expresso como uma proporção do rendimento de partes colhíveis, tal como sementes, sobre a biomassa total; e
(ix)Peso de Mil Sementes (TKW) aumentado, que é extrapolado a partir do número de grãos cheios contados e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado. Um TKW aumentado pode resultar de um aumento em tamanho de embrião e/ou tamanho de endosperma.
Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente. Além disso, um aumento em rendimento de sementes também pode ser manifestado como um aumento em área de semente e/ou comprimento de semente e/ou largura de semente e/ou perímetro de semente. Rendimento aumentado também pode resultar em arquitetura modificada, ou pode ocorrer por causa de arquitetura modificada.
Em particular, características relacionadas ao rendimento melhoradas é adotado para significar um ou mais dos seguintes: (i) aumento em biomassa aérea; (ii) aumento em biomassa de raiz; (iii) aumento em biomassa de raízes finas; (iv) número aumentado de panículas primárias; (v) número aumentado de flores por panícula; (vi) rendimento de sementes total aumentado; (vii) número aumentado de grãos cheios; (viii) número total de sementes aumentado; ou (ix) índice de colheita aumentado. Portanto, de acordo com a presente invenção, é fornecido um método para melhorar uma ou mais dos seguintes características relacionadas ao rendimento: (i) aumento em biomassa aérea; (ii) aumento em biomassa de raiz; (iii) aumento em biomassa de raízes finas; (iv) número aumentado de panículas primárias; (v) número aumentado de flores por panícula; (vi) rendimento de sementes total aumentado; (vii) número aumentado de grãos cheios; (viii) número total de sementes aumentado; ou (ix) índice de colheita aumentado, em relação às plantas de controle, cujo método compreende aumentar expressão, em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional.
Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por hectare ou acre, um aumento no número de espigas por planta, um aumento no número de fileiras, número de sementes por fileira, peso de semente, Peso de Mil Sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), aumento em Peso de Mil Sementes, entre outros.
Uma vez que as plantas transgênicas de acordo com a presente invenção têm características relacionadas ao rendimento melhoradas, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes 5 maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo 10 de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode permitir vigor melhorado. O aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido 15 com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de arroz adicionais todas dentro de um período de cultivo convencional). 20 Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies de planta diferentes (por exemplo a semeadura e colheita de plantas de milho seguido por, por exemplo, a semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo porta-enxerto no 25 caso de algumas plantas de cultivo também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento em produção anual de biomassa por acre (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma vez que as limitações territoriais para cultivar um cultivo freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% de seu tamanho máximo), entre outros.
De acordo com uma característica preferida da presente invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas em relação às plantas de controle, cujo método compreende aumentar expressão, em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo CLV1 como definido neste lugar.
Um aumento em rendimento e/ou taxa de crescimento ocorre quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%), 12%, 11%) ou 10%> ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas de cultivo cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável 5 para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido à seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por 10 um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados em condições sem estresse ou em condições de seca branda para 15 gerar plantas tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade de planta. Seca, salinidade, temperaturas extremas e estresse 20 oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse 25 osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas celulares similares, tal como a produção de proteínas de estresse, regulagem positiva de antioxidantes, acumulação de solutos compatíveis e suspensão de crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadas em condições sem estresse ou em condições de seca branda características relacionadas ao rendimento melhoradas em relação às plantas de controle adequadas cultivadas em condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda, cujo método compreende aumentar expressão em uma planta de uma seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional.
Em uma forma de realização preferida da invenção, o aumento em rendimento e/ou taxa de crescimento ocorre de acordo com os métodos da presente invenção em condições sem estresse.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. O termo “planta” é definido na seção “Definições” neste lugar e exemplos de plantas adequadas úteis na presente invenção também são descritos.
De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Exemplos de plantas de cultivo incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de-açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia. A presente invenção também abrange uso de seqüências de ácidos nucleicos codificando um polipeptídeo CLVl com um domínio C- terminal não funcional como descrito neste lugar, e uso destes polipeptídeos CLVl com um domínio C-terminal não funcional para melhorar 5 características relacionadas ao rendimento em plantas.
Seqüências de ácidos nucleicos codificando um polipeptídeo CLV1 com um domínio C-terminal não funcional descrito neste lugar, ou os próprios polipeptídeos CLVl com um domínio C-terminal não funcional, podem encontrar uso em programas de melhoramento nos quais é identificado 10 um marcador de DNA que pode ser geneticamente ligado a um gene codificando um polipeptídeo CLVl com um domínio C-terminal não funcional. Os genes/seqüências de ácidos nucleicos, ou os próprios polipeptídeos CLVl com um domínio C-terminal não funcional podem ser usados para definir um marcador molecular. Este marcador de DNA ou 15 proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo características relacionadas ao rendimento melhoradas como definido acima nos métodos da invenção.
Variantes alélicas de um gene/seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não 20 funcional, também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada 25 origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que geram características relacionadas ao rendimento melhoradas. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
Seqüências de ácidos nucleicos codificando polipeptídeos CLV1 com um domínio C-terminal não funcional também podem ser usadas como sondas para mapear geneticamente e fisicamente os genes dos quais elas são uma parte de, e como marcadores para características ligadas a tais genes. Tal informação pode ser útil em reprodução de planta a fim de desenvolver linhagens com fenótipos desejados. Tal uso de seqüências de ácidos nucleicos codificando polipeptídeos CLVl requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificando polipeptídeos CLV1 podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de planta digerido por restrição podem ser sondados com as seqüências de ácidos nucleicos codificando polipeptídeos CLV1. Os padrões de bandeamento resultantes podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics I: 174- 181) a fim de construir um mapa genético. Em adição, as seqüências de ácidos nucleicos podem ser usadas para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição da seqüência de ácido nucleico codificando um polipeptídeo CLVl com um domínio C-terminal não funcional no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes de planta para uso em mapeamento genético é descrita em Bernatzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem 5 mapeamento genético de clones específicos de cDNA usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas IO por versados na arte.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., alocação de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleico
podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 20 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando as seqüências de ácidos nucleicos. Exemplos incluem amplificação alelo 25 específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nueleie Aeid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo características relacionadas ao rendimento melhoradas, como descrito acima. Estas características também podem ser combinadas com outras características economicamente vantajosas, tal como características acentuadoras de rendimento adicionais, tolerância a outros estresses abióticos e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.
Descrição de figuras
A presente invenção será agora descrita com referência às figuras seguintes nas quais:
Fig. 1 mostra uma árvore filogenética de todos os polipeptídeos TCP de Arabidopsis thaliana de acordo com o Arabidopsis Database for Transcription factors, disponível no Center for Bioinformatics(CBI), Peking University, China. O ciado de interesse, compreendendo dois parálogos de Arabidopsis At3g27010 (também chamado AtTCP20 ou PCF1) e At5g41030 (também chamado TCP 6), foi circulado.
Fig. 2 mostra um alinhamento múltiplo de diversos polipeptídeos TCP de Classe I de planta de Tabela A (quando de seqüências de ácidos nucleicos de comprimento completo), usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma penalidade de extensão de 0,05). O domínio conservado de TCP 5 (compreendendo o bHLH) dentro das seqüências de polipeptídeos úteis para realizar os métodos da invenção é expressivamente encaixotado. Os resíduos básicos (em negrito na linha consenso) as seqüências de Hélice-Alça-Hélice (HLH) são ligeiramente encaixotados, assim como o motivo consenso C- terminal PGLEL(G/R/A)LSQX,_5G(V/L)L, onde X é qualquer aminoácido 10 (SEQ ID NO: 65). A região rica em HQ (H sendo histidina, Q glutamina) é igualmente ligeiramente encaixotada.
Fig. 3 A) mostra um alinhamento das seqüências de polipeptídeos TCP de Classe I de Tabela A codificando a estrutura de Hélice- Alça-Hélice básico (bHLH). Ao considerar a seqüência de polipeptídeo de 15 término N a término C, os resíduos básicos precedem o Hélice-Alça-Hélice. 3B) é um desenho representando a estrutura primária das seqüências de polipeptídeos úteis para realizar os métodos da invenção, de término N a término C: um domínio conservado de TCP compreendendo o Hélice-Alça- Hélice básico (bHLH), um motivo consenso C-terminal, e uma região rica em 20 HQ.
Fig. 4 mostra o vetor binário para expressão aumentada em Oryza sativa de uma seqüência de ácido nucleico codificando um polipeptídeo TCP de Classe I sob o controle de um promotor GOS2.
Fig. 5 detalha exemplos de seqüências de TCP de Classe I úteis para realizar os métodos de acordo com a presente invenção.
Fig. 6 mostra a estrutura de domínio do polipeptídeo CAH3 apresentado em SEQ ID NO: 81.0 domínio de anidrase carbônica (entrada de Pfam PFOO194) é indicado em negrito sublinhado.
Fig. 7 mostra respectivamente uma árvore filogenética construída a partir das seqüências listadas em Figura 9 (A), e um alinhamento múltiplo de seqüências de proteína CAH3 pertencendo à classe alfa (B).
Fig. 8 mostra o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico codificando proteína CAH3 de Chlamydomonas reinhardtii sob o controle de um promotor de protoclorofilida redutase (PcR).
Fig. 9 detalha exemplos de seqüências de CAH3 úteis para realizar os métodos de acordo com a presente invenção.
Fig. 10 (A) mostra a estrutura de domínio prevista de um polipeptídeo LRR-RLK tal como representado por SEQ ID NO: 212; de término N a término C: (i) SP, peptídeo sinal; (ii) 21 LRRs, as 21 repetições ricas em leucina; (iii) TM, domínio transmembrana; e (iv) o domínio de quinase. A linha vertical em negrito é colocada na extremidade do domínio transmembrana. De acordo com Bommert et al. (2004) Development 132: 1235-1245.
Fig. 10 (B) mostra uma árvore filogenética como descrito em Bommert et al. (2004). Seqüências de polipeptídeos úteis para realizar os métodos da invenção devem se agrupar com o ciado compreendendo o polipeptídeo CLYl (chamado “subfamília” A), como delimitado na figura pelo colchete. CLVl é como representado por SEQ ID NO: 212.
Fig. 11 Mostra um alinhamento múltiplo de diversas seqüências de polipeptídeos CLVl de Tabela C (quando de seqüências de ácidos nucleicos de comprimento completo), usando programa de alinhamento múltiplo VNTI AlignX, baseado em um algoritmo ClustalW modificado (InforMax, Bethesda, MD, http://www.informaxinc.com), com configurações padrão para penalidade de abertura de lacuna de 10 e uma penalidade de extensão de 0,05). O peptídeo sinal e o domínio transmembrana são encaixotados em negrito. O começo e o final do domínio LRR (com as 21 LRR numeradas e sublinhadas em preto), do domínio de quinase (com os 11 subdomínios numerados e sublinhados duplamente), e do domínio C-terminal são marcados com um colchete (cada). Motivo I (SEQ ID NO: 237) e Motivo
2 (SEQ ID NO: 238) também são encaixotados. Dentro de motivo 2, o primeiro par de cisteína é marcado, como é o segundo par de cisteína (entre o domínio LRR e o domínio transmembrana). A glicina conservada com subdomínio IX (SDIX) do domínio de quinase também é marcada. A linha vertical dentro de subdomínio IV (SDIV) do domínio de quinase marca o final do polipeptídeo CLVl com um domínio C-terminal não funcional como representado por SEQ ID NO: 210.
Fig. 12 mostra o vetor binário para expressão aumentada em Oiyza sativa de uma seqüência de ácido nucleico de Arabidopsis thaliana codificando polipeptídeo CLVl com um domínio C-terminal não funcional, sob o controle de um promotor de beta-expansina (para expressão em tecidos jovens em expansão).
Fig. 13 detalha exemplos de seqüências de CLVl úteis para realizar os métodos de acordo com a presente invenção.
A presente invenção será agora descrita com referência aos exemplos seguintes, que são como forma de ilustração apenas. Os exemplos seguintes não são pretendidos para definir completamente ou de outra maneira limitar o escopo da invenção.
Exemplos: PCFl
Exemplo 1: Identificação de seqüências relacionadas à SEQ ID NO: I e SEQ ID NO: 2
Seqüências de ácidos nucleicos (cDNA de comprimento completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 1 e/ou seqüências de polipeptídeos relacionadas à SEQ ID NO: 2 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de 5 seqüências e calculando a signifícância estatística de pareamentos. O polipeptídeo codificado por SEQ ID NO: 1 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade 10 (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as 15 duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.
Em adição às publicamente disponíveis seqüências de ácidos nucleicos disponíveis em NCBI, bancos de dados privados de seqüências também foram procurados seguindo o mesmo procedimento como descrito neste lugar acima.
Tabela A fornece uma lista de seqüências de ácidos nucleicos e polipeptídeos relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 1 e à seqüência de polipeptídeo representada por SEQ ID NO: 2.
Tabela A: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 1) úteis nos métodos da presente invenção, e os
polipeptídeos deduzidos correspondentes. Nome Estado Nome Número de N úmero Número ID acesso de ID de seqüência banco de dados seqüência polipeptídeo de ácido nucleico Arath_TCP20 comprimento Arabidopsis thaliana AKl 18178 1 2 completo At3g27010 Arath TCP6 comprimento Arabidopsis thaliana At5g41030 3 4 completo Aqufo Class I comprimento Aquilegia formosa x DR95I658 5 6 TCP completo Aquilegia pubescens DT754291 GIyma Class I comprimento Glycine max AI736626.1 7 8 TCP completo BI4 70329.1 BG044313.1 CA784744.1 BF424472.1 Goshi Class 1 comprimento Gossypium hirsutum DT574583 9 10 TCP completo DW499958 Lyces Class I comprimento Lycopersicon esculentum BW688913 U 12 TCP completo BP878035.1 BI931745.1 Maldo Class I comprimento Malus domestica EB153444 13 14 TCP completo CN895103 Medtr Class 1 comprimento Medicago Iruneatula CG926048.1 15 16 TCP completo CA921765.1 Niebe Class 1 comprimento Nieotiana benthamiana CK296978 17 18 TCP completo Oeiba CIass I comprimento Ocimum basilieum DY322462 19 20 TCP completo Orysa PCFl comprimento Oryza saliva NM 00105178 21 22 completo 2 0s01g0924400 Poptr Class 1 comprimento Populus tremuloides CX 169560.1 23 24 TCP completo DT515387.1 Saeof Class I comprimento Saccharum officinarum SCJLRT1023A 25 26 TCP completo 09.g Soltu Class I comprimento Solanum tuberosum CK271473.1 27 28 TCP completo BQ507674.2 Sorbi Class I comprimento Sorghum bieolor CLASS162154 29 30 TCP completo .1 ED507285.1 CW333599.1 Vitvi Class 1 comprimento Vitis vinifera CB972449 31 32 TCP completo EC971921 Zeama Class I comprimento Zea mays DR826915.1 33 34 TCP 1 completo DR794438.1 Zeama Class I comprimento Zea mays DR963477.1 35 36 TCP 2 completo EE022629.1 AIIee CIass I parcial Allium cepa CF439613 37 38 TCP partial 5' Bradi CIass I parcial Brachypodium distachvon DV480032 39 40 TCP partial 5' Braol Class I parcial Drassica oleracea BZ446639.1 41 42 TCP partial 5' BH464032.1 BZ445385.1 Brara Class I parcial Brassica rapa DX909657.1 43 44 TCP partial 3' DUl 15108.1 Cofca_ Class 1 parcial Coffea canephora DV701323 45 46 TCP partial middle Helan_ Class I parcial Helianthus annuus DY906028 47 48 TCP partial 3' & petiolaris DY940311.1 Horvu_ Class 1 parcial Hordeum vulgare DNl 81323 49 50 TCP partial 3' Linus_ Class 1 parcial L in mn us it a tis si mum Contig 51 52 TCP partial LU04MC0334 middle 2 61667197 Lotco Class í parcial Lotus corniculatus BW630043.1 53 54 TCP partial 5' Pethy_ Class T parcial Petunia hyhrida CY296461 55 56 TCP partial CV297628 middle Prupe Class I parcial Prunus pérsica BU044166. 57 58 TCP partial 3' Ricco Class I parcial Ricinus communis EG685326.1 59 60 TCP partial 3’ EG671551 Salmi Class I parcial Salvia miítiorrhiza CV163534 61 62 TCP partial 3’ Zinel Class 1 parcial Zinnia elegans AU307217 63 64 TCP partial middle Cieen Class I parcial Cichorium endivia, EL361878; 70 71 TCPpartial 3’ Cichorium intybus EH709336 Frave Class I parcial Fragaria vesca EX657224 72 73 TCP partial Jugsp Class 1 parcial JugIans hindsii x EL896093 74 75 TCP partial Juglans regia middle Pangi Class I parcial Panax ginseng CN846083 76 77 TCP partial 3’ Pontr Class 1 parcial Poncirus trifoliata CX644761 78 79 TCPpartial 3’ Exemplo 2: Alinhamento de seqüências de polipeptídeos relevantes
AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 5 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados). Em algumas instâncias, ajuste manual é necessário para aperfeiçoar melhor o alinhamento entre as seqüências de polipeptídeos, em particular no caso de alinhamento de motivo.
Em Figura 1 é fornecida uma árvore filogenética de TCP de acordo com o Arabidopsis Database for Transcription factors, disponível no 5 Center for Bioinformatics(CBI), Peking University, China. O ciado de interesse, compreendendo dois parálogos de Arabidopsis At3g27010 (também chamado AtTCP20 ou PCF1) e At5g41030 (também chamado TCP 6), foi circulado. Qualquer polipeptídeo caindo dentro deste ciado (depois de uma nova etapa de alinhamento múltiplo como descrito acima) é considerado 10 como sendo útil para realizar os métodos da invenção como descrito neste lugar.
O resultado do alinhamento múltiplo de seqüências de polipeptídeos TCP de Classe I de Tabela A (quando de seqüências de ácidos nucleicos de comprimento completo) úteis para realizar os métodos da 15 invenção é mostrado em Figura 2 do presente pedido. O domínio conservado de TCP (compreendendo o bHLH (Hélice-Alça-Hélice básico)) dentro das seqüências de polipeptídeos úteis para realizar os métodos da invenção é expressivamente encaixotado. Os resíduos básicos (em negrito na linha consenso) as seqüências de Hélice-Alça-Hélice (HLH) são ligeiramente 20 encaixotados, assim como o motivo consenso C-terminal PGLEL(G/R/A)LSQXi_5G(V/L)L, onde X é qualquer aminoácido (SEQ ID NO: 65). A região rica em HQ (H sendo histidina, Q glutamina) é igualmente ligeiramente encaixotada.
Dentro deste motivo, pode haver uma ou mais mudança(s) conservativa(s) em qualquer posição, e/ou uma ou três mudança(s) não conservativa(s) em qualquer posição.
Exemplo 3: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção
Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application 5 that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos 10 pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha 15 divisora e identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.
Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2
Resultados da análise de aplicativo computacional são mostrados em Tabela Al para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.
A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 29 % de identidade de aminoácidos comparada com SEQ ID NO: 2.
Tabela Al: Resultados de MatGAT para similaridade e identidade global no comprimento completo das seqüências de polipeptídeos.
Comprimento 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 completo 1. Aqufo 46,4 35,3 52,6 60,6 48,8 57 50,3 47,9 56,3 39,5 55.9 38.7 48.4 38.8 64.6 37,1 39 CLASS I TCP 2. Arath 62.1 40,4 52,1 57,4 48,4 56,2 49,2 46,9 53,7 41,6 54,1 41.3 51.2 41,6 58,8 42.6 43,1 TCP20TCP 3. Arath 48.5 52.2 32,1 34,8 31,3 33,4 33,7 30,9 35,4 30.2 32.6 30.3 34.2 29.8 35.5 30,4 30.8 TCP6 4. Glyma 61,2 64,1 43,8 68 52,6 68.2 54.9 55.5 61.3 40,4 64.6 37,1 56,3 39,3 73,2 38,4 39,1 CLASS I TCP 5. Goshi 70,2 68,8 50,3 73 62,5 75,2 58,1 59,4 68,1 41,4 74,4 41,8 62,7 41,4 84,3 40,8 41,3 CLASS1 TCP 6. Lyces 61,2 61,5 49,3 61,2 73,3 57.4 50.7 69,4 56,9 37,9 54.7 37.5 91.8 37.9 63 37,8 38,4 CLASS I TCP 7. Maldo 67,3 67,9 46,4 74,5 82,9 67 55 57.6 63 42,7 73,4 41,2 58,3 42,9 80,6 42,7 44,1 CLASS I TCP 8. Medtr 63,1 62,7 51,1 63,2 72 67,3 66,7 50,8 56,3 39.4 56,1 39,3 50,7 40,5 60,4 38,5 39,8 CLASS I TCP 9. Niebe 60,2 60,8 45,8 65,8 71,7 77,3 67,3 64,4 56,3 37,9 54,4 35,3 71 36 64,7 34,1 35,6 CLASS I TCP 10. Oeiba 68,6 65,3 50,8 70,7 80 71,7 73,5 70,7 70,4 39 62,5 38,5 57,6 39,7 70,6 41 41,4 CIjASS 1 TCP 11. Ory sa 52,7 57,4 46,4 53,6 54,9 49,8 53,9 52,1 52,7 51,1 41,1 69,6 38,2 70,6 41,8 68,4 69,3 PCFl 12. Poptr 70,6 68,1 46,6 74,8 82,8 65,9 83,2 67,5 68,8 74,4 55.3 42,5 55,8 42,5 73,6 42,5 43 CLASS1 TCP 13. Saeof 53,5 53,5 45,5 50,1 55,8 52,3 53,9 53,9 52,3 54,2 79,2 55.9 37,5 87,5 38,9 84,9 83,9 CLASS I TCP 14. Soltu 60,5 62,4 49,5 64,3 73,7 94 67 66,5 79 71,4 48,9 69.7 51,9 37,9 65,9 37,6 37 CLASS I TCP 15. Sorbi 53,2 55,4 44,3 51,6 55,4 52 56,9 53,5 51,4 55,7 80 56.6 90.5 51.1 40,9 86,1 89,4 CLASS I TCP 16. Vitvi 73,5 71 50,3 76,5 92 72,6 85,4 74,3 78 81,8 53.9 82.2 53,9 76.7 53,8 40,1 41,4 CLASS I TCP 17. Zeama 53,1 54 43,8 55,7 54,6 51,2 55,6 52,8 52,2 56,2 78,4 57,4 88.6 49,7 90.5 53.7 84,9 CLASS ITCPl 18. Zeama 54,3 57,5 43,2 53 57,1 53 59,2 57,5 51,7 60,3 78,5 58,4 89,2 52,1 90,5 56,5 87,7 CLASS 1 TCP2 A identidade percentual pode ser substancialmente aumentada
se o cálculo de identidade é realizado no domínio conservado de TCP (compreendendo o bííLH, em 69 aminoácidos contíguos totais, por exemplo 5 para SEQ ID NO: 2, o domínio conservado de TCP é como representado por SEQ ID NO: 66) dentro dos polipeptídeos úteis para realizar os métodos da invenção, como mostrado em Tabela A2. Identidade percentual no domínio conservado de TCP dentro das seqüências de polipeptídeos úteis para realizar os métodos da invenção varia entre 65 % e 100% de identidade de 10 aminoácidos.
Tabela A2: Resultados de MatGAT para similaridade e identidade global no domínio conservado de TCP (em 69 aminoácidos contíguos totais) dentro das
seqüências de polipeptídeos.
Domínio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 conservado de TCP 1. Aqufo 91.3 68,1 91.3 89,9 91,3 88,4 91.3 89,9 89,9 88.4 91,3 88,4 91,3 88,4 91,3 88,4 88,4 PCFI CD 2. Arath 95.7 68,1 94,2 95,7 95,7 91.3 95.7 94,2 97,1 91.3 94,2 91,3 95.7 91,3 94,2 91,3 91,3 PCFl CD 3. Arath 84,1 84,1 66,7 66,7 66,7 65,2 66,7 66,7 66,7 65.2 66,7 65,2 66,7 65,2 66,7 65,2 65,2 TCP6 CD 4. Glyma 94,2 98,6 82,6 98.6 98,6 97,1 95.7 95,7 97,1 89,9 100 89,9 98,6 89,9 100 89,9 89.9 PCFl CD 5. Goshi 94.2 98,6 84,1 100 97,1 95,7 94,2 94,2 98.6 88,4 98,6 88,4 97,1 88,4 98,6 88.4 88,4 PCFl CD 6. Lyces 95,7 100 82,6 98,6 98,6 95,7 94,2 97.1 98,6 91.3 98,6 91,3 100 91,3 98,6 91,3 91,3 PCFl CD 7. Maldo 92,8 97,1 81,2 98,6 98,6 97,1 92.8 94,2 94,2 89,9 97,1 89,9 95,7 89,9 97,1 89,9 89,9 PCFl CD 8. Medtr 94.2 98,6 82,6 100 100 98.6 98,6 92.8 92,8 89.9 95.7 89,9 94.2 89.9 95,7 89,9 89.9 PCFl CD 9. Nicbe 94,2 97,1 79,7 95,7 95,7 97,1 94,2 95,7 95,7 91,3 95,7 91,3 97,1 91,3 95,7 91,3 91,3 PCFl CD 10. Ociba 95,7 100 84,1 98,6 98,6 100 97,1 98,6 97,1 89,9 97,1 89,9 98,6 89,9 97,1 89,9 89,9 PCFl CD I 1. Orysa 94,2 98,6 82,6 97,1 97,1 98,6 95,7 97,1 95.7 98,6 89.9 100 91,3 100 89,9 100 100 PCFl 12. Poptr 94,2 98,6 82,6 100 100 98,6 98,6 100 95,7 98,6 97.1 89,9 98.6 89,9 100 89,9 89,9 PCFl CD 13. Sacof 94,2 98,6 82,6 97,1 97,1 98,6 95,7 97,1 95,7 98,6 100 97,1 91,3 100 89,9 100 100 PCFl CD 14. Soltu 95,7 100 82,6 98,6 98.6 100 97,1 98.6 97,1 100 98,6 98,6 98,6 91,3 98,6 91,3 91,3 PCFl CD 15. Sorbi 94.2 98,6 82,6 97.1 97,1 98,6 95,7 97,1 95,7 98,6 100 97,1 100 98,6 89,9 100 100 PCFl CD 16. Vitvi 94,2 98,6 82,6 100 100 98,6 98,6 100 95,7 98,6 97,1 100 97,1 98,6 97,1 89,9 89,9 PCFl CD 17. Zeama 94,2 98,6 82,6 97,1 97,1 98,6 95,7 97.1 95,7 98,6 100 97,1 100 98,6 100 97,1 100 PCFl I CD 18. Zeama 94,2 98,6 82,6 97.1 97,1 98,6 95,7 97,1 95,7 98,6 100 97,1 100 98.6 100 97,1 100 PCFl 2 CD Exemplo 4: Identificação de domínios compreendidos em seqüências de
polipeptídeos úteis para realizar os métodos da invenção O banco de dados Integrated Resource of Protein Families,
Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica sobre 10 proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no European Bioinformatics Institute no Reino Unido.
Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 2 são apresentados em Tabela A3.
Tabela A3: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 2
Banco de dados Número de acesso Nome de acesso InterPro ÍPR005333 Fator de transcrição de TCP PFAM PF03634 TCP O domínio de TCP compreende o Hélice-Alça-Hélice básico (bEILH). O domínio de TCP de SEQ ID NO: 2 é como representado por SEQ ID NO: 66.
Composição primária de aminoácidos (em %) para determinar
se uma região de polipeptídeo é rica em aminoácidos específicos (por exemplo em uma caixa ácida) pode ser calculada usando programas de aplicativos computacionais do servidor ExPASy, em particular a ferramenta ProtParam (Gasteiger E et al. (2003) ExPASy: the proteomics server for in- 15 depth protein knowledge and analysis. Nucleic Acids Res 31:3784-3788). A composição da seqüência de polipeptídeo de interesse pode ser então comparada com a composição média de aminoácidos (em %) no banco de dados Swiss-Prot Protein Sequence.
Inspeção visual do alinhamento múltiplo de seqüências dos 20 polipeptídeos úteis para realizar os métodos da invenção mostra que, entre o motivo C-terminal conservado e a extremidade C-terminal do polipeptídeo, reside uma região rica em histidina (His ou H) e glutamina (Gin ou Q), a região rica em HQ. Esta região HQ de baixa complexidade compreende pelo menos quatro, preferivelmente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 25 19, 20 ou mais ou de apenas resíduos H, ou de apenas resíduos Q, ou de uma combinação de resíduos HeQ (em qualquer proporção) A região HQ é encaixotada em Figura 2.
Exemplo 5: Predição da estrutura secundária das seqüências de polipeptídeos úteis para realizar os métodos da invenção
Um Hélice-Alça-Hélice básico (bHLH) não canônico previsto é encontrado em ambas as classes de fatores de transcrição TCP, como descrito por Cubas et al. (1999) Plant J 18(2): 215-222. A posição desta 5 estrutura secundária prevista é mostrada em Figura 3A. Ao considerar a seqüência de polipeptídeo de término N a término C, os resíduos básicos precedem o Hélice-Alça-Hélice.
Figura 3B é um desenho representando a estrutura primária das seqüências de polipeptídeos úteis para realizar os métodos da invenção, de término N a término C: um domínio conservado de TCP compreendendo o Hélice-Alça-Hélice básico (bHLH), um motivo consenso C-terminal 1, e uma região rica em HQ.
Exemplo 6: Ensaio relacionado às seqüências de polipeptídeos úteis para realizar os métodos da invenção A seqüência de polipeptídeo como representada por SEQ ID
NO: 2 é um fator de transcrição com atividade de ligação de DNA. Seqüências de ligação de DNA consenso destas duas classes foram identificadas: GGNCCCAC para classe 1, e GTGGNCCC para classe II. A capacidade de um fator de transcrição de se ligar a uma seqüência específica 20 de DNA pode ser testada por ensaios de alteração da mobilidade eletroforética (EMSAs; também chamados ensaios de retardamento em gel), o que é bem conhecido na arte, e relatado especificamente para TCPs por Kosugi & Ohashi (2002) Plant J 30: 337-348, e por Li et al. (2005) PNAS 102(36): 12978-83. Também relatados por Kosugi & Ohashi são métodos para detector 25 parceiros de dimerização e especificidade, usando por exemplo, o sistema de dois híbridos em levedura, enquanto que Li et al. descrevem experimentos de imunoprecipitação de cromatina para caracterizar os promotores aos quais TCPs se ligam. Os experimentos descritos em ambos os artigos são úteis para caracterizar fatores de transcrição TCP de classe I, e são bem conhecidos na arte.
Exemplo 7: Clonagem de seqüência de ácido nucleico como representada por SEQ ID NO: 1
A menos que de outra maneira determinado, técnicas de DNA 5 reeombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrão para trabalho molecular com planta são 10 descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
A seqüência de ácido nucleico usada nos métodos da invenção foi amplificada por PCR usando como modelo uma biblioteca de cDNA de 15 plântula de Arabidospis thaliana (em pCMV Sport 6.0; Invitrogen, Paisley, UK). PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão, usando 200 ng de modelo em uma mistura de PCR de 50 μΐ. Os iniciadores usados foram
- prm01501 SEQ ID NO: 68; sentido, sítio AttBl em letras minúsculas:
5 ’-ggggacaagtttgtacaaaaaagcaggcttcacaATGGATCCCAAGAACCTAA-3 ’; e
- prm01502 (SEQ ID NO: 69; reverso, complementar, sítio AttB2 em letras minúsculas:
5’-ggggaccactttgtacaagaaagctgggtTTTTAACGACCTGAGCCTT-3’,
o que inclui os sítios AttB para recombinação Gateway. O 25 fragmento amplificado de PCR foi purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”. Plasmídeo pDONR2Ql foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway©. Exemplo 8: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada por SEQ ID NO: 1
O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T- DNA: um marcador selecionável de planta; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüênçia de ácido nucleico de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 67) para expressão constitutiva foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressão resultante (Figura 4) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.
Exemplo 9: Transformação de planta Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada para transformar plantas de Ory^za sativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbare foram descascadas. Esterilização foi realizada incubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com água destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois de incubação no escuro por quatro semanas, calos embriogênicos derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados por subcultura no mesmo meio por outras 2 semanas. Pedaços de calo embriogênico foram sub-cultivados em meio fresco
3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Linhagem LBA4404 de Agrobacterium contendo o vetor de expressão foi usada para eo-eultivo. Agrobacterium foi inoeulada em meio AB com os antibióticos apropriados e cultivada por 3 dias a 28°C. As bactérias foram então coletadas e suspensas em meio de co-cultivo líquido para uma densidade (ODóOO) de cerca de 1. A suspensão foi então transferida 5 para uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calos foram então secados em um papel filtro e transferidos para um meio de co-cultivo solidificado e incubados por 3 dias no escuro a 250C. Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, 10 ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depois de transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e partes aéreas se desenvolveram nas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calos e incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qual 15 elas foram transferidas para o solo. Partes aéreas endurecidas foram cultivadas em alta umidade e dias curtos em uma estufa.
Aproximadamente 35 transformantes TO de arroz independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultivo de tecido para uma 20 estufa. Depois de uma análise de PCR quantitativo para verificar número de cópias do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibem tolerância ao agente de seleção foram mantidas para colheita de semente Tl. Sementes foram então coletadas três a cinco meses depois de transplante. O método produziu transformantes de locus único em uma taxa 25 de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei et al. 1994). Exemplo 10: Procedimento de avaliação fenotípica
10.1 Configuração de avaliação
Aproximadamente 35 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmara de cultivo de tecido para uma estufa para cultivo e colheita de semente Tl. Seis eventos, dos quais a progênie Tl segregou 3:1 para presença/ausência do transgene, foram mantidos. Para cada um destes eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero e homozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. Condições de estufa foram de dias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidade relativa de 70%.
Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
10.2 Análise estatística: teste F
Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas de planta. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e para verificar por um efeito geral do gene, também conhecido como efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em 5%> de nível de probabilidade para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a mera presença ou a posição do gene que está causando as diferenças em fenótipo.
10.3 Paramêtros medidos
Medidas de parâmetros associados à biomassa
Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada momento imagens digitais (2048x1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A parte aérea de planta (ou biomassa de folhas) foi determinada contando o número total de pixéis nas imagens digitais de partes aéreas de planta discriminadas do fundo. Foi tirada a média deste valor para as fotos tiradas no mesmo momento dos diferentes ângulos e foi convertido para um valor de superfície física expresso em mm quadrados por calibração. Experimentos mostram que a parte aérea de planta medida desta maneira se correlaciona com a biomassa de partes aéreas de planta. A área acima do solo é o momento no qual a planta atingiu sua biomassa máxima de folhas. O vigor inicial é a área acima do solo de planta (plântula) três semanas após germinação. Aumento em biomassa de raiz é expresso como um aumento em biomassa total de raiz (medida como biomassa máxima de raízes observada durante o tempo de vida de uma planta); ou como um aumento no índice raiz/parte aérea (medido como a proporção entre massa radicular e massa de parte aérea no período de crescimento ativo de raiz e parte aérea).
Medidas de parâmetros associados a sementes
As panículas primárias maduras foram coletadas, contadas, 20 ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas 25 em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. O rendimento total de sementes foi medido pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contados e seu peso total. O índice de Colheita (HI) na presente invenção é definido como a proporção entre o rendimento total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por
panícula como definido na presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de grãos como definida na presente invenção é a proporção (expressa como uma %) do número de grãos cheios sobre o número total de sementes (ou floretes).
Exemplo 11: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção são apresentados em Tabela A4. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.
índice raiz/parte aérea, rendimento de sementes, índice de colheita e Peso de Mil Sementes (TKW) são significativamente aumentados nas plantas transgênicas expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos).
Tabela A4: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção.
Característica % de aumento em geração Tl Area acima do solo -J índice raiz/parte aérea 4 Rendimento total de sementes 7 índice de colheita 9 TKW 6 Exemplo 12: Transformação de outras cultivos
Transformação de milho
Transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. Transformação é dependente de genótipo em milho e apenas genótipos específicos são receptivos para transformação e regeneração. A linhagem natural A188 (University of Minnesota) ou híbridos com A188 como um ancestral são boas fontes de material doador para transformação, mas outros genótipos também podem ser usados com sucesso. Espigas são coletadas de planta de milho aproximadamente 11 dias depois de polinização (DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm. Embriões imaturos são co-cultivados com Agrobacterlum tumefaciens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Embriões excisados são cultivados em meio de indução de calo, então meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que partes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cada embrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3 semanas, até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite (disponível a partir de C1MMYT, México) é comumente usada em transformação. Embriões imaturos são co-cultivados com Agrobaeterium tumefaciens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Depois de incubação com Agrobaeterium, os embriões são cultivados in vitro em meio de indução de calo, então meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que partes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cada embrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T- DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação do método descrito na Patente Norte-Americana de Texas A&M 5.164.310. Diversas variedades comerciais de soja são receptivas para transformação por este método. A cultivar Jack (disponível a partir da Illinois Seed foundation) é comumente usada para transformação. Sementes de soja são esterilizadas para semeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados a partir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédone remanescente são adicionalmente cultivados para desenvolver nós axilares. Estes nós axilares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co-cultivo, os explantes são lavados e transferidos para meio de seleção. Partes aéreas regeneradas são excisadas e colocadas em um meio de prolongamento de parte aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio de enraizamento até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de colza/canola
Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6 dias de idade são usados como explantes para cultivo de tecido e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para transformação, mas outras variedades também podem ser usadas. Sementes de canola são esterilizadas em superfície para semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone acoplado são excisados das plântulas in vitro, e inoculados com Agrobacterium (contendo o vetor de expressão) banhando a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são então cultivados por 2 dias em meio MSBAP-3 contendo 3 mg/l de BAP, 3 % de sacarose, 0,7 % de Phytagar a 23 °C, 16 h de luz. Depois de dois dias de co-cultivo com Agrobacterium, os explantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e então cultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina e agente de seleção até regeneração de parte aérea. Quando as partes aéreas estão com 5-10 mm de comprimento, elas são cortadas e transferidas para meio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l de B AP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para o meio de enraizamento (MSO) para indução de raiz. As partes aéreas com raiz são transplantadas para solo na estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medicago sativa) é transformado usando o método de (McKersie et al., 1999 Plant Physiol 119: 839-847). Regeneração e transformação de alfafa é dependente de genótipo e portanto uma planta regenerante é requerida. Métodos para obter plantas regenerantes foram descritos. Por exemplo, estas podem ser selecionadas a partir da cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade comercial de alfafa como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para uso em cultivo de tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolo são co-cultivados com um cultivo noturno de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ L de tioprolina, 4,35 g/ L de K2S04, e 100 μηι de acetoseringona. Os explantes são lavados em meio Murashige-Skoog com meia força (Murashige and Skoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringona mas com um agente de seleção adequado e antibiótico adequado para inibir crescimento de Agrobaeterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento BOÍ2Y não contendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L de sacarose. Embriões somáticos são subseqüentemente germinados em meio Murashige-Skoog com meia força. Plântulas enraizadas foram transplantadas em potes e cultivadas em uma estufa. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de algodão
Algodão é transformado usando Agrobaeterium tumefaciens de acordo com o método descrito em Patente Norte-Americana 5.159.135. Sementes de algodão são esterilizadas em superfície em solução de hipoclorito de sódio a 3% durante 20 minutos e lavadas em água destilada com 500 μg/ml de cefotaxima. As sementes são então transferidas para meio SH com 50μg/ml de benomil para germinação. Hipocótilos de plântulas de 4 a
6 dias são removidos, cortados em pedaços de 0,5 cm e são colocados em ágar 0,8%. Uma suspensão de Agrobacterium (aprox. 108 células por ml, diluída a partir de um cultivo noturno transformado com o gene de interesse e marcadores de seleção adequados) é usada para inoculação dos explantes de hipocótilo. Depois de 3 dias em temperatura ambiente e iluminação artificial, os tecidos são transferidos para um meio sólido (1,6 g/l de Gelrite) com sais Murashige e Skoog com vitaminas B5 (Gamborg et al., Exp. Cell Res. 50:151-158 (1968)), 0,1 mg/l de 2,4-D, 0,1 mg/l de 6-furfurilaminopurina e 750 μg/ml de MgCL2, e com 50 a 100 μg/ml de cefotaxima e 400-500 μg/ml de carbenicilina para matar bactérias residuais. Linhagens celulares individuais são isoladas depois de dois a três meses (com subculturas a cada quatro a seis semanas) e são adicionalmente cultivadas em meio seletivo para amplificação de tecido (30°C, fotoperíodo de 16 hr). Tecidos transformados são subseqüentemente cultivados adicionalmente em meio não seletivo durante 2 a 3 meses para gerar embriões somáticos. Embriões aparentemente saudáveis de pelo menos 4 mm de comprimento são transferidos para tubos com meio SH em vermiculita fina, suplementado com 0,1 mg/l de ácido indolacético, 6 fúrfurilaminopurina e ácido giberélico. Os embriões são cultivados a 3 0°C com um fotoperíodo de 16 h, e plântulas no estágio de 2 a 3 folhas são transferidas para potes com vermiculita e nutrientes. As plantas são endurecidas e subseqüentemente movidas para a estufa para cultivo adicional. Exemplo 13 Exemplos de triagens de estresse abiótico Triagem de seca
Plantas de um número selecionado de eventos são cultivadas em solo de vaso em condições normais até elas terem atingido o estágio de espigamento. Elas são então transferidas para uma seção “seca” onde irrigação é retida. Sondas de umidade são inseridas em potes aleatoriamente escolhidos para monitorar o teor hídrico do solo (SWC). Quando SWC fica abaixo de certos limiares, as plantas são automaticamente re-irrigadas continuamente até que um nível normal seja novamente atingido. As plantas são então re-transferidas para condições normais. O resto do cultivo (maturação de planta, coleta de sementes) é o mesmo que para plantas não cultivadas em condições de estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições normais.
Triagem de estresse salino
Plantas são cultivadas em um substrato feito de fibras de coco e argex (proporção de 3 para I). Uma solução nutritiva normal é usada durante as primeiras duas semanas depois de transplantar as plântulas para a estufa. Depois das primeiras duas semanas, 25 mM de sal (NaCl) é adicionado à solução nutritiva, até as plantas terem sido colhidas. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições normais.
Triagem de disponibilidade reduzida de nutriente (nitrogênio)
Plantas de seis eventos (sementes T2) são cultivadas em solo de vaso em condições normais exceto para a solução nutritiva. Os potes são irrigados de transplante até maturação com uma solução nutritiva específica contendo teor reduzido de nitrogênio N (N), normalmente entre 7 a 8 vezes menos. O resto do cultivo (maturação de planta, coleta de sementes) é o mesmo que para plantas não cultivadas em condições de estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições nonnais. Exemplos: CAH3
Exemplo 14: Identificação de seqüências relacionadas à SEQ ID NO: 80 e SEQ ID NO: 81
Seqüências (cDNA de comprimento completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 80 e/ou seqüências de proteínas relacionadas à SEQ ID NO: 81 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a signifícância estatística de identidades. O polipeptídeo codificado por SEQ ID NO: 80 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.
Tabela B fornece uma lista de seqüências de ácidos nucleicos e proteínas relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 80 e à seqüência de proteína como representada por SEQ ID NO: 81.
Tabela B: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 80) úteis nos métodos da presente invenção, e os polipeptídeos deduzidos correspondentes.
Nome Organismo fonte Ácido nucleico Polipeptídeo Acesso de banco Estado SEQ ID NO: SEQ ID NO: de dados CrC AH3 Chlamydomonas 80 81 / Comprimento completo reinhardtii C'rCAH3-2 CMamydomonas 82 83 U40871 Comprimento completo reinhardtii A1CAH3 Arabidopsis thaliana 84 85 NP 001031206 Comprimento completo MtCAH3 Medicago Iruncatula 86 87 ABE93115 Comprimento completo MtCAH3-2 Medicago truneatula 88 89 ABE93118 Comprimento completo AtCAH3-2 Arabidopsis thaliana 90 91 Atlg70410 Comprimento completo OsCAH3 Otyza saliva 92 93 0s09g0464000 Comprimento completo OsCAH3-2 Oryza saliva 94 95 NP 001065776 Comprimento completo DsCAi 13 DunaIieIIa salina 96 97 AF190735 Comprimento completo DsCAI 13-2 Dunaliella salina 98 99 AAF22644 Comprimento completo CrCAH3-3 Chlamydomonas 100 101 P24258 Comprimento completo reinhardtii CrCAH3-4 Chlamydomonas 102 103 BAA14232 Comprimento completo reinhardtii PpCAII 3 Physcomitrella 104 105 CAH58714 Comprimento completo patens AtCAI 13-3 Arabidopsis thaliana 106 107 At5g 14740 Comprimento completo DsCAI 13-3 Dunaliella salina 108 109 P54212 Comprimento completo AtCAH3-4 Arabidopsis thaliana 110 111 At3g52720 Comprimento completo AtCAH3-5 Arabidopsis thaliana 112 113 At5g56330 Comprimanto completo AICAH3-6 Arabidopsis thaliana 1!4 115 At5g04180 Comprimento completo NICAH3 Nicotiana 116 117 Q84UV8 Comprimento completo langsdorffli x Nicotiana sanderae FbCAf 13 Flaveria bidentis 118 119 P46510 Comprimento completo FIvCAH3 Hordeum vulgare 120 121 P40880 Comprimento completo CrCAH3-5 Chlamydomonas 122 123 AAB19183 Comprimento completo reinhardtii OsCAH3-3 Oryza saliva 124 125 0s01g0639900 Comprimento completo AtCAH3-7 Arabidopsis thaliana 126 127 At3g0l500 Comprimento completo FpCAH3 Flaveria pringlei 128 129 P46281 Comprimento completo FICAH3 Flaveria Iinearis 130 131 P46512 Comprimento completo FbrCAH3 Flaveria brownii 132 133 P46511 Comprimento completo NpCAI 13 Nicotiana paniculata 134 135 BAA25639 Comprimento completo NtCAH 3 Nicotiana tabaeum 136 137 P27141 Comprimento completo PtCAH 3 Populus Iremula x 138 139 AAC49785 Comprimento completo Populus Iremuloides PtCAH3-2 Populus tremula x 140 141 AAB65822 Comprimento completo Populus tremuloides AtCAH3-8 Arabidopsis thaliana 142 143 ATI G23730 Comprimento completo SoCAH3 Spinaeia oleracea 144 145 P16016 Comprimento completo PsCAH3 Pisum sativum 146 147 CAA36792 Comprimento completo MtCAH3-3 Medicago Iruncatula 148 149 ABE84842 Comprimento completo MtC AH 3-4 Medieago truncatula 150 151 ABE93117 Comprimento completo AICAH3-9 Arabidopsis thaliana 152 153 At1g08080 Comprimento completo FpCAH 3-2 Flaveria pringlei 154 155 ABC41658 Comprimento completo F1CAH3-2 Flaveria Iine a ris 156 157 ABC4165 9 Comprimento completo AtCAH3-10 Arabidopsis lhaliana 158 159 Atlgl9580 Comprimento completo GhCAH3 Gossypium hirsutum 160 161 DT561379 Comprimento completo LeCAI 13 Lycopersicon 162 163 BTO143 70 Comprimento completo esculentum ZmCAI 13 Zea mays 164 165 IJ08403 Comprimento completo ZmCAI 13-2 Zea mays 166 167 U08401 Comprimento completo UpCAH3 Uroehloa panieoides 168 169 U19741 Comprimento completo UpCAH3-2 llroehloa panieoides 170 171 U19739 Comprimento completo CrCAI 13-6 Chlamydomonas 172 173 AAR82948 Comprimento completo reinhardtii C.1-CAH3-7 Chlumydomonas 174 175 AAS48197 Comprimento completo reinhardtii OsCAH3-4 Otyza saliva 176 177 AKI03904 Comprimento completo OsCAI 13-5 Oryza saliva 178 179 0s08g0470200 Comprimento completo DcCAH3 Dioscorea cayertensis 180 181 Χ76187 Comprimento completo D5CAII3 Dioscorea batatas 182 !83 AB178473 Comprimento completo DaCAH3 Dioseorea alata 184 185 AF243526 Comprimento completo OsCAI 13-6 Oryza saliva 186 187 0s08g0423500 Comprimento completo OsCAII3-7 Oryza sativa 188 189 Osl 2g0153500 Comprimento compldo AtCAH3-l 1 Arahidopsis thaliana 190 191 At4g20990 Comprimento completo AtCAl 13-12 Arabidopsis thaliana 192 193 Atlg08065 Comprimento completo AaCAH3 Adonis aestivalis 194 / Comprimento completo GmCAH3 Glyeine max 195 / Comprimento completo BnCAl 13 Rrassiea napus 196 / Comprimento completo ZmCAH3-3 Zea mays 197 / Comprimento completo TaCAI 13 Tritieum aestivum 198 / Comprimento completo GmCAI 13-2 Glyeine max 199 / Comprimento completo HvCAH3-2 Hordeum vulgare 200 / Comprimento completo ZmCAI 13-4 Zea mays 201 / Comprimento completo BnCATI3-2 Brassiea napus 202 / Comprimento completo Exemplo 15: Alinhamento de seqüências de polipeptídeos relevantes
AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 5 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados).
O resultado do alinhamento múltiplo de seqüências usando 10 polipeptídeos CAH3 tipo alfa relevantes para identificar aqueles úteis para realizar os métodos da invenção é mostrado em Figura 7. Alinhamentos múltiplos similares podem ser criados para polipeptídeos CAH3 tipo beta e gama usando as seqüências listadas em Fig. 9. Um alinhamento múltiplo de todas as seqüências de CAH3 foi usado como dado de entrada para calcular a árvore filogenética.
Exemplo 16: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.
Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2
Resultados da análise de aplicativo computacional são mostrados em Tabela Bl para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos CAH3 tipo alfa (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.
A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 16 % de identidade de aminoácidos comparada com SEQ ID NO: 81. Tabela BI: Resultados de MatGAT para similaridade e identidade global no comprimento completo das seqüências de polipeptídeos.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 I. SEQID81 28,3 27,2 25,2 29,4 24,7 25,9 25,6 26,8 28,2 27,1 18,7 24,9 24,0 24,8 16,0 23,5 23,0 18,6 19,1 19,1 2. SEQID105 43,5 29,9 32,7 33,7 27,9 30,1 31,2 31,2 33,5 31,8 19,4 30,3 29,4 33,7 22,0 25,6 23,8 15,7 17,4 17,4 3. SEQIDl 15 44,2 45,8 40,4 37,5 37,7 35,2 35,7 40,4 41,3 38,8 21,6 37,6 33,4 33,7 23,3 21,5 21,9 15,9 15,4 18,4 4. SEQID179 45,5 46,5 58,5 56,2 42,1 44,8 44,0 46,2 44,6 49,1 27,5 45,7 33,1 39,2 22,5 22,7 24,0 15,8 15,9 16,7 5. SEQID187 44,5 50,4 54,5 74,6 45,7 46,0 46,0 40,6 43,7 42,9 24,3 37,9 32,6 36,1 23,2 23,3 22,3 17,7 17,4 18,2 6. SEQID185 39,7 48,0 55,6 62,2 61,2 67,5 67,8 37,8 38,3 39,4 24,9 41,7 31,6 35,8 26,1 23,2 22,3 15,9 15,2 16,2 7. SEQID181 42,3 48,7 55,6 64,4 60,1 84,2 91,6 36,2 42,3 42,0 26,5 39,9 31,7 36,5 22,9 22,1 20,7 15,1 15,7 17,0 8. SEQID183 41,6 49,8 55,2 62,2 60,5 83,5 93,8 36,2 41,3 43,1 26,0 40,7 32,5 37,3 22,9 21,7 21,9 14,8 14,6 17,0 9. SEQIDl91 41,6 49,4 59,6 61,1 59,4 59,0 59,7 59,3 42,1 46,2 24,8 43,5 35,3 34,3 25,4 23,9 23,8 15,6 15,8 15,0 10. SEQIDl 17 44,2 50,7 59,2 65,8 60,9 59,1 62,4 60,9 64,6 46,8 27,4 40,3 34,1 34,7 22,4 18,8 18,5 15,2 15,8 16,8 11. SEQIDl53 43,9 48,0 58,8 69,5 62,0 64,7 64,4 65,5 64,4 69,1 33,8 51,8 35,3 39,0 24,7 20,9 20,7 15,6 15,9 17,0 12. SEQIDl 13 32,6 31,7 38,3 42,9 40,6 41,4 42,3 42,3 40,0 43,7 48,6 36,8 20,9 24,2 14,5 14,7 11,6 15,8 15,1 12,2 13. SEQID193 38,4 48,7 55,6 65,8 57,6 61,2 61,9 63,1 62,5 63,1 68,7 48,6 35,8 36,7 24,4 20,4 21,7 15,3 16,5 18,7 14. SEQIDl 11 41,3 45,8 54,6 53,9 54,2 54,6 51,8 52,8 54,9 57,7 57,7 40,6 54,2 36,7 27,0 18,7 21,1 14,4 14,0 15,5 15. SEQID189 41,3 46,6 55,2 59,1 54,8 55,2 54,8 54,4 53,7 55,5 56,9 36,6 52,7 56,7 41,3 22,8 22,1 16,3 17,0 20,2 16. SEQID95 28,1 32,0 39,4 40,0 35,5 40,7 39,2 39,2 40,1 36,1 38,5 23,4 38,4 39,8 48,8 15,6 15,4 13,8 14,1 13,5 17. SEQID101 36,8 38,2 36,3 37,9 37,1 34,2 35,3 33,7 33,7 34,5 32,1 30,3 33,9 33,7 35,3 23,9 91,9 16,7 19,3 19,1 18. SEQID103 36,6 35,0 38,5 38,2 36,3 32,6 34,7 34,2 34,0 35,3 34,7 24,9 34,2 35,0 37,7 24,9 95,0 16,5 19,1 19,5 19. SEQID109 27,0 23,8 24,1 23,6 25,6 22,6 24,3 23,6 23,6 24,3 26,1 25,8 24,3 23,4 25,0 19,4 27,8 28,9 43,4 32,4 20. SEQID99 26,3 26,3 27,4 25,6 26,1 24,5 25,2 24,5 23,6 24,9 27,0 24,7 25,2 25,6 26,1 19,8 31,0 29,7 60,1 31,3 21. SEQID97 26,9 26,3 30,1 28,5 28,5 25,5 28,3 27,1 27,1 26,7 27,5 24,3 27,7 29,5 27,7 19,5 33,7 33,5 46,2 46,5 184 10
15
20
Exemplo 17: Identificação de domínios compreendidos em seqüências de polipeptídeos úteis para realizar os métodos da invenção
O banco de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no European Bioinformatics Institute no Reino Unido.
Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 81 são apresentados em Tabela F2.
Tabela B2: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 81
Banco de dados Número de acesso Nome de acesso PRODOM PD000865 Q39588 CHLRE Q39588 PANTHER PTHRl 8952 CARBONIC ANHYDRASE PFAM PFOO194 Carb anhydrase PROFILE PSOO162 ALPHA CA 1 PROFILE PS51144 ALPHA CA 2 SUPERFAM1LY SSF51069 Carbonic anhydrase 25
Exemplo 18: Predição de topologia das seqüências de polipeptídeos úteis para realizar os métodos da invenção (localização subcelular, transmembrana...)
TargetP 1.1 prediz a localização subcelular de proteínas eucarióticas. A designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a predição final está baseada não são probabilidades realmente, e eles não necessariamente adicionam a uma. Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a predição. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a predição mais forte. TargetP é mantido no servidor da Technical University of Denmark.
Para as seqüências previstas conterem uma pré-seqüência N-
terminal um sítio de clivagem potencial também pode ser previsto.
Diversos parâmetros foram selecionados, tal como grupo de organismo (não planta ou planta), conjuntos de atalhos (nenhum, conjunto pré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e o cálculo de predição de sítios de clivagem (sim ou não).
Os resultados de análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 81 são apresentados em Tabela B3. O grupo de organismo “planta” foi selecionado, nenhum atalho definido, e o comprimento previsto do peptídeo de trânsito requisitado. A 15 localização subcelular da seqüência de polipeptídeo como representada por SEQ ID NO: 81 é prevista como sendo mitocondriana, mas em Chlamydomonas reinhardtii ela foi mostrada sendo uma enzima cloroplástica. O comprimento previsto do peptídeo de trânsito putativo é de 13 aminoácidos começando do término N (não tão confiável quanto a predição da própria 20 localização subcelular, pode variar em comprimento de alguns aminoácidos). Tabela B3: Análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 81
Comprimento (AA) 310 Peptídeo de trânsito cloroplástico 0,308 Peptídeo de trânsito mitocondriano 0,800 Peptídeo sinal de via secretora 0,004 Outro direcionamento subcelular 0,046 Localização Prevista mitocondriana Classe de confiança 3 Comprimento previsto de peptídeo de trânsito 13 Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:
· ChloroP 1.1 hospedado no servidor da Technical University of Denmark; • Protein Prowler Subcellular Localisation Predictor versão
1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Austrália;
• PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no servidor da University of Alberta, Edmonton, Alberta, Canadá;
• TMHMM, hospedado no servidor da Technical University
o f Denmark
Exemplo 19: Ensaio relacionado às seqüências de polipeptídeos úteis para realizar os métodos da invenção
Seqüência de polipeptídeo como representada por SEQ ID NO: 81 é uma enzima com, de acordo com Enzyme Commission (EC; classificação de enzimas pelas reações que elas catalisam), número EC 4.2.2.1 para anidrase carbônica. O ensaio funcional pode ser um ensaio para atividade CA baseado em um ensaio titrimétrico, como descrito por Karlsson et al. (Plant Physiol. 109: 533-539, 1995). Resumidamente, atividade CA é eletroquimicamente determinada medindo o tempo para que o pH diminua de 8,0 a 7,2, a 2°C, em uma amostra de 4 ml de 20 mM de tampão veronal, pH 8,3, mediante adição de 2 ml de H2O destilada congelada saturada com CO2. Um WAU (Wilbur-Anderson Unit; Wilbur and Anderson, J Biol Chem 176: 147-154, 1948; Yang et al., Plant Cell Physiol 26: 25-34, 1985) de atividade é definido como: WAU = (t0-t)/t, onde t0 é o tempo para a mudança de pH com controles de tampão e t é o tempo obtido quando amostras contendo CA são adicionadas.
Exemplo 20: Clonagem de seqüência de ácido nucleico como representada por SEO ID NO: 80
A menos que de outra maneira determinado, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrão para trabalho molecular com planta são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
O gene CAH3 de Chlamydomonas reinhardtii foi amplificado por PCR usando como modelo uma biblioteca de cDNA de Chlamydomonas reinhardtii (Invitrogen, Paisley, UK). Iniciadores prm8571 (SEQ ID NO: 207; sentido, códon de início em negrito, sítio AttBl em itálico: 5’- ggggacaagtttgtacaaaaaag caggcttaaacaatgcgctcagccgttc-3’) e prm8572 (SEQ ID NO: 208; reverso, complementar, sítio AttB2 em itálico: 5’- ggggaccactttgtacaagaaagctgggtctcactg accctagcacactc-3’), o que inclui os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão. Um fragmento de PCR compreendendo o CDS de CAH3, incluindo sítios attB, foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”, pCAH3. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 21: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada por SEQ ID NO: 80
O clone de entrada pCAH3 foi subseqüentemente usado em uma reação LR com pPCR, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável de planta; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor de protoclorofilida redutase de arroz (PcR, SEQ ID NO: 206) para expressão constitutiva foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressão
resultante pPCR::CAH3 (Figura 8) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.
Exemplo 22 Transformação de planta
Veja Exemplo 9 acima para detalhes de transformação de arroz e veja Exemplo 12 acima para detalhes de transformação de milho, trigo, soja, canola/colza, alfafa e algodão.
Exemplo 23: Procedimento de avaliação fenotípica
Veja Exemplo 10 acima para detalhes.
Exemplo 24: Resultados da avaliação fenotípica das plantas transgênicas Os resultados da avaliação de plantas transgênicas de arroz
expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção são apresentados em Tabela B4. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.
Rendimento total de sementes, número de grãos cheios, taxa
de enchimento de grãos e índice de colheita são significativamente aumentados nas plantas transgênicas expressando uma seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos).
Tabela B4: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da
Característica % de aumento em geração Tl % de aumento em geração T2 Faxa de enchimento 91 13 índice de colheita 19,4 18,3 Exemplos: CLAVATA Exemplo 25: Identificação de seqüências relacionadas à SEO ID NO: 209, SEQ ID NO: 210. SEO ID NO: 211 e SEO ID NO: 212
Seqüências de ácidos nucleicos (cDNA de comprimento completo, ESTs ou genômicas) relacionadas à SEQ ID NO: 209 ou SEQ ID NO: 211, e/ou seqüências de polipeptídeos relacionadas à SEQ ID NO: 210 e SEQ ID NO: 212 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a significância estatística de identidades. O polipeptídeo codificado por SEQ ID NO: 209 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.
Em adição às publicamente disponíveis seqüências de ácidos nucleicos disponíveis em NCBI, bancos de dados privados de seqüências também foram procurados seguindo o mesmo procedimento como descrito neste lugar acima. Tabela C fomece uma lista de seqüências de ácidos nucleicos e aminoácidos relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 211 e à seqüência de aminoácido representada por SEQ ID NO: 212. A seqüência de ácido nucleico como representada por SEQ ID NO: 5 209 está compreendida em SEQ ID NO 211. Entretanto, um códon de parada prematura foi introduzido através de PCR em posição 2251 da seqüência de ácido nucleico como representada por SEQ ID NO: 211, substituindo a A por uma T (mudando de um códon AGA para um códon de parada TGA).
Tabela C: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 211) úteis nos métodos da presente invenção, e os
polipeptídeos deduzidos correspondentes.
Nomc Oreanismo fonte Aeido Polipeptídeo Número Estado Arath CLAVATAl Arabidopsis thaliana 212 213 ATU96879 Comprimento completo Brana LRR-RLK Brassica napus 214 215 AY283519 Comprimento completo Eucgr LRR-RLK Eucalvptus grandis 216 217 AAA79716 Comprimento completo Glyma CLVlA GIycine max 218 219 AF197946 Comprimento completo Glyma NARK GIyeine max 220 221 AF197947 Comprimento completo CLVlB Lotja IlARl Lotus japonicus 222 223 AB092810.1 Comprimento completo Medtr SUNN Medieago Iruneatida 224 225 ΛΥ769943 Comprimento completo Orysa FONl Oiyza sativa 226 227 AB1823 88 Comprimento completo Pissa SYM29 Pisuni sativa 228 229 PSA495759 Comprimento completo Poptr LRR-RLK I Populus tremuloides 230 231 scaff 1514.1 Comprimento completo Poptr LRR-RLK II Populus tremuloides 232 233 scaff 11.178 Comprimento completo Zeama K IN 5 Zea mays - 234 Bommert et al. Comprimento completo tipo Ipoba CLVl Ipomoea batatas 235 236 ΛΒ162660.1 Parcial Exemplo 26: Alinhamento de seqüências de polipeptídeos relevantes
AlignX do Vetor NTI (Invitrogen) é baseado no popular algoritmo Clustal de alinhamento progressivo (Thompson et al. (1997) 15 Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos estão alinhados). 20 O resultado do alinhamento múltiplo de seqüências usando
polipeptídeos relevantes para identificar aqueles úteis para realizar os métodos da invenção é mostrado em Figura 11. As seguintes características são identificadas, de término N a término C:
- um peptídeo sinal previsto (identificado como em Exemplo
30);
- Motivo 1 como representado por SEQ ID NO: 237
- Motivo 2 como representado por SEQ ID NO: 238, compreendendo um par de cisteínas conservado;
- um domínio de repetição rica em leucina (LRR), compreendendo 21 LRRs (veja Exemplo 28);
- um segundo par de cisteínas conservado;
- um domínio transmembrana previsto (identificado como em
Exemplo 30);
- um domínio de quinase, compreendendo 11 subdomínios conservados (veja Exemplo 28); dentro deste domínio de quinase, o sítio ativo
de quinase previsto é identificado.
Exemplo 27: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção
Porcentagens globais de similaridade e identidade entre seqüências de polipeptídeos de comprimento completo úteis para realizar os 20 métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; aplicativo computacional hospedado 25 por Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.
Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2
Resultados da análise de aplicativo computacional são mostrados em Tabela Cl para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.
A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 51 % de identidade de aminoácidos comparada com SEQ ID NO: 212.
Tabela Cl: Resultados de MatGAT para similaridade e identidade global no
comprimento completo das seqüências de polipeptídeos.
1 2 3 4 5 6 7 8 9 10 11 12 I. Arath CLAVATA1VFL 87,1 61,8 61,6 60,3 60,2 61,2 55,9 60,9 68,2 66,7 54,2 2. Brana RLK 92,6 60,8 61,2 60,4 60,8 59,9 55,6 61 69,2 67,5 54,1 3. Eucgr RLK 76,8 75,1 59,7 58,8 60,8 58,6 53,4 58,8 63,2 62,7 53,3 4. Glyma NARK CLVlB 75.3 75,9 74.5 90,2 78 75,2 53,5 74,6 64,6 63,5 53,5 5. Glyma RLK CLVlA 75,6 75,5 73,9 94,3 77 75,1 52,8 74,7 63,8 63 52,4 6. Lotja RLK\HAR1 76,8 77,1 74,8 88 86 79,2 52,9 78 64,9 64,9 52,8 7. Medtr SUNN 75,5 75,2 73,9 85,1 84,6 88,1 52 86,2 63,5 64,2 52 8. Orysa FON1 70,7 71 69,5 67,8 67,9 69,1 67,7 51.9 55,8 56,2 77,2 9. Pissa LRR-RLK 75,5 74,8 74,3 85 84,5 88 91,9 66,8 64 64,2 51 10. Poptr RLKM 80,9 81,3 77,1 78,9 77,9 77,8 77 71,1 77,4 86,8 54,6 11. Poptr RLKMI 79,8 80,5 76,7 77,8 77 78,2 77,1 71,3 76,5 92,2 55,1 12. Zeama K1N5 69,7 68,8 68,7 67,4 66,9 68,1 66,9 85,9 66,2 71,5 70,7 Exemplo 28: Identificação de domínios compreendidos em seqüências de
polipeptídeos úteis para realizar os métodos da invenção
O banco de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica 5 sobre proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE (acessos PS), TrEMBL, PRlNTS (acessos PR), ProDom (acessos PD) e Pfam (acessos PF), Smart (acessos SM), e TIGRFAMs. InterPro é hospedado no European Bioinformatics Institute no Reino 10 Unido.
Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 212 são apresentados em Tabela C2 e em Figura 11. O domínio de repetição rica em leucina compreende um total de 21 cópias in tandem de repetições ricas em leucina 15 (LRRs) de 23-25 resíduos de aminoácidos de comprimento, e é flanqueado por pares de resíduos de cisteína espaçados necessários para ligação dissulfeto com outras proteínas (por exemplo com Clavata 2). Baseado na classificação de Shiu e Bleecker (2001) Proc Natl Acad Sc 98(19): 10763-10768), a seqüência de polipeptídeo como representada por SEQ ID NO: 212 pertence à 20 subfamília LRR XI. O domínio LRR é seguido por um domínio transmembrana previsto correspondendo aos resíduos de aminoácidos 641 a 659 na seqüência de polipeptídeo como representada por SEQ ID NO: 212 (veja Exemplo 30). Depois do domínio transmembrana está o domínio de quinase intracelular compreendendo os 11 subdomínios característicos com 25 todos os resíduos de aminoácidos invariantes conservados em comparação com outras proteínas quinases eucarióticas (Hank and Quinn 1 (1991) Methods Enzymol 200:38-62). Um sítio ativo de quinase também é previsto durante a varredura de InterPro.
Tabela C2: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 212
Número de acesso de Números de acesso Nome de acesso InterPro integrado IPR000719 PD000001 Proteína quinase PF00069 PS50011 IPROO1245 SM00219 Tirosina proteína quinase IPROOl611 PR00019 Repetição rica em Leucina PF00560 IPR002290 SM00220 Serina/treonina proteína quinase IPR003591 SM00369 Repetição rica em Leucina, subtipo típico IPR008271 PS00108 Serina/treonina quinase, sítio ativo IPROl 1009 SSF56112 Tipo proteína quinase 1PR013210 PF08263 Repetição rica em Leucina, N-terminal Exemplo 29: Predição de sítios de fosforilação compreendidos nas seqüências de polipeptídeos úteis para realizar os métodos da invenção
O estado de fosforilação/desfosforilação do polipeptídeo como representado por SEQ ID NO: 212 está diretamente relacionado à ativação/inativação do polipeptídeo (Trotochaud et al., (1999) Plant Cell 11: 393-405). Uma proteína fosfatase, KAPP, se liga de uma maneira 'dependente de fosforilação ao domínio de quinase de SEQ ID NO: 212, com isso inativando a transdução de sinal. Substituindo os aminoácidos fosforiláveis pelo domínio de quinase de aminoácidos não fosforiláveis, a atividade da seqüência de polipeptídeo como representada por SEQ ID NO: 212 é abolida. E possível identificar sítios de predição de fosforilação de serina (S), treonina (T) e tirosina (Y) usando algoritmos tal como NetPhos 2.0, hospedado no servidor da Technical University of Denmark. O servidor NetPhos 2.0 produz previsões de redes neurais para sítios de fosforilação de serina, treonina e tirosina em proteínas eucarióticas.
Os resultados de análise NetPhos 2.0 da seqüência de polipeptídeo como representada por SEQ ID NO: 212 são apresentados abaixo. O domínio de quinase de SEQ ID NO: 212 foi sublinhado, e sítios de 20 fosforilação S, T, e Y preditos compreendidos dentro deste domínio foram encaixotados. Estes podem ser mutados para aminoácidos não fosforiláveis por técnicas bem conhecidas na arte, tal como mutagênese dirigida por sítio. Seqüência de polipeptídeo de SEQ ID NO: 212
MAMRLLKTHLLFLHLYLFFSPCFAYTDMEVLLNLKSSMIGPKGHGLHDWIHSSSPDAHCSFSGVSCDDDARVISLNVSFT 80
PLFGTISPEIGMLTHLVNLTLAANNFTGELPLEMKSLTSLKVLNISNNGNLTGTFPGEILKAMVDLEVLDTYNNNFNGKL 160
PPEMSELKKLKYLSFGGNFFSGEI PESYGDIQSLEYLGLNGAGLSGKSPAFLSRLKNLREMYIGYYNSYTGGVPREFGGL 2 40
T KLEIL DMAS CTLT GE I PTSLSNLKHLHTLFLHINNLTGHIPPELSGLVSLKSLDLSINQLTGEI PQS FINLGNI TL INL 320
FRNNLYGQI PEAIGELPKLEVFEVWEINNFTLQLPANLGRNGNLI KLDVSDNHLTGLI PKDLCRGEKLEMLILSNNFFFGP 400
IPEELGKCKSLTKIRIVKNLLNGTVPAGLFNLPLVTIIELTDNFFSGELPVTMSGDVLDQIYLSNNWFSGEIPPAIGNFP 480
NLQTLFLDRNRFRGNIPREIFELKHLSRINTSANNITGGIPDSISRCSTLISVDLSRNRINGEIPKGINNVKNLGTLNIS 5 60
GNQLTGSIPTGIGNMTSLTTLDLSFNDLSGRVPLGGQFLVFNETSFAGNTYLCLPHRVSCPTRPGQTSDHNHTALFSPSR 64 0
IVITVIAAITGLILISVAIRQMNKKKNQKSLAWKLTAFQKLDFKSEDVLECLKEENIIGKGGAGIVYRGSMPNNVDVAIK 720
RLVGRGTGRSDHGFT AEIQTLGRIRHRHIVRLLGYVANKDTNLLLYEYMPNGSLGELLHGSKGGHLQWETRHRVAVEAAK 800
GLC YLHHDCS PLILHRDVKSNNILLDSDFEAHVADFGLAKFLVDGAASECMSSIAGS YGYIAPEYA YTLKVDEKSDVYSF 880
GVVLLELi AGKKPVGEFGEGVDIVRWVRNTEEEITQPSDAAIVVAIVDPRLTGYPLTSVIHVFKIAMMCVEEEAAARPTM 960 RE V VHMLTN P PKS VANLIAF 1040
Sítios de fosforilação preditos correspondentes
........................Y...........S................S..........S..............................80
......................................S..................................................................................160
...........Y.S............SY................S. .S................................................................240
...................S.............................S............................................................320
.....Y....................................................................................................................................................400
.............................................S...............Y....................................480
..........................S. ..T.............S. .S.......S................................................560
.......................S..........................................TS........S. . . 640
.....................................................................S....................720
......T...........................Y..........................................................................................800
...............................................S................Y. .T......S..........880
.............................T.....................T..........................T. 960
S..............1040
Ser Thr Tyr Sítios de fosforilação preditos 22 7 7 Sítios de fosforilação preditos 3 5 2 compreendidos no domínio de quinase Exemplo 30: Predição de topologia das seqüências de polipeptídeos úteis para realizar os métodos da invenção (localização subcelular, transmembrana...)
TargetP 1.1 prediz a localização subcelular de proteínas 5 eucarióticas. A designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a predição final está baseada não são probabilidades realmente, e eles não necessariamente adicionam a uma.
Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a predição. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a predição mais forte. TargetP é mantido no servidor da Technical University of Denmark.
Para as seqüências previstas conterem uma pré-seqüência N- terminal um sítio de clivagem potencial também pode ser previsto.
Diversos parâmetros foram selecionados, tal como grupo de organismo (não planta ou planta), conjuntos de atalhos (nenhum, conjunto pré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e o cálculo de predição de sítios de clivagem (sim ou não).
Os resultados de análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 212 são apresentados em Tabela C3. O grupo de organismo “planta” foi selecionado, nenhum atalho definido, e o comprimento previsto do peptídeo de trânsito requisitado. A localização subcelular da seqüência de polipeptídeo como representada por SEQ ID NO: 210 é a via secretora (retículo endoplasmático ou ER), e o comprimento previsto do peptídeo sinal é de 24 aminoácidos começando do término N (não tão confiável quanto a predição da própria localização subcelular, pode variar em comprimento de alguns aminoácidos).
Tabela C3: Análise 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 210
Comprimento (AA) 980 Peptídeo de trânsito cloroplástico 0,001 Peptídeo de trânsito mitocondriano 0,113 Peptídeo sinal de via secretora 0.973 Outro direcionamento subcelular 0,018 Localização Prevista Secretora (retículo endoplasmático ou ER) Classe de confiança 1 Comprimento de peptídeo sinal previsto 24 Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:
• ChloroP 1.1 hospedado no servidor da Technical University of Denmark;
• Protein Prowler Subcellular Localisation Predictor versão 1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Austrália;
• PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no servidor da University of Alberta, Edmonton, Alberta, Canadá;
· TMHMM, hospedado no servidor da Technical University
of Denmark. O resultado de algoritmo TMHMM2.0 na seqüência de polipeptídeo de SEQ ID NO: 212 é dado na Tabela C4 abaixo. Duas regiões hidrofóbicas são identificadas, que correspondem a: (i) um peptídeo sinal para direcionamento subcelular de ER; e (ii) um domínio transmembrana.
Tabela C4: Resultado de algoritmo TMHMM2.0 na seqüência de polipeptídeo de SEQ ID NO: 212
Posição relativa à membrana Aminoácidos de término N Domínio correspondente na plasmática a término C de SEQ ID seqüência de polipeptídeo de SEQ NO: 212 ID NO: 212 Seqüência fora de célula 1-640 Domínio LRR extracelular Hélice transmembrana 641-659 Domínio transmembrana Seqüência dentro de célula 660-980 Domínio de quinase intracelular Exemplo 31: Ensaio relacionado às seqüências de polipeptídeos úteis para realizar os métodos da invenção, e métodos de interromper a função biológica do domínio C-terminal
Em uma primeira etapa, atividade dos polipeptídeos úteis para
realizar os métodos da invenção é identificada por sua capacidade de se ligar a seus interactores naturais, tal como em Trotochaud et al. (1999; Plant Cell 11: 393-406), usando os métodos descritos neste. Um ensaio de atividade de CLVl é verificar a interação física de KAPP com o domínio de quinase do polipeptídeo CLVl usando o sistema de dois híbridos de levedura.
Em uma segunda etapa, os polipeptídeos CLVl identificados são tornados úteis para os métodos da invenção interrompendo a função biológica do domínio C-terminal. Tais métodos (para interromper a função biológica) são bem conhecidos na arte e incluem: remoção, substituição e/ou 25 inserção de aminoácidos do domínio C-terminal. Um ou mais aminoácido(s) do domínio C-terminal pode(m) ser removido(s), substituído(s) e/ou inserido(s), normalmente usando técnicas baseadas em PCR, por exemplo:
(i) remoção, substituição e/ou inserção de aminoácidos compreendendo todo ou parte do domínio C-terminal (neste exemplo particular (i), adotado para significar a seqüência de aminoácidos seguindo a
seqüência de aminoácidos codificando o domínio transmembrana (de término N a término C)); ou
(ii) substituir aminoácidos conservados (tal como o sítio ativo de quinase como mostrado em Figura 2 e Exemplo 28 (envolvido em sítio de ligação de ATP de substrato), ou o G conservado em subdomínio IX de
quinase (envolvido em autofosforilação), ou as cisteínas conservadas no segundo par (envolvido em homo e heterodimerização)) por alanina, etc.; ou
(iii) inserir aminoácidos no sítio ativo de quinase, por exemplo, para interromper ligação de substrato;
(iv) substituir aminoácidos fosforiláveis (tal como serina, treonina ou tirosina) por aminoácidos não fosforiláveis (para interação com
outras proteínas, por exemplo);
(v) ou qualquer outro método para interromper a função biológica conhecido na arte.
Um exemplo de interrupção da função biológica do domínio 20 C-terminal de um polipeptídeo CLVl compreende introduzir um códon de parada prematura (no iniciador reverso, SEQ ID NO: 240) através de PCR em posição 2251 da seqüência de ácido nucleico como representada por SEQ ID NO: 211, substituindo a A por uma T (mudando um códon AGA para um códon de parada TGA).
Exemplo 32: Clonagem de seqüência de ácido nucleico como representada por SEO ID NO: 209
A menos que de outra maneira determinado, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratoiy Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, CuiTent Protocols. Materiais e métodos padrão para trabalho molecular com planta são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
A seqüência de ácido nucleico de Arabidopsis thaliana codificando o polipeptídeo CLVl com um domínio não funcional de SEQ ID NO: 210 foi amplificado por PCR usando como modelo uma biblioteca de cDNA de plântulas de Arabidopsis thaliana (Invitrogen, Paisley, UK). Os seguintes iniciadores os quais incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR:
1) prm8591 (SEQ ID NO: 239; sentido, códon de início em negrito, sítio AttBl em itálico):
5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgatgagacttttgaag-
3’;e
2) prm8592 (SEQ ID NO: 240; reverso, complementar, sítio AttB2 em itálico):
5 ’-ggggaccactttgtacaagaaagctgggtcgctacgtaaccaagaagtcac-3 ’).
PCR foi realizado usando Hifl Taq DNA polimerase em condições padrão. Um fragmento de PCR foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®. Exemplo 33: Construção de vetor de expressão usando a seqüência de ácido nucleico como representada por SEQ ID NO: 209
O clone de entrada contendo a seqüência de ácido nucleico codificando o polipeptídeo CLYl de SEQ ID NO: 210 foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável de planta; uma 5 gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor de beta-expansina de arroz (SEQ ID NO: 241) para expressão em tecidos jovens em expansão, foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressão
resultante compreendendo a seqüência de ácido nucleico para o promotor de beta-expansina promoter antes da seqüência de ácido nucleico codificando Arath_CLVl com um domínio C-terminal não funcional (Figura 12) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.
Exemplo 34 Transformação de planta
Veja Exemplo 9 acima para detalhes de transformação de arroz e veja Exemplo 12 acima para detalhes de transformação de milho, trigo, soja, canola/colza, alfafa e algodão.
Exemplo 35: Procedimento de avaliação fenotípica
Veja Exemplo 10 acima para detalhes.
Exemplo 36: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção são apresentados em Tabela C5. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.
Biomassa aérea, biomassa total de raízes, biomassa de raízes finas, número de panículas primárias, número de flores por panícula, rendimento total de sementes, número de grãos cheios, número total de sementes, e índice de colheita são significativamente aumentados nas plantas transgênicas expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos).
Tabela C5: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da
invenção.
Característica % de aumento em geração T1 Biomassa aérea 5 Biomassa total de raízes 2 Biomassa de raízes finas 2 Número de panículas primárias 8 Número de flores por panícula 6 Rendimento total de sementes 9 Número de grãos cheios 12 Número total de sementes 14 índice de colheita 5 TKW -3 I LISTAGEM DE SEQÜÊNCIAS
110> CropDesign N.V.
<120> Plantas tendo características relacionadas ao rendimento
melhoradas e um método para fazer as mesmas
<130> PF58581
<150> EP 06124785.4
<151> 2006-11-24
<150> US 60/868,381
<151> 2006-12-04
<150> EP 06125156.7
<151> 2006-11-30
<150> US 60/883,166
<151> 2007-01-03
<150> EP 06126018.8
<151> 2006-12-13
<150> US 60/883,170
<151> 2007-01-03
<160> 241
<170> PatentIn version 3.3 <210> 1 <211> 945 <212> DNA
<213> Arabidopsis thaliana <4 00> 1
atggatccca agaacctaaa tcgtcaccaa gtaccaaatt tcttgaaccc accaccacca ccgcgaaatc agggtttggt agatgatgat gctgcttctg ctgttgtttc cgacgagaat cgcaaaccaa caactgagat taaagatttc cagatcgtgg tctctgcttc cgacaaagaa ccaaacaaga agagtcagaa tcagaaccag cttggtccta agagaagctc taacaaagac agacacacta aagtcgaagg tagaggtcga cgaattcgga tgcctgctct ttgtgctgct aggatttttc aattgactag agaattgggt cataaatctg atggtgaaac tatccagtgg ctgcttcaac aagctgagcc atcgattatt gcagctactg gttcaggaac tataccggcc tctgctttag cttcttcagc tgcaacctct aaccatcatc aaggtgggtc tcttactgct ggtttaatga tcagtcatga cttagatggt gggtctagta gtagtggtag accattaaat tgggggattg gtggcggtga aggagtttct aggtcaagtt taccaactgg gttatggcca aatgtagctg ggtttggttc tggtgtgcca accactggtt taatgagtga aggagctggt tatagaattg ggtttcctgg ttttgatttt cctggtgttg gtcatatgag ttttgcatct attttgggtg ggaatcataa tcagatgcct ggacttgagt taggcttgtc tcaagaaggg aatgttggtg ttttgaatcc tcagtctttt actcagattt atcaacagat gggtcaggct caggctcaag ctcaaggtag ggttcttcac catatgcatc ataaccatga agaacatcag caagagagtg gtgagaaaga tgattctcaa ggctcaggtc gttaa 945
<210> 2 <211> 314 <212> PRT
<213> Arabidopsis thaliana <4 00> 2
Met Asp Pro Lys Asn Leu Asn Arg His Gln Val Pro Asn Phe Leu Asn 10 15
Pro Pro Pro Pro Pro Arg Asn Gln Gly Leu Val Asp Asp Asp Ala Ala 20 25 30
Ser Ala Val Val Ser Asp Glu Asn Arg Lys Pro Thr Thr Glu He Lys 35 40 45
Asp Phe Gln He Val Val Ser Ala Ser Asp Lys Glu Pro Asn Lys Lys 50 55 60
Ser Gln Asn Gln Asn Gln Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp 65 70 7 5 80
Arg His Thr .Lys Val Glu Gly Arg Gly Arg Arg He Arg Met Pro Ala 8 5 90 95
Leu Cys Ala Ala Arg He Phe Gln Leu Th.r Arg Glu Leu Gly His Lys 100 105 110
Ser Asp Gly Glu Thr He Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser 115 120 125
60 120 180 240 300 360 420 480 540 600 6 60 720 780 840 900 Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala Leu Ala 130 135 140 Ser Ser Ala Ala Thr Ser Asn His His Gln Gly Gly Ser Leu Thr Ala 145 150 15 5 160 Gly Leu Met Ile Ser His Asp Leu Asp Gly Gly Ser Ser Ser Ser Gly 165 170 175 Arg Pro Leu Asn Trp Gly Ile Gly Gly Gly Glu Gly Val Ser Arg Ser 180 185 190 Ser Leu Pro Thr Gly Leu Trp Pro Asn Val Ala Gly Phe Gly Ser Gly 195 200 205 Val Pro Thr Thr Gly Leu Met Ser Glu Gly Ala Gly Tyr Arg Ile Gly 210 215 220 Phe Pro Gly Phe Asp Phe Pro Gly Val Gly His Met Ser Phe Ala Ser 225 230 235 240 Ile Leu Gly Gly Asn His Asn Gln Met Pro Gly Leu Glu Leu Gly Leu 245 250 255 Ser Gln Glu Gly Asn Val Gly VaI Leu Asn Pro Gln Ser Phe Thr Gln 260 265 270 Ile Tyr Gln Gln Met Gly Gln Ala Gln Ala Gln Ala Gln Gly Arg Val 275 280 285 Leu His His Met His His Asn His Glu Glu His Gln Gln Glu Ser Gly 290 295 300 Glu Lys Asp Asp Ser Gln Gly Ser Gly Arg 305 310
<210> 3 <211> 732 <212> DNA
<213> Arabidopsis thaliana <4 00> 3
atggtcatgg agcccaagaa gaaccaaaat ctaccaagtt tcttaaaccc atcacgacag aatcaggaca acgacaagaa gaggaaacaa acagaggtta aaggtttcga cattgtggtc ggcgaaaaga ggaagaagaa ggagaatgaa gaggaagacc aagaaattca gattctttat gagaaggaga agaagaaacc aaacaaagat cgtcacctta aagttgaagg aagaggtcgt agagttaggt tacctccact ctgtgcagca aggatttatc aattgactaa agaattaggt cacaaatcag atggtgagac tcttgaatgg ttgcttcaac atgctgagcc atcgatactc tctgctactg taaatggtat caaacccact gagtctgttg tttctcaacc tcctctcacg gctgatttga tgatttgtca tagcgttgaa gaagcttcaa ggactcaaat ggaggcaaat gggttgtgga gaaatgaaac aggacagacc attggagggt ttgatctgaa ttacggaatt gggtttgatt tcaatggtgt tccagagatt ggttt.tggag ataatcaaac gcctggactt gaattaaggc tgtctcaagt tggggttttg aatccacagg tttttcaaca aatgggtaaa gaacagttca gggttcttca tcatcattca catgaagatc agcagcagag tgcagaggaa aatggttcat aa 732
<210> 4 <211> 243 <212> PRT
<213> Arabidopsis thaliana <4 00> 4
Met Val Met Glu Pro Lys Lys Asn Gln Asn Leu Pro Ser Phe Leu Asn 1 5 10 15 Pro Ser Arg Gln Asn Gln Asp Asn Asp Lys Lys Arg Lys Gln Thr Glu 20 25 30 Val Lys Gly Phe Asp Ile Val Val Gly Glu Lys Arg Lys Lys Lys Glu 35 40 45 Asn Glu Glu Glu Asp Gln Glu Ile Gln Ile Leu Tyr Glu Lys Glu Lys 5 0 55 60 Lys Lys Pro Asn Lys Asp Arg His Leu Lys Val Glu Gly Arg Gly Arg 65 70 75 80 Arg Val Arg Leu Pro Pro Leu Cys Ala Ala Arg Ile Tyr Gln Leu Thr 8 5 90 95 Lys Glu Leu G1 y His Lys Ser Asp Gly Glu Thr Leu Glu Trp Leu Leu 100 105 110 Gln His Ala Glu Pro Ser Ile Leu Ser Ala Thr Val Asn Gly Ile Lys 115 120 125
60
120
180
240
300
360
420
480
540
600
660
720 Pro Thr Glu Ser VaI Val Ser Gln Pro Pro Leu Thr Ala Asp Leu Met 130 135 140 Ile Cys His Ser Val Glu Glu Ala Ser Arg Thr Gln Met Glu Ala Asn 145 150 155 160 Gly Leu Trp Arg Asn Glu Thr Gly Gln Thr Ile Gly Gly Phe Asp Leu 165 170 175 Asn Tyr Gly Ile Gly Phe Asp Phe Asn Gly Val Pro Glu Ile Gly Phe 180 185 190 Gly Asp Asn Gln Thr Pro Gly Leu Glu Leu Arg Leu Ser Gln Val Gly 195 200 205 Val Leu Asn Pro Gln Val Phe Gln Gln Met Gly Lys Glu Gln Phe Arg 210 215 220 Val Leu His His His Ser His Glu Asp Gln Gln Gln Ser Ala Glu Glu 225 230 235 240 Asn Gly Ser <210> 5 < 211> 930 <212> DNA
<213> Aquilegia formosa χ Aquilegia pubescens <400> 5
atggatgatc ttaagaattc atcaaagcaa ccacaagaag tagtaacaag tttcttgaga
cattcttcac aacaagagat gggaggagga ggaggagaga ataaacaaac agaaatcaga
gattttcaaa tctcaacagt tgttgcagat aaagatggtg gtaagaagca gttagcacca
aaaagaactt caaataaaga tagacatact aaggtagatg gaagaggtag aaggataagg
atgccagctt tatgtgcagc tagaattttt cagttaacaa gagaattggg tcataaatct
gatggagaaa ctatacaatg gttattacaa catgctgaac catcaataat tgccgctaca
ggtactggaa ctataccagc ttcagcttta gttcaatcta gtagctcagt ttcacaacag
gggaattctg tttcagttgg tttacaaaca aagatcagtg aattgggaca tgaaattggg
tccagtagta gtaggaccaa ttggaatttg gttagatccc cagtaacaac aagtttatgg
ccctctgtca gtggttatgt accagggttt catccttctt caggccaacc gacatcgaat
ctgagtagtg atggtttgaa ttatttgcct aaattcggta ttcatggttt cgaaatgcct
ggatcaaatt taggtacaat gaatttaaat tcattcatgg gggttggtaa taatcaacaa
cttcctggat tggaattagg attatctcaa gatgtgcata ccggggtatt gaatcctcaa
gctttacagt tttatcagca gatggttcaa tcaagaggag ttgtcatgca tcaacaacag
cagcaccagc aacaacaaca acaacaacag cagcagcagc agcaaccaca tgatgatgat
gaggatgatt ctcaaggttc aagacattaa 930 <210> 6 <211> 309 <212> PRT
<213> Aquilegia formosa x Aquilegia pubescens <4 00> 6
Met Asp Asp Leu Lys Asn Ser Ser Lys Gln Pr o Gln Glu Val Val Thr 1 5 10 15 Ser Phe Leu Arg His Ser Ser Gln Gln Glu Met Gly Gly Gly Gly Gly 20 25 30 Glu Asn Lys Gln Thr Glu Ile Arg Asp Phe Gln Ile Ser Thr Val Val 35 40 45 Ala Asp Lys Asp GSly Gly Lys Lys Gln Leu Ala Pro Lys Arg Thr Ser 50 55 60 Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg 65 70 75 80 Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu 85 90 95 Gl y His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln His Ala 100 105 110 Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser 115 120 125 Al a Leu Val Gln Ser Ser Ser Ser Val Ser Gln Gln Gly Asn Ser Val 130 13 5 140 Ser Va 1 Gly Leu Gln Thr Lys Ile Ser Glu Leu Giy His Glu IIe GIy 145 150 155 160 Ser Ser Ser Ser Arg Thr Asn Trp Asn Leu VaI Arg Ser Pro Val Thr 165 170 175
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900 Thr Ser Leu Trp Pro Ser Val Ser Gly Tyr Val Pro Gly Phe His Pro 180 185 190 Ser Ser Gly Gln Pro Thr Ser Asn Leu Ser Ser Asp Gly Leu Asn Tyr 195 200 205 Leu Pro Lys Phe Gly Ile His Gly Phe Glu Met Pro Gly Ser Asn Leu 210 215 220 Gly Thr Met Asn Leu Asn Ser Phe Me t: Gly Val Gly Asn Asn Gln Gln 225 230 235 240 Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Val His Thr Gly Val 245 250 255 Leu Asn Pro Gln Ala Leu Gln Phe Tyr Gln Gln Met Val Gln Ser Arg 260 265 270 Gly Val Val Met His Gln Gln Gln Gln His Gln Gln Gln Gln Gln Gln 275 280 285 Gln Gln Gln Gln Gln Gln Gln Pro His Asp Asp Asp Glu Asp Asp Ser 290 295 300
Gln Gly Ser Arg His 305
<210> 7 <211> 1038 <212> DNA <213> Glycine max <4 00> 7
atggatccca agggctcaaa gcagcagcca cagcaatcac aggaggtggt accaaacttc ctcagcctcc cccaacagca acaagggaat accaacaaca acaacatggg agagaacaaa cctgcagagg tgaaggattt ccagatagtg gtagctgaga acaaggaaga gagcaagaaa cagcagcaac agttggcacc aaagaggagt tccaacaagg acaggcacac caaggttgaa ggcaggggaa ggaggataag gatgcctgct ctctgcgcag ccagaatctt ccagttgacc agggaattgg gtcacaaatc tgatggggaa accatccagt ggctcctcca gcaggctgag ccatccatca tagctgccac tgggactggc acaataccag catctgctct tgctgctgct ggaaactcac tctcaccaca agctgcttct ctttcatcat ccttgcacca acatcaacaa aagattgatg aattgggtgg gtcagggggg agtagtagta gggccagctg gcaaatggtt ggggggaatt tggggagacc ccatttgggt gtgggtgtgg ccacagcagc aggcctatgg ccccctcatg tcagtggatt tggatttcaa acaccaccaa caacaacaac accaacaaca acaacatcat catctggtcc atctaatgcc accttagcca ctgagagctc caattacctt cagaaaattg cattccctgg ctttgacttg cctacttctg ccactaacat gatgggtcac atgagtttca cctcaatttt gggtggaggt gggggtggtg gggcccagca tatgcctggc ttggagcttg gtctttccca ggatggccat attggggtgt tgaatcaaca ggccttgaac cagatttatc agcagatgaa tcaggctggt agagtgcatc atcatcagca tcagcatcat catcagcatc atcagcagca acaacaccat cagcaaactc ctgctaagga tgattctcaa ggctcaggag gacagtag 1038
<210> 8 <211> 345 <212> PRT <213> Glycine max <4 00> 8
Met Asp Pro Lys Gly Ser Lys Gln Gln Pro Gln Gln Ser Gln Glu Val 1 5 10 15 Val Pro Asn Phe Leu Ser Leu Pro Gln Gln Gln Gln Gly Asn Thr Asn 20 25 30 Asn Asn Asn Met Gly Glu Asn Lys Pro Ala Glu Val Lys Asp Phe Gln 35 4 0 4! c; Ile Val Val Ala Glu Asn Lys Glu Glu Ser Lys Lys Gln Gln Gln Gln 50 5 5 60 Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu 65 70 7 5 80 Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile 8 5 90 95 Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile 100 10 5 110 Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly 115 120 125 Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala Ala Gly Asn Ser Leu 60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020 130 135 140
Ser Pro Gln Ala Ala Ser Leu Ser Ser Ser Leu His Gln His Gln Gln 145 150 155 160 Lys Ile Asp Glu Leu Gly Gly Ser Gly Gly Ser Ser Ser Arg Ala Ser 165 170 175 Trp Gln Met Val Gly Gly Asn Leu Gly Arg Pro His Leu Gly Val Gly 180 185 190 Val Ala Thr Ala Ala Gly Leu Trp Pro Pro His Val Ser Gly Phe Gly 195 200 205 Phe Gln Thr Pro Pro Thr Thr Thr Thr Pro Thr Thr Thr Thr Ser Ser 210 215 220 Ser Gly Pro Ser Asn Ala Thr Leu Ala Thr Glu Ser Ser Asn Tyr Leu 225 230 235 240 Gln Lys Ile Ala Phe Pro Gly Phe Asp Leu Pro Thr Ser Ala Thr Asn 245 250 255 Met Met Gly His Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Gly Gly 260 265 270 Gly Gly Ala Gln His Met Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp 275 280 285 Gly His IIe Gly Val Leu Asn Gln GIn AIa Leu Asn Gln Ile Tyr Gin 290 295 300 Gln Met Asn Gln Ala Gly Arg Val His His His Gln His Gln His His 305 310 315 320 His Gln His His Gln Gln Gln Gln His His Gln Gln Thr Pro Ala Lys 325 330 335 Asp Asp Ser Gln Gly Ser Gly Gly Gln 340 345
<210> 9 <211> 903 <212> DNA
<213> Gossypium hirsutum <4 00> 9
atggatccca agggcgccaa gcagcctcca gaggaagtag ccaacttgtt gagcctgcca ccccaacccc aacagcaaca gcctcaaaac atgggagaga ataaagcagc agaaatcaag gatttccaga ttgtggttgc agataaagga gaagggaaga agcaacagtt ggccccaaag agaagttcta acaaagacag gcacaccaaa gttgaaggaa gaggtagaag gataaggatg cctgctttat gtgctgctag aatctttcag ttgaccaggg aattgggtca caagtctgat ggggaaacca tacagtggct gttacaacaa gctgaaccat ccataattgc cgccactggg agcggaacaa ttccagcatc agctttggct gcagctggag gctcagtttc acagccaggg gcctctctat cagcagggtt gcaccaaaag atggaagatt taggggggtc cagtataggg tcagggagca gtaggaccag ttggacaatg gttggtggca atttgggaag accccatcat gtggcgaccg ggttatggcc accagtcagt ggttttgggt ttcagtcatc atctggtccg tctacaacaa atttaggcag tgatagttcc aattatctgc aaaagcttgg gtttccaggt tttgatttgc cagctagtaa catgggtcag ataagtttca cctcaatctt gggcggagct aatcagcagc tcccgggttt ggaacttggg ttatctcaag atggtcatat tggggtctta aatcctcatg ctttgaacca gatttatcag cagatggagc aagctcggat gcaaccccaa catcagcatc agcaccagca acaaccccct gctaaggatg actcccaagg atcgggccag taa 903
<210> 10 <211> 300 <212> PRT
<213> Gossypium hirsutum <4 00> 10
Met Asp Pro Lys Gly Ala Lys Gln Pro Pro Glu Glu Val Ala Asn Leu 1 5 10 15 Leu Ser Leu Pro Pro Gln Pro Gln Gln Gln Gln Pro Gln Asn Met Gly 20 25 30 Glu Asn Lys Ala Ala Glu Ile Lys Asp Phe Gln Ile Val Val Ala Asp 35 40 4 5 CO Gly Glu Gly Lys Lys Gln Gln Leu Ala Pr ο Lys Arg Ser Ser Asn 5 0 5 5 60 Lys Asp Arg His Thr Lys Val Glu Gily Arg Gly Arg Arg Ile Arg Met 65 7 0 7 5 8 0
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900 Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly 85 90 95 His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu 100 105 110 Pro Ser Ile Ile Ala Ala Thr Gly Ser Gly Thr Ile Pro Ala Ser Ala 115 120 125 Leu Ala Ala Ala Gly Gly Ser Val Ser Gln Pro Gly Ala Ser Leu Ser 130 135 140 Ala Gly Leu His Gln Lys Met Glu Asp Leu Gly Gly Ser Ser Ile Gly 145 150 155 160 Ser Gly Ser Ser Arg Thr Ser Trp Thr Met Val Gly Gly Asn Leu Gly 165 17 0 175 Arg Pro His His Val Ala Thr Gly Leu Trp Pro Pro Val Ser Gly Phe 180 185 190 Gly Phe Gln Ser Ser Ser Gly Pro Ser Thr Thr Asn Leu Gly Ser Asp 195 200 205 Ser Ser Asn Tyr Leu Gln Lys Leu Gly Phe Pro Gly Phe Asp Leu Pro 210 215 220 Ala Ser Asn Met Gly Gln Ile Ser Phe Thr Ser Ile Leu Gly Gly Ala 225 230 235 240 Asn Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His 245 250 255 Ile Gly Val Leu Asn Pro His Ala Leu Asn Gln Ile Tyr Gln Gln Met 260 265 270 Glu Gln Ala Arg Met Gln Pro Gln His Gln His Gln His Gln Gln Gln 275 280 285 Pro Pro Ala Lys Asp Asp Ser Gln Gly Ser Gly Gln 290 295 300 <210> 11 <211> 819 <212> DNA <213> Lycopersicon esculentum <4 00> 11 atggatccca aacaggctaa ccacaacaat attaagccta
ttgcagattt tgaaaaatga tgaaacgaac aaggtggctg
catacaaaag ttgaaggtag agggaggaga atacgtatgc
atcttccagc ttacgcgcga attgggtcat aaatctgatg
ctgcagcaag ccgagccttc gattattgct gctactggca
gctttagctg cagcagcctc tgtttctcaa caggggatct
attgaatcgg gggcgaatat cgcggggtct ggtagcagta
aattggccaa tgatctgtgg gaattttgga agaccccatt
cctgcccctg cccctgttgt cactagtttt gggtttcaat
gcgagtttag gtagtgatag ttcaaattat tacttacaga
gatctgcctg cagctacaag tatgaatccg atgtgtttta
aatcagcaac tgccaggatt ggaactggga ttatctcaag
aaccagatat accagcaggc aagaatgcaa catccgcagc
caatctccgg aggaggattc tcaaggatca ggacattaa <210> 12 <211> 272 <212> PRT
<213> Lycopersicon esculentum <4 00> 12
ctcatgatca
ctcccaaaag
cggcgctctg
gtgagacaat
cagggacaat
ctgtatcagc
gaagtagtaa
tggctacagc
cctcatctgc
aaattgggtt
cttcaattct
agggtcattt
agcaacatca
gataaaagag
aaaagatagg
tgcagcaaga
tcagtggctg
acctgcctcg
tggtttaatg
tagtaggacc
aggaatgtgg
tccatcaagc
tcctggattt
tggtggaagt
aggggttttg
3.C3.3.C3.3.C3.3
819
Met Asp Pro Lys Gln Ala Asn His Asn Asn Ile Lys Pro Thr His Asp 1 5 10 15 Gln Ile Lys Glu Leu Gln Ile Leu Lys Asn Asp Glu Thr Asn Lys Val 20 25 30 Ala Ala Pro Lys Arg Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly 35 40 45 Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu 50 5 5 60 Thr Arg Glu Ijeu Gly Hi. s Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu 65 7 0 75 80 Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr 60
120
180
240
300
360
420
480
540
600
660
720
780 85 90 95
Ile Pro Ala Ser Ala Leu Ala Ala Ala Ala Ser Val Ser Gln Gln Gly 100 105 110 Ile Ser Val Ser Ala Gly Leu Met Ile Glu Ser Gly Ala Asn Ile Ala 115 120 125 Gly Ser Gly Ser Ser Arg Ser Ser Asn Ser Arg Thr Asn Trp Pro Met 130 135 140 Ile Cys Gly Asn Phe Gly Arg Pro His Leu Ala Thr Ala Gly Met Trp 145 150 155 160 Pro Ala Pro Ala Pro Val Val Thr Ser Phe Gly Phe Gln Ser Ser Ser 165 170 175 Al a Pro Ser Ser Ala Ser Leu Gly Ser Asp Ser Ser Asn Tyr Tyr Leu 180 185 190 Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Ala Thr Ser Met 195 200 205 Asn Pro Met Cys Phe Thr Ser Ile Leu Gly Gly Ser Asn Gln Gln Leu 210 215 22 0 Pro Gly Leu Glu Leu Gly Leu Ser Gln Glu Gly His Leu Gly Val Leu 225 230 235 240 Asn Gln Ile Tyr Gln Gln Ala Arg Met Gln His Pro Gln Gln Gln His 245 250 255 Gln Gln Gln Gln Gln Ser Pro Glu Glu Asp Ser Gln Gly Ser Gly His 260 265 270
<2 10> 13 <211> 966 <212> DNA
<213> Malus domestica <400> 13
atggatccca agggctcaaa gcagacacaa gacataccca gcttcttgag ccttccccca 60 caatcacaac cacaacctga gcagcagcag caaccacaac aacaacctca acccaacaac 120 aacatgagcg acaacaaacc tgctgaaatc aaagacttcc agattgtaat cgccgacaaa 180 gatgagtcgg gaaagaagca gttggcgccc aagagaagct ccaacaaaga cagacacact 240 aaagtcgaag gcaggggaag gaggatacgg atgccggccc tctgcgccgc cagaatcttt 300 caattgacca gagagttggg tcacaaatcc gatggggaaa caatccagtg gctcctccag 360 caggccgagc cgtcgattgt tgccaccacc gggaccggga cgattccggc gtcggctttg 420 gcggcggcag gtggctctgt ttcgcaacag gggacttctt tatcagctgg attgcaccaa 480 aagatcgatg aattgggggg gtccagtggg ggtaggacca gttgggcaat ggtgggcggg 540 aatttgggga gaccccatgt ggcaggggtg ggcgggctat ggccccctgt cagtagcttt 600 gggttccagt catcatctgg tcctccatcg gccaccacaa atctgggcac tgagagttca 660 aattacctgc aaaaaattgg gtttcctggc tttgacttgc ctgtctctaa catgggtccg 720 atgagtttta cttcaatttt gggtgggggc aatcagcagc agcagcagca gcttcctggg 780 ttggaacttg ggttgtcaca ggatggacat attggggttc tgaactctca ggctttgagc 840 cagatttacc agcagatggg gcatgttaga gtgcaccagc agccgccgca gcaccaccac 900 cagcaacacc accaccacca gcagcaaccg ccttccaagg acgattctca aggatccgga 960 cagtag 966
<210> 14 <211> 321 <212> PRT
<213> Malus domestica <4 00> 14
Met Asp Pro Lys Gly Ser Lys Gln Thr Gln Asp Ile Pro Ser Phe Leu 1 5 10 15 Ser Leu Pro Pro Gln Ser Gln Pro Gln Pro Glu Gln Gln Gln Gln Pro 20 25 30 Gln Gln Gln Pro Gln Pro Asn Asn Asn Met Ser Asp Asn Lys Pro Ala 35 40 45 Glu Ile Lys Asp Phe Gln Ile Val Ile Ala Asp Lys Asp Glu Ser Gly 50 55 60 Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr 65 7 0 75 80 Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala 85 9 0 95 Ala Arg Ile Phe Gln Leu Thr Arg G Iu Leu Gly His Lys Ser Asp Gly 100 105 110
Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu
115 120 125 Thr Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala
130 135 140
Gly Ser Val Ser Gln Gln Gly Thr Ser Leu Ser
145 150 155 160
Lys Ile Asp Glu Leu Gly Gly Ser Ser Gly Gly
165 170 175
Met Val Gly Gly Asn Leu Gly Arg Pro His Val
180 185 190
Leu Trp Pro Pro Val Ser Ser Phe Gly Phe Gln
195 200 205
Pro Ser Ala Thr Thr Asn Leu Gly Thr Glu Ser
210 215 220
Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Val
225 230 235 240
Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Asn
245 250 255
Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser Gln
260 265 270
Val Leu Asn Ser Gln Ala Leu Ser Gln Ile Tyr
275 280 285
Val Arg Val His Gln Gln Pro Pro Gln His His
290 295 300
His His Gln Gln Gln Pro Pro Ser Lys Asp Asp
Pro Ser Ile Leu Ala Ala Ala Gly Leu Arg Thr Ser Ala Gly Val Ser Ser Ser Ser Asn Tyr Ser Asn Met Gln Gln Gln Asp Gly His Gln Gln Met His Gln Gln Ser Gln Gly
Val Ala Ala Gly His Gln Trp Ala Gly Gly Gly Pro Leu Gln Gly Pro Gln Gln Ile Gly Gly His His His Ser Gly
305 Gln <210> <211> <2 12> <213> <400>
310
315
320
15 855 DNA
Medicago truncatula 15
atggatccca aaaactcaaa gcaacaatca caactctcaa tcagagacaa aaaatcttca aattgtgtta tctgaaacaa aaacaactag caccaaaaag aacatcaaac aaagacagac ggaagaagaa taaggatgcc agctttatgt gcagcaagaa ttaggtcata aatcagatgg tgaaacaatt caatggcttt atcatagctg caacaggaac aggaacaata ccagcttcag actttgacac cacaaggttc atctttgtct tctggtttac tgggctcaga cccatcaagc ccatcaggcc catcagggcc ttatggccac atcatcatgt tggtggattt ggatttcatc ttagtagcta ctactgttgg tgaaaataat agtggaaatt tctggatttg atatgccaac aggaacaaat ttgggagtgg attttggggg gtgcaaatca gcagatgcct ggtttggaat catattggtg tgttgaatca acaagcttta actcagattt caaactaggg ttcagcacca gaatcagcag aataataata agttcagaac agtag E
<210> 16 <211> 284 <212> PRT
<213> Medicago truncatula <4 00> 16
Met Asp Pro Lys Asn Ser Lys Gln Gln Ser Gln
10 15
Glu Asn Lys Glu Ser Glu Thr Lys Asn Leu Gln
25 30
Thr Thr Thr Lys Asp Glu Thr Lys Lys Gln Leu
40 45
Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly
50 55 60
Arg Met Pro Ala Leu Gys Ala Ala Arg Ile Phe 65 7 0 7 5 8 0
acatgggaga caacaaaaga acacaaaagt tctttcagct tacaacaatc ctttagcttc agttgaatga atcatgttag aatcatcatc attttcagaa gagggatgag tagggttgtc atcagcagat ctactaagga 55
gaacaaagaa tgaaacaaag tgaaggaaga aacaagagag tgaaccatca ttctggtaat taggaatact ttctacaagt atctggtggt aattgggttt ttttacttca acaagatgga tggtcaaaat tgattctcac
Leu Ser Asn Met Gly Ile Val Leu Ser Glu Ala Pro Lys Arg Thr Arg Gly Arg Arg Ile Gln Leu Thr Arg Glu
60 120 180 240 300 360 420 480 540 600 660 720 780 840 Ile Gln
Gly Thr
Leu Thr
Arg Asn
Leu Gly His Lys Ser Asp Gly
85 90
Ser Glu Pro Ser Ile Ile Ala
100 105
Ser Ala Leu Ala Ser Ser Gly
115 120
Leu Ser Ser Gly Leu Gln Leu
135 140
Ala His Gln Ala His Gln
150 155
Pro His His His Val Gly Gly 165 170 175
Gly Gly Leu Val Ala Thr Thr 185 190
Gln Lys Ile Gly Phe Ser Gly Phe
200 205
Gly Val Gly Gly Met Ser Phe Thr
130 His Gln 145
Leu Trp Ser Ser
Glu Thr 95
Ala Thr 110 Asn Thr 125
Asn Asp
Gly
His 160 Phe
Val
His Gly Gly
Asn
Thr
180 Tyr Phe 195 Asn
Leu
210 Ala Asn 225 His
Ile
Ile Gly
Gln
Gly 245 Gln
215 Gln Met 230 Val
Pro
Leu
Asn
260 Thr Thr
Asn
Lys
17
275 <210> <211> <212> <2 13> <4 00> atggatccca gttgagtaca caattggttc cgtatgcctg tctgatggag accgggacag tcccaacaga aatatagtcg atgatgattg actcctgttg ttgggtagtg cctgcagcca ccaggtttgg ggcttgagcc catgagcatc <210> <211> <2 12> <213>
Asn 250 Gln Thr
265 Asp Asp 280
220 Gly Leu 235
Gln Gln Arg Val
Ser
Glu
Ala 255 Gln 270 His Ser
Leu 240 Leu
Gly
Thr
His Gln
Ser Glu
Trp Leu Gly Thr Pro Gln Thr Trp Val Ser Phe His Glu Asn Asp Met Ser Ile Leu Ser Gln Ile Asn Gln Gln
Leu Gln Gln Ile Pro Ala Gly Ser Ser Ala Gln Thr Ser Thr Ser Gln Ser Ser Asn Ser Gly Pro Thr Gly Leu Gly Gly Gln Asp Gly Tyr Gln Gln Gln Asn Asn
Pro
5 Ile
<4 00> Met Asp 1
Asn Asn 20
Asp Asp Glu
35 Arg His 50
Leu Cys 65
Ser Asp
DNA
Nicotiana benthamiana
17
agcagccgcc agcgcagtct ataagcctgt tcatgatcaa ctaaaagaaa agataggcac ctctttgcgc tgctaggatt agacaatcca gtggctgctg ggaccatccc tgcctcggct ggacctctgt atctgctggt ggtccgctag tatatgtagt ggaattttgg aagaccccat tcaatagttt cgcgttacag aaagttccaa ttattaccta ccaatatgag ttttacttca agcttggatt atctcaagac agatatacca ggctagaatt tatctcccga ggatgattct
18 295 PRT
Nicotiana benthamiana 18
Lys Gln
aacgctatca ataaaagatg acaaaagttg ttccaactca cagcaagccg ttagctgtag ttgcataaaa agtagtagta ttggccacag acagcactga caaaagattg attctaggtt aggggtcata cataatcaac cacggatcag
acattaacaa atgaaaccaa aaggcagagg cccgcgaatt agccctccat cagccgctgg aaatggatga ctagtagggc caggaatatg ctcctggatc gctttcctgg ccagtaataa taggggtttt agcagcacca gacactaa
caatattatg gaagcggcag gaggaggata aggtcataaa atttgcggcc cccctctgtt attgggagcg cagttggcca gcccggacct aagcaccaat atttgatctg ccagcaattg aaactctcaa gcaaaatcag
Pro Pro Ala Gln Ser Asn 15
Met Val Glu Tyr Asn Lys Pro Val
30
Thr Lys Lys Arg Gln Gln Leu Val
40 45
Lys Val Glu Gly Arg Gly Arg Arg
55 60
Ala Arg Ile Phe Gln Leu Thr Arg 70 75 80
Gly Glu Thr Ile Gln Trp Leu Leu Gln 85 90 95
Thr
Ala
Ala Ile Asn Ile Asn His Asp Gln Ile Lys Pro Lys Arg Lys Asp Ile Arg Met Pro Ala Glu Leu Gly His Lys Gln Ala Glu Pro Ser
60 120 180 240 300 360 420 480 540 600 660 720 780 840 Ile Phe Ala Ala Thr Gly Thr Gly Thr Ile Pro
100 105 110
Val Ala Ala Ala Gly Pro Ser Val Ser Gln Gln
115 120 125
Ala Gly Leu His Lys Lys Met Asp Glu Leu Gly
130 135 140
Ser Ala Ser Ile Cys Ser Ser Ser Ser Thr Ser
145 150 155 160
Met Met Ile Gly Asn Phe Gly Arg Pro His Leu
165 170 175
Trp Pro Gly Pro Thr Pro Val Val Asn Ser Phe
180 185 190
Leu Thr Pro Gly Ser Ser Thr Asn Leu Gly Ser
195 200 205
Tyr Leu Gln Lys Ile Gly Phe Pro Gly Phe Asp
210 215 220
Asn Met Ser Phe Thr Ser Ile Leu Gly Ser Ser
225 230 235 240
Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Arg
245
250
255
Leu Asn Ser Gln Gly Leu Ser Gln Ile Tyr Gln
260 265 270
Gln Gln Gln His Gln Gln Asn Gln His Glu His
275 280 285
Asp Ser His Gly Ser Gly His
290 295
<210> 19 <211> 894 <212> DNA
<213> Ocimum basilicum <400> 19
atggatccga agagctcgaa gcagccgcag gaggtttcga ttaggcgaaa acaaagcagc ggaaatcaag gattttcaga gattcgaaga agctagccct agctccgaag cgaagctcca gtggaaggcc gcggccggcg aattcggatg ccggcgctct ttgacccgag aattagggca caaatccgat ggcgagacca gccgagccgt cgatcatcgc cgccacgggg agcggcacca gcagccgccg gctcgatttc tcagcaaggt agctcgattt atcgaggatt taggcgcttc tatgggtggt ggtgggggca ggtgggaatc tgagtagacc acatgtgggc gcaagcacag ttcggcttcc agacggcgtc gtcttcttcc tcgtctggtc cctaattatc tccagaaaat ggggtttgct ggatttgagc atgagtttca cctccatctt aagcggcggc gggcagcagc ctttcacaag atggaaatat tggggttttg aatccgcaag cagattaatc cggcggcgcg tgtggttaac gcacatcaaa catcagcagc cattgtcgtc gaaagatgat gattctcaag <2 10> 20 <211> 297 <212 > PRT
<213> Ocimum basilicum <4 00> 20
Met Asp Pro Lys Ser Ser Lys Gln Pro Gln Glu
10 15
Asn Thr Asn Ser Leu Gly Glu Asn Lys Ala Ala
25 30
Gln Ile Val Val Ala Glu Lys Asp Asp Ser Lys
40 45
Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr
50 55 60
Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala 65 7 0 7 5 8 0
Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly 85 90 95
Ala Ser Arg Thr Ala Asn Arg Ala Ala Thr Ala Leu Glu Ser Leu Pro Asn Asn Gly His Ala Arg Leu Ser
Ala Leu Ala Ser Val Ser Ile Val Gly Ser Trp Pro Ala Gly Ile Gln Thr Ala Ser Asn Tyr Ala Ala Thr Gln Gln Leu Ile Gly Val Ile His Asn Pro Glu Asp
atcacagcaa ttgtagttgc acaaggaccg gcgccgccag tccagtggct tccccgcctc cgtctggact ggaatccctg gattatggcc cgtcaatcgc tgcccgggaa tgcccggatt cttttgggca atcaccacca aatcaggaca
caccaacagc ggagaaggat ccacaccaag aatcttccaa cctccagcaa cgccctcgcc ccatcagaaa gcctatgatt tcccactgga ggcggagaat tatcgggcag ggagctcggc gatttatcag acaacaccac gtag 8Í
Val Ser Asn His Ser Glu Ile Lys Asp Phe Lys Leu Ala Leu Ala Lys Val Glu Gly Arg Ala Arg Ile Phe Gln Glu Thr Ile Gln Trp
60 120 180 240 300 360 420 480 540 600 660 720 780 840 Leu
Thr
Gln
Leu Gln 100 Ile Pro 115
Gly Ser
Gln
Ala
Ser
Ala Glu
105 Ser Ala 120
Ile Ser
130
135
Pro
Leu
Ser 14
Ser Ile Ile Ala 110
Ala Ala Ala Ala 125
Gly Leu His Gln
Gly Ala Ser Met Gly Gly Gly Gly Gly Arg Asn
145
Gly Gly Asn 165
Pro Pro Thr 180
Gly Pro Ser 195
Phe Ala Gly 210
150 Leu
Gly
Ile
Phe
Ser Arg 170 Phe Gly
185 Ala Ala 200
Glu Leu
155 Pro
Phe
Glu
Pro
160
His Val Gly Ala 175
Gln Thr Ala Ser 190
Asn Pro Asn Tyr 205
Gly Asn Ile Gly
215
220
Ser Ile Leu Ser Gly Gly Gly Gln Gln Leu Pro 225 230 235 240
Leu Ser Gln Asp Gly Asn Ile Gly Val Leu Asn
Gln
Gln
245 Ile Tyr 260 Asn His 275
Gln
His
250 Gln Ile
265 Gln Gln 280
Asn
His
255 Pro Ala
270 His His 285
Ala Arg
Gln Gln
Asp Asp Asp Ser Gln Glu Ser Gly Gln
290 <210> <21i> <212> <213> <4 00>
295
<210> <2 11> <212> <213> <400> Met Asp 1
sativa
Thr
Gln
22 317 PRT Oryza 22
Pro Lys Phe 5
Thr Thr 20 His Arg 35
Thr Thr 25
Leu Gln 40
Pro 10 Asn
Ile
Pro
Gln
Gln 45
Pro Pro 15
Gln His 30
Val His
Pro Leu
His His
Pro Gln
Asp Gly Gly Gly Gly Gly Gly Lys Asp GJ.η Gln
50 55 60
Gln Val Val Val Ala Ala Ala Ala Gly Glu Arg 65 7 0 7 5 8 0
Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg His
Ala Thr Gly Ser Lys Ile Pro Trp Ser Thr Ser Ser Leu Gln Gln Met Gly Leu Pro Gln Va1 Val Pro Leu
Gly Ser Gly Ile Ser Gln Glu Asp Leu Pro Met Ile Gly Leu Trp Ser Ser Ser Lys Met Gly Ser Phe Thr Glu Leu Gly Ala Phe Gly Asn Ala His Ser Ser Lys
21 954 DNA
Oryza sativa 21
atggacccca aattcccccc acccccaccg ctaaacaaaa accaaccagc agcatcacca cgatgagcag cagcagcagc catcctcagc agcaggagca gcaggatgga ggtggaggag cagcagcaga tgcaggtggt ggttgcggcg gcggcggggg gggccgaagc ggagctcgaa caaggaccgc cacaccaagg atccggatgc cggcgctgtg cgccgcccgg atcttccagc aagtccgacg gcgagaccgt ccagtggctg ctccagcagg gccacgggga ccgggaccat cccggcgtcc gcgctcgcct tcccccaact ccgccctctc caggtcgcac caccaccacc ccgcccacgg cgtccgccgg gttcgccggt gcagggttct atcggcggga tcatgcagcg gatggggatc cccgccggga gcgggggggt tggggggtgg gggtggcggc ggcggtggcc ttcgccagcc acgcggcggc ggcggcggcc atgccggggc gacggccaca tcggcgtgct cgccgcgcag tcgctcagcc gccgccggtc agctgcagca ccagcaccag catcaccatc gacggggagg acaaccgcga cgacggcgag tccgatgagg
cggagcccac atcgcctcca gagggaagga agaggaggat tggacgggcg tcacgcggga cggagccggc ccgtcgcccc accacatgtg ccggcgccga tcgagctcca acatcgggtt tagagctagg agttctacca agcagcagca agtccgggca
caccaccacc 60
gattcaagtt 120
tcagcagcag 180
gcaggggcta 240
ggggcggcgg 300
gctcggccac 360
catcgtcgcc 420
ctccctccct 480
ggcggcagcg 54 0
ctccggggtg 600
gggcggggga 660
cgcgcccatg 720
gctctcgcag 780
ccaggtcggc 840
gcagcagcag 900 gtag 954
Asn Lys Thr GJ.u Pro
Asp Glu Gln Gln Gln
Gln Gln Glu Gln Gln
Gln Gln Gln Gln Met
Arg Met Gln Gly Leu
Thr Lys Val Asp Gly Arg Gly Arg Arg 100
Gln Leu Thr
115 Trp Leu
130 Gly Thr 145 Ser
Arg
Leu Gln
90
Ile Arg
105 Glu Leu 120 Gln
Met
Pro
Trp Ala
Ile
Asn 165 Ala
135 Pro Ala 150
Ser Ala Ala Pro
Ala
Ser
Leu 170 Pro
Gly
125 Glu Pro
140 Ala Leu 155
Ser Arg Thr Ala
95
Pro Ala 110 His Lys
Leu
Ser
Cys Asp
Ala Ile Val
Ala
Ser 175 Ser
Ser 160 His
Val
His
Ala Gly
Phe
Gly
180 Ser Gly 195
Ile Pro
Ala
Ala
185 Asp Ser 200
Gly Ile
210
215
190
Gly Val Ile Gly Gly 205
Glu Leu Gln Gly Gly 220
Gly Gly Gly Gly Gly Gly Gly Gly Gly His Ile
225 Phe
Ala
Ser 245 Leu Ser 260
Gln Phe 275
Gln His 290 Asn Arg Asp 305
Gly
Ser
His
230 His
Gln
Tyr
Ala Ala 250 Asp Gly
265 His Gln 280 His
<210> <211> <212> <213> <4 00> atggatccca acccaccctt catagccaaa tttcagattg tcaaacaaag ctttgtgcag acaatacagt actatacctg ctttctgctg agttgggcaa tggcccccag acaaatatag tttccagggt ggtgggggta ggggttttga caccagcagc tga
His
295 Asp Gly 310
23 963 DNA
Populus 23
agggctctaa ctcctcctca accaacaaca tagtagctga acagacacac cgagaatctt ggcttctaca catcagcttt gtttgcatca tgttaggtgg ttggaggtta ggactgaagc ttgacttgcc cccagcagtt gtccacaagc agcatcagca
235 Ala
His
Val
Gln Gln
Ala Ala 255 Ile Gly
270 Gly Ala 285 Gln
240
Ala
Met
Val Leu
Ala Gly
Gln Gln Gln
Glu
300 Ser Asp 315
Glu Glu Ser
Ala Ala Gly Glu Ala Ala Ala Pro His His Phe Ala Ile Met Gly Ala Gly Phe Pro Gly Ala Ala Gln Leu Gln Asp Gly Gln
Arg Ile Phe Thr Val Gln Thr Gly Thr Ser Leu Pro His His Met Gly Ala Gly Gln Arg Met Gly Gly Leu Ala Pro Met Leu Glu Leu Gln Ser Leu Gln His Gln Gly Glu Asp
tremuloides
ctcaaaaaac tcctcctcca acccaacatg caaagaagag aaaagttgaa tcaattgaca acaagctgaa agcagctgct aaagattgat caatttaggg tgggttccag tgctgctgct gggtaacaac accaggattg tttgaatcag acaaaatcct
ccacatgagt caacctcatc ggagacaaca caaaagaaac ggtagaggta agagaattgg ccatctataa ggcggtgcaa gatttaggtg agaccccatc tcatcatcta ggtggttcta atggggccta gaacttgggt atttatcagc tctaaagatg 963
tacccacttt ttcaacaacc aaccagcaga agttagcacc gaaggataag gtcacaaatc ttgcagcaac tttcacaaca ggtccagtag atgttactac attccactgg gttatttgca tgagttttac tgtcacagga agatggggca attcacaagg
cttgacccac acaacaactc aatcaaagac aaagagaagc gatgccagct tgatggagag tgggactggt aggagcttct tagtagggcc tgcaggatta tccatcaaca aaaactcggg ttcaatttta cgggcatatt tgctagagtg atcaggccag
<210> <211> <212> <2 13> <4 0 0> Met Asp
24
320
PRT
Populus 24
tremuloides
1
Phe His
Pro
5
Leu Thr 20 Leu Gln 35
Lys Gly
His
Gln
Thr 25 Pro 40
Ser 10 His
Gln
Asn Ser Lys 15
Ser Pro
Pro
30 Leu
Asn Met Gly Asp Asn Lys
Gln
45
Pro Ala
Asn Pro His Glu Leu Pro Thr
Pro His Pro Pro Pro Gln Pro
His Ser Gln Asn Gln Gln Gln Pro
Glu Ile Lys Asp Phe Gln Ile Val
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 50 55 60 Val Ala Asp Lys Glu Glu Gln Lys Lys Gln Leu Ala Pro Lys Arg Ser 65 7 0 75 80 Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg Gly Arg Arg Ile 85 90 95 Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu 100 105 110 Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln 115 120 125 Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala 130 135 1' 10 Ser Ala Leu Ala Ala Ala Gly Gly Ala Ile Ser Gln Gln Gly Ala Ser 145 150 155 160 Leu Ser Ala 165 Gly Leu His 170 Gln Lys Ile 175 Asp Asp Leu Gly Gly Ser Ser Ser Ser Arg Ala Ser Trp Ala Met Leu Gly Gly Asn Leu Gly Arg Pro 1! 30 lí 35 190 His His Val Thr Thr Ala Gly Leu Trp Pro Pro Val Gly Gly Tyr Gly 195 200 205 Phe Gln Ser Ser Ser Asn Ser Thr Gly Pro Ser Thr Thr Asn Ile Gly 210 215 220 Thr Glu Aia Ala Ala Ala Gly Gly Ser Ser Tyr Leu Gln Lys Leu Gly 225 230 235 240 Phe Pro Gly 245 Phe Asp Leu 250 Pro Gly Asn 255 Asn Met Gly Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Gly Thr Gln Gln Leu Pro Gly Leu Glu Leu 260 265 270 Gly Leu Ser Gln Asp Giy His Ile Giy Val Leu Ser Pro Gin Ala Leu 275 280 285 Asn Gln Ile Tyr Gln Gln Met Gly His Ala Arg Val His Gln Gln Gln 290 295 300 His Gln Gln Gln Asn Pro Ser Lys Asp Asp Ser Gln Gly Ser Gly Gln 305 310 315 320 <210> 25 <2 11> 933 <212 > DNA <213> Saccharum officinarum <220> <221> mi sc feature <222> (699 ) · · ( 701) <223> η é a, c / ou t <4 00> 25
atggacccca agttccccac acccccaccg ctaaacaaaa cggagcccac caccgcgacg 60
accaccacca ccacctcgac cgcgcagcag ctggatccta aggactacca gcagcagcag 12 0
ccggcgcagc accacctgca aatccaaatc caccagccgc cgcagcagga cgggggcggc 180
ggagggaagg agcaacagca gcagctgcag gtggtggcgc agcccgggga gcggaggcag 2 4 0
cagccgctcg cgcccaagcg gagctccaac aaggaccgcc acaccaaggt cgatggcagg 300
ggccgccgga tccggatgcc cgcgctgtgc gccgcgcgga tcttccagct cacgcgggag 360
ctcggccaca agtccgacgg cgagaccgtg cagtggctgc tgcagcaggc cgagccggcc 420
atcgtcgccg ccaccggcac gggcaccata ccggcgtccg cgctcgcatc cgtcgcgccc 480
tcgctcccgt cgcccacctc cgggctcgcc aggccgcacc accaccacca tccgcaccac 540
atgtgggcgc cttccgccgc gtccgcgggt ttctcctcgc cctccttcct caattccgcc 600
gccgcaggca cgggagacgc cgctggtatc ggcggcatca tgcagcggat ggggatcccc 660
gcgggcctcg agctgccggg agggggcgcc gctggggcnn ncggctttgc gcccatgttc 720
gctgaacacc ccgcggccat tccggggctc gagcttgccc tctcgcagga cggccacatc 780
gggttgctcg ccgcgcagtc gatcacccag ttctaccacc aggtgggtgc tgccggcggc 840
agcggccaga tgcagcaccc tcacggccac cagcaggagg acggggagga cgaccgcgag 900 qacggcgagt ccgatgatga gtctgggcag tag 933 <210> 26 <211> 310 <212> PRT
<213> Saccharum officinarum < 2 2 0 > <2 21> INCERTO <222> (234 ) . . (234)
<223> Xaa pode ser qualquer aminoácido oco <4 00> 26
Met Asp Pro Lys Phe Pro Thr Pro Pro Pro Leu
10 15
Thr Thr Ala Thr Thr Thr Thr Thr Thr Ser Thr
25 30
Pro Lys Asp Tyr Gln Gln Gln Gln Pro Ala Gln
40 45
Gln Ile His Gln Pro Pro Gln Gln Asp Gly Gly
50 55 60
Gln Gln Gln Gln Leu Gln Val Val Ala Gln Pro 65 70 75 80
Gln Pro Leu Ala Pro Lys Arg Ser Ser Asn Lys
85 90 95
Val Asp Gly Arg Gly Arg Arg Ile Arg Met Pro
100 105 110
Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His
115 120 125
Thr Val Gln Trp Leu Leu Gln Gln Ala Glu Pro
130 135 140
Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala Leu 145
Ser Leu
His
Ser
Pro 165 Pro His 180
150
Ser Pro
155 160
Thr Ser Gly Leu Ala Arg 170 175
His Met Trp Ala Pro Ser Ala Ala 185 190
Pro Ser Phe Leu Asn Ser Ala Ala Ala Gly 195 200 205
Gly Ile Gly Gly Ile Met Gln Arg Met: Gly Ile
210 215 220
Leu Pro Gly Gly Gly Ala Ala Gly Ala Xaa Gly 225 230 235 240
Ala Glu His Pro Ala Ala Ile Pro Gly Leu Glu
245 250 255
Asp Gly His Ile Gly Leu Leu Ala Ala Gln Ser
260 265 270
His Gln Val Gly Ala Ala Gly Gly Ser Gly Gln
275 280 285
Gly His Gln Gln Glu Asp Gly Glu Asp Asp Arg
290 295 300
Asp Asp Glu Ser Gly Gln 305 310
<210> 27 <211> 846 <212> DNA
<213> Solanum tuberosum <4 00> 27
atggatccca agcagcctaa caacaaaaat ttgcagattt tgaaaaatga tgaaaccaag aaagataggc ataccaaagt tgaaggtaga gcagcaagaa tctttcaact tacgcgcgaa cagtggctgc tgcagcaagc cgagccttcg cctgcatcgg ctttagctgc agcagcatct ggtttaatga ttgaatcggg ggcgaatatc agtaggacca attggccaat gatctgtggg aattttggaa ggaatatggc ctgcccctgc ccctgttgtc actagttttg ccatcaagcg ccagtttaga cagtgaaagt cctggatttg atctgcctgc agctacaaat ggtggaagta accagcaact gccaggattg ggggttttga accagatata ccagcaggaa gatcagcatc agcatcagca tcaacaacaa
rrendo naturalmente Asn Lys Thr Glu Pro Ala Gln Gln Leu Asp His His Leu Gln Ile Gly Gly Gly Lys Glu Gly Glu Arg Arg Gln Asp Arg His Thr Lys Ala Leu Cys Ala Ala Lys Ser Asp Gly Glu Ala Ile Val Ala Ala Ala Ser Val Ala Pro Pro His His His His Ser Ala Gly Phe Ser Thr Gly Asp Ala Ala Pro Ala Gly Leu Glu Phe Ala Pro Met Phe Leu Ala Leu Ser Gln Ile Thr Gln Phe Tyr Met Gln His Pro His Glu Asp Gly Glu Ser
attaagccta aaacagcagc gggaggagga ttgggtcata attattgctg gtttctcaac gcggggtcag
tcaaactatt atgaatccta gagcttggat agaatgcaac tctccggagg
ctcatgatca aggtggctgc tacgtatgcc aatctgatgg ctactggcac aggggatctc gtagcagtag gaccccattt ggtttcagtc acttacagaa tgagttttac tatctcaaga atccgcagca atgattctca
gataaaagac tcctaaaaga tgctctatgt tgagacaatt agggacaatt tgtatcagct aagtagtaat ggctacagta ctcatct gct aattgggttt: ttcaattctt gggtcattta gcaacaacaa aggatcagga
60 120 180 240 300 360 420 480 54 0 600 660 720 780 840 cattaa 846
<210> 28 <211> 2.81 <212> PRT
<213> Solanum tuberosum <4 00> 28
Met Asp Pro Lys Gln Pro Asn Asn Lys Asn Ile
10 15
Gln Ile Lys Asp Leu Gln Ile Leu Lys Asn Asp
25 30
Gln Gln Val Ala Ala Pro Lys Arg Lys Asp Arg
40 45
Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu
50 55 60
Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser 65 70 75 80
Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile
85 90 95
Thr Gly Thr Ile Pro Ala Ser Ala Leu Ala Ala
100 105 110
Gln Gln Gly Ile Ser Val Ser Ala Gly Leu Met
115 120 125
Asn Ile Ala Gly Ser Gly Ser Ser Arg Ser Ser
130 135 140
Trp Pro Met Ile Cys Gly Asn Phe Gly Arg Pro
145
150
155 160
Gly Ile Trp Pro Ala Pro Ala Pro Val Val Thr
165 170 175
Ser Ser Ser Ala Pro Ser Ser Ala Ser Leu Asp
180 185 190
Tyr Tyr Leu Gln Lys Ile Gly Phe Pro Gly Phe
195 200 205
Thr Asn Met Asn Pro Met Ser Phe Thr Ser Ile
210 215 220
Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser 225 230 235 240
Gly Val Leu Asn Gln Ile Tyr Gln Gln Glu Arg
245 250 255
Gln Gln Gln Gln Asp Gln His Gln His Gln His
260 265 270
Glu Asp Asp Ser Gln Gly Ser Gly His
275 280
<210> 29 <211> 978 <212> DNA
<213> Sorghum bicolor <400> 29
atggacccca agttccccac acccccaccg ctaaacaaaa accaccacca cctcgaccgc gcagcagcag cagcagcagc cagccggcgc agcagcacca cctgcaaatc caaatccacc cagcagcagg acggaggcaa ggagcagcag ctgcaggtgg aggcagcagg cgctcgcgcc caagcggagc tccaacaagg ggcaggggcc gccggatccg gatgcccgcg ctgtgcgccg cgggaactcg gccacaagtc cgacggcgag accgtgcagt ccggccatcg tcgccgccac cggcaccggc accataccgg gcgccctcgc tcccgtcgcc cacctccggg ctcgccaggc caccacatgt gggcgccgtc cgccgcgtcc gcgggtttct tccgccgccg cgggcacggg agacgccgct. ggtatcggcg atccccgcgg gtctcgagct gccgggaggc ggcgccgctg ggccacatcg gctttgcgcc catgttcgct ggacacgccg ctcggcctct cgcaggacgg ccacatcggc gtgctcgcag taccaccaag tgggtgctgc tggcggcagc ggccagatgc catcaccatc atcagcagca ggaggacggg gaggacgacc
Lys Pro Glu Thr His Thr Cys Ala Asp Gly Ile Ala Ala Ala Ile Glu Asn Ser His Leu Ser Phe Ser Glu Asp Leu Leu Gly Gln Glu Met Gln Gln Gln
Thr His Asp Lys Lys Gln Lys Val Glu Ala Arg Ile Glu Tlir Ile Ala Thr Gly Ser Val Ser Ser Gly Ala Arg Thr Asn Ala Thr Val Gly Phe Gln Ser Ser Asn Pro Ala Ala Gly Ser Asn Gly His Leu His Pro Gln Gln Ser Pro
cggagcccac tggatcctaa agccgccgcc tggcgcagcc accgccacac cgcggatctt ggctgctgca cgtccgcgct cgcaccacca cctcgccctc gactcatgca gaggcaccct cggccatgcc cgcagtcgat agcacc.cgca gcgaggacgg
caccgcgacg ggactaccag gcagcagcag cggggagcgg caaggtcgac ccagctcacg gcaggccgag cgcatccgte ccaccacccg cttcctcaat gcggatgggg cggcgctggc ggggctcgag cagccagttc cggccaccag cgagtccgat
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 gacgagtctg ggcagtag
978
<210> <211> <212> <213> <4 00> Met Asp
30
325
PRT
Sorghum bícolor 30
1
Thi
Th 20
Gln Leu Asp 35
Gln Ile Gln 50
Gly Gly Lys 65
Pro Lys 5
Ala Thr
Phe
Thr 25
Pro 10 Thr
fhr
Pro 40
Ile Hi
55 Glu 70
Thr Ala
Gln Pro Ala
Pro Pro Pro Leu 15
Thr Thr Se. 30
Lys Asp Tyr Glr 45
Gln Pro Pro Pro Gln Gln 60
Gln Gln Leu Gln Val Val Ala 75 80
Arg Gln Gln Ala Leu Ala Pro Lys Arg Ser Ser
85 90 95
Thr Lys Val Asp Gly Arg Gly Arg Arg Ile Arg
100 105 110
Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu
115 " 120 125
Gly Glu Thr Val Gln Trp Leu Leu Gln Gln Ala
130 135 140
Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser
145 Ala
His
Phe
Pro Ser 165 His His 180 Ser Ser 195
150 155 160
Leu Pro Ser Pro Thr Ser Gly Leu
170 175
Pro His His Met Trp Ala Pro Ser
185 190
Pro Ser Phe Leu Asn Ser Ala Ala 200 205
Ala Ala Gly Ile Gly Gly Leu Met Gln Arg Met
210 215 220
Leu Glu Leu Pro Gly Gly Gly Ala Ala Gly Gly 225 230 235 240
Gly His Ile Gly Phe Ala Pro Met Phe Ala Gly
245 250 255
Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly
260 265 270
Ala Ala Gln Ser Ile Ser Gln Phe Tyr His Gln
275 280 285
Gly Ser Gly Gln Met Gln His Pro His Gly His
290 295 300
Gln Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu 305 310 315 320
Asp Glu Ser Gly Gln
325 <210> 31 <211> 891 <212> DNA
<213> Vitis vinífera <4 00> 31
atggatccca agggctcaaa gcagccgcag ccaaacatgg gagagaacaa gccagctgaa aaggaagagg gtaagaagca gttggccccc aaggttgaag gcagagggag gagaataagg cagttgacta gggaattggg tcacaaatct caggccgagc cgtccataat agcggccact gcggcggcag gaggctctgt: gtcgcaacag ggaacttcta aagattgatg aattgggggg gtccagtatt gggtcaggga atggtaggtg caaatttggg gagaccccat ggttttgggt ttcagtcatc: atctggacca
Asn Lys Gln Gln Gln Gln Gln Gln Gli1 Pro Asn Lys Met Pro Gly His Glu Pro Ala Leu Ala Arg Ala Ala Ala Gly Gly Ile Thr Leu His Ala His Ile Val Gly Gln His Asp Gly
Thr Glu Pro Gln Gln Gln His His Leu Gln Gln Asp Gly Glu Ary Asp Arg His Ala Leu Cys Lys Ser Asp Ala Ile Val Ala Ser Val Pro His His Ser Ala Gly Thr Gly Asp Pro Ala Gly Gly Ala Gly Ala Ala Met Gly Val Leu Ala Ala Gly His His His Glu Ser Asp
gaggtaccaa gtgaaggact aagaggagct atgccggctc gacggggaaa ggtactggga
gtggccacag tcaaccacca
acttcttgag ttcagattgt caaacaagga tttgtgcagc ccatacagtg caataccggc tatcagcagg gtagtaggac ggctatggcc atttggggaa
cctacctcag 60
gattgcagat 120
caggcacacc 180
cagaattttt 240
gttgttgcag 300
gtcggcttta 3 60
attgcatcaa 420
cagttgggca 480
cccagtcagt 54 0
tgaaagttcc 600 aattatctgc aaaaaattgc cttccctggg tttgacttgc
atgagtttta cttcaatttt gggtgggagt aaccagcagc
ctatcacagg atggtcatat tggggttttg aactcacaag
cagatggggc aggccagggt gcaccagcaa cagcagcatc
catcaacagc aacctcctgc taaggatgat tctcaaggtt
ctgcaacaaa tctgggtcct ttcctggttt ggagctgggc ccttaagcca gatttaccag aacatcagca tcagcatcag cagggcagta g 891
<210> <211> <212> <213> <4 00> Met Asp
32
296
PRT
Vítis vinifera 32
Pro Lys
1
Sei
5
Leu Pro 20
Asp Phe Gln 35
3 In
Ser 10
Pro Asn 25
jys G
Met
Ile
Val 40
Il'
η Pro Gln 15
Gly Glu Asn 30
Asp Ly
Glu Lys Clu Glu
Ala 45
Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His
50 55 60
Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys 65 7 0 7 5 8 0
Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp
85
90
Trp Leu Leu Gln Gln Ala Glu
100
Gly Thr Ile 115
105
95
Pro Ser 110
Ile Ile
Pro Ala Ser Ala Leu Ala Ala Ala 125
120
Gln Gln Gly Thr Ser Ile Ser Ala Gly Leu His
130 135 140
Leu Gly Gly Ser Ser Ile Gly Ser Gly Ser Ser 145 150 155 160
Met Val Gly Ala Asn Leu Gly Arg Pro His Val
165 170 175
Pro Pro Val Ser Gly Phe Gly Phe Gln Ser Ser
180 185 190
Thr Asn Leu Gly Asn Glu Ser Ser Asn Tyr Leu
195 200 205
Pro Gly Phe Asp Leu Pro Ala Thr Asn Leu Gly
210 215 220
Ser Ile Leu Gly Gly Ser Asn Gln Gln Leu Pro 225 230 235 240
Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn
245 250 255
Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg Val
260 265 270
His Gln His Gln His Gln His Gln His Gln Gln
275 280 285
Asp Asp Ser Gln Gly Ser Gly Gln
Val Pro Pro Ala Gly Lys Thr Lys Ala Ala Gly Glu Ala Ala Gly Gly Gln Lys Arg Thr Ala Thr Ser Gly Gln Lys Pro Met Gly Leu Ser Gln His Gln Gln Pro
Asn Phe Leu Glu Val Lys Lys Gln Leu Val Glu Gly Arg Ile Phe Thr Ile Gln Thr Gly Thr Ser Val Ser Ile Asp Glu Ser Trp Ala Gly Leu Trp Pro Ser Thr Ile Ala Phe Ser Phe Thr Glu Leu Gly Ala Leu Ser Gln Gln Gln Pro Ala Lys
290 <2 10> <211> <212> <213> <4 00>
2 95
3 3 97 5 DNA
Zea mays 33
atggacccca agttccccac
accaccacca cctcgaccgc
acggcgcagc accaggagca
caccagccgc cgccgccgcc
ctgcaggtgg tggcgcagcc
tccaacaagg accgccacao
ctctgcgccg cgcggatctt
actgtgcagt ggctgctgca
accataccgg cgtccgcgct
ctcgccaggc cgcaccacca
acccctagcg gcagcatcat gcagcagcac gcaggac.ggg cggggatcgg caaggtcgac ccagctcacg gcaggccgag cgcctccgtc ccacccgcac
ctaaacaaaa cagctggatc caccatcacc ggcggcggag aggcagcagg ggcaggggcc cgggagctcg ccggccatcg gcgccctcgc cacatgtggg
cggagcccac ctaaggacta cccacctgca tgaaggagca cgctcgcccc gccggatccg gccacaagtc tcgccgccac tcccgtogcc cgccgtccgc
caccgcgacg ccagcagcag aatccaaatc gcagcagctg caagcggagc gatgccggcg cgacggcgag cggcacgggc tacctccggg cggcttctcc
660 720 780 840
60 120 180 240 300 360 420 480 540 600 tcgccctcct tcctgaattc cgcgggcgcg ggcgacggca ccggtatcgg cggcatcatg 660 cagcggatgg gggtccccgc gggcctggag ctgccgggag gcggcgccgc cggcggccac 720 atcggctttg cgcccatgtt cgctggacac gccgcggcca tgccggggct cgagctcggc 780 ctctcgcagg acggtcacat cggcgtgctc gccgcgcagt cgatcagcca gttctaccac 840 caggtgggtg ccgctgccgg cggcagtggc cagatgcagc acccgcacgg gcaccagcat 900 caccatcatc agcagcagga ggacggggag gacgaccgcg aggacggcga gtctgatgac 960 gagtctgggc agtag 975
<210> 34 <211> 324 <212> PRT <213> Zea mays <4 00> 34
Met Asp Pro Lys Phe Pro Thr Pro Leu Ala Leu Asn Lys Thr Glu Pro 10 15
Thr Thr Ala Thr Thr Thr Thr Thr Ser Thr Ala Gln IIis IIis Gln Leu
25 30
Asp Pro Lys Asp Tyr Gln Gln Gln Thr Ala Gln His Gln Glu Gln Gln
40 45
Gln His His His His Pro His Leu Gln Ile Gln Ile His Gln Pro Pro
50 55 60
Pro Pro Pro Gln Asp Gly Gly Gly Gly Val Lys Glu Gln Gln Gln Leu 65 70 75 80
Leu Gln Val Val Ala Gln Pro Gly Asp Arg Arg Gln Gln Ala Leu Ala
85 90 95
Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp Gly Arg
100 105 110
Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln
115 120 125
Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val Gln Trp
130 135 140
Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly Thr Gly 145 150 155 160
Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu Pro Ser
165 170 175
Pro Thr Ser Gly Leu Ala Arg Pro His His His His Pro His His Met
180 185 190
Trp Ala Pro Ser Ala Gly Phe Ser Ser Pro Ser Phe Leu Asn Ser Ala
195 200 205
Gly Ala Gly Asp Gly Thr Gly Ile Gly Gly Ile Met Gln Arg Met Gly
210 215 220
Val Pro Ala Gly Leu Glu Leu Pro Gly Gly Gly Ala Ala Gly Gly His 225 230 235 240
Ile Gly Phe Ala Pro Met Phe Ala Gly His Ala Ala Ala Met Pro Gly
245 250 255
Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu Ala Ala
260 265 270
Gln Ser Ile Ser Gln Phe Tyr His Gln Val Gly Ala Ala Ala Gly Gly
275 280 285
Ser Gly Gln Met Gln His Pro His Gly His Gln His His His His Gln
290 295 300
Gln Gln Glu Asp Gly Glu Asp Asp Arg Glu Asp Gly Glu Ser Asp Asp 305 310 315 320
Glu Ser Gly Gln
<210> 35 < 211> 948 <212> DNA <213> Zea mays <4 00> 35
atggacccca agttcccccc acccccaccg ctaaacaaaa cggagcccac caccgcgacg 60 accaccacca cctcgaccgc gcagcagcag cagcagcagc tggatcctaa ggactaccag 12 0 cagcagcagc agcagccggc gcagcacctg caaatccaaa tccaccagtc gcagcaggac 180 ggaggcggcg gagggaagga gcagcagcag ctgcaggtgg tggcgcagcc cggggagagg 240 aggcagcagg ggcaggggcc cgggaactcg ccggccatcg gcgccctcgc ccgtccgccg gccgccggta gccgccggag cacgccgccg ctcgccgcgc ggccagatgc gaggacgacc
cgctcgcgcc caagcggagc ggcggatccg gatgcccgcg gccacaagtc cgacggcgag tcgccgccac cggcacgggc tcccgtcgcc cacctccggg gcttctcctc gccctccttc tcatgcagcg gatggggatc ccaccctcgg cgccggcggc ccatgccggg gctcgagctc agtcgatcag ccagttctac
atcacgcgca gcgaggacgg
cgggcaccat cgagtccgat
tccaacaagg ctctgcgccg accgtccagt accataccgg ctcgccaggc ctgaactctg cccgcgggct cacatcggct gggctatcgc caccaggtgg catcaccatc gacgagtctg
accgacacac cgcggatctt ggctgctgca cgtccgcgct cgcaccacca ccgccgcggg tcgagctgcc ttgcgcccat aggacggcca gtgctgccgc accagcagca ggcagtag
caaggtcgac ccagctcacg gcaggccgag cgcctccgtc catgtgggcg cacgggcgat gggagcctcc gttcgctgga catcggcgtg cggcggcggc ggaggacggg 948
<210> <211> <212 > <213> <400> Met Asp 1
Thr
Gln
His 5( Gly 65 Arg
Thr
Ala
Gly
36 315 PRT Zea 36 Pro 5
Thr Ala 20 Leu Asp
mays
Lys Phe
Thr
Thr 25
Pro Lys 40
Gln Ile Gln 55
Lys Glu Gln Gln 70
Gln Ala Leu 85
35 Leu
Gln
Pro 10 Thr
Asp
Ile
Pro
Thr
Gln 75
Ala Pro 90
Tyr
45
His Gln 60
Leu Gln
Pro Pro
15 Thr Ser 30 Gln
Pro Leu
Thr Ala
Gln Gln Gln
Ser Gln Gln
Val 80
Lys Arg 95
Val Ala
Ser Ser
Lys Val 100 Ala Arg 115
Glu
Asp Gly Arg Gly Arg Arg Ile Arg
Thr
130 Ala Ala 145 Ala
Thr
Pro
His
Ser
Gly
Ser 165 Met Trp 180 Ala Ala 195
Ile Pro
Ile
120 Val Gln
135 Gly Thr 150 Leu
105 Phe Gln
Ala
Ala
Ala
Pro
Pro Ii Gly 200 Gly
Trp
Gly
Ser 170 Ser !5
Thr Phe
Leu
125 Leu Leu
140 Thr Ile 155
Pro Thr
110 Thr Arg
Glu Leu
Gln Gln Ala
Pro
Ser 175 Phe
Ala 160 Gly
Ser
Leu
Ser Ser
210 Thr Leu 225 His
215
Ala Gly
190
Gly Asp Ala Ala Gly 205
Glu Leu Pro Gly Ala 220
Gly Ala Gly Gly His Ile Gly
Ala
His
Val
His
Ala 245 Ile Gly 260 Gly Ala 275 His
230 Ala
Val
Ala
His His
Met
235 Gly
Leu
Glu 255 Ser
Phe 240 Leu
Ala
Gly
Ile Ser
290 Glu Asp 305 <210> <211> <212 > < 213 > <400>
Gly
295 Glu Ser 310
Pro 250
Leu Ala Ala Gln
265 270
Ala Gly Gly Gly Gly Gln Met 285
His Gln Gln Gln Glu Asp 300
Asp Asp Glu Ser Gly Gln 315
280 His
Asn Lys Gln Gln Gln Gln Asp Gly Gln Pro Asn Lys Met Pro Gly His Glu Pro Ala Leu Ala Arg Pro Ser Ile Met Ser Ala Pro Met Leu Ser Gln Phe His His Gly Glu
Thr Glu Pro Gln Gln Gln Pro Ala Gln Gly Gly Gly Gly Glu Arg Asp Arg His Ala Leu Cys Lys Ser Asp Ala Ile Val Ala Ser Val Pro His His Phe Leu Asn Gln Arg Met Ala Gly Ala Phe Ala Gly Gln Asp Gly Tyr His Gln Ala His Gly Asp Asp Arg
37
648
DNA
Allium 37
cepa
300 360 420 480 540 600 660 720 780 840 900
atggatccaa aagaatccca acccaactcg gatcgtcaat tgatgaccca aaccgaatcc
60 attcaagacc cacaccaaag atcttccagc ctgcatcatg gctttagctt ttatggggag aataatggag atgagtgggc gggcttcagt aaccattttt <210> <211> <212 > <213> <400> Met Asp 1
Gln Thr 20
Lys Arg Thr 3 5
Arg Arg 50
Thr Arg
cgcaaaaaag ttgacggccg tgacccgaga cagaacctgc cttctcaggc gttttaattc tcggccctag acatgagctt tagggctgtc atcaacagat 38 216 PRT
Allium cepa 38
Pro Lys Glu 5
Glu
agcccttctt cggccggagg actcggccat catcatcgcc gatgccgaac
gccccaaaac attcgcatgc aaatccgacg gctaccgggt tctaagcccg
cggatttatg aattccaata ctcgagcaat ttagggtttg
tacttcaatg tcaagatggg gggtcataat
ctgggagggc catattgggg gttagggttg
ggacctccaa ccgctctctg gcgagaccgt cgggtaccat acaacagttg atagcagtaa tggggatgga agcctgggcc ttttgaatac gaaatggg
caaagaccgc cgccgccaga tcagtggctt acccgcatcc ggctgttggg caacaacaat gatgacaggg acaaatgccc acaagggttg 648
Ile
Ser Ile
25
Ser Asn 40
Arg Met
Ser 10 Gln
Gln
Asp
Ser Asp Lys Arg
Glu
65 Leu
Ile
Pro
Phe
His
55 Leu 70 His Ala
Gly
Glu
Pro Asn
15 Pro Gln 30
Lys Asp Arg His Thr Lys 4 5
Pro Ala Leu Cys Ala Ala 60
His Lys
75 Pro Ala
85 Pro Ala 100 Asp Asn 115 Met
Ser
Ser
Asn Ser
90
Ala Leu
105 Trp Ala 120 Asn
Ala
Val
Asn Ser
Ser Asp 80
Ile Ile 95
Ser Ser 110 Gly Leu 125 Ser
Gly Glu
Ala Ala
Gln Ala
Trp Gly
Asn Asn Asn
130 Gly Pro 145
Met Ser Pro Gln
Ser
Gly 165 Met
135 Ser Ser 150 His
Pro
Met
Gly
180 Val Leu 195 Asn
Val
His
210 <210> <211> <212> <2 13> <4 00> atggacccca acgaccacca cagcagcacc aaggagcagc ctggggccga cggatccgga cacaagtcgg gccgccacag ccttcgccca gcggcggggt ggcggcctcg ggcggtggtg gc.ggccatgc
<210> 40 <211> 243
Gly 1!
Asn Thr 200 Arg Val 215
Asn
Ser 170 Leu !5
Gln
140 Leu Gly 155 Phe
Thr
Gln Leu
Phe
Ser 175 Gly
Gly
Gly Asn
190 Leu Asn 205 Gly
Val Gly 160
Met Leu Leu Ser His Phe
Arg Gln Ala Leu Val Asp Arg Ile Thr Val Thr Gly Met Pro Gly Phe Asn Asn Met Glu Gly Gly Gln Asp Tyr Gln
Leu Met Thr Leu Ala Pro Gly Arg Gly Phe Gln Leu Gln Trp Leu Ser Gly Thr Asn Ser Lys Asn Ser Gly Asn Gly Val Met Thr Gly Gln Pro Gly Gly His Ile Gln Met Gly
39
731
DNA
Brachypodium distachyon 39
agtttcctcc tcccccaccg ctaaacaaaa ccaccacgac ctcccagcag cagctggatc tgcaaatcca agtgcaccag cagcagcagg agcagcaggt ggtggcggcg gcgggggcgg agcggagctc caacaaggac cggcacacca tgccggcgct gtgcgcggcg cggatcttcc acggggagac ggtccagtgg ctgctgcagc ggtccggcac cataccggcg tccgcgctcg cctccgcgct cgccaggccg caccaccacc tctccccggc cgggttcatg aactcggccc gcgggcttat gcagaggata gggcttcccg gggggcacat cgggttcgcg cccatgttcg c 73
cggagcccac acgagcagta aggaagatgg gggagaggag aggtggacgg agctgacgcg aggcggagcc cctccgtcgc accacctctg cagccggcgc ccgggatgga ccagccacgc
120 180 240 300 360 420 480 540 600
caccggcgtg tcaccagccg cggcggggga ggtgcagggg gcgggggcgg ggagctgggg ggccatcgtc gccctcgctg ggggccctcg tgactctggg gctccctggc ggcggcggcg
60 120 180 240 300 360 420 480 540 600 660 720 <212> PRT
<213> Brachypodium distachyon <4 00> 40
Met Asp Pro Lys Phe Pro Pro Pro Pro Pro Leu Asn Lys Thr Glu Pro 1 5 10 15
Thr Thr Gly Val Thr Thr Thr Thr Thr Thr Thr Ser Gln Gln Gln Leu
25 30
Asp His Glu Gln Tyr His Gln Pro Gln Gln His Leu Gln Ile Gln Val
40 45
His Gln Gln Gln Gln Glu Glu Asp Gly Gly Gly Gly Lys Glu Gln Gln
50 55 60
Gln Gln Val Val Ala Ala Ala Gly Ala Gly Glu Arg Arg Val Gln Gly 65 70 75 80
Leu Gly Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Asp
85 90 95
Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile
100 105 110
Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Val
115 120 125
Gln Trp Leu Leu Gln Gln Ala Glu Pro Ala Ile Val Ala Ala Thr Gly
130 135 140
Ser Gly Thr Ile Pro Ala Ser Ala Leu Ala Ser Val Ala Pro Ser Leu 145 150 155 160
Pro Ser Pro Thr Ser Ala Leu Ala Arg Pro His His His His His Leu
165 170 175
Trp Gly Pro Ser Ala Ala Gly Phe Ser Pro Ala Gly Phe Met Asn Ser
180 185 190
Ala Pro Ala Gly Ala Asp Ser Gly Gly Gly Leu Gly Gly Leu Met Gln
195 200 205
Arg Ile Gly Leu Pro Ala Gly Met Glu Leu Pro Gly Gly Gly Gly Gly
210 215 220
Gly His Ile Gly Phe Ala Pro Met Phe Ala Ser His Ala Ala Ala Ala 225 230 235 240
Ala Ala Met
<210> <211> <212> <213> <400> atggatccca ccgagagatg gacaaagaac gacagacaca gcaaggattt tggctgcttc gcctctgctt gctggtttga ccaagttggg tttcccggat ggtggtggta gttggggtct ggtagggttc <210> <211> <212> <213> <4 00> Met Asp 1
Pro Pro Asp
41 768 DNA
Brassica oleracea
41
agaacccaaa tccacaccaa gtaccaaact cttccgatga caacaaagaa gtaaatgatt cgaacagtaa cggtaagaag cagcttgccc ccaaagtgga aggtcgcggt cggagaatca ttcaactgac cagagaattg ggtcacaaat aacaagccga accgtcgctt atcgcagcca tagcctcagc tgcttctgct gtagtctcta tgatcagtca tcatgactta gactgtggtg gagaaggagg aggagaagta tggccaaatg ttgattttcc tggtggagct atgagttttg atggtaatca gatgcttgga cttgagttag tgaatcaaca gatttatcaa cagatggctc ttcaccatac tcttcatcat aatccaggac
42 256 PRT
Brassica oleracea 42
Pro Lys Asn Pro Asn Pro His
10 15
Pro Gln Pro Arg Asp Ala Ser 25 30
Phe Gln Ile Val Val Ala Ser
tcttgatacc ttcagatcgt ccaagagaag ggatgcctgc cagacggtga ccggttcagg accaaggcgg gtgggtctag gagctggtta cttccatttt ggttgtctca aagctcaggc atgaagag
accaccacaa ggtcgcttcc ctcaaacaaa tctctgcgcg aacaatccag aactgtaccg gtctctcact tagtggtaga cagaattggg tggtgctagt ggtagggaat tcaggctcag 768
Gln Val Pro Asn Phe Leu Ile Asp Asp Asn Lys Glu Val Asn Asp Lys Glu Pro Asn Ser Asn Gly
60 120 180 240 300 360 420 480 540 600 660 720 35 40 45 Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr 50 55 60 Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala 65 7 0 75 80 Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly 85 90 95 Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Leu Ile Ala 100 105 110 Ala Thr 115 Gly Ser Gly 120 Thr Val Pro 125 Ala Ser Ala Leu Ala Ser Ala Ala Ser Ala Val Val Ser Asn Gln Gly Gly Ser Leu Thr Ala Gly Leu Met 130 135 140 Ile Ser His His Asp Leu Asp Cys Gly Gly Gly Ser Ser Ser Gly Arg 145 150 155 160 Pro Ser Trp 165 Gly Glu Gly 170 Gly Gly Glu 175 Val Trp Pro Asn Gly Ala Gly Tyr Arg Ile Gly Phe Pro Gly Phe Asp Phe Pro Gly Gly Ala Met Ser lí 30 1! 35 190 Phe Ala 195 Ser Ile Phe 200 Gly Ala Ser 205 Gly Gly Gly Asn Gly Asn Gln Met Leu Gly Leu Glu Leu Gly Leu Ser Gln Val Gly Asn Val Gly Val Leu 210 215 220 Asn Gln Gln Ile Tyr Gln Gln Met Ala Gln Ala Gln Ala Gln Ala Gln 225 230 235 240 Gly Arg Val 245 Leu His His 250 Thr Leu His 255 His Asn Pro Gly His Glu Glu
<210> 43
<211 > 723
<212> DNA
<213> Brassica rapa
<4 00> 43
agaagctcaa acaaagacag acacatcaaa gtggaaggca cctgctctct gcgccgctag gatcttccag ttgactagag ggcgagacaa tccagtggct gcttcagcag gctgagccgt tcaggaacta taccggcctc tgctttagcc tcagccgctg cttcagggtg gtgggtctct cactgctggt ttgatgatca tctagtagtg ggagaccaaa ttggggtgtt ggcgggggag ttaccaactg ggctgtggcc aaatgtagct gggtttggag gatggaggtg gttacaggat tgggtttcct gggtttgatt tttgcgtcca ttcttggtgg tggtagtaac aatcagatgc gctcaggaag ggaatgttgg tgtcttgaat cctcagtctt cagatgagtc aggctcaagc tcagggtagg gttcttcacc tcacatgagg agcatcagca agagagtggt gagaaagatg
ggggtcggag aattgggtca cgattatcgc ctgctgtatc gtcatgagtt atggagggtc ctggggtgca atcctggtgg ctggacttga ttgcacagat atactcttca attctcaagg
aatcaggatg caaatccgac agccaccggt gagccaccat ggatggtggg taggtcgagt gaccatgagt agctatgagt gttagggttg ttatcagcag gcataaccca gtcagggcgt
taa <210> <2 11 > <212> <213> <4 00> Arg 1
Ara
723
44
240
PRT
Brassica 44
rapa
Ser Ser Asn Lys Asp Arg His Ile Lys Val
10 15
Ile Arg Met Pro Ala Leu Cys Ala Ala Arg 25 30
Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr
40 45
Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr
50 55 60
Pro Ala Ser Ala Leu Ala Ser Ala Ala Ala Ala 65 70 75 80
Leu Gln Gly Gly Gly Ser Leu Thr Ala Gly Leu
85 90 95
Leu Asp Gly Glv Ser Ser Ser Gly Arg Pro Asn
Glu Gly Arg Gly Arg Ile Phe Gln Leu Thr Ile Gln Trp Leu Leu Gly Ser Gly Thr Ile Val Ser Ser His His Met Ile Ser His Glu Trp Gly Val Gly Gly
60 120 180 240 300 360 420 480 54 0 600 660 720 100 IC 5 110 Gly Asp Gly Gly Ser Arg Ser Ser Leu 115 120 125 Val Ala Gly Phe Gly Ala Gly Val Gln 130 135 14 0 Tyr Arg Ile Gly Phe Pro Gly Phe Asp 145 150 155 Phe Ala Ser Ile Leu Gly Gly Gly Ser 165 170 175 Glu Leu Gly Leu Ala Gln Glu Gly Asn lí 30 ιε ;5 190 Ser Phe Ala Gln Ile Tyr Gln Gln Gln 195 200 205 Gly Arg Val Leu His His Thr Leu Gln 210 215 220 His Gln Gln Glu Ser Gly Glu Lys Asp 225 230 235 <210> 45 <211> 696
160
Lys Asp Asp Ser Gln Gly Ser Gly Arg 240
<212> <213> <220> <22i> <222> <223> <220> <22 1> <222> <223> <400>
DNA
Coffea canephora
misc feature (56lT..(561) η é a, c, g, ou t
misc feature (622) .. (622) η é a, c, g, ou t 45
attttccagc tcaccagaga attgggtcac aaatccgatg gagaaaccat ccaatggctg
ttacagcagg ctgaaccatc cattatagcc gccacgggga cggggaccat accggcctcc
gctctagccg ctgcggccgc tggagcaggg ggctctgttt ccatgtcagc tgggctgcat
cctccaaaga tcagtgctga attgggtgca caccaccccc cacacatgga tattgccggg
tcaggtcaag gagcgggtag caccggtgct agtaggacca attggccaat ggtcggcggg
agtttgttac gagcccccca tatgggaatg cccactacaa ctgcagggat atggccccct
acttctgctt ctggtgctgt cagtggtttc gggttccagt catcatcctc ccctgctcca
gcagccacca gtttgggcac tgaaagttca aattacctac acaagcttgg gtttcctggt
tttgacttgc cagctgcaac taacaacttg ggtcctatga gtttcacctc catcgtgggg
gctgctactg accagcagca ncaccttcct ggattggagc tggggctatc acaagatggt
catgttgggg ttttgaaccc tncaaccttg agccagattt atcagcatat ggggcaggct
cgagcgcacc agcacaacac agcacgagac cacagc 696
<210> <211> <2 12> <213> <220> <22 1> <222> <223> <220> <22 1> < 2 2 2 > < 2 2 3 > <4 00> Ile Phe Gln Leu
46
232 PRT
Coffea canephora
INCERTO (187)..(187)
Xaa pode ser qualquer aminoácido ocorrendo naturalmente
1
INCERTO (208) . . (208)
Xaa pode ser qualquer aminoácido ocorrendo naturalmente 4 6
Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr 15
Ile Gln Trp Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr
25
Gly Thr Gly Thr Ile
4 0
Ala Gly Gly Ser Val 50 55
30
Pro Ala Ser Ala Leu Ala Ala Ala Ala Ala Gly 45
Ser Met Ser Ala Gly Leu His Pro Pro Lys Ile 60
60 120 180 240 300 360 420 480 540 600 660 Ser Ala Glu Leu Gly Ala His His Pro Pro His 65 7 0 7 5 8 0
Ser Gly Gln Gly Ala Gly Ser Thr Gly Ala Ser 85 90 95
Val Gly Gly Ser Leu Leu Arg Ala Pro His
Met
Thr
100 Thr Ala
115 Gly Phe
130 Leu Gly 145
Phe Asp
Gly
Thr
Leu 165
Gly
120 Phe Gln
135 Glu Ser 150
Pro Ala
105 Ile Trp
110 Pro Thr
Ser Ala
Ser
Ser
Ala 170
Pro
125
Ser Ser Ser Pro Ala 140
Asn Tyr Leu
155 Thr
Asn
Ser Ile Val Gly Ala Ala Thr 180 185
Asp
Asn 175 Gln
His 160 Leu
Lys Gly
Gln Xaa
190
Ser
Glu Leu Gly Leu Ser Gln Asp Gly His Val Gly 200 205
Gln Ile Tyr Gln His Met Gly Gln 215 220
Thr Ala Arg Asp His Ser 230
47 993 DNA
Helianthus annuus & petiolaris
47
gacccaaagg ctcaaaccta catcatcctc ccttcttagc ccacccaaac cccaccacaa acatcaacac caacaacctc aacaaacttt ctgacaaaca agagtctgct accaagaaac aagacaggca caccaaggtt gaaggaagag ctgcaagaat ctttcagctc actagagagt aatggctgct acagcaagct gagccttcca cggcttctgt gttagccgcc actggggcgg tgcaacaaaa gattgatgaa ttaagcggga ctggtgtcaa ctgtaggacc agttggccaa ccactaccca tatggctacg cctacggcta cctcttcttc gtccccaggt ccatcgggca tgcaaaagat ggcgttttcc gggtttgatt tttcttcgat tttgggtaat cataatcata ggctggagct tggactgtcc caggatggtc atcagatata ccaaatggac cagaccagaa ctcaaggttc agaggggcag tag
48 329 PRT
Helianthus annuus & petiolaris 48
Pro Lys Gly Ser Asn Leu His 15
Ala Ser Ser Ser Thr Phe Leu Ala
30
Asn Met Gly Asp His Asn Asn Asn
40 45
Lys Leu Ser Glu Ile Lys Asp Phe
55 60
Glu Ser Ala Thr Lys Lys Gln Gln 7 0 7 5 8 0
Thr Ser Asn Lys Asp Arg His Thr Lys Val Glu
85 90 95
Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile 100 105 110
195 Thr Leu 210 His Asn 225 <210> <211> <212> <213> <4 00>
tcggccgggg tcaagttcaa aacaacaata attacagttt acctccaata gctttatgtg gaaactattc gggacaatcc tcggttggct aatattaata gtgggtagac gggttccagt tcgaattact cagatgagtt cagcttcctg caggctttga aatgataatt <210> <211> <212> <213> <400> Ser Ala Gly Gly 1 5
Pro His Glu 20
Thr Thr Asp 35
Asn Leu Asn 50
Asp Lys Gln 65
Met Asp Ile Arg Thr Asn Met Gly Met Ser Gly Ala Pro Ala Ala Leu Gly Phe Pro Met Ser His Lcu Pro Val Leu Asn Ala Arg Ala
Ala Gly Trp Pro Pro Thr Val Ser Thr Ser Pro Gly Phe Thr Gly Lcu Pro Xaa His Gln
aacagcagcc cagacaacat ctgaaatcaa aacagttagc gtaggaggat taggtaacaa ttatagccgc cttcacacgg gtaataataa tggttggtcc tctggcccgc acaatttggg tgcccggttc atcataatca atttaggggt tgcaacaaca 9
acatgaggcc gggagatcac agatttccag ccccaaaaga aaggatgcct atctgatggt caccggaacc ggtctcgatt cagtaatagt agctttgggt tgctggattc cgtcgaaagt taatatgggt tcatcagcag tttgaatcaa gcagacttca 93
His Pro Gln Gln Gln His Pro Asn Pro Thr Asn Ile Asn Thr Asn Gln Ile Thr Val Ser Leu Ala Pro Lys Arg Gly Arg Gly Arg Arg Phe Gln Leu Thr Arg
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 Glu Leu Gly Asn Lys Ser Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln
115 120 125
Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro
130 135 140
Ala Ser Val Leu Ala Ala Thr Gly Ala Ala Ser His Gly Val Ser Ile 145 150 155 160
Ser Val Gly Leu Gln Gln Lys Ile Asp Glu Leu Ser Gly Ser Asn Asn
165 170 175
Asn Ser Asn Ser Asn Ile Asn Thr Gly Val Asn Cys Arg Thr Ser Trp
180 185 190
Pro Met Val Gly Pro Ala Leu Gly Val Gly Arg Pro Thr Thr His Met
195 200 205
Ala Thr Pro Thr Ala Ile Trp Pro Ala Ala Gly Phe Gly Phe Gln Ser
210 215 220
Ser Ser Ser Ser Pro Gly Pro Ser Gly Asn Asn Leu Gly Val Glu Ser 225 230 235 240
Ser Asn Tyr Leu Gln Lys Met Ala Phe Ser Gly Phe Asp Leu Pro Gly
245 250 255
Ser Asn Met Gly Gln Met Ser Phe Ser Ser Ile Leu Gly Asn His Asn
260 265 270
His Asn His Asn His His Gln Gln Gln Leu Pro Gly Leu Glu Leu Gly
275 280 285
Leu Ser Gln Asp Gly His Leu Gly Val Leu Asn Gln Gln Ala Leu Asn
290 295 300
Gln Ile Tyr Gln Met Asp Thr Arg Met Gln Gln Gln Gln Thr Ser Asn 305 310 315 320
Asp Asn Ser Gln Gly Ser Glu Gly Gln
325 <210> 49 <211> 345 <212> DNA
<213> Hordeum vulgare <4 00> 49
atcggcggcc tcatgcagcg gatcggcctc cccgccggga tcgagctgcc gggcggcggc 60 gcggggggca tgggcgggca catcgggttc gcgcccatgt tcgccagcca cgcggcggcc 120 gcaataccgg ggctggagct cggcctgtcg caggagggcc acatcggggt gctcagccag 180 ttctaccacc aggtcggcgg cgccggggcc agcgggcagc tgcagcaccc gcaccctcat 240 cagcaccacc accacgaaca gcaccaccat caccagcagc agcagcagga ggaggacggg 300 gaggaggagc gcgaggacgg cgactccgag gaggagtccg gccag 345
<210> 50 <211> 115 <212> PRT
<213> Hordeum vulgare <4 00> 50
Ile Gly Gly Leu Met Gln Arg Ile Gly Leu Pro Ala Gly Ile Glu Leu
10 15
Pro Gly Gly Gly Ala Gly Gly Met Gly Gly His Ile Gly Phe Ala Pro
25 30
Met Phe Ala Ser His Ala Ala Ala Ala Ile Pro Gly Leu Glu Leu Gly
40 45
Leu Ser Gln Glu Gly His Ile Gly Val Leu Ser Gln Phe Tyr His Gln
50 55 60
Val Gly Gly Ala Gly Ala Ser Gly Gln Leu Gln His Pro His Pro His 65 7 0 7 5 8 0
Gln His His His His Glu Gln His His His His Gln Gln Gln Gln Gln
85 90 95
Glu Glu Asp Giy Glu Glu Glu Arg Glu Asp Gly Asp Ser Glu Glu Glu
100 105 110
Ser Gly Gln
115 < 210 > 51 <211 > 521 <212 > DNA <213> Linum usitatissimuin <4 00> 51
atcatcatca cccatctatt ctcttgtcta
gtgcttatgg aacaacaaca acaacaacca
caaaacagca acaaccctct ttcggcaatg
aacagcagta caaagaagca gcagagttta
cacaagaaag tggacggaag agggagaagg atcaggatgc
atcttccagc tgactcgaga attgggtcac aaatccgacg
ctgaaccaat ctgagccgtc catcattgca
gctcttgccg ctgcagggtc ctctgtttct
ttctctgctg ggaacaattg ggcagccttg
tcctctctcc aaggtcccaa aaagacgttc ggtccgaaga
gccaccggca aattcggaga atgaatgcca
cctgcagctc accaccttga aaatcacatc ggagttcgaa cagctttatg gcgagaccat ccgggacaat tgcaggggag a
ttcttatctt tgatccacac acttgttcca caaggacagg cgccgctagc ccagtggctt tccggcctct ctctgtttct 521
<210> < 211 > <212> <213> <4 00> Ile Ile 1
Ser Ser 20
52
173
PRT
Linum usítatissímum 52
Thr His
Ile 5
Tyr Leu Val 25
Leu Phe Ser Cys Leu Ser 15
Leu Met Glu Gln Gln Gln 30
Pro Asn His Leu Asp Asp Pro His Gln Asn Ser
40 45
Ala Met Lys Asp Val Gln Ile Thr Ser Leu Val
50 55 60
Lys Lys Gln Gln Ser Leu Gly Pro Lys Arg Ser 65 70 75 80
His Lys Lys Val Asp Gly Arg Gly Arg Arg Ile
85 90 95
Cys Ala Ala Ser Ile Phe Gln Leu Thr Arg Glu
100 105 110
Asp Gly Glu Thr Ile Gln Trp Leu Leu Asn Gln
115 120 125
Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala
130 135 140
Ala Gly Ser Ser Val Ser Asn Ser Glu Met Gln 145 150 155 160
Phe Ser Ala Gly Asn Asn Trp Ala Ala Leu Met
165 170
<210> 53 <211> 441 <212> DNA
<213> Lotus corniculatus <4 00> 53
atggatccca agggctcaaa gcagcagaac caggaggttg caacaacaag ggaacaacaa caacaacatg ggagagaaca ttccagattg tgattgctga gaaagatgag agcaagaagc tccaacaagg acagacacac aaaagttgaa ggcaggggaa ctgtgtgcag caagaatctt ccagttgacc agagaattag accatccagt. ggcttctgca gcaggctgag ccatcaatca acaatcccag catctgcttt agcttctgct gctggtaact tctttatctg ctggtttgca c <210> 54 <211> 147 < 212 > PRT
<213> Lotus corniculatus <4 00> 54
Met Asp Pro Lys Gly Ser Lys Gln Gln Asn Gln
10 15
Phe Leu Gln Gln Gln Gln Gln Gly Asn Asn Asn
25 30
Asn Lys Pro Ser Glu Val Lys Asp Phe Gln Ile
4 0 4 5
Asp Glu Ser Lys Lys Gln Leu Ala Pro Lys Arg
Ser Leu Gln Gln Asn Asn Pro Asn Ser Asn Arg Met Leu Gly Ser Glu Ser Ala Gly Ser Asn Ala
Pro Cys Ser Pro Lys Val Pro Leu Ser Ser Ser Thr Lys Asp Arg Pro Ala Leu His Lys Ser Pro Ser Ile Leu Ala Ala Ser Val Ser
ttccaaactt aaccatccga agttggcacc ggaggataag gtcacaaatc tagcagccac ctgtttcaca 441
ccttcaacaa ggttaaggat aaagaggacc gatgccagct tgatggtgaa tggaactgga acaggggacc
Glu Val Val Pro Asn Asn Asn Met Gly Glu Val Ile Ala Glu Lys Thr Ser Asn Lys Asp
60 120 180 240 300 360 420 480
60 120 180 240 300 360 420 50 55
Arg His Thr Lys 65 7 0
Leu Cys Ala Ala 85
60
Arg
75 Ile Phe
90
Ser Asp Gly Glu Thr Ile Gln
Ala
120 Gly Asn 135
Val Glu Gly Arg Gly Arg Arg Ile Arg Met Pro Ala
Thr Arg Glu Leu Gly His Lys
Leu Gln Gln Ala Glu Pro Ser
Ala Ser Ala Leu Ala Thr Ser Leu Ser Ala
105 Thr Gly
Thr
Ser Val
80
Gln Leu 95
Trp Leu 110 Gly Thr 125
Ser Gln
Ile Pro
Gln Gly
100
Ile Ile Ala 115
Ser Ala Ala
130 135 140
Gly Leu His 145
<210> 55 <211> 668 <212> DNA
<213> Petunia hybrida <4 00> 55
gcggcgtcta aatatggatc cccgggctgc aaacaattag ctccaaaaag aagttcaaac ggtagaagaa ttcgtatgcc agctttatgt ttgggtcata aaactgatgg tgaaacaatt attattgctg ctactgggac tggtactatt tctgtttctg aacaggggaa ctctgtttct tatggtttgt ttagagctaa ttgggctaat tcttggccta gttttggatc aggatttgtg ttgagttctg ttccaagatt tggctttgag aatcaaaatg ttcctggttt agaacttgga aattttcaat ctttacaaca gttttatcag gctcgagg <210> 56 <211> 222 <212> PRT
<213> Petunia hybrida <400> 56
Ala Ala Ser Lys Tyr Gly Ser Pro Gly Cys Arg
10 15
Glu Ser Ser Lys Lys Gln Leu Ala Pro Lys Arg
25 30
Arg His Lys Lys Val Asp Gly Arg Gly Arg Arg
40 45
Leu Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg
50 5 5 60
Thr Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln 65 7 0 7 5 8 0
Ile Ile Ala Ala Thr Gly Thr Gly Thr IIe Pro
85 90 95
Ala Ala Thr Ser Ser Val Ser Glu Gln Gly Asn
100 105 110
Ser Leu His Ser Arg Ile Asp Asp Tyr Gly Leu
aggaatcggc aaagataggc gctgcaagaa caatggctgt cctgcttcag gctacttctt ttaagtagac caaaattcaa tttactcaaa ttatctcaag caaatagcta 668
115 Ala Asn
130 Phe Gly 145
Leu Ser Gly Phe
Leu
Ser
Ser 165 Asn
120 Ser Arg
135 Gly Phe 150 Val
Gln 180
Gln GIu GIy Arg 195
Pro
Asn
Ile 200
Pro
Val
Arg 170 Gln
5
Giy
12 5 Gln Met
140 Gln Asn 155
Phe Gly Asn Val
Ser
Phe 175 Pro
Ser 160 Glu
Asn
190 Leu Asn 205
acgagagaga ataaaaaagt ttttccaatt tacaacaagc ttcttgcagc tacattcaag cccagatgcc gtaatttgag attcattggg agggtcgaat cacaaagtgg
aagtagcaag agatggtaga gactcgtgaa tgagccttca tgctacttcc aattgatgat tgtttctggt tactcaaatg at ttaatcag tgggaacttg agatgctgct
Pro Val Ser
Asn
Phe
Gly Leu
Phe Gln
Tyr Gln Gln Ile Ala Thr Gln Ser Gly Asp Ala 210 215 220
Asn Arg His Ser Ser Asn Ile Arg Met Glu Leu Gly Gln Ala Glu Ala Ser Val Ser Val Ser Phe Arg Ala Gly Ser Trp Leu Ser Thr Thr Gln Asn Glu Leu Gly Ser Leu Gln Ala Ala Arg
Glu Arg Lys Asp Pro Ala His Lys Pro Ser Leu Ala Ala Thr Asn Trp Pro Ser Gln Met Ser Leu Leu Ser Gln Phe
60 120 180 240 300 360 420 480 540 600 660 <210> 57 <211> 294 <212> DNA
<213> Prunus pérsica <4 00> 57
gagttcaaat tacatgcaaa agatggcttt ggtcctatga gtttcacctc aattttgggt gagcttgggt tgtctcagga tggtcatatt: atttaccagc agatggggca tgctagagta caccagcacc agcaaccccc tgctaaggat
cctggctttg ggtgggagta ggggttttga caccagcacc gactctcaag
acttgcctgt ctccaacatg 60 accaacagct tcctggcttg 120 actcacaagc cttgagccag 180 agcaccagca ccagcaccag 24 0 gctcaggaca gtag 294
<210> 58 <211> 97 <212> PRT
<213> Prunus pérsica <4 00> 58
Glu Phe Lys Leu His Ala Lys Asp Gly Phe Pro
10 15
Val Ser Asn Met Gly Pro Met Ser Phe Thr Ser
25 30
Ser Asn Gln- Gln Leu Pro Gly Leu Glu Leu Gly
40 45
His Ile Gly Val Leu Asn Ser Gln Ala Leu Ser
50 55 60
Met Gly His Ala Arg Val His Gln His Gln His 65 70 75 80
His Gln His Gln Gln Pro Pro Ala Lys Asp Asp 85 90 95
Gln
Gly Phe Asp Leu Pro Ile Leu Gly Gly Gly Leu Ser Gln Asp Gly Gln Ile Tyr Gln Gln Gln His Gln His Gln Ser Gln Gly Ser Gly
<210> <211> <212> <2 13> <4 00> aacccacatg caacaaccac aataaaccag aaacagttag gggaggagga ttgggtcata ataattgctg tcagtttcac ggtgggtcca aatttaggga ggattccagt tctagttatt cctatgagtt cttgggttgt tatcagcaga cctgctaagg <210> < 2 11 > <212 > <2 13> <4
59
936
DNA
Ricinus communis
59
aattacctaa cttcttgact caccctcctc aaccagccct acagcaacaa 60
aacaagaaca acaacatcaa aaccagaaac aacagacaaa catgggagag 120
cagaaatcaa agatttccag attgttattg cagataaaga agagcagaag 180
caccaaaaag aagctcaaac aaagacagac atacgaaagt tgaaggaaga 240
taaggatgcc agcactttgt gcagcaagaa tctttcaatt gacaagagaa 300
aatctgatgg ggaaacaata cagtggttat tacaacaagc tgaaccatct 360
caactgggac aggaacgata ccagcatcag ctttggtagc tgctggtgga 420
agcaagggac ttctctatca gctggattac accaaaagat tgatgattta 480
gtagtattac tagtagtaat agtaggacaa gttgggcaat ggtaggtggc 540
gaccccatca tgtggcaaca acagggttat ggcccccagt tggtggtttt 600
catcatctac tactactggt ccagtaacat caaatttggg aaatgaaagt 660
tgcaaaaaat tgggtttcct gggtttgatt tgccagggaa taatatggga 720
ttacctcaat cttgggtggg actagcaacc agcagatacc tggtttggag 780
cacaagatgg tcatattggg gttttgaatt cacaagcttt tagtcagatt 840
tggggcaggc cagagtgcag caccagcacc agcaccagca ccagcaaaat 900
atgattctca agggtcagga cagtaa 936
60 311 PRT
Ricinus communis
Asn 1
Leu
Lys
Phe 50
J> Pro
60 His 5
Gln Gln 20 Gln Gln 3 5
GIn Ile
Glu Leu
Gln
Thr
Gln 25 Asn 4 0
Val Ile 55
Pro 10 Gln
Met
Ala
Asn
Pro
Gly 45
Asp Lys 60
Phe Leu 15
Gln Gln 30
Glu Asn
Thr His Pro Pro Gln Pro Ala Glu Gln Gln His Gln Asn Gln Lys Pro Ala Glu Ile Lys Asp Giu Glu Gln Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn Lys Asp Arg His Thr Lys Val Glu Gly Arg 65 70 75 80
Gly Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala Arg Ile Phe Gln
85 90 95
Leu Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu Thr Ile Gln Trp
100 105 110
Leu Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly
115 120 125
Thr Ile Pro Ala Ser Ala Leu Val Ala Ala Gly Gly Ser Val Ser Gln
130 135 140
Gln Gly Thr Ser Leu Ser Ala Gly Leu His Gln Lys Ile Asp Asp Leu 145 150 155 160
Gly Gly Ser Ser Ser Ile Thr Ser Ser Asn Ser Arg Thr Ser Trp Ala
165 170 175
Met Val Gly Gly Asn Leu Gly Arg Pro His His Val Ala Thr Thr Gly
180 185 190
Leu Trp Pro Pro Val Gly Gly Phe Gly Phe Gln Ser Ser Ser Thr Thr
195 200 205
Thr Gly Pro Val Thr Ser Asn Leu Gly Asn Glu Ser Ser Ser Tyr Leu
210 215 220
Gln Lys Ile Gly Phe Pro Gly Phe Asp Leu Pro Gly Asn Asn Met Gly 225 230 235 240
Pro Met Ser Phe Thr Ser Ile Leu Gly Gly Thr Ser Asn Gln Gln Ile
245 250 255
Pro Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His Ile Gly Val Leu
260 265 270
Asn Ser Gln Ala Phe Ser Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg
275 280 285
Val Gln His Gln His Gln His Gln His Gln Gln Asn Pro Ala Lys Asp
290 295 300
Asp Ser Gln Gly Ser Gly Gln 305 310
<210> 61 <211> 231 <212> DNA
<213> Salvia miltiorrhiza <400> 61
agtttcacct caattttgag cggcggcgct cagcagctgc ccggattgga gcttggccta 60 tcacaagatg gaaatattgg cgtgctcaat cctcaagcat tcgggcagtt ttatcagcag 120 atggcaccgg cggcgcgtgt tgcccaccac catcagcagc aacaccacca ccaccatcag 180 cagcagcctt tgtcgcccaa ggatgatgat tctcaagaat caggacagta g 231
<210> 62 <211> 76 <212> PRT
<213> Salvia miltiorrhiza <4 00> 62
Ser Phe Thr Ser Ile Leu Ser Gly Gly Ala Gln Gln Leu Pro Gly Leu 10 15
Glu Leu Gly Leu Ser Gln Asp Gly Asn Ile Gly Val Leu Asn Pro Gln
25 30
Ala Phe Gly Gln Phe Tyr Gln Gln Met Ala Pro Ala Ala Arg Val Ala
40 45
His His His Gln Gln Gln His His His His His Gln Gln Gln Pro Leu
50 55 60
Ser Pro Lys Asp Asp Asp Ser Gln Glu Ser Gly Gln 6 5 7 0 7 5
<210> 63 < 211> 598 <212> DNA
<213> Zinnia elegans <4 00> 63
cacacaaagg ttaaaggaag aggtagaaga attaggatgc cagctttatg tgctgcaaga 60 atctttcaac tcactaggga gttaggtaac aaatctgatg gggaaacaat ccagtggctg 12 0 ctacagcagg ccgagccatc tatcatagca gccactggca gtgttagcca ccaccggagc ggcttcacac ggagtctcga aagattgatg tattaggtag tgggaatagt aacactagta agtaatatct gtggcaacaa ctgtaggacc agttggccta atggccacgc ctactacagg tatatggccc gcaatgggat ggcaacaatt taggggttga aagctcgaat tacctgcaaa gaattgcctg ggtctaatat gggtcagatg agtttttcgt catgatcatc atcagcagca gcagcttcct gggttggaac <210> 64 < 211> 199 <212> PRT
<213> Zinnia elegans <4 00> 64
His Thr Lys Val Lys Gly Arg Gly Arg Arg Ile
10 15
Cys Ala Ala Arg Ile Phe Gln Leu Thr Arg Glu
25 30
Asp Gly Glu Thr Ile Gln Trp Leu Leu Gln Gln
40 45
Ile Ala Ala Thr Gly Thr Gly Thr Ile Pro Ala
50 55 60
Thr Gly Ala Ala Ser His Gly Val Ser Ile Ser 65 7 0 7 5 8 0
Lys Ile Asp Val Leu Gly Ser Gly Asn Ser Asn
85 90 95
Ser Asn Ser Asn Ser Asn Ile Cys Gly Asn Asn 100 105 110
Pro Met 115 Trp Pro
130 Gly Val 145
GIu Leu
Gly Arg Pro Thr Thr His Met AIa Thr
120 125
Ala Met Gly Tyr Gly Ser Ser Gly Pro
Glu
Pro 165
135 Ser Ser 150
Gly Ser
Asn
Asn 170
140 Tyr Leu 155 Met
Gln
Gly
Gly Asn His Asn His Asp
180 185
Glu Leu Gly Leu Ser Gln
195 <210> <2 11> <2 12> <213> <22 0> <223> <220> <22 1> <222> <223> <220> < 2 21 > <222>
< 2 2 3 > <220> <22 1> <222>
< 2 2 3 >
< 4 0 0 > Pro Gly 1
<2 10>
< 211 > < 212 >
His
Asp
Gln 175 His Gln 190
Lys Met 160
Met Ser Gln Gln
65 13 PRT
Seqüência artificial
motivo 1 C-terminal de consenso
VARIANTE (6) . . (6)
/substituir="Arg" /substituir="Ala"
INCERTO (10) . . (10) Xaa pode ser
ccgggactat tttcggtagg ttagtaatag tgggtagacc acgggtcttc agatggcgtt cgattttagg ttgggttgtc
cccggcttcc 180 attgcaacat 240 taacagtaat cacaacccat gggtccctcg ttccgggttt taatcataat ccaagatg
300 360 420 480 540 598
Arg Met Leu Gly Ala Glu Ser Val Val Gly Thr Ser Cys Arg Pro Thr Ser Gly Ala Phe Phe Ser Gln Leu
Pro Ala Leu Asn Lys Ser Pro Ser Ile Leu Ala Thr Leu Gln His Ile Ser Asn Thr Ser Trp Thr Gly Ile Asn Asn Leu Ser Gly Phe Ser Ile Leu Pro Gly Leu
uma extensão de 1 a 5 aminoácidos ocorrendo naturalmente
VARIANTE (12) . . (12) /substituir="Leu"
65
Leu Glu Leu Gly Leu 10
66 69 PRT
Ser Gln Xaa Gly Val Leu < 213 > <220> <223> <4 00> Lys Asp Arg 1 5
Pro Ala Leu 20 Lys 35 Ser
Seqüência artificial
Domínio 66
TCP conservado de SEQ ID NO
)2
His Thr
Cys Ala
25
Lys 10 Ala
Glu Gly Arg Gly 15
Arg
His
Ser
Pro
50 Leu Ala 65 <210> <211> <212> <213> <4 00> aatccgaaaa aaatataaaa catccaccta tttccttagt tctgtcatga aaaaaatctt atgaagatat ttgtgcattc ttagtaatta gtacttacgc tcaactagca tgaattcaag aattttacag aaaaaaagaa acagagtggc tccgcaacaa aaccaagcat ggaggcatcc cgaccgcctt cacctcctcc tgtagtacgg gatttgggat ggttttcaat gattttgtga aataaaagta ctatcctttg atgagattga acagtagtcc cctgttcttc ctttctggtt gctgtagttc tttctgatct attatttttt tgtcctcaat cctgtagaag agctgtaatc tggtgtagct <210> <2 11> <212> <213> <22 0> < 2 2 3 > <4 00>
Ser Asp Gly Glu 40
Ile Ile Ala Ala
55 Ser
Ile 30 Thr Ile 45
Thr Gly 60
Phe Gln
Arg Arg Ile Arg Met
Thr Arg Glu Leu Gly
Gln Trp Leu Leu Gln Gln Ala Glu
Ser Gly Thr Ile Pro Ala Ser Ala
Ala
67
2193 DNA Oryza 67
sativa
gtttctgcac cgttttcacc. ccctaactaa caatataggg aacgtgtgct 60
tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tgccactttc accagcaaag ttc 2193
68 53 DNA
Seqüência artificial
iniciador: 68
prmO15 01 ggggacaagt ttgtacaaaa aagcaggctt cacaatggat cccaagaacc taa
53
<2 10> <211> <212> <213> <220> <223> <4 00>
69 48 DNA
Seqüência artificial
iniciador: prm01502 69
ggggaccact ttgtacaaga aagctgggtt tttaacgacc <210> 70 <211> 924 <212> DNA
<213> Cichorium endivia <400> 70
cggggggatc cagagttcaa gcaacaacat cctcaacagc ttcttaagca tcccgcaacc caccagcaac aacatgggag tctgaaatca aagatttaca gattgtaatt cccgacaagg caattagcac ccaaacgcac atccaacaaa gacaggcata cgcaggatta ggatgcccgc tctctgtgct gcaagaatct ggtcataaat ccgatgggga aacaatccag tggctcctac atcgccgcca ccggaactgg aactatcccg gcttcggtgt tcacatgggg tttcgacttc ggcgggatta caacagaaac ggaaatacta gtgacagctg taggaccagt tggccgattg cccgcaaccc acatggccac tcctttaggt atgtggccaa cagtcgcctc cgtcgtcctc tggtccatca tcggccaaca aattacttgc aaaagattgc attttctggg tttgatctgc atgagttttt cttcgatttt gggtaatcat catcaacagc ggactgtcac aagatggtca cataggggtc ttgaatcaac cagatgggtc aggccagaat gcaccatcaa caacaacaac tctcaaggtt cagggggaca atag <210> 71 <211> 307 <212> PRT
<213> Cichorium endivia <4 00> 71
Arg Gly Asp Pro Glu Phe Lys Gln Gln His Pro
10 15
Glu Val Ser Ser Phe Leu Ser Ile Pro Gln Pro
25 30
Gly Asp Asn Asp Asn Ser Lys Pro Ser Glu Ile
40 45
Val Ile Pro Asp Lys Glu Thr Ser Lys Lys Gln
50 55 60
Lys Arg Thr Ser Asn Lys Asp Arg His Thr Lys 65 7 0 7 5 8 0
Arg Arg Ile Arg Met Pro Ala Leu Cys Ala Ala
85 90 95
Thr Arg Glu Leu Gly His Lys Ser Asp Gly Glu
100 105 110
Leu Gln Gln Ala Glu Pro Ser Ile Ile Ala Ala
115 120 125
Ile Pro Ala Ser Val Leu Ala Thr AIa Gly Ala
130 135 140
Ser Thr Ser Ala Gly Leu Gln Gln Lys Leu Asp 145 150 155 160
Gly Asn Thr Ser Asp Ser Gys A.rg Thr Ser Trp
165 170 175
Gly Val Gly Arg Pro Ala Thr His Met Ala Thr
180 185 190
Pro Thr Thr Thr Gly Phe Gly Phe GIn Ser Pro
195 200 205
Pro Ser Ser Ala Asn Asn Leu Gly Ile Glu Ser 210 215 220
tgagcctt
48
agccatatga ataacgacaa aaaccagcaa caaaggttga ttcagctgac agcaggccga tagccacagc ttgacgaatt ttggtccggg ccacaaccgg atttgggcat ccggttctaa aacttcccgg aagcgctgaa atcaaacttc 924
ggtttcaagc cagcaagcct gaagcaacaa aggccgaggt tcgagaatta gccttccatt cggcgcagtt agttggtgtg ggtgggtaga atttgggttt cgaaagctcc tctgggcccg gttggagctg ccagatttac taaggatgat
Gln Gln Thr Ser Lys Asp Gln Gln Vai Glu Arg Ile Thr Ile Thr Gly Vai Ser Glu Leu Pro Ile Pro Leu Pro Ser Ser Asn
Gln Pro Tyr Asn Asn Met Leu Gln IIe Leu Ala Pro Gly Arg Gly Phe Gln Leu Gln Trp Leu Thr Gly Thr His Gly Val Val Gly Val Val Gly Pro Gly Met Trp Ser Ser Gly Tyr Leu Gln
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 Phe Asp Leu 235
Leu Gly Asn 255
Ser Gln Asp
270 Ile Tyr Gln 285
Gln Thr Ser 300
Gly
Pro 240
His His Gly His Met Gly
Lys Ile Ala Phe Ser Gly 225 230
Met Ser Phe Ser Ser Ile 245 250
Gly Leu Glu Leu Gly Leu
260 265
Gln Gln Ala Leu Asn Gln
275 280
His Gln Gln Gln Gln His
290 295
Gly Gly Gln 305
<210> 72 <211> 585 <212> DNA
<213> Fragaria vesca <400> 72
accaccggca ccgggacgat cccggcgtcg gctctagcgg cagcagggga gttcaatatc agctggcttg tatcaaaaga ggaggtagga ccagttgggc tatggtggga gggaatttag gcaactgggc tatggccccc tgctgggttt ggtttttctt ccatctacta caaatctggg agggactgag agcagctcca cttcctgggt ttgacttgcc agtcaccaac atgggaccta ggtgggggaa gtcaacagct gcctggtttg gaacttgggt ggggttttga attctcaggc ttaccagatt taccagcaga caccatcaac agcagcaaca gcaacaccac cagcagcagc caagctccgt cttctaagga tgattctcaa ggctcaggac <210> 73 <211> 194 <212> PRT
<213> Fragaria vesca <4 00> 73
Thr Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala
10 15
Gly Ser Val Ser Gln Gln Gly Ser Ser Ile Ser
25 30
Lys Thr Asp Asp Leu Gly Ser Ser Gly Gly Arg
40 45
Val Gly Gly Asn Leu Gly Arg Pro His Val Ala
50 55 60
Trp Pro Pro Ala Gly Phe Gly Phe Ser Ser Gln 65 7 0 7 5 8 0
Pro Ser Thr Thr Asn Leu Gly Gly Thr Glu Ser
Ser Asn Leu Gly Pro Gln Gln Gln Leu Pro Ile Gly Val Leu Asn Gln Ala Arg Met His Lys Asp Asp Ser Gln Gly Ser
85
Gin Lys Ile Gly 100
Pro Met Ser Phe 115
130 Ser Gln 145 His
Gln
Gly
His
Gln lí Gln
Ala Tyr Gln Ile 150
Gln Gln Gln Gln 165 170
Gln Gln Gln Ala iO 185
< 2 1 O > 74 <211> 818 <212> DNA
<213> Juglans hindsii χ Juglans regia
< 4 O O > 7 4
cggcaggagg cagatgattt ggaggcccca cacagtcatc attacctcca tgagcttcac tgtctcaaga tgggccatgc accaacacca agtag
gtctgtatcg 60
agggtccagt 120
tgtggctgca 180
ttcatctggt 240
aaagattggc 300
ttcaattctg 360
tggccatctt 420
tagagtgcac 480
gcaacagcag 540 585
90 95
Leu Pro Gly Phe Asp Leu Pro
105 110
Thr Ser Ile Leu Gly Gly Gly 120 125
Gly Leu Glu Leu Gly Leu Ser Gln Asp Gly His
140
Tyr Gln Gln Met Gly 155 160
Gln Gln His His Gln 175
Pro Ser Ser Lys Asp 190
Leu Ala Ala Gly Thr Ser Ala Ala Ser Ser Ser Ser Val Thr Ser Gln Leu Gly His Ala Gln Gln Asp Ser
Ala Ala Gly Leu Tyr Gln Trp Ala Met Thr Gly Leu Ser Ser Gly Asn Tyr Leu Asn Met Gly Gln Leu Pro Val Leu Asn Arg Val His His Gln His Gln Gly Ser ccaagggctc aacaacagca aagcagccac aacaagtacc aaccacaaca acaacctaac atgggtgaga acaagcctgc ttgtgattgc tgacaaagaa gagggcaaga agcagttggc aagaccggca caccaaagtt gaaggcaggg gaaggagaat cagcgaggat: ttttcaattg accagagaat tgggccacaa acagcaggct gagccatcga taatagcagc tttagcagcg gcagggggtt ctgtatcaca ctggattgca ccaaaagatt gatgatttgg gggggtccag ccagttgggc aatggtaggt gggaatttag ggagacccca ccccggtcag tgggtttggg tttcagtcat catctggtcc gtgagagttc aaattacctg caaaagattg gcttccctgg ctatgagttt; cacctcaata ttgggtggga ataatcagca gcttatccca agatggtcat atcggggttt tgaacccaca aacagatggg gcaggctaga gtgcagcagc aacagcaa
agtggctgtt: cggcttcagc
aaacttcttg tgaaatcaaa ccccaagaga aaggatgcca atctgatgga cactgggact gcagggggcc tatcgggtta tgtggccaca atcgactgcg ctttgacttg gctaccggga agcct tgagt
agcctcccac gacttccaga agctcaaaca gctctttgtg gaaaccatac ggaaccatac tctctatcag gggagtagga gggctatggc aatttgggaa ccagccaccc ttggagctcg cagatttatc 818
<210> <211> <212> <213> <4 00>
75
272
PRT
Juglans hindsíí χ Juglans regia 7 5
Lys Gly Ser Thr Thr Ala Lys Gln Pro Gln Gln
10 15
Ser Leu Pro Gln Pro Gln Gln Gln Pro Asn Met
25 30
Ala Glu Ile Lys Asp Phe Gln Ile Val Ile Ala
40 45
Lys Lys Gln Leu Ala Pro Lys Arg Ser Ser Asn
50 55 60
Lys Val Glu Gly Arg Gly Arg Arg Ile Arg Met 65 70 75 80
Ala Arg Ile Phe Gln Leu Thr Arg Glu Leu Gly
85 90 95
Glu Thr Ile Gln Trp Leu Leu Gln Gln Ala Glu
100 105 110
Ala Thr Gly Thr Gly Thr Ile Pro Ala Ser Ala
115 120 125
Gly Ser Val Ser Gln Gln Gly Ala Ser Leu Ser
130 135 140
Lys Ile Asp Asp Leu Gly Gly Ser Ser Ile Gly 145 150 155 160
Ser Trp Ala Met Val Gly Gly Asn Leu Gly Arg
165 170 175
Gly Leu Trp Pro Pro Val Ser Gly Phe Gly Phe
180 185 190
Pro Ser Thr Ala Asn Leu Gly Ser Glu Ser Ser
195 200 205
Ile Gly Phe Pro Gly Phe Asp Leu Pro Ala Thr
210 215 220
Ser Ile Leu Gly Gly Asn Asn Gln Gln Leu Pro 225 230 235 240
Leu Ser Gln Asp Gly His Ile Gly Val Leu Asn
245 250 255
Gln Ile Tyr Gln Gln Met Gly Gln Ala Arg Val
260 265 270
<210> 76 <211> 474 <212> DNA <213> Panax ginseng <4 00> 76
tcagcagggc tgtatcagaa aattgatgaa ttgggcgggt ccaatggttg gtgggaattt gggaagaccc catatggcca gctgcagtcg gtggctatgg gtttcagtca tcatcatctg ggacatgaaa gttcaaatta cttgcaaaaa attgggtttt accaatttgg gtcctatgag ttttgcctca attttgggtg
Val Pro Gly Glu Asp Lys Lys Asp Pro Ala His Lys Pro Ser Leu Ala Ala Gly Leu Gly Pro His Gln Ser Asn Tyr Pro Met Gly Leu Pro Gln Gln Gln
Asn Phe Leu Asn Lys Pro Glu Glu Gly Arg His Thr Leu Cys Ala Ser Asp Gly Ile Ile Ala Ala Ala Gly Leu His Gln Ser Arg Thr Val Ala Thr Ser Ser Gly Leu Gln Lys Ser Phe Thr Glu Leu Gly Ala Leu Ser Gln Gln Gln
60 120 180 240 300 360 420 480 540 600 660 720 780
ctagtagtag gagcagttgg cagcaggatt atggcccgct gtccatcgac aaccaatttg ctgggtttga cttgccagcc caagtaatca gcagctccct
60 120 180 240 300 ggtttggagc ttggcctctc acaagatgga catattgggg
acccagattt accagcagat gggaaatgat agaatgcacc
cggaatcacc agcaggcatc tcccaaggat gaatctcaag
<210> 77
<211> 157
<212> PRT
<213> Panax ginseng
<4 00> 77
Ser Ala Gly Leu Tyr Gln Lys Ile Asp Glu Leu
10 15
Arg Ser Ser Trp Pro Met Val Gly Gly Asn Leu
25 30
Ala Thr Ala Gly Leu Trp Pro Ala Ala Ala Val
40 45
Gln Ser Ser Ser Scr Gly Pro Ser Thr Thr Asn
50 55 60
Ser Asn Tyr Leu Gln Lys Ile Gly Phe Ser Gly 65 70 75 80
Thr Asn Leu Gly Pro Met Ser Phe Ala Ser Ile
85 90 95
Gln Gln Leu Pro Gly Leu Glu Leu Gly Leu Ser
100 105 110
Gly Val Leu Cys Pro Gln Ala Leu Thr Gln Ile
115 120 125
Asn Asp Arg Met His Gln Gln Gln Gln Gln Gln
130 135 140
Gln Ala Ser Pro Lys Asp Glu Ser Gln Gly Ser
ttttgtgccc tcaagccttg 360 agcaacagca acaacagcac 420 ggtcaggaga gtag 474
Gly Gly Gly Arg Gly Gly Leu Gly Phe Asp Leu Gly Gln Asp Tyr Gln His Arg Gly Glu
Ser Ser Ser Pro His Met Tyr Gly Phe IIis Glu Ser Leu Pro Ala Ala Ser Asn Gly His Ile Gln Met Gly Asn His Gln
145 150 155
<210> 78 <211> 582 <212> DNA
<213> Poncirus trifoliata <4 00> 78
gaaccatcta tcatcgctgc tacaggaact gggactattc gcaggggcct ctgtttctga acaggggaac tctgtttcag gaagggttgg gaccaggtgt tgggtccatt aatagggcca aattttggaa ggtctcaaat tccaagtgga gtttggccaa gggtttattc aaaattctgg ccagttgact tcaaattttg aatccaaaat ttgggttcca cgggattgaa tttccaaata ttctcctcta tgttgagcgg tgctagccat caaattcctg caggatgcgc atgtgggggt gatgaattct caagctataa gggcatcaca gaagcgcttc aggatccttg aatcagcagc tctgataagg atgattctca gggatcagga tcaaagcagt <210> 79 <211> 193 <212> PRT
<213> Poncirus trifoliata <4 00> 79
Glu Pro Ser Ile Ile Ala Ala Thr Gly Thr Gly
10 15
Met Leu Ala Ala Ala Gly Ala Ser Val Ser Glu
25 30
Ser Ala Gly Leu His Thr Lys Ile Glu Gly Leu
40 45
Ser Ile Asn Arg Ala Asn Trp Thr Met Met Ser
50 55 60
Ser Gln Ile Pro Ser Gly Val Trp Pro Asn Ile 65 70 75 80
Gly Phe Ile Gln Asn Ser Gly Gln Leu Thr Ser
85 90 95
Asn Leu Ser Ala Asn Pro Lys Phe Gly Phe His
100 105 110
Asn Met Asn Met Gly Leu Met Ser Phe Ser Ser
cagcctctat caggcttgca actggacaat atataaatgg gaagtgaaaa tgaatatggg gcttggagct gccagttcta atcagcatca ag
gcttgcagct tacaaaaata gatgagtgca aactgggtct tttgagtgca tttgatgagt tggtctctca tcaacagatg gcaacaaatt 582
Thr Ile Gln Gly Gly Pro Ala Asn Asn Gly Asn Phe Gly Ile Met Leu
Pro Ala Ser Asn Ser Val Gly Val Gly Phe Gly Arg Thr Gly Ser Gly Ser Glu Glu Phe Pro Ser Gly Ala
60 120 180 240 300 360 420 480 540 115
Ser His Gln 130
Val Gly Val 145
Gly His His 165
120 Ile Pro
135 Met Asn 150
Arg Ser Ala 170
Ser
125
Gly Leu Glu Leu Gly Leu 140
Gln Ala Ile Ser Gln 155 160
Ser Gly Ser Leu Asn 175
Ser Gln
Gln Gln Gln Ile Ser Asp Lys Asp Asp 180 185 190
Gln
80 933 DNA
Chlamydomonas reínhardti i 80
ccgttctaca acgcggccag gcgcggcgag gcgtggattc gctgccctcg gtcagctcct gaccggtgct tgtgcaagcc tggggaggca caacctggaa gggtgtgtgt acacatcggc gccgaaggtc tcgagaagtg cgacgtgctg gcaacctggc gttcattggc cctcggagca cgccatggat ataaaagcac cggcaaccta agaacccggc gctgtccact cctcgcccaa gggcatcaac ggccgttcgt gcactaccct ggtttgtgtt catgcagccc tcgtgggcga caacaagaca gcctggtcga atacgagctg
81 310 PRT
Chlamydomonas reinhardtii 81
Met Arg Ser Ala Val Leu Gln Arg Gly Gln Ala
10 15
Arg Val Arg Ala Asp Gly Ser Gly Val Asp Ser
Ser Gln Asp Ala His Phe Tyr Gln Gln Met Gln Gln His Gln His Gly Ser Gly Ser Lys
<210> <211> <212 > <213> < 4 0 0 > atgcgctcag gatggttcgg attgatcgcc ccttgccccc gcgggtccgc atcccgttga tacggcagct ttccccgctg ttccacgcgc gtgcacaaga ggcctgatca gccaagaagc gccgggacac ggggtggact ttcatgcgct ctcaacagcc <210> <211> <212> <213> <4 00>
accagcgcca gctgcgtcgg aaggccgcag gcgacgggca gacgcggaga aacacgggac aacatggagc ggccgccgtt gctgtgctgg gctctggagg cccgtcatgc ggctcgctta atcaaggtgc tacgccacca tga
tgtcttgccg ggttcgggcg 60
gcagcagcgc acgccctctc 120
tcataacctt cgttggctgc 180
cttggaacta tggcgaagtt 240
agcgccagtc gcccatcaac 300
tgggcgaatt cgatttcgcc 360
acagcaccat gcaggtgaac 420
tggagctgct gcagttccac 480
acgccatgga ggcgcatctg 540
gcattatgct ggagcccggc 600
tggcgcccga ggtgcccctg 660
tgctgcccaa gaagagcaag 720
ccacgccccc gtgttcggag 780
ccgacagcca gatcctggac 840
acacgcggcc actgcagctg 900 933
20
25
30
Ala Ser Ser Ser Ala Arg Pro Leu Ile Asp Arg
4 0 4 5
Gly Ala Ala Ala Ser Val Ile Thr Phe Val Gly
50 Cys Lys 65 Ala
Gly
Trp Cys Ala
85
Ser Pro Ile 100
Glu Met Gly Glu 115
Val Leu Asn
55 60
Pro Gly Glu Ala Lys Ala Ala Ala
70 75 80
Pro Pro Thr Trp Lys Gly Val 90 95
Asn Ile Pro Leu Asn Thr Ser Ala 105 110
Phe Asp Phe Ala Tyr Gly Ser 120 125
Gly His Ser Thr Met Gln Val
Thr
130
135
140
Asn Leu Ala Phe Ile Gly Asn Met Glu Leu Glu 145 150 155 160
Phe His Ala Pro Ser Glu His Ala Met Asp Gly
165
Glu Ala His 180
Leu Gly Ile 195
Ser Thr Ala
170 175
Leu Val His Lys Asn Lys
185 190
Met Leu Glu Pro Gly Gly
200 205
Leu Glu Val Ala Pro Glu
Ser Thr
Leu Ile
Val Pro
Arg Arg Val Leu Pro Ser Arg Gln Leu Cys Pro Cys Asn Tyr Gly Thr Gly Lys Pro Lys Val Phe Glu Lys Asn Phe Pro Leu Leu Gln Arg Arg Tyr Gly Asn Leu Lys Asn Pro Leu Ala Lys
Ser Cys Thr Ser Leu Thr Pro Leu Glu Val Arg Gln Asp Ala Cys Asp Ala Gly Phe His Ala Met Ala Val Ala Leu Lys Pro 210 215 220
Ser Pro Lys Gly lie Asn Pro Val Met Leu Leu 225 230 235 240
Ala Gly Thr Arg Pro Phe Val His Tyr Pro Gly
245 250 255
Pro Cys Ser Glu Gly Val Asp Trp Phe Val Phe
260 265 270
Val Pro Asp Ser Gln Ile Leu Asp Phe Met Arg
275 280 285
Lys Thr Tyr Ala Thr Asn Thr Arg Pro Leu Gln
290 295 300
Leu Val Glu Tyr Glu Leu 305 310
<210> 82 <211> 1383 <212> DNA
<213> Chlamydomonas reínhardtii <4 00> 82
cttttgtaga cccacttgtc agtgggcact gcccctagaa gatgcgctca gccgttctac aacgcggcca ggcgcggcga ggatggttcg ggcgtggatt cgctgccctc gaccagcgcc cattgatcgc cgtcagctcc tgaccggtgc tgctgcgtcg cccttgcccc ctgtgcaagc. ctggggaggc aaaggccgca tgcgggtccg ccaacctgga agggtgtgtg tgcgacgggc catcccgttg aacacatcgg cgccgaaggt cgacgcggag ctacggcagc ttcgagaagt gcgacgtgct gaacacggga cttccccgct ggcaacctgg cgttcattgg caacatggag cttccacgcg ccctcggagc acgccatgga tggccgccgt ggtgcacaag aataaaagca ccggcaacct agctgtgctg cggcctgatc aagaacccgg cgctgtccac tgctctggag ggccaagaag ccctcgccca agggcatcaa ccccgtcatg ggccgggaca cggccgttcg tgcactaccc tggctcgctt gggggtggac tggtttgtgt tcatgcagcc catcaaggtg cttcatgcgc ttcgtgggcg acaacaagac atacgccacc gctcaacagc cgcctggtcg aatacgagct gtgagcggac gagcagcgtg tgaacatgaa gattacaagt ttgctgacag gcatcgcatc gtaacagccc gcgaagtacg acttaacatg tattgactgg tttggcccac ggtggggaag gcgtacgcgc ggggaggcat: cgccttgcac gcacttgccg tatgtaggcg ggcgagagac ccgcgaacta aacttaagta gattacccat gtgccctctc aattggggca ccgatgcagg ggctggaagg tca 1383
<210> 83 <211> 310 <212> PRT
<213> Chlamydomonas reinhardtí i <4 00> 83
Met Arg Ser Ala Val Leu Gln Arg Gly Gln Ala
10 15
Arg Val Arg Ala Asp Gly Ser Gly Val Asp Ser
25 30
Ala Ser Ser Ser Ala Arg Pro Leu Ile Asp Arg
40 45
Gly Ala Ala Ala Ser Val Ile Thr Phe Val Gly
50 55 60
Cys Lys Pro Gly Glu Ala Lys Ala Ala Ala Trp 65 70 75 80
Ala Gly Pro Pro Thr Trp Lys Gly Val Cys Ala
85 90 95
Ser Pro Ile Asn Ile Pro Leu Asn Thr Ser Ala
100 105 110
Glu Met Gly Glu Phe Asp Phe Ala Tyr Gly Ser 115 120 125
Pro Lys Lys Ser Lys Ser Leu Thr Thr Pro Met Gln Pro Ile Lys Phe Val Gly Asp Asn Leu Leu Asn Ser Arg
gcggcttctt gtgtcttgcc agcagcagcg gtcataacct gcttggaact aagcgccagt atgggcgaat cacggcacca ctggagctgc tacgccatgg ggcattatgc gtggcgcccg ctgctgccca accacgcccc cccgacagcc aacacgcggc acgagtgtgc agagcgggcg acataaaagt ggttccatca tgctggtgaa gtatccttta ccccgtgtaa
gaccagagaa gggttcgggc cacgccctct tcgttggctg atggcgaagt cgcccatcaa tcgatttcgc tgcaggtgaa tgcagttcca aggcgcatct tggagcccgg aggtgcccct agaagagcaa cgtgttcgga agatcctgga cactgcagct tagggtcagt gagtgcccat gcaatgcgca agcagccttt tgaggtatgg tttggcttgc cacatgacac
Arg Arg Leu Pro Arg Gln Cys Pro Asn Tyr Thr Gly Pro Lys Phe Glu
Val Ser Cys Ser Thr Ser Leu Leu Thr Cys Pro Leu Gly Glu Val Lys Arg Gln Val Asp Ala Lys Cys Asp
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 Val Leu Asn Thr Gly His Gly Thr Met Gln Val
130 135 140
Asn Leu Ala Phe Ile Gly Asn Met Glu Leu Glu 145 150 155 160
Phe His Ala Pro Ser Glu His Ala Met Asp Gly
165 170 175
Glu Ala His Leu Val His Lys Asn Lys Ser Thr
180 185 190
Leu Gly Ile Met Leu Glu Pro Gly Gly Leu Ile
195 200 205
Ser Thr Ala Leu Glu Val Ala Pro Glu Val Pro
210 215 220
Ser Pro Lys Gly Ile Asn Pro Val Met Leu Leu 225 230 235 240
Ala Gly Thr Arg Pro Phe Val His Tyr Pro Gly
245 250 255
Pro Cys Ser Glu Gly Val Asp Trp Phe Val Phe
260 265 270
Val Pro Asp Ser Gln Ile Leu Asp Phe Met Arg
275 280 285
Lys Thr Tyr Ala Thr Asn Thr Arg Pro Leu Gln
290 295 300
Leu Val Glu Tyr Glu Leu
305 <210> <2 11> <2 12> <2 13> <4 00>
310
Asn Phe Leu Leu Arg Arg Gly Asn Lys Asn Leu Ala Pro Lys Ser Leu Met Gln Phe Val Leu Leu
Pro Ala Gly Gln Phe His Tyr Ala Met Leu Ala Val Pro Ala Leu Lys Lys Pro Lys Ser Lys Thr Thr Pro Pro Ile Lys Gly Asp Asn Asn Ser Arg
1244 DNA
Arabidopsis thaliana 84
caaaattcat gtgttagttc ttcttcttta caaaattgag atccaaatga ggaatcactt tgcactatta atagaaaata aagatactat aatagtagag atcaaagacc tgagcaaaaa aaaaaaaaga cttctcctca aaaatggcgt ttacactagg tctctgcaac atcagttcat caaaatggtt gcttacacaa atcggtttca gcttggtgaa gcaaaagcaa taagattact tttggtcttt atagttcttt aaaaaaaaaa gtgaatcaaa ctgttttttt gtatcatagg agaacaaaca tggttcaaga ttatggatct aaacagagaa acagagacaa gttatgattt gatttctgaa attcaagaga caaaagtatc taccggagat ccatagctca atcaccaaag gtaatggtga taggatgtgc cttatgtact aggatttcaa cctggtgaag cttttactat ttaccccggt tcagaatgga ccaacagaaa ccaactcggc ctcttcaggt tgagaacatt atagttatgg gtcatagcaa ttatgagtca tcaaaaccac caagggcaac actctagttt atgggaaagc cgctaagtta agaacacaat tagcttcatc aatgcagaaa ctgtgagaag gaatctataa aggattctgt catggataag agatagagta aagagaggtg aagtcaagat tgtcagattg tagtcttgag aagtggagat taagttcaga atatttcaga cagagagata tggagttgag taaatattga tcagatgtat ctttgtacat acgaaatgat atttacacaa <2 10> <2il> <212> <213> <4 00>
tttaaactgt atacacaacc ctgaaagaaa tggaagagct actgcaacaa acccaggtga gaataaagac attaggaatc tctggatgaa agaaaagttt agattcaagg ccgaaatgtc tcttgagttt ttgtggagga agtagaaagg acatttatcc gatgaatttg tcatggatgt caagactaac acaatcctca ttgg
tttattacta 60 aaacatctaa 120 aaaaaaaaaa 180 cgtcgtctag 240 attggatcgg 300 taagataaag 360 agagattact 420 agggaagaat 480 atgagacaca 540 aaagctttgg 600 gtatgtccat 660 gccaatctcg 720 gcggtcacca 780 attgcagcac 840 tgggttatga 900 tttgatgaac 960 ataacttatt 1020 tattacaatt 1080 tatggattct 1140 gttctaatat 1200 1244
85 286 PRT
Arabidopsis thaliana 8 5
Met Ala Phe Thr Leu Gly Gly Arg Ala Arg Arg
10 15
Ser Val His Gln Asn Gly Cys Leu His Lys Leu
25 30
Asp Arg Phe Gln Leu Gly Glu Ala Lys Ala Ile
40 45
Arg Thr Asn Met Val Gln Glu Leu Gly Ile Arg 50 55 60
Leu Val Ser Ala Thr Gln Gln Ile Gly Ser Arg Leu Leu Pro Arg Glu Glu Phe Met Asp Leu Asn Arg Glu Thr Glu Thr Ser Tyr Asp Phe
65 7 0 7 5 8 0
His Arg Phe Leu Lys Phe Lys Arg Gln Lys Tyr
lie
85 90
Lys Phe Lys Ala Leu Ala
100 105
Gly Cys Ala Asp Ser Arg Val
115
Pro Gly Glu 130
Val Gln Asn 145
Thr Thr Leu 165
120 Ala Phe
135 Gly Pro 150
Gln Val
Gly Gly Ile Ala Ala Leu
180 185
Ser Arg Trp Val Met
95
Ala Gln Ser Pro 110
Cys Pro Ser Tyr 125
Ile Arg Asn Val Ala 140
Glu Thr Asn 155
Asn Ile Ile 175
Met Ser His Gln Asn 190
Asn Gly Lys Ala Ala Lys
205
Ser Phe Asp Glu Gln Cys 220
Met Asn
Thr
Thr
Glu 170
Ser Ala 160
Val Met
195 200
Ala Ser Ser His Leu
210 215
Glu Ser Ile Lys Asp Ser Val Met Asn Leu Ile 225 230 235 240
Arg Asp Arg Val Lys Arg Gly Glu Val Lys Ile
245 250 255
Asn Leu Ser Asp Cys Ser Leu Glu Lys Trp Arg
260 265 270
Thr Asn Tyr Gly Phe Tyr Ile Ser Asp Arg Glu
275 280 285
<210> 86 <211> 801 <212> DNA
<213> Medicago truncatula <400> 86
atggcaaatc aatcatctga gctagccatt gaacaactga gaggaactta atggggtggc cacagcaaaa attgagcagc tgtcatccaa atccaattga acctgctgat cagagaatca aagctcaaca atttcaacaa gaacccggaa ctgtatgatc cccaagttta tggtatttgc ttgttccgac tctcgagtga tttcaacctg gtgaagcttt catggttcga aacattgcta cagttaagat acagtggagt tggtgcaacc cttgagtatg gagaacatct tggttattgg acatagtcgc tgcggcggaa ccagaggatg gttctgctcc atatgacttc atagatgatt tccaaagtca aggttttgaa agaacatgaa cgctgtgatt tgtgaaatgg aatcagtgaa taactcatta gtgaacctga agagaaataa ggaacaagaa cttagctctg ttgggaggtt gaattcaagc tttggaagta taagaatcat gtcactgaac ggccttgaca tgaccatcta a <210> 87 <211> 266 <212> PRT
<213> Medicago truncatula <400> 87
Met Ala Asn Gln Ser Ser Glu Leu Ala Ile Glu
10 15
Leu Arg Glu Lys Glu Glu Leu Asn Gly Val Ala
25 30
Gln Leu Ile Val Glu Leu Gln Gly Cys His Pro
40 45
Ala Asp Gln Arg Ile Ile Asp Gly Phe Thr Tyr
50 55 60
Phe Asn Lys Asn Pro Glu Leu Tyr Asp Arg Leu 65 70 75 80
Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser
Leu Asp Leu Pro Lys Val Val Leu Asn Leu Leu Glu Gly His His Gln Leu Arg Arg Asn Thr Tyr His Gly Leu Ser Ile Trp
Glu Met Arg Glu Ile Glu Met Val Ile Gly Phe Gln Val Thr Pro Phe Ala Val Ser Asn Cys Gly Gln His Thr Gln Leu Cys Glu Lys Ser Trp Ile Cys Tyr Tyr Ser Asp Lys Ser
agaagcttct ttatagttga ttgatggttt gacttgctaa gtccctctgt acatggtccc ctattacagc tctcaaggct gggtgaaaat tcaaagaaca agacatatcc actatgattt ctgttaccat 801
cagagagaag attacaggga tacgtacttc aggccagtct tatcctgaac tccatttaat tctaaaggtg tatgaatcat tggtttatct atgcaaattc atatgttgat tgtgagtgga ccctctaaaa
Gln Leu Lys Lys Leu Thr Ala Lys Ile Glu Asn Pro Ile Glu Pro Phe Lys Leu Asn Asn Ala Lys Gly Gln Ser Arg Val Ser Pro Ser
60 120 180 240 300 360 4 20 480 540 600 660 720 780 85 90 95 Val Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe
100 105 110
Ala Asn Met Val Pro Pro Phe Asn Gln Leu Arg
115 120 125
Ala Thr Leu Glu Tyr Ala Ile Thr Ala Leu Lys
130 135 140 Val Ile Gly His Ser Arg Cys Gly Gly Ile Ser
145 150 155 160
Pro Glu Asp Gly Ser Ala Pro Tyr Asp Phe Ile
165 170 175
Ile Gly Leu Ser Ser Lys Val Lys Val Leu Lys
180 185 190
Asp Phe Lys Glu Gln Cys Lys Phe Cys Glu Met
195 200 205
Ser Leu Val Asn Leu Lys Thr Tyr Pro Tyr Val
210 215 220
Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr Tyr
225 230 235 240
Glu Phe Lys Leu Trp Lys Tyr Lys Asn His Val
245 250 255
Ile Pro Leu Lys Gly Leu Asp Met Thr Ile
260 265
88
774
DNA
Medicago truncatula
Met Val Tyr Ser Val Glu Arg Leu Asp Asp Glu His Glu Ser Asp Arg Asp Phe Thr Glu
Arg Asn Ile Gly Val Gly Asn Ile Leu Met Asn His Trp Val Lys Glu Arg Cys Val Asn Asn Glu Ile Arg Val Ser Gly Pro Val Thr
<210> <211> <2 12> <213> <4 00> 88
atggcaaatc aatcatctga gctagccatt gaacaactga gaggaactta atgaggtggc cactgcaaaa attgaggaaa tgtcatccac aaccaattga tcctgctgag cagagaatca aagctcaaca atttcgacaa ggaccggaaa ttgtatgatc cccaagttta tggtatttgc ttgttctgac tctagagtga tttcaacctg gagaagcttt: catggtccga aacattgcta cagttaagat acagtggagt tggtgcaacc cttgagtatg gagaacatct tggttattgg acatagtcgc tgcggcggta ccagaggatg gttctgctcc atatgacttc atagatgatt tctaaagtca aggtcctgaa agaacataaa ttctgtgatt tgtgaaatgg aatcagtgaa taactcatta gtgaaccttc gcagaaataa ggaacaagaa cttagcacta ttggggggtt gaattcaagt tttggaagta taagactcat attactgaac <210> 89 <211> 257 <212> PRT
<213> Medicago truncatula <4 00> 89
Met Ala Asn Gln Ser Ser Glu Leu Ala Ile Glu
1 5 10 15
Leu Arg Glu Lys Glu Glu Leu Asn Glu Val Ala
25 30
Glu Ile Ile Val Glu Leu Gln Gly Cys His Pro
40 45
Ala Glu Gln Arg Ile Ile Asp Gly Phe Thr Tyr
50 55 60
Phe Asp Lys Asp Arg Lys Leu Tyr Asp Arg Leu 65 70 75 80
Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser
85 90 95
Ile Ile Leu Asn Phe Gln Pro Gly Glu Ala Phe
100 105 110
Ala Asn Met Val Pro Pro Phe Asn Gln Leu Arg
115 120 125
Ala Thr Leu Glu Tyr Ala Ile Thr Ala Leu Lys
agaagcttct ttatagttga ttgatggttt gacttgctaa gtccctctat acatggtccc ctattacagc tatcaaggct gggtgaaaat tcgagcaaca agacatatcc actatgactt ccattacaat
cagagagaaa 60
gttgcaggga 120
tacttacttc 180
aggacaatcc 240
tatcctgaac 300
tccatttaat 360
tctaaaggtg 420
tatgagtcat 480
tggtttacct 540
atgtgaattt 600
atatgttgat 660
tgtgagtgga 720 ctga 774
Gln Leu Lys Thr Ala Lys Gln Pro Ile Phe Lys Leu Ala Lys Gly Arg Val Ser Met Val Arg Tyr Ser Gly Val Glu Asn
Lys Leu Ile Glu Asp Pro Asn Asn Gln Ser Pro Ser Asn Ile Val Gly Ile Leu 130
135
140
Val Ile Gly His Ser Arg Cys Gly Gly Ile Ser Arg Leu Met Ser His 145 150 155 160 Pro Glu Asp 165 Gly Ser Ala 170 Pro Tyr Asp 175 Phe Ile Asp Asp Trp Val Lys Ile Gly Leu Pro Ser Lys Val Lys Val Leu Lys Glu His Lys Phe Cys Ii 30 185 190 Asp Phe 195 Glu Gln Gln 200 Cys Glu Phe 205 Cys Glu Met Glu Ser Val Asn Asn Ser Leu Val Asn Leu Gln Thr Tyr Pro Tyr Val Asp Ala Glu Ile Arg 210 215 220 Asn Lys Asn Leu Ala Leu Leu Gly Gly Tyr Tyr Asp Phe Val Ser Gly 225 230 235 240 Glu Phe Lys 245 Phe Trp Lys 250 Tyr Lys Thr 255 His Ile Thr Glu Pro Ile Thr
Ile <2 10> <211> <212> <213> <4 00> ttcttcgata atcctttaag caatgatctt gttgacggcg gaccggtttt tcttgccaag tccatctcac tatggttcca agttgtacat taagggactc ttgggtgaag ctacgatgat gctttcgtac tcactacaat tgcttttgcc aaaaagacac ctttgatttc aacaataaag aagatttgaa <210> ■ <211> <2 12> <213> <4 00> Met Ala
1
Ser Lys
Pro 5
Pro Glu 20 Gly Leu 35 Ala
90 1100 DNA
Arabidopsis
90
aggattttac gaaaaagacg ctcagtacga gagctaaagg actcaattca actcagaccc atcttgaatt ccttttgacc ctcaaggtgg atgtccattg ataggcgcat caatgcaaca ccattcgtga ttcgtcaaag ttctcttaag tttgactcat tttttgttaa ctgtaaccaa ctttccttct
91 280 PRT
Arabidopsis 91
Ala Phe
thaliana
tctccagaga aaatggcaac aagcggatct agcttgactc aaaccgagaa caaagtttct tccaacctgg agaagagaca agaacatttt aagatgatgc cagcgaggaa agtgtgagaa gagctgaggt gaacgtttga aaagaaagct ctttcttcat ttcaaaactt cgtttgaaac
thaliana
aagaaaaaaa ggaatcgtac cggaaacgtc aagcaattca atatttgaag ggtgtttgct tgaggctttt ctctggagtt ggtgataggc tgccccaact caagatcaag ggaagctgtg ggtgaagaac tctctgggag accggaacat tctctcatgt caactttgct ttctatattt
aaacctcctc gaagccgcca gccgccgcga gacgcaattg aatagtactt tgctctgatt gttgtcagaa ggcgccgccg catagctgct caaagtgact gaggaacata aacgtatcgc acacttgcaa ctcgatttca ataaaactct tgatgattcc gcttctattt gtctaattga 1100
tgcttttgtg 60 ttaaaggact 120 agatcaaagc 180 aacgaatcaa 240 tgttcaatca 300 ctcgagtttg 360 acatagccaa 420 ttgaatacgc 480 gtggtggtat 540 tcattgaaaa 600 aagacttgag 660 ttggaaactt 720 taagaggagg 780 agaccactcc 840 tttgagataa 900 tctccaactt 960 caaaagctca 1020 tgtttgaacg 1080
Gly Lys 10
Ala
Ala 50
Ser Ser Asn
Lys Asp 25
Asn Asp 40
Lys Ile
Glu
Leu
Lys
65 Phe
Lys
5 Ser 70 Thr Glu
Asp Lys
Ala
75 Tyr Leu
Met
30
Leu Ser 45
Ala Leu 60 Ile
Cys Phe 15
Ala Thr
Glu
Ala Lyi
HD Thr
Gln
Arg
Va J
100 Val Cys 115
Val Arg
130
90
Thr Pro 105
Pro Ser His 120
Asn Ile Ala 135
Lys 95
Phe Leu 110 Leu Asn 125
Asn Met Val
Lys
Ile
Met Phe Cys Cys Ala Lys Thr Glu Ser Tyr Glu Ala Ala Ile Thr Lys Ala Asp Leu Gly Asn Val Thr Ala Glu Leu Lys Glu Leu Asp Ile Lys Thr Gly Phe Thr Gln Ser Thr Leu Phe Asn His Leu Val Phe Ala Cys Ser Asp Ser Phe Gln Pro Gly Glu Ala Phe Pro Pro Phe Asp Gln Lys Arg
Arg
80 Asn
14 0 His Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val Val His Leu Lys 145 150 155 160 Val Glu Asn Ile Leu Val Ile Gly His Ser Cys Cys Gly Gly Ile Lys 165 170 175 Gly Leu Met Ser Ile Glu Asp Asp Ala Ala Pro Thr Gln Ser Asp Phe lí 30 lí 35 190 Ile Glu Asn Trp Val Lys Ile Gly Ala Ser Ala Arg Asn Lys Ile Lys 195 200 205 Glu Glu His Lys Asp Leu Ser Tyr Asp Asp Gln Cys Asn Lys Cys Glu 210 215 220 Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Ser Tyr Pro Phe 225 230 235 240 Val Arg Ala Glu Val Val Lys Asn Thr Leu Ala Ile Arg Gly Gly His 245 250 255 Tyr Asn Phe Val Lys Gly Thr Phe Asp Leu Trp Glu Leu Asp Phe Lys 260 265 270 Thr Thr Pro Ala Phe Ala Phe Ser
275 <210> <211> <212> <213> <4 00> atcatttttc cgtgctcgct ttccctccca gacatcctca cccccaccgc cgctcagcgt tggcctcaag tagatgagat tcaagcacag caccaaagtt ggtttcagcc agcatggtgc agaatgtatt aaagtaagca agagtgcaag aacattgtga tagagaaaag attgcacatt atgccataaa ttcactctgc ttgcactttg ctgttacggt gttgtatgtt gactaggctg ggcagcaaag Ctgtattatt taccaaaaac tgtaattgca atataataat ttttgtcg <2 10> <211> <2 12> <213>
92
17 4 8 DNA Oryza 92
280
sativa
taaaaaagaa gcctcgctct caaatgcccg catggctcct cgacggcccc ttccctgcgt agatcattct agatggggaa gaattgtgtg catggtggtt cggggaagca ttcagagact agtggtaggt agatgattcg gttaagtacg aaaggaatca ggtgaatgaa cgagaagtgg gaataggact cccctgcagt ctccattgtg gttgttggta atcagcttca cagttgagcg tgaaagtttg ttctgcttag atgtacgatc aaaataagat tctcaaatag
aatcgctgcc accccgtaaa agaccccgac agtctgctcc ggccggagcc gtgggaggat ggtttgactc catgatccat gataatattt gcttgtgctg tttactgtcc agcgctgcac cacagccgtt caatctagaa gaagcagcag attaatagct ggaactttga aaattagtat acctggtctt ttagcatggt gtattgacat ccattgatta cagaggtaca aaaccacaat tcaaactgcc aagcatcata ttgccacatt agagctttgt ttgaaacaat
tcgacctcgg atcccccccg cacgacgacc gccccgcctc gctccgctgt ctagccggag gacagctttt tcatggagtt ctaactatca attctagggt gtaatatagc tggagttcgc gtggtggtat gctttatcag ctggaaattt cactgttgaa gccttcatgg accgccaagg gatcaagagg tttgctttgc tctgcaagaa acataacact tgtggcactt ggagtgaagt ggggacaaag ttaattcaat tggcaaatta aatctggtgt gttgtgttta 1748
tttctccgtc gccgttgccg accacccgcg cccgtgcctc gacgatcggt ggactttccg agattttcaa gaaagcaagg aaatcttgct atgtccttca aaatttggta tgtcaacaca ccaagcacta agattgggtg gaattttgaa cttgttaaca gggctattac gttggaaggt cattgcttac cactgtgctg cgagtcccag tgacggccat taacagttat gcaacagaaa tgaattttgt aagctgcaaa ttgtgttgta gccgggcagc aagttcaatc
gcatcgccgt cgcgaagctt cgagcaccgg aacctcgcgc ggttcgaggc tgtaccacaa catggtacag ttcatggact cagcagcaaa agtgttttgg ccaccatatc ctagaggtag atgagtatga tcaat tgcaa ttacagtgca tacccttgga aattttattg ggaagcaagt ctgggtaaat tccattttca tatcaagtca acttggtcat ttgatacagt tgaacattat ccaaatatcc ctcatattca tcatttatcg tgctgtatca tttactgttc
<4 00> Met Ala
1
Pro
93
306
PRT
Oryza sativa 93
Pro Ser Leu
D
Thr
Gly
Pro 20 Gly Ser
Leu 10
Ala Asp Gly 25
Arg Pro Leu
Arg
Pro
Ser
Pro Ala 15
Gly Arg 30
Val Ser
Ser Pro Gys Leu Asn Leu Ala Ser Arg Ser Ala Val Thr Ile Leu Arg Val Gly Gly Ser Ser
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 35
Arg Arg Asp
50 55
Leu Thr Arg Gln 70
Gly Glu His
85 Lys His 100 Gln Gln
40 Phe Pro
Leu
65 Asp
Phe
Arg
Ala
Arg
115 Val 130 Thr Val 145 Ser
Glu
Cys Arg
Gln
Pro
Asp 90
Asn Cys
105 Thr Pro 120 Ser
Cys
60
Leu Asp
75 Pro Phe
45 Thr Thr
Met Ala Ser
Phe
Val
Lys
Glu
Leu
Thr 165 Val 0
Ser
Asn
1
Met 195
Ile Arg Asp 210 Ala Ala Ala 225 Lys
135 Asn Ile 150 Ser
Leu
Ala
Met
Ile
Tyr
Glu Ser 245 Glu Lys 260 Asn Phe
Val lí Lys 200 Trp Val
215 Gly Asn 230 Ile
Ser
Ala
Ala 170 Val
5
Ser
Val
14 0 Asn Leu 155 Leu
Gln 80
Met Glu
95
Asp Asn 110 Phe Met 125 Leu
His
Leu
Gly Lys
Ile Ser
Val Val
Gly Phe Gln
Val
Glu
Pro 160 Ala
Pro
Val
Gly Lys
Ser Ile Ala
Phe 17 5
His Ser Arg Cys 190
Gln Asp Asp Ser 205
Lys Ser Ala
Asn
Arg Val
Leu
Ser 250 Asn
220 Asn Phe 235 Ser
Leu
Glu Gly
Glu
Leu 255 Thr
Leu 240 Asn
Gln
Leu
Gln
Leu
275 Gly 290 Trp Ser 305 <2 10> <211> <2 12> <213> <4 00> agcagcaatg cctctcatac ggcggactac cccggcgtac gcaggccatc caccctcgtc tacctacatt ct cattcata tgccatgtca acgtgatatg gaaataaatt aaataaaaaa atttttgcat atatgtcact aatttgacta gtataagaat tgattttttt cccccgaggg gcagagattt ggtggggacg gccgtcggag tgccgccgac cttctacttc
2 65 27 0
Ile Asp Cys Thr Phe Glu
280 285
Glu Gly Gly Ser Lys 295 300
Leu Ser
Lys Trp
Tyr Ala Ile
94
1997 DNA Oryza 94
s ativa
gtgtcctccc ggtgaggcgg gggtacgcgg aagctgtgcg tccaacccca aacaacggca gggatttttt ttttcaatat gtctgaatac ttattttacc taagaaaggt aaatt ctcca gtcacttaaa tqacaataca tgaatagaac tttaacttgc tttaattttt acaaaaatcc gattgattgg gtgacggtga cacaccatca ggcagcctcg cagctcaaga
atgcagccat: cgccgaagat cggggagcaa gcgacggcaa acctcgactc aggacatctt ttgaatttgt ctgaaccttt acggtgtggt atggtaggca ttgtttttga ttgggaaaac aagtcattaa tattcaaatt gcataattca gtgtctgtga cgataacgtt acttcccctg catatcgaac acggcaaggt acggggagaa cegtcatcgc ggaagctcgc
Arg Asp Thr Val Ala Arg Asn Tyr Ala Cys Pro Gly Tyr Gln Asn Thr Gly Gly Gln Ser Arg Leu Cys Lys Leu Thr Leu His Lys Leu Lys Asn
His Ser Gly Asp Glu Ile Phe Met Asp Gln Asn Leu Ala Asp Ser Glu Ala Phe His Gly Ala Leu Glu Val Ile Gln Ala Arg Ser Phe Ser Thr Glu His Cys Glu Tyr Pro Trp Gly Gly Tyr Val Tyr Arg Arg Thr Thr
cgtcttcttc gacggcggtg gctggggccg gaagcagtcg actcaaccgc ggcaagccat ttttattttt tgaccacggg agaaataaat ggttggcgtg aataaaaaaa tctattcatc aaattttgaa caacttgtac cggttaaatt aaagatatat ttgaacgtca cattgttgca catggcgcag gtacagcttc gcacccgctg catcctctac cgagctcgcc
ctcgtcgccg gcggcggact gagaactggg cccatcgaca acctacaccg ctaacctaac aattctaaaa ttggcgtggc tttcatgctg gccaaaagat tttagaaaag ccttcaagag aaaatttagt atatagaaac tattattttt catatattga tgcacaaaac ttatccaatg atggagttcg aggcgggtgc gagctccaga aagtacggcg gccgacggct
cgtcgtcgct 60 acgggtaccc 120 ggaagctgag 180 tcgtcaccaa 240 cctccgacgg 300 tagctagacc 360 acaaacattt 420 aaaataatac 480 gttttaggtg 540 tcagattttg 600 ttcaagaaaa 660 atatcccctt 720 agcatatgta 780 aaaaataaca 840 gtttcgaatt 900 tctatcttga 960 gagaggatgt 1020 gagctagcta 1080 agccagacaa 1140 actggcacgc 1200 tggtgcacgc 1260 ccccggactc 1320 gcagcttcgg 1380 cgaggagaac gcccaggtcg ggggagctac ttccgctacg ctggagcgtg ctcggcaaga gctgctcccc gccggcggcg
ctacaacccg tttggcccat tgaaggatct tgcttagata tttggaaaca gcacttgttt gagctgattt <210> <211> <212> <213> <400> Met Ala
cccaacagca ttatatatac caatttttga ggcccttatc tggttgctta ttcattcaaa gaatttt
ccctcggcct ccggctcgct. tcaggcagat cgaggccgac ccatctcctt tatatgggtt gatttttctt tatagtatag tcctcacttg cattagcctg
cgtccacctc gacggcgccg cagccaggag gcagccgctc caaggtctag gcattgggct gtttctggag taacatatgt gaattaggct tcgcatagat
cgctcgctgc ccgtgcaccg caggtcgccc aacggccgca tagccccagg gcacaggccc aaaaaaaatt atatgaattt tttaaaagtc agtctttttc 1997
agaagcggac aggacgtctt tcatcaccgc ccgtgcagtt cccaatgggc tgaaattgat catgtactgt aattttagga gagcacatgt ttaataatta
1
Asn Glu
Gly
20
His Thr 35 Ala
95 182 PRT
Oryza satíva 95
Gln Met Glu 5
Lys Val
Ile
His
50 Tyr Gly 65 Glu
Ala
Leu
Ala 55 Pro 70
Ala Ala
Ala
Tyr
25 Asn :0
Asp Asp Asp
Phe 10 Ser
Gly
C-Iy
Ala
Tyr
Val
85
Leu Gly 100 Phe Arg 115 Phe
Ser
75 Gly Cys 90
Glu Pro Asp Lys Val 15
Phe Arg Arg Val His 30
Glu Lys His Pro Leu
45 Ser Leu 60 Phe
Ala Val Ile
Tyr
Phe 80 Phe
Gln Leu
Leu
Tyr
Trp
Leu
Val His
105 Ala Gly 120
Val Leu
Leu
Ser
Ser 95
Arg Ser 110 Leu Thr 12 5 Lys
130 Val Ala 145
Gln Pro Thr Ile
<210> <211> <212> <213> <4 00> atggcgcgcc gggtcacctg caagggcctc gcggcttcca
Ser Val Leu Gly
135 140
Ile Thr Ala Leu Leu Pro 150 155
Leu Asn Gly Arg Thr Val Gln 165 170 175
Ser Phe Lys Val 180 96
1497 DNA
Dunaliella salina 96
tcgcgctgtt aggcgccgcg aggggcatgg cactaagact ataccaacag cgaccccccc gttcaagtgc cgaaattact ggacatgcag
Gly Glu
Leu Gln
Ala Pro
Ile Arg Gln
Ala 160 Phe
Gly Tyr
ccagtggccg actgtgatgg gcagacccga ctgaccgcag
gattttgtgc gacgcgccca cagcccatcc taccctcttg atcggcacca gttgaggatg gacatggaga tacgacggca agccccagga caccccaatg gtctaccgct gagctgtctt
tgcgaagcaa cgtccggcaa agctttactt atgcccacct tgtataagta cacttgagga
cggcgtgt ct cgtcaagttg cctgcccacc ccaccacttt tgtcatggct tggcaatggc gcgtgatgat
tcagcccgaa agaccatgtc gcctgaccac ccctccctgc
ccatctccat aagccatccc acgaggctac ctcccacgac
cgaecagctg caccaacaac agccatggat cgtcacagca
Gly Thr Val Trp His Ala Glu Leu Gln Ala Ile Leu Lys Arg Lys Glu Asn Ala Lys Arg Thr Pro Cys Thr Ile Ser Gln Gly Ala Arg Asn Pro Pro
Thr Val Pro Ser Met Val Tyr Lys Leu Ala Gln Val Gly Ser Glu Asp Glu Gln Pro Thr Asn Ser
ctactatgcg gagatgatgg tacaactaca gagctgtgcg agcccaatca ggcatcaacc aacatcgagc atcatgatcg gccagtgagc tcccttgatg gatgacttcc gtgtcttacg ctgccccagt agtgaggtgg aagacatttg cgcgtgatcc gactccggcg acctacgaca
ccctggcggt gcgctggaag actgccatgg acagcccagc acatcgtgac tgagaggcat aagacatgaa acggcacaga acaccatcaa accccaacca tggcgcgcct gcagcaaaga cctccctgga tgaagtggca agagggtctc agcctctcgg atggcaccgg tcatggtctc
1440 1500 1560 1620 1680 1740 1800 1860 1920 1980
ctcgacgcaa 60 gctgctccag 120 ctttgactgg 180 atcaagtttt 240 gagcgagctt 300 gggctcctcg 360 gatcagctgg 420 gcagcgattc 480 tgggcagctc 540 gctggctgtc 600 gttcggcaag 660 agtgccaatt 720 gtacgctggc 780 cgtgttcacc 840 cttcaacgcg 900 caccacjggct 960 caacgctgac 1020 aggcaccgct 1080 agcagcctgg cggacatgtt caacaatgga gctcgtctgg acaatggcgg ttttggtcct 1140 gatgaccagg cagaggctga cctgctgcgc cagatccagc ggcgtgcacg tgcaaactct 1200 ggtgctgaag gcgctgaggt ggtccgcatg atgaagttca cagctgccct tggccgtcgc 1260 aggctcaacc agcagggcgc ggcagcagag atggacatca ggtactactt tgagggtagc 1320 accgatcaag aagaggctac atcagctgtg aatggcatga acccctcttc gctgggcagc 1380 tccagcagtg gcctgactga tgtgcagcag actgaggtaa cctcttctgc cagcagcctg 1440 cgtgctggcc tgggcttggt tgtggcagcc ttcttcggtg ctgcattggc actgtga 1497 <210> 97 <211> 498 <212> PRT
<213> Dunaliella salina <4 00> 97
Met Ala Arg Leu Ala Leu Leu Gly Ala Ala Leu Leu Cys Ala Leu Ala 10 15
Val Ser Thr Gln Gly Ser Pro Glu Gly His Gly Thr Lys Thr Glu MeL
25 30
Met Gly Ala Gly Arg Leu Leu Gln Gln Gly Pro His Thr Asn Ser Asp
40 45
Pro Pro Tyr Asn Tyr Asn Cys His Gly Phe Asp Trp Ala Ala Ser Ser
50 55 60
Ser Ser Ala Glu Ile Thr Glu Leu Cys Asp Ser Pro Ala Ser Ser Phe 65 70 75 80
Pro Val Ala Asp Cys Asp Gly Asp Met Gln Ser Pro Ile Asn Ile Val
85 90 95
Thr Ser Glu Leu Ala Asp Pro Thr Asp Arg Ser Gly Val Ser Gly Ile
100 105 110
Asn Leu Arg Gly Met Gly Ser Ser Asp Phe Val Leu Arg Ser Asn Val
115 120 125
Lys Leu Asn Ile Glu Gln Asp Met Lys Ile Ser Trp Asp Ala Pro Thr
130 135 140
Ser Gly Asn Leu Pro Thr Ile Met Ile Asp Gly Thr Glu Gln Arg Phe 145 150 155 160
Gln Pro Ile Gln Leu Tyr Phe His His Phe Ala Ser Glu His Thr Ile
165 170 175
Asn Gly Gln Leu Tyr Pro Leu Asp Ala His Leu Val Met Ala Ser Leu
180 185 190
Asp Asp Pro Asn Gln Leu Ala Val Ile Gly Thr Met Tyr Lys Tyr Gly
195 200 205
Asn Gly Asp Asp Phe Leu Ala Arg Leu Phe Gly Lys Val Glu Asp Ala
210 215 220
Leu Glu Glu Arg Asp Asp Val Ser Tyr Gly Ser Lys Glu Val Pro Ile 225 230 235 240
Asp Met Glu Ile Ser Pro Lys Asp His Val Leu Pro Gln Ser Ser Leu
245 250 255
Glu Tyr Ala Gly Tyr Asp Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu
260 265 270
Val Val Lys Trp His Val Phe Thr Ser Pro Arg Thr Ile Ser Ile Asp
275 280 285
Gln Leu Lys Thr Phe Glu Arg Val Ser Phe Asn Ala His Pro Asn Glu
290 295 300
Ala Ile Pro Thr Asn Asn Arg Val Ile Gln Pro Leu Gly Thr Arg Ala 305 310 315 320
Val Tyr Arg Tyr Glu Ala Thr Ala Met Asp Asp Ser Gly Asp Gly Thr
325 330 335
Gly Asn Ala Asp Glu Leu Ser Ser Pro Thr Thr Val Thr Ala Thr Tyr
340 345 350
Asp Ile Met Val Ser Gly Thr Ala Ser Ser Leu Ala Asp Met Phe Asn
355 360 365
Asn Gly Ala Arg Leu Asp Asn Gly Gly Phe Gly Pro Asp Asp Gln Ala
370 375 380
Glu Ala Asp Leu Leu Arg Gln Ile Gln Arg Arg Ala Arg Ala Asn Ser 385 390 395 400
Gly Ala Glu Gly Ala Glu Val Val Arg Met Met Lys Phe Thr Ala Ala 405 410 415
Leu Gly Arg Arg Arg Leu Asn Gln Gln Gly Ala
420 425 430
Ile Arg Tyr Tyr Phe Glu Gly Ser Thr Asp Gln
435 440 445
Ala Val Asn Gly Met Asn Pro Ser Ser Leu Gly
450 455 460
Leu Thr Asp Val Gln Gln Thr Glu Val Thr Ser 465 470 475 480
Arg Ala Gly Leu Gly Leu Val Val Ala Ala Phe 485 490 495
Ala Leu <210> 98 <211> 1668 <212> DNA
<213> Dunaliella salina <4 Θ0> 98
atggcgaggc tcgtcctgct aggggcgttg ctcggcgcgc ggctccctgg atggctctca ggttgaggcg ggtctaggaa ccccatgagt acaactacaa cagacatggc atcgactgga tgcgctggct ccatgcagag ccccatcaac atcgacatgg gagcgcagcg atgtgagcgg cctctacctc aatggcctcg gccgccgacg tgacagtgaa cgcggagcag gacatgaaga cagaacaaca tgcctgccat caagatcgac ggcagcgaca ctgcacttcc accacttcct cagcgagcac gccatcaacg gcgcaccttg tgatggggga cgcaagcggc aacaccaacc atgtaccagt acggcgagca gcctgacgac ttcgtccggc gatgagatcg cgaccaacgg tgctgggtac ggagagactg gtgaacatca tgaaggatgt gctgcccccc acccaccaca agcctgacca cgcccccgtcj cgatgagagg gtgaagtggc accatcacaa ctgggcagct ggagaagttc ctgatgatca gcgatcgtca ccaacaaccg catcgtgcag cccattggca cccacacccg ccagctacaa ctacgcgcgc aagggcattg gacaactgtg ctggtgacag gcagagcccc atcaacattg ggcgctgtct ctggcatcag cctgaacggc ctggagtcac gcctacgtga acctggagca ggacatgaag gtcagcttca cccactgtca acatcgatgg gaacgacgag tcgttcaggc cacttctcca gcgagcacac cgtggatggc atgatctacc atggcatccc aggccgagaa cagcaaccag ctggcagtca ggcagtgagg ctgatgactt cctgaccagg ctgcacaccg ggcaacgcca actggggcga caacaacgtg cccatcaacc gatttgatgc ccagcagtac tgagcactgg gcctatgagg tgcgatgaga gggtgaggtg gattgtgatg aaggagccca atggagacct tcaagactgc caccgtgaac gcccactacg cgcgcgattc aggagcgcaa cagcaggcct attagcagta <210> 99 <211> 555 <212> PRT
<213> Dunaliella salina <4 00> 99
Met Ala Arg Leu Val Leu Leu Gly Ala Leu Leu
10 15
Thr Ala Val Gln Gly Ser Leu Asp Gly Ser Gln
25 30
Gly Arg Gln Leu Thr Gln Asp Lys Pro His Glu
40 45
His Gly Ile Asp Trp Arg Asp Glu Gly Leu Asp
50 55 60
Met Gln Ser Pro Ile Asn Ile Asp Met Ala Thr 65 7 0 7 5 8 0
Glu Arg Ser Asp Val Ser Gly Leu Tyr Leu Asn
85 90 95
Ala Tyr Asp Val Ala Ala Asp Val Thr Val Asn
Ala Ala Glu Met Asp Glu Glu Ala Thr Ser Ser Ser Ser Ser Gly Ser Ala Ser Ser Leu Phe Gly Ala Ala Leu
tgtgtgccac ggcagctcac gggacgaggg ccactttgaa cctcgcccgc tcaccttcaa tgctcttcaa gcgcgcacta agctggcggt gcttgcagac tgaacgtcac actacgtggg acgtgttcac caaagcgcgg ggcctctgta actggaggga acacaaccga agagcttcac ccgcccccac ccatccagct ccctggaggc ttgccatctt aggccatcag tgcccatcac gcagcttgac ggaccaccac ctgccgagat tcccttaa
ggctgttcaa acaggacaag cctggacaac ccgtggcgag ctacgatgtc ggacgtcgcg gcccgtgcag ccctctggag gctgggcatc gaagaccatt cgacttgtct ctacgacggg cgagcccagg ccacactgat ccactacaag ggctggcctg tctccaacct attcaccgac aaacaacctg gcacttccac ccaccttgtg ctaccagtac cgctcagcaa cttcgccacg caccccacct tgctgagcag tgtcaacaac 1668
Gly Ala Leu Cys Ala Val Glu Ala Gly Leu Tyr Asn Tyr Asn Arg Asn Cys Ala Gly Ser Leu Asn Arg Gly Glu Gly Leu Ala Ser Pro Ala Glu Gln Asp Met
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 100 105 110
Lys Ile Thr Phe Lys Asp Val Ala Gln Asn Asn Met Pro Ala Ile Lys
115 120 125
Ile Asp Gly Ser Asp Met Leu Phe Lys Pro Val Gln Leu His Phe His
130 135 140
His Phe Leu Ser Glu His Ala Ile Asn Gly Ala His Tyr Pro Leu Glu 145 150 155 160
Aia His Leu Val Met Gly Asp Ala Ser Gly Asn Thr Asn Gln Leu Ala
165 170 175
Val Leu Gly Ile Met Tyr Gln Tyr Gly Glu Gln Pro Asp Asp Phe Val
180 185 190
Arg Arg Leu Gln Thr Lys Thr Ile Asp Glu Ile Ala Thr Asn Gly Ala
195 200 205
Gly Tyr Gly Glu Thr Val Asn Val Thr Asp Leu Ser Val Asn Ile Met
210 215 220
Lys Asp Val Leu Pro Pro Thr His His Asn Tyr Val Gly Tyr Asp Gly 225 230 235 240
Ser Leu Thr Thr Pro Pro Cys Asp Glu Arg Val Lys Trp His Val Phe
245 250 255
Thr Glu Pro Arg Thr Ile Thr Thr Gly Gln Leu Glu Lys Phe Leu Met
260 265 270
Ile Thr Lys Arg Gly His Thr Asp Ala Ile Val Thr Asn Asn Arg Ile
275 280 285
Val Gln Pro Ile Gly Arg Pro Leu Tyr His Tyr Lys Pro Thr Pro Ala
290 295 300
Ser Tyr Asn Tyr Ala Arg Lys Gly Ile Asp Trp Arg Glu Ala Gly Leu 305 310 315 320
Asp Asn Cys Ala Gly Asp Arg Gln Ser Pro Ile Asn Ile Asp Thr Thr
325 330 335
Asp Leu Gln Pro Gly Ala Val Ser Gly Ile Ser Leu Asn Gly Leu Glu
340 345 350
Ser Gln Ser Phe Thr Phe Thr Asp Ala Tyr Val Asn Leu Glu Gln Asp
355 360 365
Met Lys Val Ser Phe Thr Ala Pro Thr Asn Asn Leu Pro Thr Val Asn
370 375 380
Ile Asp Gly Asn Asp Glu Ser Phe Arg Pro Ile Gln Leu His Phe His 385 390 395 400
His Phe Ser Ser Glu His Thr Val Asp Gly Met Ile Tyr Pro Leu Glu
405 410 415
Ala His Leu Val Met Ala Ser Gln Ala Glu Asn Ser Asn Gln Leu Ala
420 425 430
Val Ile Ala Ile Phe Tyr Gln Tyr Gly Ser Glu Ala Asp Asp Phe Leu
435 440 445
Thr Arg Leu His Thr Glu Ala Ile Ser Ala Gln Gln Gly Asn Ala Asn
450 455 460
Trp Gly Asp Asn Asn Val Pro Ile Asn Leu Pro Ile Thr Phe Ala Thr 4 65 470 47 5 480
Asp Leu Met Pro Ser Ser Thr Glu His Trp Ala Tyr Glu Gly Ser Leu
485 490 495
Thr Thr Pro Pro Cys Asp Glu Arg Val Arg Trp Ile Val Met Lys Glu
500 505 510
Pro Arg Thr Thr Thr Ala Glu Gln Met Glu Thr Phe Lys Thr Ala Thr
515 520 525
Val Asn Ala His Tyr Ala Ala Glu Ile Val Asn Asn Arg Ala Ile Gln
530 535 540
Glu Arg Asn Ser Arg Pro Ile Ser Ser Ile Pro 545 550 55 5
<210> 100 < 211> 1125 <212 > DNA
<213> Chlamydomonas reínhardtii <4 00> 100
atggcgcgta ctggcgctct actcctggcc gcgctggcgc ttgcgggctg cgcgcaggct tgcatctaca agttcggcac gtcgccggac tccaaggcca gatcatagtc tcaatggcga gaactgggag ggcaaggacg tgcaagactg gccgcaagca gtcgcccatc aacgtgcccc aagggttcca agattgccac cggcctgcag acccagtggt aacggcagct cggttcaagt catcaacaac ggccacacca gactacgccg gccatgccac catcgccatc cctgccatgc gtggacgtgc tggagatgcg ccccaacgac gcctccgacc cagttccact tccactccac ctcggagcac ctgctggcgg ttgcacattg tgcacaaggt gactgacaag ctagaggcct gtcaccggca tcctgttcca gctcgacaac ggccccgata cgcgagggca ccttcaccaa cctgccggcg ggcaccacca cccagcgacc gcgactacgt cacctacgag ggcagcctca ggcctgctgt ggcacgtcat gacccagccg cagcgcatca taccgcctgg ctgtgggcga gaaggagtgc aactccacgg gacgccggcc atcatcacca ccaccaccgc cgcctgctgc gaggtgcctg ccgccacctc cgagcccaag cactacttcc gagaaccccg atgcttacac ctgcacgacc gttgcctttg cagtacgcca acggccgcac catcaagctg gcccgctacg <210> 101 <211> 380 <212> PRT
<213> Chlamydomonas reinhardtií <4 00> 101
Met Ala Arg Thr Gly Ala Leu Leu Leu Ala Ala
10 15
Cys Ala Gln Ala Cys Ile Tyr Lys Phe Gly Thr
25 30
Ala Thr His Thr Gly Asp His Trp Asp His Ser
40 45
Trp Glu Gly Lys Asp Gly Ala Gly Asn Pro Trp
50 55 60
Arg Lys Gln Ser Pro Ile Asn Val Pro Gln Tyr 65 70 75 80
Lys Gly Ser Lys Ile Ala Thr Gly Leu Gln Thr
85 90 95
Asp Leu Met Ser Asn Gly Ser Ser Val Gln Val
100 105 110
Thr Ile Gln Val Gln Trp Thr Tyr Asp Tyr Ala
ctcacacagg gcgcgggcaa agtaccatgt cgtaccctga tccaggtgca gcaaccagag gcgtgactgc gcaagatctt gcaagggcgg acgagctgct tcaagctggg ccaccccgcc gcttcggcca agaccgatgc acaaceacgc gccgcgtgat gccagaactt agtaa
egaecactgg cccctgggtc cctggacggg cctgatgtcc gtggacctac caaccgcatc cgtgcccacc tcctcttgag ctgcttcagc tgagcccacg tgagctgctg ctgcagcgag gtggaaccgc tgcccacgcg gcacctggag ggaggagacc ccgcaacgcc 1125
115 Ala Ile
130 Glu Met 145 Gln
120 125
Pro Ala Met Arg Asn Gln Ser Asn Arg
135 140
Arg Pro Asn Asp Ala Ser Asp Arg Val
Phe
Ala
Asp
Phe
Pro IE Cys 195
His 165 Leu 0
Lys
150 Phe
His
Glu
Ser 170 Leu His 185
Gly Gly Cys 200
155 Thr
Ile
Phe
Ser Glu 175 Val His
190 Ser Val 205
160 His
Leu
Lys Val Thr Gly
210 Pro Thr 225
Asn Gly Pro Asp Asn Glu Leu Leu Glu Pro 215 220
Glu Gly Thr Phe Thr Asn Leu Pro 230 235 240
Arg
Lys Leu Giy Glu Leu Leu Pro Ser Asp Arg Asp
245
Gly Ser Leu 260 Met Thr Gln
275
Leu Ala Val 290
250
Thr Thr Pro
265 Pro Gln Arg 280 Gly Glu Lys 2 95
Pro
Ile
255 Cys Ser
270 Ser Phe
Glu Gly Gly Gln
His Ala Asp Ala GIy His 305 310
285 Glu Cys
300 His His 315
Asn Ser Thr
His
His 320
His
Leu Ala Leu Ser Pro Asp Leu Asn Gly Val Cys Lys His Val Leu Gln Trp Ser Ile Asn Asn Gly His Ala Ile Val Asp Thr Ala Val Leu Ala Gly Thr Asp Lys Ile Leu Phe Ile Phe Ala Ala Gly Thr Tyr Val Thr Leu Leu Trp Trp Asn Arg Glu Thr Asp Arg Arg Leu
Ala Gly Ser Lys Glu Asn Thr Gly Asp Gly Tyr Pro Gly His Thr Ile Val Leu Pro Thr Lys Ile Leu Glu Gln Leu Asn Met Thr Ile Tyr Glu His Val Tyr Arg Ala Ala Leu His
120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 Asn His Ala His Leu Glu Glu Val Pro Ala Ala Thr Ser Glu Pro Lys
325 330 335
His Tyr Phe Arg Arg Val Met Glu Glu Thr Glu Asn Pro Asp Ala Tyr
340 345 350
Thr Cys Thr Thr Val Ala Phe Gly Gln Asn Phe Arg Asn Ala Gln Tyr
355 360 365
Ala Asn Gly Arg Thr Ile Lys Leu Ala Arg Tyr Glu
370 375 380
<210> 102 <211> 1134 <212> DNA
<213> Chlamydomonas reinhardtii <4 00> 102
atggcgcgta ctggcgctct actcctggtc gcgctggcgc tgcatctaca agttcggcac gtcgccggac tccaaggcca gaccatggcc tcaacggcga gaactgggag ggcaaggacg tgcaagactg gccgcaagca gtcgcccatc aacgtgcccc aagggttcca agattgccaa cggcctgcag acccagtggt aacggcacct cggtccaagt catcaacaac ggccacacca aactacgccg gccatgccac catcgccatc cctgccatgc gtggacgtgc tggagatgcg ccccaacgac gccgccgacc cagttccact tccactccac ctcggagcac ctgctggcgg ttgcacattg tgcaccaggt gactgagaag ctggaggcct gtcaccggca tcctgttcca gctcgacaac ggccccgata tttgcgaaca tgccctcgcg cgagggcacc ttcagcaacc aagctgggtg agctgctgcc cagcgaccgc gactacgtaa accccgccct gcagcgaggg cctgctgtgg cacgtcatga ttcggccagt ggaaccgcta ccgcctggct gtgggcctga accgccgcgg acgccggcca ccaccaccac caccgccgcc ctggaggagg tgcctgccgc cacctccgag cccaagcact gccgagtccg cgaaccccga tgcctacacc tgcaaggccg cgcaaccccc agtacgccaa cggccgcacc atcaagctgg <210> 103 <211> 37 7 <212> PRT
<213> Chlamydomonas reinhardtii <4 00> 103
Met Ala Arg Thr Gly Ala Leu Leu Leu Val Ala 10 15
Cys Ala Gln Ala Cys lie Tyr Lys Phe Gly Thr
25 30
Ala Thr Val Ser Gly Asp His Trp Asp His Gly
40 45
Trp Glu Gly Lys Asp Gly Ala Gly Asn Ala Trp
50 55 60
Arg Lys Gln Ser Pro Ile Asn Val Pro Gln Tyr 65 70 75 80
Lys Gly Ser Lys Ile Ala Asn Gly Leu Gln Thr
85 90 95
Asp Leu Met Ser Asn Gly Thr Ser Val Gln Val
100 105 110
Thr Ile Gln Val Gln Trp Thr Tyr Asn Tyr Ala
115 120 125
Ala Ile Pro Ala Met His Asn Gln Thr Asn Arg
130 135 140
Glu Met Arg Pro Asn Asp Ala Ala Asp Arg Val
ttgcgggctg ccgtttcggg gcgcaggcaa agtaccaggt cgtaccctga tccaggtgca acaaccagac gcgtgactgc gcaagatcta gcaagggcgg acgagctgct tgccggcggg cgtacgaggg cccagccgca aggagtgcaa tgctgcacaa acttccgccg ttgcctttgg cccgctatca
cgcgcaggct 60 tgatcactgg 120 cgcctgggtt 180 cctggacggg 240 cctgatgtcc 300 gtggacttac 360 caaccgcatc 420 cgtgcccacc 480 tccccttgag 540 ctgcttcagc 600 tgagcccatc 660 caccaccatc 720 cagcctcacc 780 gcgcatcagc 840 ctccacggag 900 ccacgcgcac 960 cgtgatgctg 1020 ccagaacttc 1080 ctaa 11 34
145
150
155
160
Gln Phe His Phe His Ser Thr Ser Glu His Leu
165
170
17 5
Tyr Pro Leu Glu Leu His Ile Val His Gln Val 180 185 190
Phe Ser Val Thr Gly 205
Ala Cys Lys Gly Gly Cys 195 200
Leu Ala Ser Pro Leu Asn Val Cys Gln Val Gln Trp Ile Asn Gly His Ile Val Thr Ala Leu Ala Thr Glu Ile Leu
Leu Ala Gly Asp Ser Lys Gly Glu Asn Lys Thr Gly Leu Asp Gly Ser Tyr Pro Asn Gly His Ala Thr Ile Asp Val Leu Val Pro Thr Gly Lys Ile Lys Leu Glu Phe Gln Leu 270
Ie Ser Phe Gly Gln 285
Asp Asn Gily Pro Asp Asn Glu Leu Leu Glu Pro
210 215 220
Pro Ser Arg Glu Gly Thr Phe Ser Asn Leu Pro 225 230 235 240
Lys Leu Gly Glu Leu Leu Pro Ser Asp Arg Asp
245 250 255
Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Gly
260 265
Met Thr Gln Pro Gln Arg
275 280
Leu Ala Val Gly Leu Lys Glu Cys Asn Ser Thr
290 295 300
Ala Gly His His His His His Arg Arg Leu Leu 305 310 315 320
Leu Glu Glu Val Pro Ala Ala Thr Sei Glu Pro
325 330 335
Arg Val Met Leu Ala Glu Ser Ala Asn Pro Asp
340 345 350
Ala Val Ala Phe Gly Gln Asn Phe Arg Asn Pro
355 360 365
Arg Thr Ile Lys Leu Ala Arg Tyr His
370 375
<210> 104 <211> 810 <212> DNA
<213> Physcomitrella patens <4 00> 104
atggcgagcc aacttgtgca ggcagtggcc gctgttgtgg agctgggttg gcgcgtgggc aggatcggct caggctgagg gactacagcg gtgggtcgca tgggccaggt ggctggggtg gtgtgcaagt cgggcagccg gcagtccccg atcgccatca gaccgcagtc tggggaagct ggatgccaag taccggaaga aacagcgggc atggggctga ggtgagcatg ccagccggct ggcgagacgt accgacccgt ccagttccac atccacatgc aaccagagtt tcccgctgga gctccacttg gtgcacaagt gtgatcgggt tcctgtttga ggaaggaggc gagagcgaat gaggtgccat cgtcaaatag cccaggcgtg aaggtcgact aagccggaga ggaactacgg cacttacatg ggatccctca ggtgtcacct ggattctgtc gttgttcaac tttcaaacgg aagctccggg cttctgtgcc gaagggacac aacaaccgtc aggggtttcc gcatgcgcac caacgcttga <210> <211> <212> <213> <4 00>
Ile Phe Ala Ala Gly Thr Tyr Val Thr Leu Leu Trp Trp Asn Arg Glu Thr Ala His Asn His Lys His Tyr Ala Tyr Thr Gln Tyr Ala
Asn Met Thr Ile Tyr Glu His Val Tyr Arg Ala Asp Ala His Phe Arg Cys Lys Asn Gly
ttctgcaatg gaggtgacga acctgaaggc cggcgctcga gagttcatgc cgggacgctt ccagcgagca ccgatgatgg tcctggccca tggggcacat ccaccccacc cgtccgcgga caaccttcgg 810
catctccgca ggtgcactgg cgagtggggt cctggtcaca cactctttac gaggatcggt cacaatcatg gaagcttgcg gttcgcacat caagatgatg atgcgcggag acagctggct cagcgccgga
105 269 PRT
Physcomitrella patens 105
Met Ala Ser Gln Leu Val Gln Ala Val Ala Ala
10 15
Cys Ile Ser Ala Ser Trp Val Gly Ala Trp Ala
25 30
Glu Gly Gly Asp Glu Val His Trp Asp Tyr Ser
40 45
Pro Gly Gly Trp Gly Asp Leu Lys Ala Glu Trp
50 55 60
Gly Ser Arg Gln Ser Pro Ile Ala Ile Thr Ala 65 70 75 80
Asp Arg Ser Leu Gly Lys Leu Asp Ala Lys Tyr
85 90 95
Ala Thr Leu Tyr Asn Ser Gly His Gly Ala Glu
100 105 110
Gly Ser Gly Arg Leu Arg Ile Gly Gly Glu Thr
115 120 125
Phe His Ile His Met Pro Ser Glu His Thr Ile
Val Val Gly Ser Gly Gly Gly Val Leu Asp Arg Lys Val Ser Tyr Arg Met Asn
Val Leu Gln Ala Gln Ala Ser His Gly Cys Lys Ser Leu Val Thr Arg Val His Met Pro Ala Pro Val Gln Gln Ser Phe
60 120 180 240 300 360 420 480 540 600 660 720 780 130
Pro Leu Glu 145 Val
Gln
Asp
Tyr
Ile Gly 165 Phe Ala 180 Leu Gly 195 Met
135 Leu Hls 150 Phe
His
His
210 Ile Leu 225
Lys Leu
Gly
Ser
Leu
Glu l: Ile 200 Leu
Ser
215 Leu Phe 230
Ala Ser
Leu
Phe 17 0 Val 55
Lys Thr Asn
140 Val His 155 Glu
Glu
Pro
Met
Gly 175 Ser Ser
190 Met Lys 205 Pro
Gly Ser
<210> <211> <212> <213> <4 00> aaatagagaa gggagaaat t tttagttctc tgatagtata attcaatttt actacagttt gccacaaaac ctcttcccgt ttcaaacttg ctctcaagaa agaagatcac tcgaacgaat ctttgtatgg actcacgagt gtaatatcgc ccattgaata catgtggtgg tcatagagga aaagttcagc tagcaaacct tgaagggagg gaatttcccc catcacaaac tactcttatt ttcattatcc gctgaagttg <210> <211> <212> <213> <4 00> Met Gly
Val 250
Gly Arg Gly 2 65
Arg 245 Ala 260 106 1519 DNA
Arabidopsís 106
gctcttcaag gcatgtgtaa ttcttcttct attaagttgt; gtaaagaagc ctcgaaatgg agtataaata tccatttatc gtataaactg gcttctcatt ggcggagctt: taaggaaggc tgagctcgcc gtgcccatca caatatggtt cgctgtcttg catcaagggg ttgggtcaaa atttgaagac. attgacatat ctactatgac cgttcattct atcatcatcg taattgctac agttataaaa ctttgattt 107 259 PRT
Arabidops is 107
Glu Ser
Thr 220 Phe Gln 235
Pro Lys Phe Arg
Lys Ser Asp Asp Gly Lys Leu Ala 160
Gly Glu Ser Glu Phe Leu Ala Asn Ser Pro Gly Val Lys Val Pro Glu Arg Asn Tyr Gly Thr Pro Cys Ala Glu Gly Val Thr Trp Ser Ala Glu Gln Leu Ala Asn Asn Arg Pro Thr Phe Arg Thr Asn Ala
Thr
Gly 255 Met
Ala 240 His
thaliana
tatccgatgt tcataaaatg tttttcgtca ttgtaataat tctacatgtt ctcatcagac tccttctctt cgcaaacgga agaaggatgg gagaaggatg caggcagcct ttcgtcacct aaaggtcaaa cacgtactag cctccttttg caccttaagg cttatgtcat atctgtttac caatgtggcc ccatttgtga tttgttaatg atatgaacta tcgtcatcat ttgtaatggt taaataaata
thalíana
ttttgtttaa tagatgttag ttacaatctc ctgtacaaag ccttgctctg tcagagacga cgtccctctc gcttgttttc gaaacgaatc atctgaagga cgtcatcgga tcaagaagga gcccaaagta acttccatcc acaaggtcaa tggaaaacat ttcctcttga cagcaaagtc gatgcgaaag gagaaggagt gctcctttga acacatcacc catgatcagc atacatttac aatcatgttt
tcaacaagag cttcgtcgtt tttcttaatt atgttgtgtt taaacatggt ctctccaatc atcgcctgtc ggtgcacctg atatgaagac tgtagctgcg cagcaaatct gaaatacgag catggtgttt tggagatgcc atatgcagga tgtggtgata cggaaacaac aaaagttttg ggaggcagtg tgtgaaagga gctttgggag atcaccatcg atcttcatat ttgcgatgag actttcacag 1519
gcggagatac tttactatag tacttcttct ctcataaaaa ccccttttgg tgcttcaaaa tctcctcttc cttcagccac gccatcgaag gccaaggtga tttgatcccg accaatcctg gcttgttcgg ttcgtggttc gttggagccg gggcacagtg tctactgact gcagaaagtg aatgtgtcac acacttgctt ctccagtttg ctaccaccac ataaatgttt cttcttttcc atatcgtttt
1
Leu Lys
Ile
Asn
5
Glu
Lys
Phe 50
Glu Lys 65
20 Ile Thr 35
Asp Pro
Tyr
10
Asp Asp
25
Ala Glu Leu 40
Val Glu
Glu
Leu
Asp Ala 15
Lys Asp 30
Tyr
Glu 70
Thr
Arg
Asn 75
Gln Ala 45
Ile Lys 60
Pro Ala
Ile Glu Ala Leu Lys Lys Leu Val Ala Ala Ala Lys Val Lys Ala Ser Ser Ser Asp Ser Lys Ser Val Thr Phe Lys Lys Glu Leu Ala Lys Gly
Glu
Leu 80
Gly Phe Tyr Gly
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 Gln Ser Pro 85
Pro Ser His 100
Asn Ile Ala 115
Val Gly Ala
130 Ile Val Val 145
Ser Phe Pro 165
Val Lys Ile 180
Ser Ser Ala 195
Asn Val Ser 210 Val Val Lys 225
Asn Gly Ser 245
His Ser Ile
Lys Tyr Met 90
Val Leu Asp 105
Asn Met Val 120
Ala Ile Glu
135 Ile Gly His 150
Leu Asp Gly 170
Cys Leu Pro
185
Phe Glu Asp 200
Leu Ala Asn
215 Gly Thr Leu 230
Phe Glu Leu 250
Val Phe Ala 95
Phe His Pro 110 Pro Pro Phe 125
Tyr Ala Val
140 Ser Ala Cys 155
Asn Asn Ser 175
Ala Lys Ser 190
Gln Cys Gly 205
Leu Leu Thr 220 Ala Leu Lys 235
Trp Glu Leu 255
Cys Ser
Gly Asp
Asp Lys
Leu His
Gly Gly 160
Thr Asp
Lys Val
Arg Cys
Tyr Pro
Gly Gly 240
Gln Phe
Asp Ser Ala Phe Val Lys Leu Lys Ile Lys Phe Ile Leu Ala Glu Arg Phe Val Tyr Tyr Gly Ile
Arg Val Cys Val Val Arg Tyr Ala Gly Val Glu Asn Gly Leu Met Glu Asp Trp Glu Ser Glu Glu Ala Val Arg Glu Gly Asp Phe Val Ser Pro Val
<210> <211> <212> <213> <400> atgggatccc gaagggcgta gtgagctctg tacaactatg agcaagcaga gggaccgcgg
108
1770
DNA
Dunaliella salina 108
gccgcatcac ccctgcttac tggtagctgg agaaagttgg gcccaatcaa atgacacttc
ctgaccagcg aagtggcaat gatgaagact tgcctcaact
cctcttgggg acacaacctg ttctgcaggc ctttgattgg cattgagact acgcctggcc caacctggag tactattggt cagcgagcac ccagaatgac agatcctttc aaatgtggag cctgacctac gtggcatgtg
atccactttc accactttgc gcccacatgg tgatggcatc atgtacaagt acggggaaga aatggcgaag ctgccgacaa gatttgctgc ctgagtcaga ggttgtgatg agcgagtgaa cagctcaagg tgttttcaga ggtcacgctg aaccgtgtca ttcagccgct caatggcagg gacaagtaca actatgtcca gcatggcttt gctggcgacg tccagagccc tattgacatc cggagtgatg tttctagtgt caacctgaat ggcaacactg tgaatattgg gcaaggcatg gacctgcccg tcatcagaat tggtactagg tggcacttct ttttgagtga gcacactgtg attgttatga aggacaatga caaccttggt attatgtaca agtacggcga tgcagacccc gataaaattg catcaggtgc catcacctat gatgatccct tcaatgtcaa catcaagaat ggctacgatg gcagcctgac cacccctcct ctggagccta ggactgtttc agtggagcag tctaatccag gtgcgaccgt gacaaccaac gtgtacggat ataacggtgc tgctgcttaa
< 210 > 109 <211> 589
< 212 > PRT
<213> Dunaliella salina
gctctgttcg aaggccgagg aggcagttgc acgggggggg gacagcctgg ttgaagggcc caggatatgc ggggttgtcc gctattgacg ggctctgacc ctcaaaaggc ctgaactcgt tatggatatg ttcaaggagg gctgcccacc aaggtctacg gactggcgcg gtgaccagca gacttgaaca caaatcaatt gacgtcactt gatggagtgc gattctgccg ttcattactg ggacaatcag aatttcctgc tgctctgaga atggaggtct: cgaatgatcc
ctgtcctggc ctgctgagac tggtgagtga tctgcgtcaa ctgaggaatc tactgtcttc agttttcttt acaccttcaa gccagcttta agcttgctgt tgcaagaaac tttccatcaa ■atggtagctt caaggactgt ctgaagctac agtacaaggg ataatggctt ctttgcaagc ccgacgcgtt ttggtgaccc tcaggcccct actaccccct gccagcttgc atatgcagaa gagtgtctct cctctgagct ttgtgaagtg ttgcagatgt agccactgga 17 7 0
ggtcgcaatc agtggatgca gcctcacgac taccgggacc agagaggctg atcctaccag taatgcgcct gcctgtgcaa tcctcttgag cattggcatc tgcacagagc tgtggccagg gactaccccc ctcagtggcg ggttaccaac tgaacccaac ggatagctgt tggatcttct cacgctgacc ccctgcgggt ccaggtgcac ggaagctcat tgtcatcggt gagggtgtca gaacaatcct tggatatgct gcatgtgttc gactctgaac gggtaggact
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 <4 00> 109
Met Gly Ser Arg Arg Ile Thr Leu Leu Gly Ala Leu Phe Ala Val Leu 1 5 10 15
Ala Val Ala Ile Glu Gly Arg Thr Leu Leu Thr His Asn Leu Lys Ala
25 30
Glu Ala Ala Glu Thr Val Asp Ala Val Ser Ser Val Val Ala Gly Ser
40 45
Ala Gly Arg Gln Leu Leu Val Ser Glu Pro His Asp Tyr Asn Tyr Glu
50 55 60
Lys Val Gly Phe Asp Trp Thr Gly Gly Val Cys Val Asn Thr Gly Thr 65 7 0 7 5 8 0
Ser Lys Gln Ser Pro Ile Asn Ile Glu Thr Asp Ser Leu Ala Glu Glu
85 90 95
Ser Glu Arg Leu Gly Thr Ala Asp Asp Thr Ser Arg Leu Ala Leu Lys
100 105 110
Gly Leu Leu Ser Ser Ser Tyr Gln Leu Thr Ser Glu Val Ala Ile Asn
115 120 125
Leu Glu Gln Asp Met Gln Phe Ser Phe Asn Ala Pro Asp Glu Asp Leu
130 135 140
Pro Gln Leu Thr Ile Gly Gly Val Val His Thr Phe Lys Pro Val Gln 145 150 155 160
Ile His Phe His His Phe Ala Ser Glu His Ala Ile Asp Gly Gln Leu
165 170 175
Tyr Pro Leu Glu Ala His Met Val Met Ala Ser Gln Asn Asp Gly Ser
180 185 190
Asp Gln Leu Ala Val Ile Gly Ile Met Tyr Lys Tyr Gly Glu Giu Asp
195 200 205
Pro Phe Leu Lys Arg Leu Gln Glu Thr Ala Gln Ser Asn Gly Glu Ala
210 215 220
Gly Asp Lys Asn Val Glu Leu Asn Ser Phe Ser Ile Asn Val Ala Arg 225 230 235 240
Asp Leu Leu Pro Glu Ser Asp Leu Thr Tyr Tyr Gly Tyr Asp Gly Ser
245 250 255
Leu Thr Thr Pro Gly Cys Asp Glu Arg Val Lys Trp His Val Phe Lys
260 265 270
Glu Ala Arg Thr Val Ser Val Ala Gln Leu Lys Val Phe Ser Glu Val
275 280 285
Thr Leu Ala Ala His Pro Glu Ala Thr Val Thr Asn Asn Arg Val Ile
290 295 300
Gln Pro Leu Asn Gly Arg Lys Vai Tyr Glu Tyr Lys Gly Giu Pro Asn 305 310 315 320
Asp Lys Tyr Asn Tyr Val Gln His Gly Phe Asp Trp Arg Asp Asn Gly
325 330 335
Leu Asp Ser Cys Ala Gly Asp Val Gln Ser Pro Ile Asp Ile Val Thr
340 345 350
Ser Thr Leu Gln Ala Gly Ser Ser Arg Ser Asp Val Ser Ser Val Asn
355 360 365
Leu Met Thr Leu Asn Thr Asp Ala Phe Thr Leu Thr Gly Asn Thr Val
370 375 380
Asn Ile Gly Gln Gly Met Gln Ile Asn Phe Gly Asp Pro Pro Ala Gly 385 390 395 400
Asp Leu Pro Val Ile Arg Ile Gly Thr Arg Asp Val Thr Phe Arg Pro
405 410 415
Leu Gln Val His Trp His Phe Phe Leu Ser Glu His Thr Val Asp Gly
420 425 430
Val His Tyr Pro Leu Glu Ala His Ile Val Met Lys Asp Asn Asp Asn
435 440 445
Leu Gly Asp Ser Ala Gly Gln Leu Ala Val Ile Gly Ile Met Tyr Lys
450 455 460
Tyr Gly Asp Ala Asp Pro Phe Ile Thr Asp Met Gln Lys Arg Val Ser 465 470 475 480
Asp Lys Ile Ala Ser Gly Ala Ile Thr Tyr Gly Gln Ser Gly Val Ser 485 490 495 Leu Asn Asn
500 Leu Pro Ser
515 Pro Pro Cys
530 Thr Val Ser 545
Ser Asn
Pro Asp Asp Pro Phe Asn
505 510
Glu Leu Gly Tyr Ala Gly
520 Ser Glu
535 Val Glu 550 Gly
525
Ile Val Lys 540
Gln Met Glu
555 Thr Val Thr 570
Val Tyr Gly Tyr Asn 585
Ala
Pro 565
Glu Gly Arg Thi
580 <210> 110 <211> 693 <212> DNA
<213> Arabidopsis thaliana <400> 110
Val Asn Ile Lys Asn Asn Phe Tyr Asp Gly Ser Leu Thr Thr Trp His Val Phe Leu Glu Pro Arg Ala Asp Val Thr Leu Asn Arg Met Ile Gln Pro Leu Gly Ala Ala Ala
Val
Thr
575
Phe 560 Asn
atgaagatta tgatgatgat cctgcagatg ctcagacaga caatggggac acttaaaccc attgatattc aaaggaggca tactacttca caaacgcaac gagggagcag gagatgtgat cacactcctt ctgaacatca caccaagcaa aagatggaag gagcctttcc tctctcagat gggaaccaca cagcacaagt actcgaaagt actacagata tcttggacca tccttggcaa <210> <211> <212> <213> <4 00> Met Lys 1
taagctctgc aggagtagtg tcacttcacc aatattttac actagtgaac aatagaaaac cctccatgga ctttgctgtg gaaggagaaa ggaagtagga cattggttca ggtaatcttt
ttcttctcca tttggatata acatgcgcgg aaccacaaat cacgtctgta aagaactata gtccaatatg gtggcaagtc ttggtgaagc agaatcgaca ctcactactc taa
Tyr
115 His Gly
130 Asp Gly 145 Glu
Glu
100
Thr Leu
Pro
Asp
Val
Ser
Phe 165 Leu
iO
Arg
Arg 1
Thr 195 Gly Ser 210 Leu Gly Lys
105
Leu Gln Met 120
Gln Tyr Ala 135
Phe Ala Val 150
Leu Ser Gln 170
Lys Gly Asn
His
125 Ala Glu
140 Val Ala 155
Met Lys
110 Trp His
Ser
Leu 160 Lys
Leu
tgtccctcat aaggcaaaaa tcggtaaatt tgaattcaat atgttgccat ccttactgca cagctgagct tcttcaaaat taaaggaaga caagacacat ctccttgctc 6
ctgcattgca tggaccaaac gcaatctcca acaccgtgaa gttcttcggg aatgcattgg gcacatggta cggcactgaa gagactcaaa tgaacgtaag cgagaacgtt 93
111 284 PRT
Arabidopsis thaliana 111
Ile Met Met Met Ile Lys Leu Cys Phe 10 15
Ile Cys Ile Ala Pro Ala Asp Ala Gln Thr Glu
25 30
Tyr Lys Gly Lys Asn Gly Pro Asn Gln Trp Gly
4 0 4 5
Phe Thr Thr Cys Ala Val Gly Lys Leu Gln Ser
50 55 60
Arg Arg Gln Ile Phe Tyr Asn His Lys Leu Asn 65 70 75 80
Tyr Tyr Phe Thr Asn Ala Thr Leu Val Asn His
85 90 95
Met Phe Phe Gly Glu Gly Ala Gly Asp Val Ile
Thr Pro
Leu His Met
Phe
Leu
Glu 175
His Thr Ala Gln Val 185 190
His Ile Glu Arg Lys Thr Arg Lys
200 205
Thr Thr Pro Pro Cys Ser Glu Asn
215 220
Val Arg Ser Met Ser Lys Glu Gln
Phe Ser Met Gly Val Val His Leu Asn Pro Ile Asp Ser Ile His Val Cys Asn Ile Glu Asn Ser Glu His Val His Gln Lys Ile Gly Val Lys Leu Glu Val Gly Tyr Tyr Arg Val Ser Trp Val Glu Leu
Ser Leu Phe Gly Pro His Ile Gln Arg Glu Val Ala Lys Asn His Leu Ala Lys Thr Glu Lys Glu Arg Ile Tyr Ile Thr Ile Leu Arg
60 120 180 240 300 360 420 480 540 600 660 225 Ser
Pro
230 Asp
235 Phe
Lys
Glu
Lys
Asn 255 Met Phe
270 Lys Lys
Leu Asp Thr Ser 245 250
Leu Asn Gly Arg Arg Val
260 265
Lys Lys Glu Thr Gly Asn
275 280
<210> 112 <211> 1053 < 212 > DNA
<213> Arabidopsís thalíana <400> 112
atgaagatat catcactagg atgggtctta tcgagtgcac cagcacctaa aaacctaagc ccacaccagc cctcctaaac ctaagcctgc cctacacctc ctaaacctaa ccagcaccta cacctcctaa aaacctaaac ctgcacctaa agctacgaga cgaaaggaaa aaaatgtgtg gaataggcaa gttagtaata aatttggatt: aacagaggtc atgatatcat atccgtggta ctagatatca atcaatggca aaaggtttgc tacgctgttg tcgcattctt gaaaaacaat tgaagaagat tcaagtaaac aagtgaagct aggccgcttc aagcagtcaa atgaagaaat actgtaatat <210> 113 <211> 350 <212> PRT <213> Arabidopsis <4 0 0> 113 Met Lys Ile Ser Ser 1
Ile
240 Asn
Ser
His Asp Lys Pro
Arg Pro Cys Gln Pro His Glu Arg Val Asp Asn
acctcctaaa acctacacct accagcacct gcccaaacca acctaagcct accagcacca caaggggcca aatgcaatct gcttcgtagc gttgaaattc acttcaacaa gctagaggaa atacaatctc aactgataca tctccgtgtg taagcgcaag aagttcttac
thaliana
gtccttatct cctaagcctg cctaaaccta acacctccta gcacctacac gcaccagcac ggtggagaag gcgaaatggg cctattgatc cagtatctgc aaaggaggaa cttcattggc cacttggttc ggagcatctg catgcgtccg gctgtacacg gtatatttat tag
tcatctctat caccagcacc agcccaaacc aacctaagcc ctcctaat cc cagcaccaac ttgaggacga gaacactaga ttcgggacaa cttctaatac ataaaggtat actctccttc atgagagcaa acccttttct aggaacatat atgcttcaga acaaaccaaa
1053
ta ccattgtt 60 tacacctcct 120 agcacctaca 180 cgcaccagca 240 taagcccaca 300 accagcaccg 360 aaccgagttt 420 tgcagagtgg 480 aaatgtggta 540 caccattaag 600 tggtgtcact 660 cgaacataca 720 agataaacgc 780 cttttcgttg 840 tcgcactgtg 900 ttcaaatgcc 960 ggttaagtta 1020
Ile 5
Thr Ile 20
Pro Ala Pro 35
Pro Pro
55
AIa Pro 70
Thr Pro Pro 85
Pro Lys Pro 100 Pro Ala
Thr
50 Lys Pro 65 Pro
Val Ser 25
Ala Pro 40
Lys Pro
Ala
Leu Gly Trp Val Leu Val 15
Ser Ala Pro Ala 30
Thr Pro Pro Lys Pro 45
Lys Pro Lys 60
Thr Pro
Pro Lys Lys Pro Ala Pro
Ala
115
Ala Pro Gly 130
Lys Gly Asn 145 Lys
Lys
Leu
Thr
Pro
Lys
Met Cys 165 Asn Val 180 Pro Ser 195
Phe Lys
Lys
90
Pro Ala
105 Thr Pro 120
Gly Glu Val
135 Lys Gly 150 Gly
Pro
75 Pro Lys
Pro 80 Lys
Pro
Ala
Pro
Ile
Glu
140 Ala Lys 155 Lys
Pro 95
Thr Pro 110 Pro Lys 125 Asp
Lys Pro
Pro Ala
Pro
Pro
Lys Lys
Glu Thr Glu
Trp
Val
210
Val
lí
Asn Thr 200 Gly Gly 215
Gly Lys Met Gln 17 0 17 5
Ser Asn Lys Phe 190
Thr Ile Lys Asn 205
Asn Lys Gly Ile 220
Gly 160 Ser
Thr
Pro
Leu
Gly Arg
Gly Val
Gly
Leu Ile Pro Pro Pro Thr Thr Pro Lys Pro Pro Thr Pro Lys Pro Ala Phe Ser Leu Asp Ile Asp Leu Arg His Asp Thr Ile
Phe Ile Ser Lys Pro Lys Pro Ala Pro Pro Lys Pro Ala Pro Ala Pro Pro Asn Pro Ala Pro Pro Lys Pro Tyr Glu Thr Ala Glu Trp Leu Arg Asp Ser Gln Tyr Ile Met Leu Arg Gly Thr Arg Tyr Gln Leu Gln Gln Leu His Trp His Ser
225 230 235 240
Ile Asn Gly Lys Arg Phe Ala Leu Glu Glu His
245 250 255
Lys Asp Lys Arg Tyr Ala Val Val Ala Phe Leu
260 265 270
Ser Asp Pro Phe Leu Phe Ser Leu Glu Lys Gln
275 280 285
Asp Thr His Ala Ser Glu Glu His Ile Arg Thr
290 295 300
Val Lys Leu Leu Arg Val Ala Val His Asp Ala
305 310 315 320
Arg Pro Leu Gln Ala Val Asn Lys Arg Lys Val
Pro Ser Glu His Thr Leu Val His Glu Ser Tyr Asn Leu Gly Ala Leu Lys Lys Ile Thr Val Ser Ser Lys Gln Ser Asp Ser Asn Ala Tyr Leu Tyr Lys Pro
325
330
335
Lys Val Lys Leu Met Lys Lys Tyr Cys Asn Ile Ser Ser Tyr
340 345 350
<210> 114 <211> 834 <212> DNA
<213> Arabídopsis thaliana <4 00> 114
atgaaaacca ttatcctttt tgtaacattt cttgctcttt gagacagaga ctgaatttca ttacaaaccc ggtgagatag agtatcaagg ctgaatggaa aatttgcggg acagggaaga actccaaaaa tagctcgcat tgttcacaat tctacagaga cctgtagagg ctattcttaa gaaccgtgga ttcgacatga gcagggaaga tcgtgatcaa tgataccgac tataaattgg ccttcagagc attttctcga tggacagagg ttggcaatgg agtgtagaag ggcacttggc agtgattgga gttctcttca ttcatttcgc ggatcatgga caagatccat aagatcgcag agcatcggaa agatagatcc aagagaattt ggatgggatc agaggttctc tcacgactcc tccttgcacg gaagatgtca gtggggactg tttcacgtga gcaaattgat gtattgacag gagaagaacg cgagaccagc tcaacctctg aacggacgtc tccagtccaa gtccaactcc acggctaaga ataccacgag <210> <211> <212> <213> <4 00>
cttcttcatc ccgatccctc ggcaatcgcc ttcttcagac aggttaagtg ttcaaagcca aacttcacat gagaaggaga acgtacaaga ttacaaagtt tgtggaccat atgctcgtcg tggtttattt ttggtccggt
tctagccgat gaaatggagc aatcaatctt atattacaaa ggaagacgat ctggcacgca ggtacacaaa accaaatgct tggagaggtc ttatgaatac catcaacaag cggtggttat aaacgagcag ctaa
60 120 180 240 300 360 420 480 540 600 660 720 780
834
115 277 PRT
Arabídopsis thaliana 115
Met Lys Thr Ile Ile Leu Phe Val Thr Phe Leu
10 15
Ser Leu Ala Asp Glu Thr Glu Thr Glu Phe His
25 30
Ile Ala Asp Pro Ser Lys Trp Ser Ser Ile Lys
40 45
Cys Gly Thr Gly Lys Arg Gln Ser Pro Ile Asn
50 55 60
Ala Arg Ile Val His Asn Ser Thr Glu Ile Leu 65 70 75 80
Pro Val Glu Ala Ile Leu Lys Asn Arg Gly Phe
85 90 95
Trp Glu Asp Asp Ala Gly Lys Ile Val Ile Asn
100 105 110
Leu Val Gln Ser His Trp His Ala Pro Ser Glu
115 120 125
Gln Arg Leu Ala Met Glu Leu His Met Val His
130 135 140
His Leu Ala Val Ile Gly Val Leu Phe Arg Glu 145 150 155 160
Phe Ile Ser Arg Ile Met Asp Lys Ile His Lys
165 170 175
Asp Gly Glu Val Ser Ile Gly Lys Ile Asp Pro
Ala Leu Tyr Lys Ala Glu Leu Thr Gln Thr Asp Met Asp Thr His Phe Lys Ser Gly Glu Ile Ala A.rg Glu
Ser Ser Ser Pro Gly Glu Trp Lys Ile Pro Lys Ile Tyr Tyr Lys Lys Val Lys Asp Tyr Lys Leu Asp Gly Val Glu Gly Pro Asn Ala Asp Val Gln Phe Gly Trp Asp
Lys
180 Leu Thr 195
Cys Thr Glu 210 Ser Arg Glu 225
Lys Asn 245 Asn Glu 260 Val Gly 275 <210> 116 <211> 825 <212> DNA
<213> Nicotiana langsdorffii χ <400> 116
Glu
Leu
Arg
185 Phe Tyr 200 Asp Val Met 215
Gln Ile Asp 230
Arg Pro 250 Ser Ser
265 Val
Ala
Gln
190
Glu Tyr Arg Gly Ser Leu Thr Thr Pro Pro 205
Trp Thr Ile Ile Asn Lys Val Gly Thr Val 220
Val Leu Thr Asp Ala Arg Arg Gly Gly Tyr 2 35 24 0
Ala Gln Pro Leu Asn Gly Arg Leu Val Tyr 255
Pro Ser Pro Thr Pro Arg Leu Arg Ile Pro 270
Pro
Nicotiana sanderae
atgaggatgg cagcaataac tttcttgcaa ggtccggaga gagaatggac cagctaattg ttgcagtctc ctattgatat cttcaaaagg actacaaacc ttgagattgg atgatggagg ttgcattggc acacaccttc catttggtac: atgaaagtaa ggattatggc ctgatccctt aaaaaaggta tagagagagg aaaaaatatt ttaggtatat tggataattg atagaaaggt gctgttcatg atggatttga atcaactcaa cataccattc <210> <211> <212> <213> <4 00>
caaaatgttg agttgatgat gggcaatatt ttttgacttg atcgaatgcc atacttgaag tgaacacact taatggaaag cttatctatg cattggaatt tggctcact L aaaaactgta aaccaacgct ctttggtatt 117 274 PRT
Nicotiana langsdorffii χ
ttcatttcgt gagagtgaat cgtccagatt agggctgaag actctcttga ataaatgaaa atcaatggag tttgttgtca atagagaacg attgatccaa acaacacctc accagaagac agaccaactc gaaaagcagc
ttcttttcct ttcaagtgta 60
ttagttacga tgaaaaaagt 120
ggaaagaatg tagtggcaaa 180
tagtttcaaa cttgagaata 240
acagaggtca tgatataatg 300
ctcaatatca actcaagcaa 360
aaaggtttaa tttggaggct 420
ttggaatagt ctacgagatc 480
atttgaaagt tcctgctaat 540
atcaaataaa attggatggc 600
cttgcaccga aggtgttgtc 660
aaataaaact actccaagaa 720
aaccagaaaa cgaacgttat 780
agtga
825
Nicot iana sanderae
Leu Phe Ile Ser Phe Leu Phe
117
Met Arg Met Ala Ala Ile Thr Lys Met
10 15
Leu Ser Ser Val Phe Leu Ala Arg Ser Gly Glu Val Asp Asp Glu Ser
25 30
Glu Phe Ser Tyr Asp Glu Lys Ser Glu Asn Gly Pro Ala Asn Trp Gly
40 45
Asn Ile Arg Pro Asp Trp Lys Glu Cys Ser Gly Lys Leu Gln Ser Pro
50 55 60
Ile Asp Ile Phe Asp Leu Arg Ala Glu Val Val Ser Asn Leu Arg Ile 65 70 75 80
Leu Gln Lys Asp Tyr Lys Pro Ser Asn Ala Thr Leu Leu Asn Arg Gly
85 90 95
His Asp Ile Met Leu Arg Leu Asp Asp Gly Gly Tyr Leu Lys Ile Asn
100 105 110
Glu Thr Gln Tyr Gln Leu Lys Gln Leu His
115 120 125
His Thr Ile Asn Gly Glu Arg Phe Asn Leu
130 135 140
Glu Ser Asn Asn Gly Lys Phe Val Val Ile 145 150 155 160
Gly Leu Trp Pro Asp Pro Phe Leu Ser Met
165 170 175
Val Pro Ala Asn Lys Lys Gly Ile Glu Arg
180 185 190
Pro Asn Gln Ile Lys Leu Asp Gly Lys Lys 195 200 205
Trp His Thr Pro Ser Glu Glu Ala His Leu Val His Gly Ile Val Tyr Glu Ile Ile Glu Asn Asp Leu
Gly Tyr
Ile
Gly Phe Arg Tyr
Ile Ile
Ile
Lys Asp Gly Ser Leu Thr Thr Pro Pro Cys Thr Glu Gly Val Val Trp Ile Ile Asp
210 215 220
Arg Lys Val Lys Thr Val Thr Arg Arg Gln Ile Lys Leu Leu Gln Glu 225 230 235 240
Ala Val His Asp Gly Phe Glu Thr Asn Ala Arg Pro Thr Gln Pro Glu
245 250 255
Asn Glu Arg Tyr Ile Asn Ser Thr Tyr His Ser Phe Gly Ile Glu Lys
260 265 270
Gln Gln
<210> <211> <212> <213> <400> atgtcggccg aagaaagcgt tcgtcgtcgt gctgctcccg
118 993 DNA
Flavería bídentís 118
cctctgcttt ctacttcagc cgtcttcgtc cgcccatcat
gaagccattg acgcgctcaa gctacaagaa tcgaccaaat gaccctgttg agaggatcaa aacccagcct tgtacgatga tgctcagact cgcgtgtttg gttgttcgta acgttgccaa
ggagctgctg catagccgtt accgatttca gaacacaacg gtgtcgcttg ctcgcgctca gactttgggc <210> <211> <212> <213> <4 00>
ttgagtatgc gtggaggaat tcgaagattg gcacacatct gaaacctgtt agggtggtca tttcgtctcc 119 330 PRT
Flaveria bídentís 119
cgccatgaat tagatctggt: tgcaactcct cacaccgaat gaaaacgctc cacagctcaa atccggcttc gcttgctaaa cccgtcacac catggtccct agttttgcat caagggtctc ggtgaaagtg tgatgatcaa gacataccca ctatgacttt tacctctgta
gcgccttcgt gtgttgtccg ccgagtctca tggaccgaag attgaaaagg gccgcagcac gtgaagttca ggccaaagcc gttcttgatt ccctttgaca ctaaaggtac atgactttcc tgtctccccg tgtgtactat tttgtaaggg gttaacggga tga
tcgtcaacgc ccagatttac ttcgtaacga acggaaatga gtgagttaga ccgacaccaa agacagagaa caaagttcat tccagcccgg agaccaaata aagaaatctt cagacgaagg cgaagtcaaa gtgaaaagga atggattgag cctttgagct
ttcgtcgctg gtgcaattcg gcctgttttc atcatacgaa accagttgcc agctccattt attcgtcaca ggtgtttgca tgaggcgttt ttctggagta tgtaattggg acctcactca agtggtagca agctgtgaac gaacaagaca gtgggcactt
993
Met Ser Ala Ala Ser Ala Phe Ala Met Asn Ala Pro Ser Phe Val Asn 1 5 10 15 Ala Ser Ser Leu Lys Lys Ala Ser Thr Ser Ala Arg Ser Gly Val Leu 20 25 30 Ser Ala Arg Phe Thr Cys Asn Ser Ser Ser Ser Ser Ser Ser Ser Ala 35 40 45 Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val Phe Ala Ala Pro Ala 50 55 60 Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly Asn Glu Ser Tyr Glu 65 70 75 80 Glu Ala Ile Asp Ala Leu Lys Lys Thr Leu Ile Glu Lys Gly Glu Leu 85 90 95 Glu Pro Val Ala Ala Thr Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala 100 105 110 Ala Pro 115 Asp Thr Lys 120 Ala Pro Phe 125 Asp Pro Val Glu Arg Ile Lys Ser Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu 130 135 14 0 Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala 145 150 155 160 Cys Ser Asp 165 Ser Arg Val 17 0 Cys Pro Ser 175 His Val Leu Asp Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe IE iO l: 3 5 190 Asp Lys 195 Thr Lys Tyr 200 Ser Gly Val 205 Gly Ala Ala Val Glu Tyr Ala Val
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 Leu
Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys
215 220
Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser 230 235 240
Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser 250 255
Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val
260 265 270
Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr
275 280 285
Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Lys Thr Leu Ala Leu Lys
Leu His 210 Gly Gly Ile 225
Thr Asp Phe 245
290 295
Gly Gly His Tyr Asp
Phe
305 Asp
Phe
310 Leu
Ser
Ser 330
<210> <211> <212> <213> <4 00>
Gly 325 120 975 DNA
Hordeum vulgare 120
300 Val Asn 315
Pro Thr
Gly
Thr 320 Val
Phe Glu Leu Trp Ala Leu
atgtcgttgc aagcggcaac agcatgaaaa ccacgtacta ccccgtgccc gcctccttcc gcattgatgg gtctacgaca atggtgttcg ggtgaggcct tacgccggtg gtggtgattg gcagacgact aaggtgcaga gaggccgtca accaacggaa acatgggagc <2 10> <211 > <212> <213> <400>
agattgggcg tgctccatgg tcaatagcac cctcacacta gctcctccac gccccaagct acgccgccgt agaagcccga cgtgcgccga tcaccatccg ttggatcggc gccacagccg ccttccactt ctgagtgcgc acgtgtccct ccctcaagct agtaa 121 324 PRT
Hordeum vulgare 121
gacagagagg acggtgtagt ttgtacattg ctcgaccgcc catcgccgcc catcaggacc ggagcgcctc tttcttcgag ctcgcgtgtg caacatcgcc catcgaatac ctgcggtgga cgttgaggac ctccatgcct ccagaacctc cgtcggcggc
gcccggtccc cggtctttgt ctttgcacac 60
accatcgaca atgcaaattg cagcacctgc 120
acggccctgc cgattgccgc actgcctggg 180
gcggctaact ggtgctacgc aaccgtcgcg 240
agcctcggca cccccgcgcc ctcctcctcc 300
acccccgtcc aggccgcgcc cgtcgcacct 360
aagaccgggt tcgagaagtt caagaccgag 420
ccgctcaagg ccggccaggc gcccaagtac 480
tgcccgtcgg tcaccctggg ccttgagccc 540
aacatggtcc cggcctactg caagaacaag 600
gccgtctgcg cgctcaaggt tgaggtcatc 660
atcaaggctc tgctctcgct caaggatggc 720
tgggtcagga tcgggttccc ggccaagaag 780
ttcgatgacc agtgcaccgt cctggagaag 840
ttgacctacc cgttcgtcaa ggagggtgtg 900
cactacgact tcgtctccgg caagttcgaa 960 975
Met Ser Leu Gln Ile Gly Arg Thr Glu Arg Ala Arg Ser Pro Val Phe 1
Val Asp
10 15
Phe AIa His Lys Arg Gln Leu Leu His Gly Arg Cys Ser Thr Ile
Thr 50
Ser His 65 Pro
20 Asn Ala 35 Leu
Arg
Thr
5
Tyr Ser 70
Ala Arg
25
Asn Cys 40
Ala Leu
Ser
Ser
Pro
60
Ala Ala
7 5 Ser Thr
30 Thr Cys
45 Ile Ala
Ser Met Lys Ile Asn Ser Thr Cys Ala Leu Pro Gly Pro Arg Thr Thr
Ala
Asn 80 Ala
Pro
Val
Arg
85
Ser Ser 100 Gln Aia 115 Leu
130 Lys Pro 14 5
Lys Asp
Ser
Ala
Thr
90
Ala Ser
105 Pro Val 120
Gly Phe
Ile
95
Arg Pro 110
Ala Pro Ala 125
Lys Phe
Phe
Glu
Trp Cys Tyr Ala Thr Val Ala Ala Ser Leu Gly Thr Pro Ala Lys Leu Ile Arg Thr Thr Pro Leu Met Asp Ala Ala Val Glu Lys Thr Glu Val Tyr Asp Lys
135 Phe Phe 150
140
Glu Pro Leu Lys Ala Gly Gln Ala Pro Lys Tyr 155 160 Met Val Phe Ala Cys Ala Asp Ser Arg Val Cys 165 170 175 Gly Leu Glu Pro Gly Glu Ala Phe Thr Ile Arg lí 30 lí 35 190 Val Pro Ala Tyr Cys Lys Asn Lys Tyr Ala Gly 195 200 205 Glu Tyr Ala Val Cys Ala Leu Lys Val Glu Val 210 215 220 His Ser Arg Cys Gly Gly Ile Lys Ala Leu Leu 225 230 235 240 Ala Asp Asp Ser Phe His Phe Val Glu Asp Trp 245 250 255 Pro Ala Lys Lys Lys Val Gln Thr Glu Cys Ala 260 265 2 70 Asp Gln Cys Thr Val Leu Glu Lys Glu Ala Val 275 280 285 Asn Leu Leu Thr Tyr Pro Phe Val Lys Glu Gly 290 295 300 Leu Lys Leu Val Gly Gly His Tyr Asp Phe Val 305 310 315 320
Pro Ser Asn Ile Val Gly Ile Val Ser Leu Val Arg Ser Met Asn Val Val Thr Ser Gly
Val Thr Leu Ala Asn Met Ser Ala Ile Val Ile Gly Lys Asp Gly Ile Gly Phe Pro Phe Asp Ser Leu Gln Asn Gly Thr Lys Phe Glu
Thr Trp Glu Gln <210> 122
<211> <212 > <2 13> <400>
804 DNA
Chlamydomonas reínhardtii 122
atgtcgtcgc ggaatgtcgc taccgctctg cgcatgttcg gctggcgagg cctcggccat gatgggcacc ggctcggcgc gccctgggcg gcgcctcggc tgttaacaag ggctgcagct tgcatgggcg cgtgcatgcc gatgcgccac ctccacgccc cccgaccagg ccctggagta ccttcgcgag ggcaacaagc cacgactcgc accccacgcg caacctggac cgcgtcaagg cccttcgccg ccttcctgtc ctgcgccgac tcgcgcgtgc cagggcttcg gtgacgtgtt cgtgacgcgc gtggccggca acggcgtcgc tggagttcgg cacggccgtc ctgggctcca cacagcgctt gcggcgccgt ggcggccacc atgaacggcg tcctctctct actacagcat cagcccggcc tgcaagaagg ggtgccattg ccgagaacgt caaggtccag atggagcagc caggggctcg tgaaggaggg caagctcaag atcgtgggcg ggcaaggtga ccgagatcgc ctaa <210> 123 <211> 267 <212> PRT
<213> Chlamydomonas reinhardtii <400> 123
Met Ser Ser Arg Asn Val Ala Thr Ala Leu Arg
10 15
Gly Pro Ser Gln Ala Gly Glu Ala Ser Ala Met
25 30
Ala Leu Leu Ala Gln Arg Ala Ala Ala Leu Gly
40 45
Asn Lys Gly Cys Ser Cys Arg Cys Gly Arg Val
50 55 60
Cys Met Pro Met Arg His Leu His Ala His Pro 65 70 75 80
Pro Asp Gln Ala Leu Glu Tyr Leu Arg Glu Gly
85 90 95
Asn Asn Lys Pro His Asp Ser His Pro Thr Arg
100 105 110
Lys Ala Thr Ala Ala Gly Gln Lys Pro Phe Ala
115 120 125
Ala Asp Ser Arg Val Pro Val Glu Ile Ile Phe 130 135 14 0
cgaccctcgg tgctcgcgca gccgctgcgg accccaaccc gcttcgtgaa ccaccgccgc ctgtcgagat acatcgtgac aggtgctcat ccgccgtgcc ctcaggctgg tcaaggtgtc gcgtgtacga 804
tccgagccag gcgcgcggcc ccgcgtggcg gccctcggac caacaagccg gggccagaag catcttcgac caacgagatc ggtgctgggc tggcgtcatc cgacgttgac gcccgtgctg cctggccacc
Met Phe Met Gly Gly Ala Ala Cys Asn Pro Asn Lys Asn Leu Ala Phe Asp Gln
Ala Thr Leu Thr Gly Ser Ser Ala Val Met Gly Ala Pro Ser Asp Arg Phe Val Asp Arg Val Leu Ser Cys Gly Phe Gly
60 120 180 240 300 360 420 480 540 600 660 720 780 145 Thr
Met
150 155 160
Ala Ser Leu Glu Phe Gly Thr Ala Val
165 170 175
Val Leu Gly His Ser Ala Cys Gly Ala
Leu
Val
Asp Val Phe Val Thr Arg Val Ala Gly Asn Ile Val Thr Asn Glu Ile
Gly Ser Lys Val Leu
Ala Ala Thr Met Asn
Ser Leu Tyr Tyr Ser Ile Ser
Gly Asp Val Asp Gly Ala Ile Ala
Val Ser Pro Val Leu
Val Gly Gly Val Tyr
Gly
30 Ala
Cys
Val
1
Ala 195 Pro Ala 210 Glu Asn Val 225
Gln Gly Leu Val 245
li Pro 200 Lys Lys
215 Lys Val 230
Lys
5 Gly
Ala
Gln
Glu 250
Val
205 Gln Ala 220 Met Glu 235
Gly Lys
190 Ie Ser
Gln
Leu 255
Leu 240 Lys
Lys
Ile
Ile Ala
Asp Leu Ala Thr Gly Lys Val Thr Glu
260 265
<210> 124 <211> 846 <212> DNA <213> Oryza sativa <4 00> 124 ggagcgcgcc gtgcaccgcc agctggtgct tcgccactgt tccccatcac cgtcctcctc cgcccccgcc tcatccgcaa gacgccgccg tcgaccgcct aagaagccgg agctcttcga tcgtgcgccg actctcgcgt ttcaccgtcc gcaacatcgc gtcgggtcgg ccatcgagta ggccacagcc gctgcggtgg tccttccact tcgtcgagga accgagcacg cctcgctgcc aaccaatccc tggagaacct accctcaagc tcgtcggcgg ccctaa <210> 125 <211> 273 <212> PRT <213> Oryza sativa <4 00> 125
Met Ser Thr Ala Ala Ala Ala Ala Ala Ala Gln
10 15
Thr Val Thr Pro Arg Ser Arg Ala Thr Val Val
25 30
Pro Ser Pro Ser Ser Ser Ser Ser Ser Ser Ser
40 45
Pro Ala Pro Phe Arg Pro Arg Leu Ile Arg Asn
50 55 60
Ala Pro Val Ala Pro Ala Ala 65 7 0 7 5
Asp Gly Phe Ala Lys Phe Lys
tctcacaatg tcgaccgccg caccccgcgc tcccgcgcca ctcctcctcc tccaacagca cacccccgtc ttcgccgccc caaggatggg ttcgccaagt accgctcaag gccggccagg gtgcccgtcg gtgaccatgg caacatggtc ccagcttact cgccgtctgc gccctcaagg aatcaaggcc ctcctctcac. ctgggtcagg accggtttcc tttcgatgac caatgcgcca caagacctac ccgttcgtca ccactacgac ttcgtctccg 846
ccgccgccgc cagtcgtcgc gcaacctccc ccgtcgcccc tcaagaccga cacccaagta gcctggagcc gcaagatcaa tcgaactcat tcaaggatgg ccgccaagaa tcttggagaa aggaggggat gcaacttgga
cgctgcccag cagcctcgcc ggcccccttc cgccgcgatg gttctatgac catggtgttc cggcgaggcc gcacgctggc cgtggtgatt agcaccagac gaaggttcag ggaggccgtg cgccaacggc cttatgggag
Met
Leu
85
Phe Glu 100
Ser Cys Ala
115 Pro Gly
130 Tyr Cys 145
Val Cys
Pro
90
Leu Lys Ala 105
Asp 80
Thr Glu
95
Gly Gln 110
Ala Ala
Phe Tyr
Ala Pro
Glu
Lys
Ala 165
Asp Ser Arg Val Cys Pro Ser Val
120 125
Ala Phe Thr Val Arg Asn Ile Ala
135 140
Ile Lys His Ala Gly Val Gly Ser 150 ' 155 160
Leu Lys Val Glu Leu Ile Val Val 17 0 17 5
Ser Trp Ala Ser Asn Ser Thr Pro Val Asp Asp Lys Lys Tyr Thr Met Asn Met Ala Ile Ile Gly
Cys Phe Ala Leu Ala Ser Ser Asn Leu Val Phe Ala Arg Leu Lys Lys Pro Glu Met Val Phe Gly Leu Glu Val Pro Ala Glu Tyr AIa His Ser Arg
60 120 180 240 300 360 420 480 540 600 660 720 780 840 Cys Gly Gly 180 Ser Phe His
195 Lys Lys 210 Ala Ile
Ile
Val
Leu
225 Thr
Tyr
Val
Pro 245 Gly Gly 260
Pro <210> <211> <212> <213> <4 00> atggtcccct caatctgctt ctgtctctcc acctgcttca gccatcgaag gccaaggtga tttgatcccg accaatcctg gcttgttcgg ttcgtggttc gttggagccg gggcacagtg tctactgact gcagaaagtg gtgtcactag cttgctttga cagtttggaa <2 10> <211> <212>
Phe
200 Gln Thr
215 Glu Lys 230 Phe
Lys Ala
185 Val Glu
Leu
Glu
Glu
Val
His
Lys 250 Tyr Asp 265
Asp
205 His Ala 220 Ala Val 235 Glu
Leu Ser
190 Trp Val
Gly
Phe
Leu Lys Asp Gly Ala Pro Asp
Arg Thr Gly Phe Pro Ala Lys
Ser Leu Pro Phe Asp Asp Gln Cys
Asn Gln Ser Leu Glu Asn Leu Lys 240
Ala Asn Gly Thr Leu Lys Leu Gly Asn Leu Asp Leu Trp Glu
Ile 255 Val Ser 270
<213> <4 00> Met Ser
1
Ser Ala
Thr 5
Gln Ser 20 Cys Leu 35 Ser
126 993 DNA
Arabidopsis 126
tttggactac caaaagccac tcttcctctt gccacttcaa ctctcaagaa agaagatcac tcgaacgaat ctttgtatgg actcacgagt gtaatatcgc ccattgaata catgtggtgg tcatagagga aaagttcagc caaacctatt agggaggcta tttcccccgt 127 347 PRT
Arabidopsis 127
Ala Pro
thaliana
agtttctcga aaaacagtat cccgttccat acttgaactg gcttctcatt ggcggagctt taaggaaggc tgagctcgcc gtgcccatca caatatggtt cgctgtcttg catcaagggg ttgggtcaaa atttgaagac gacatatcca ctatgacttt tcattctata
thaliana
aatggctcat aaatatcctt ttatccgcaa agaaggatgg gagaaggatg caggcagcct ttcgtcacct aaaggtcaaa cacgtactag cctccttttg caccttaagg cttatgtcat atctgtttac caatgtggcc tttgtgagag gttaatggct tga
Ser 50
Ala Pro 65 Glu
Arg
Ser Leu 25
Pro Pro 40
Ser Val
Leu 10 Gln
Ala
Pro
Ser
Ala
Ala
Lys Glu
55 Pro 70 Tyr Asp 85 Glu
Ile
Glu
Lys
30 Ser Ser 45
Thr Leu 60 Ala
Gly Phe
15 Leu Ser
Phe Leu
Leu Arg
Ser Ser Ser
Ile Arg Asn
Ile 75
Ala Ile
Pro
Tyr 80 Ala
Trp Ser
Leu
Ala
Val
100 Ala Leu 115
Glu
Gln
Thr Ile
90
Lys Thr
105 Thr Gly 120 Lys
130 Glu Thr
145
Lys Tyr Val Leu
135
Asn Pro Ala 150
Val Phe
Met 165 Asp
Gln
Leu
Ala 170
Val
Thr
Gly 1' Tyr 155 Cys
Glu 95
Ala Ala 110 Ser Ser 125 Phe
Ile
Leu Ala Asp Lys
Lys Lys Lys Phe
Gly Glu
Ser
Asp
175
Leu Ala 160
Ser Arg
cagactcaga ctcttcgtcc acggagcttg gaaacgaatc atctgaagga cgtcatcgga tcaagaagga gcccaaagta acttccatcc acaaggtcaa tggaaaacat ttcctcttga cagcaaagtc gatgcgaaag aaggagttgt cctttgagct 9
gacgactctc ctctcatcgc ttttcggtgc atatgaagac tgtagctgcg cagcaaatct gaaatacgag catggtgttt tggagatgcc atatgcagga tgtggtgata cggaaacaac aaaagttttg ggcagtgaat gaaaggaaca ttgggagctc 93
Phe Gln Pro Gly Asp Ala Phe Val
Thr Ser Leu Thr Ser Ser Ser Ser Ser Glu Pro Val Glu Glu Met Lys Leu Leu Val Glu Gln Lys Ala Phe Lys Lys Glu Lys Gly Gln Val Cys Pro Val Arg Asn
Ser Pro Thr Val Ser Ser Phe Ala Gly Thr Ile Glu Ile Thr Asp Pro Lys Tyr Ser Pro Ser His Ile Ala
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1 c 30 185 190 Asn Met Val Pro Pro Phe Asp Lys Val Lys Tyr Gly Gly Val Gly Ala 195 200 205 Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile Val Val 210 215 22.0 Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro 225 230 235 240 Leu Asp Gly Asn Asn Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Ile 2.4 5 250 255 Cys Leu Pro Ala Lys Ser Lys Val Ile Ser Glu Leu Gly Asp Ser Ala 260 265 270 Phe Glu Asp Gln Cys Gly Arg Cys Glu Arg Glu Ala Val Asn Val Ser 275 280 285 Leu Ala Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu Val' Lys 290 295 300 Gly Thr Leu Ala Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ala 305 310 315 320 Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Glu Thr Ser Ser Val 325 330 335 Lys Asp Val Ala Thr Ile Leu His Trp Lys Leu
340
345
128 990 DNA
Flaveria pringleί 128
<2 10> <211> <2 12> <213> <4 00>
atgtcgaccg cctctgcttt cgccattaat gcgccttcgt aagaagtcgt cttcttcagc cagatctggt gtgttgtccg tcgtcgtctt cttcgtctgc tactcctccg agtctcattc gctccggctc ctatcatcac accgaattgg accgaagatg gccattgacg cactcaagaa aatgctcatt gaaaagggtg gcaagaatcg accaaatcac agctcaagcc gcagcacccg cctgttgaga ggatcaaatc cggcttcgtg aagttcaaga ccggtcttgt acgatgagct tgctaaaggc caaagcccaa tcagactcgc gtgtttgccc atcacacgtt cttgatttcc gtccgtaacg ttgccaacat ggtccctccc tttgacaaga gctgctgttg agtatgcagt tttgcatcta aaggtacaag agccgttgtg gagggatcaa gggtctcatg actttcccag gatttcatcg aagattgggt gaaagtatgt ctccccgcga cacaacggca cacatcttga tgatcaatgt gtactatgtg tcgcttggaa acctgttgac atacccattt gtaagggatg gcgctcaagg gtggtcacta tgactttgtt aacgggacct tttggccttt cgtctcctac ctctgtatga < 210 > 129 <211> 329 <212> PRT
<213> Flaveria pringlei <400> 129 Met Ser Thr Ala Ser
tcgtcaacgc ccagatttac gtaacgagcc gaaatgaatc agttagaacc acaccaaagc cagagaaatt agttcatggt agcccggtga ccaaatattc aaatatttgt acgaaggacc agtcaaaagt aaaaggaagc gattgaggaa ttgagctgtg 990
ttcgtcgctg gtgcaattcg tgttttcgct atacgaggaa agttgccgct tccatttgac cgtcacaaac gtttgcatgc ggcgtttgtt tggagtagga aattgggcat tcactcaacc ggtagcagaa tgtgaacgtg caatacactc ggcacttgac
1
Ala Ser
Pro
50 Ile Ile 65 Ala
Thr
5
Ser Ser 20 Ala Arg 35 Pro
Ser
Leu Lys 25
Phe Thr 40
Leu Ile
Ala 10 Lys
Cys
Arg
Phe
Ser
Thr
Ile
Pro Val
5 Pro 70
Asp Ala 85 Ala
Asn
Leu
Ala
Pro
100 Asp Thr
Lys
Trp 75
Lys Lys 90
Ala Arg Ile 105
Ala Pro Phe
Asn 45
Asn Glu 60 Thr
Ala Ile
15 Ser Ser 30 Ser
Glu
Met 95
Asp Gln 110 Asp Pro
Asn Ala Pro Ser Phe Val Asn Ser Ala Arg Ser Gly Val Leu Ser Ser Ser Ser Ser Ser Ala Thr Pro Val Phe Ala Ala Pro Ala Pro Gly Asn Glu Ser Tyr Glu Glu Ile Glu Lys Gly Glu Leu Glu Ile Thr Ala Gln Ala Ala Ala Val Glu Arg Ile Lys Ser Gly
Asp 80 Leu
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 115 Phe Val
130 Asp Glu 145 Ser
Asp
Glu Ala
Lys
His
Lys
Leu
Ser 165 Phe 180 Thr Lys 195 Leu
120 Phe Lys
135 Ala Lys 150 Arg
Val
Val Val
Tyr
210 Gly Ile 225 Asp
Phe
Val Val
Lys
Lys
Ile 245 Ala
Val
Thr
Gly
Cys 170 Arg 185 Ser Gly 200 Gln
125 Glu Lys
140 Gln Ser 155 Pro
Phe Val Thr
Ser
Asn Val
Pro
His 17 5 Ala
Lys 160 Val
Phe
Leu
Val
Glu Ile
190 Gly Ala 205 Phe
Asn Met
Ala Val
Val Ile Gly
215 Gly Leu 230
Glu Asp Glu His
Cys
Pro
260 Glu Lys 275 Phe
Glu
Met
Trp 250 Asn 265 Ala Val 280
220 Thr Phe 235 Val
Pro
Lys
Gly
Asn
Val 255 Thr His
270 Val Ser 285
Asp 240 Cys
Leu
Leu
Val
Tyr
290 Gly His 305
Phe Gly
<21 0> <211> <2 12> <213> <4 00> atgtcgaccg aagaagtcgt tcgtcgtcgt gctgccccgg gaagccattg gctgcaagaa gaccctgttg aacccagccc tgctcagact gttgtccgta ggagctgctg catagccgtt actgatttca gaacacaacg gtgtcgcttg ctcgcgctca gactttgggc <2 10> <2 11> < 212 > <2 13> <4 00>
Arg Asp Gly Leu Arg Asn Asn
295 300
Asp Phe Val Asn Gly Thr Phe 310 315 320
Ser Ser Pro Thr Ser Val
Glu Leu Asp Gly Thr Glu
1inearis
Met
1
Ala Leu
Thr
5 Ser
Thr
50 Pro Ile
Ser
Ser 20 Ser Ala 35
Pro Pro
Leu 32 5 130 993 DNA
Flaveria
130
cctctgcttt cgacttcttc cttcttcgtc cgcccatcat acgcactcaa tcgaccaaat agaggatcaa tgtacgatga cgcgtgtttg acgttgccaa ttgagtatgc gcggagggat tcgaagattg gcacacatct gaaacctgtt agggtggtca tttcgtctcc
131 330 PRT
Flaveria 131
Ala Ser
cgccattaac agccagatct tgcaactcct aacaccgaat gaaaatgctc cacagctcaa atccggcttc gcttgctaaa cccatcacac catggtccct agttttgcat caagggtctc ggtgaaagta tgatgatcaa gacataccca ctatgatttt tacctctgta
1inearis
Asn Pro Met Val Asp Phe Val Pro Glu Tyr His Ser Gly Pro Pro Ala Asp Gln Asn Leu Leu Ala Leu Trp
Val Leu Tyr Phe Ala Cys Gln Pro Gly Pro Phe Asp Ala Val Leu Arg Cys Gly His Ser Thr Lys Ser Lys Cys Val Leu Leu Thr Tyr Leu Lys Gly Ala Leu Asp
gcgccttcgt ggtgtgtrgt ccgagtctca tggaccgaag attgaaaagg gccgcagcac gtgaagttca ggccaaagcc gttcttgatt ccctttgaca ctaaaggtac atgactttcc tgcctccccg tgtgtacaat tttgtaaggg gttaacggga tga
tcgtcaacgc ccgccagatt ttcgtaacga acggaaatga gtgagttaga ccgacaccaa agacagagaa caaagttcat tccagcccgg agaccaaata aagaaatatt cagacgaagg caaagtcaaa gtgaaaagga atggtttgag cctttgagct
ttcatcgctg tacgtgcaat gcctgttttc atcatacgag acccgttgcc agctccattc attcgtaaca ggtgtttgca tgaggcgttt ttctggagta tgtaattggg acctcactca agtggtagca agctgtgaac gaacaataca gtgggcactt
993
Leu
Ala 10 Lys
Ile
Lys 25
Arg Phe 40
Ser Leu 55
Thr Pro Asn
Phe
Ser
Ala Ile 15
Ser Thr
Thr
Ile
30
Cys Asn 45
Arg Asn 60
Trp Thr
Asn Ala Pro Ser Phe Val Asn Ser Ser Ala Arg Ser Giy Val Ser Ser Ser Ser Ser Ser Ser Ala Glu Pro Val Phe Ala Ala Pro Ala Glu Asp Gly Asn Glu Ser Tyr Glu
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 65 '7 0 7 5 8 0
Glu Ala Ile Asp Ala Leu Lys Lys Met Leu Ile Glu Lys Gly Glu Leu
85 90 95
Glu Pro Val Ala Ala Ala Arg Ile Asp Gln Ile Thr Ala Gln Ala Ala
100 105 110
Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val Glu Arg Ile Lys Ser
115 120 125
Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val Thr Asn Pro Ala Leu
130 135 140
Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys Phe Met Val Phe Ala 145 150 155 160
Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln Pro
165 170 175
Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Met Val Pro Pro Phe
180 185 190
Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala Val Glu Tyr Ala Val
195 200 205
Leu His Leu Lys Val Gln Glu Ile Phe Val Ile Gly His Ser Arg Cys
210 215 220
Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro His Ser 225 230 235 240
Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys Leu Pro Ala Lys Ser
245 250 25 5
Lys Val Val Ala Glu His Asn Gly Thr His Leu Asp Asp Gln Cys Val
260 265 270
Gln Cys Glu Lys Glu Ala Val Asn Val Ser Leu Gly Asn Leu Leu Thr
275 280 28 5
Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Asn Thr Leu Ala Leu Lys
290 295 300
Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Ala Leu 305 310 315 320
Asp Phe Gly Leu Ser Ser Pro Thr Ser Val
325 330
<210> 132 <211> 993 <212> DNA
<213> Flaveria browníi <4 00> 132
atgtcgaccg cctctgcttt cgccactaac gtgccttcgt tcgtcaacgc ttcatcgctg 60 aagaagtcgt ccacttcttc agccagatct ggtgtgttgt ccgccaaatt tacgtgcaat 120 tcgtcgtcgt cttcttcgtc tgcaactcct ccgagtctca ttcgtaacga gcctgttttc 180 gctgctccgg cgcccatcat cacaccgaat tggaccgaag acggaaatga atcatacgag 240 gaagccattg acgcactcaa gaaaatgctc attgaaaagg gtgagttaga accagttgcg 30 0 gctgcaagaa tcgaccaaat cacagctcaa gccgcggcac ccgacaccaa agctccattc 360 gaccctgttg agaggatcaa atccggcttc gtgaagttca agactgagaa attcgtaaca 420 aacccagccc tgtacgatga gcttgctaaa ggccaaagcc caaagttcat ggtgtttgca 480 tgctcagact cgcgtgtttg cccatcacac gttcttgatt tccagcccgg tgaggcgttt 540 gttgtccgta acgttgccaa catggtccct ccctttgaca agaccaaata ttctggagta 600 ggagctgctg ttgagtatgc agttttgcat ctgaaggtac aagaaatatt tgtaattggg 660 catagccgtt gcggagggat caagggtctc atgactttcc cagacgaagg acctcactca 720 accgatttca tcgaagattg ggtgaaagta tgcctccccg cgaagtcaaa agtggtagca 780 gaacacaacg gcacacatct tgatgatcaa tgtgtactat gtgaaaagga agctgtgaac 84 0 gtgtcgcttg gaaacctgtt gacataccca tttgtaaggg atggtttgag gaacaataca 900 ctcgcgctca agggtggtca ctatgatttt gttaacggga cctttgagct gtgggcactt 960 gactttgggc tttcgtctcctacctctgtatga 9 93
<210> 133 <211> 330 <212> PRT
<213> Flaveria browníi <4 00> 133
Met Ser Thr Ala Ser Ala Phe Ala Thr Asn Val Pro Ser Phe Val Asn 10 15
Ala Ser Ser Leu Lys Lys Ser Ser Thr Ser Ser Ala Arg Ser Gly Val 25 30
Leu Ser Ala Lys Phe Thr Cys Asn Ser Ser Ser
40 45
Thr Pro Pro Ser Leu Ile Arg Asn Glu Pro Val
50 55 60
Pro Ile Ile Thr Pro Asn Trp Thr Glu Asp Gly 65 70 75 80
Glu Ala Ile Asp Ala Leu Lys Lys Met Leu Ile
85 90 95
Glu Pro Val Ala Ala Ala Arg Ile Asp Gln Ile
100 105 110
Ala Pro Asp Thr Lys Ala Pro Phe Asp Pro Val
115 120 125
Gly Phe Val Lys Phe Lys Thr Glu Lys Phe Val
130 135 140
Tyr Asp Glu Leu Ala Lys Gly Gln Ser Pro Lys
145 150 155 160
Cys Ser Asp Ser Arg Val Cys Pro Ser His Val
165 170 175
Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn
180 185 190
Asp Lys Thr Lys Tyr Ser Gly Val Gly Ala Ala
195 200 205
Leu His Leu Lys Val Gln Glu Ile Phe Val Ile
210 215 220
Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp
225 230 235 240
Thr Asp Phe Ile Glu Asp Trp Val Lys Val Cys
245
250
255
Lys Val Val Ala Glu His Asn Gly Thr His Leu
260 265 270
Leu Cys Glu Lys Glu Ala Val Asn Val Ser Leu
275 280 285
Tyr Pro Phe Val Arg Asp Gly Leu Arg Asn Asn
290 295 300
Gly Gly His Tyr Asp Phe Val Asn Gly Thr Phe 305 310 315 320
Asp Phe Gly Leu Ser Ser Pro Thr Ser Val
325 330
<210> 134 <211> 969 <212> DNA
<213> Nicotiana paniculata <4 00> 134
atgtcaactg cttccattaa cagttgcctt actatctccc aaaccaattc gtcctgttgc ttttgctagg cttagcaaca gttcccagtc tcatcagaaa cgagcccgtc ttcgccgccc attttgagag aagaaatggc aaaggaatcc tatgagcagg ctcctcagcg aaaaaggaga acttggacca attgctgcag gctgaattgc aatcatcaga tggcagcaaa ccattcgacc ggctttattc acttcaaaac tgagaaatac gagaagaacc tcaaaaggcc agagccccaa gttcatggtc tttgcctgct tcacatgttc tgaacttcca acctggtgag gctttcgtgg gtccccgctt atgacaagac cagatactct ggtgtcggag ctccacctta aggtagagaa cattgttgtc attggccaca ggtctcatgt ctctatctgc agatggttct gaatcaactg aaaattggtt tacctgccaa ggccaaggtg gagggtgaac gatcaatgca cagcttgtga gaaggaagct gtgaatgtgt tatccatttg tgagagaagg tttggtgaag aaaacactag gattttgtga atggaggatt tgagctgtgg ggacttgagt
Ser Ser Phe Ala Asn Glu Glu Lys Thr Ala Glu Arg Thr Asn Phe Met Leu Asp Met Val Val Glu Gly His Glu Gly Leu Pro Asp Asp Gly Asn Thr Leu Glu Leu
Ser Ser Ala Ala Pro Ala Ser Tyr Glu Gly Glu Leu Gln Ala Ala Ile Lys Ser Pro Ala Leu Val Phe Ala Phe Gln Pro Pro Pro Phe Tyr Ala Val Ser Arg Cys Pro Hls Ser Ala Lys Ser Gln Cys Val Leu Leu Thr Ala Leu Lys Trp Ala Leu
cagctcaagc cctcttcttc caactcccat ccattgctgc caagagttga ctgttgagca cagccttata ctgactctcg tccgaaacat cagctatcga gcgcatgtgg cctttattga acgcggataa cacttggaaa cattgaaggg tcggtctttc
ttcccttaag ttcttcttcc catcaacccc actcgagaaa ccagattaca catgaaagct tggggaacta agtgtgccca cgccaacatg atacgctgtt aggtatcaaa ggattgggtg atgttttgca tttgctgacc aggtcactat tccttctctt
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960
tccgtatga <210> 135 < 211> 322
969 <212> PRT
<213> Nicotiana paniculata <4 00> 135
Met Ser Thr Ala Ser Ile Asn Ser Cys Leu Thr Ile Ser 10 15
Ala Ser Leu Lys Lys Pro Ile Arg Pro Val Ala Phe Ala
25 30
Asn Thr Ser Ser Ser Ser Ser Ser Val Pro Ser Leu Ile
40 45
Pro Val Phe Ala Ala Pro Thr Pro Ile Ile Asn Pro Ile
50 55 60
Glu Met Ala Lys Glu Ser Tyr Glu Gln Ala Ile Ala Ala 65 70 75 80
Leu Leu Ser Glu Lys Gly Glu Leu Gly Pro Ile Ala Ala
85 90 95
Asp Gln Ile Thr Ala Glu Leu Gln Ser Ser Asp Gly Ser
100 105 110
Asp Pro Val Glu His Met Lys Ala Gly Phe Ile His Phe
115 120 125
Lys Tyr Glu Lys Asn Pro AIa Leu Tyr Gly Glu Leu Ser
130 135 140
Ser Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg 145 150 155 160
Ser His Val Leu Asn Phe Gln Pro Gly Glu Ala Phe Val
165 170 175
Ile Ala Asn Met Val Pro Ala Tyr Asp Lys Thr Arg Tyr
180 185 190
Gly Ala Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val
195 200 205
Val Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly
210 215 220
Leu Ser Ala Asp Gly Ser Glu Ser Thr Ala Phe Ile Glu 225 230 235 240
Lys Ile Gly Leu Pro Ala Lys Ala Lys Val Glu Gly Glu
245 250 255
Lys Cys Phe Ala Asp Gln Cys Thr Ala Cys Glu Lys Glu
260 265 270
Val Ser Leu Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg
275 280 285
Val Lys Lys Thr Leu Ala Leu Lys Gly Gly His Tyr Asp
290 295 300
Gly Gly Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser 305 310 315 320
Ser Val
Pro Ala Gln Arg Leu Ser Arg Asn Glu Leu Arg Glu Leu Glu Lys Ala Arg Val Lys Pro Phe Lys Thr Glu Lys Gly Gln Val Cys Pro Val Arg Asn Ser Gly Val Glu Asn Ile Leu Met Ser Asp Trp Val His Ala Asp Ala Val Asn Glu Gly Leu Phe Val Asn Pro Ser Leu
<210> 136 <211> 966 <212> DNA
<213> Nicotiana tabacum <4 00> 136
atgtcaactg cttccattaa cagttgcctt actatctccc ctgctcaagc ttcccttaag 60
aaaccaactc gtcctgttgc ttttgcaagg cttagcaact cttcttcttc tacttctgtt 120
cccagtctca tcagaaacga gcccgtcttc gccgccccta ctcccatcat caaccctatt 180
ttgagagaag aaatggcaaa ggaatcctat gagcaggcca ttgctgcact cgagaaactc 240
ctcagcgaaa aaggagaact tggaccaatt gctgcagcaa gagttgacca gattacagct 300
gaattgcaat catcagatgg cagcaaacca ttcgaccctg ttgagcacat gaaagctggc 360
tttattcact tcaaaactga gaaatacgag aagaacccag ccttatatgg ggaactatca 420
aaaggccaga gccccaagtt catggtcttt gcctgctctg actctcgagt gtgcccatca 480
catgtcctga acttccaacc tggtgaggct ttcgtggtcc gaaacatcgc caacatggtc 540
cctgcttatg acaagaccag atactccgga gtcggagcag ctatcgaata cgctgttctt 600
caccttaagg tagagaacat tgttgtcatt ggccatagcg catgtggagg tatcaaaggt 660
ctcatgtctt tacctgcaga tggttctgaa tcaactgcct tcattgagga ttgggtgaaa 720
attggtttac ctgccaaggc gaaggtgcag ggtgaacacg tggataaatg ttttgcagat 780 caatgcacag cttgtgagaa ggaagctgtg aatgtgtcac ttggaaattt gctgacctat 840
ccatttgtga gagaaggttt ggtgaagaaa acactagcat tgaagggagg tcactatgat 900
ttcgtgaatg gaggatttga gctgtgggga cttgagttcg gtctttctcc ttctctttcc 960
gtatga 966
<210> 137
<211> 321
<212> PRT
<213> Nicotiana tabacum
<4 00> 137 Met Ser Thr Ala Ser Ile Asn Ser Cys Leu Thr Ile Ser Pro Ala Gln 1 5 10 15 Ala Ser Leu Lys Lys Pro Thr Arg Pro Val Ala Phe Ala Arg Leu Ser 25 30 Asn Ser Ser Ser Ser Thr Ser Val Pro Ser Leu Ile Arg Asn Glu Pro 40 45 Val Phe Ala Ala Pro Thr Pro Ile Ile Asn Pro Ile Leu Arg Glu Glu 50 55 60 Met Ala Lys Glu Ser Tyr Glu Gln Ala Ile Ala Ala Leu Glu Lys Leu 65 7 0 75 8 0 Leu Ser Glu Lys Gly Glu Leu Gly Pro Ile Ala Ala Ala Arg Val Asp 85 90 95 Gln Ile Thr Ala Glu Leu Gln Ser Ser Asp Gly Ser Lys Pro Phe Asp 100 105 110 Pro Val Glu His Met Lys Ala Gly Phe Ile His Phe Lys Thr Glu Lys 115 120 125 Tyr Glu Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys Gly Gln Ser 130 135 140 Pro Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser 14 5 150 155 160 His Val Leu Asn Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Ile 165 170 175 Ala Asn Met Val Pro Ala Tyr Asp Lys Thr Arg Tyr Ser Gly Val Gly If 30 Ii 35 190 Ala Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Asn Ile Val 195 200 205 Val Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Leu 210 215 220 Pro Ala Asp Gly Ser Glu Ser Thr Ala Phe Ile Glu Asp Trp Val Lys 225 230 235 240 Ile Gly Leu Pro Ala Lys Ala Lys Val Gln Gly Glu His Val Asp Lys 245 250 255 Cys Phe Ala Asp Gln Cys Thr Ala Cys Glu Lys Glu Ala Val Asn Val 260 265 270 Ser Leu Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Glu Gly Leu Val 275 280 285 Lys Lys Thr Leu Ala Leu Lys Gly Gly His Tyr Asp Phe Val Asn Gly 290 295 300 Gly Phe Glu Leu Trp Gly Leu Glu Phe Gly Leu Ser Pro Ser Leu Ser
305 310 315 320
Val
<210> 138 <211> 963 <212> DNA
<213> Populus tremula χ Populus tremuloides <4 00> 138
atgtcgactg cttcgattaa cagctggtgt ctcacctctg tctctgcctc taagaaatca 60 ctacccgcat tacgtccttc agtctttgca agcctcaact cctctgtttc tcctcctacc 120 cttatcagaa accagcctgt tttcgcagcc cctgctccta ttctctatcc acggagaggc 180 gaagaaatgg gaaacgacta caacgaggcc attgaatctc tcaagaaact cctcagtgac 240 aaggaagagc tgaaaactgt agcagctgcg aaagtggagc agataacagc tgaattacaa 300 accgtctcat cttctgaccc caaggcattc gatcctgttg agaagattaa atccggattc 360 attcacttca agaaggagaa atatgacaag aatccgggac tgtactccga gcttgccaaa 420 ggccaaagcc ccaagtttat ggtgtttgca tgctcggatt cccgggtttg cccgtcccat 480 gtgcttgatt tccaaccagg ggaagctttt gtggtccgca atgttgcgaa tatggtcccg 540 ccatacgata agactaagta cgctggagtt ggggcagcga tagagtacgc agttttgcat 600 ctgaaggtgg aatacattgt ggtcatcgga cacagcgcct gtggtggaat taagggcctc 660 atgtccttcc cgtatgatgg aacaacatca actgatttca tagaagactg ggtcaaagtc /20 tgctacaatg ccaagaccaa gattttagca gaacatgcca actcaccttt cccagacatg /80 tgtacacaat gtgaaaagga ggcagtgaac gtgtccatcg gacacttgct cacctacccg 840 tttgtgagag atggcttggt gaacaaaact ctaggactga agggtggtta ttatgatttt 900 gtcaaaggca gttttgagct ctgggggctt gagtacagcc tctccccctc tctctccgta 960 tga 963
<210> 139 <211> 320 <212> PRT
<213> Populus tremula χ Populus tremuloides <4 00> 139
Met Ser Thr Ala Ser Ile Asn Ser Trp Cys Leu Thr Ser Val Ser Ala 10 15
Ser Lys Lys Ser Leu Pro Ala Leu Arg Pro Ser Val Phe Ala Ser Leu
25 30
Asn Ser Ser Val Ser Pro Pro Thr Leu Ile Arg Asn Gln Pro Val Phe
40 45
Ala Ala Pro Ala Pro Ile Leu Tyr Pro Arg Arg Gly Glu Glu Met Gly
50 55 60
Asn Asp Tyr Asn Glu Ala Ile Glu Ser Leu Lys Lys Leu Leu Ser Asp 65 70 75 80
Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys Val Glu Gln Ile Thr
85 90 95
Ala Glu Leu Gln Thr Val Ser Ser Ser Asp Pro Lys Ala Phe Asp Pro
100 105 110
Val Glu Lys Ile Lys Ser Gly Phe Ile His Phe Lys Lys Glu Lys Tyr
115 120 125
Asp Lys Asn Pro Gly Leu Tyr Ser Glu Leu Ala Lys Gly Gln Ser Pro
130 135 140
Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His 145 150 155 160
Val Leu Asp Phe Gln Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala
165 170 175
Asn Met Val Pro Pro Tyr Asp Lys Thr Lys Tyr Ala Gly Val Gly Ala
180 185 190
Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu Tyr Ile Val Val
195 200 205
Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu Met Ser Phe Pro
210 215 220
Tyr Asp Gly Thr Thr Ser Thr Asp Phe Ile Glu Asp Trp Val Lys Val 225 230 235 240
Cys Tyr Asn Ala Lys Thr Lys Ile Leu Ala Glu His Ala Asn Ser Pro
245 250 255
Phe Pro Asp Met Cys Thr Gln Cys Glu Lys Glu Ala Val Asn Val Ser
260 265 270
Ile Gly His Leu Leu Thr Tyr Pro Phe Val Arg Asp Gly Leu Val Asn
275 280 285
Lys Thr Leu Gly Leu Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser
290 295 300
Phe Glu Leu Trp Gly Leu Glu Tyr Ser Leu Ser Pro Ser Leu Ser Val 305 310 315 320
<210> 140 <2 11> 963 < 212 > DNA
<213> Populus tremula χ Populus tremuloides <4 00> 140
atgtcgactg cttcgattaa cagctggtgt ctcacctctg tctctccctc taagaaatca 60 ctacccgcat tacgtccttc agtctttgca agcctcaact cctctgtttc tcctcctacc 120 cttatcagaa accagcctgt tttcgcagcc cctgctccta ttctctatcc acggagaggc 180 gaagaaatgg gaaacgacta caacgaggcc attgaatctc tcaagaaact cctcagtgat 240
aaggaggagc tgaaaactgt agcagctgcg aaagtggagc agataacagc tgaattacaa 300
accgtctcat cttctgaccc caaggcattc gatcctgttg agaagattaa atccggattc 3 60
attcacttca agaaggagaa atatgacaag aatccgggac tgtactccga gcttgccaaa 420
ggccaaagcc ccaagtttat ggtgtttgca tgctcggatt cccgggtttg cccgtcccat 480
gtgcttgatt tccaaccggg ggaagctttt gtggtccgca atgttgcgaa tatggtcccg 540
ccatacgata agactaagta cgctggagtt ggggcagcga tagagtacgc agttttgcat 600
ctgaaggtgg aatacattgt ggtcatcgga cacagcgcct gtggtggaat taagggcctc 660
atgtccttcc cgtatgatgg aacaacatca actgatttca tagaagactg ggtcaaagtc 720
tgctacaatg ccaagaccaa gattttagca gaacatgcca actcaccttt cccagacatg 780
tgtacacaat gtgaaaagga ggcagtgaac gtgtccctcg gacacttgct cacctacccg 840
tttgtgagag atggcttggt gaacaaaact ctaggcctta agggtggtta ttatgatttt 900
gtcaaaggaa gttttgagct ctggggcctt gagtacagcc tctctccctc tctctccgta 960
tga <210> <211> <212> <213> <4 00>
963
141 320 PRT
Populus tremula 141
Met Ser Thr Ala Ser Ile Asn Ser Trp Cys Leu 1 5 10 15 Ser Lys Lys Ser Leu Pro Ala Leu Arg Pro Ser 25 30 Asn Ser Ser Val Ser Pro Pro Thr Leu Ile Arg 40 45 Ala Ala Pro Ala Pro Ile Leu Tyr Pro Arg Arg 50 55 60 Asn Asp Tyr Asn Glu Aia Iie Glu Ser Leu Lys 65 70 75 80 Lys Glu Glu Leu Lys Thr Val Ala Ala Ala Lys 85 90 95 Ala Glu Leu Gln Thr Val Ser Ser Ser Asp Pro 100 105 110 Val Glu Lys Ile Lys Ser Gly Phe Ile His Phe 115 120 125 Asp Lys Asn Pro Gly Leu Tyr Ser Glu Leu Ala 130 135 140 Lys Phe Met Val Phe Ala Cys Ser Asp Ser Arg 145 150 155 160 Vai Leu Asp Phe Gin Pro Gly Glu Ala Phe Val 165 170 175 Asn Met Val Pro Pro Tyr Asp Lys Thr Lys Tyr 1! 30 Ii 35 190 Ala Ile Glu Tyr Ala Val Leu His Leu Lys Val 195 200 205 Ile Gly His Ser Ala Cys Gly Gly Ile Lys Gly 210 215 220 Tyr Asp Gly Thr Thr Ser Thr Asp Phe Ile Glu 225 230 235 240 Cys Tyr Asn Ala Lys Thr Lys Iie Leu Ala Glu 245 250 255 Phe Pro Asp Met Cys Thr Gln Cys Glu Lys Glu 260 265 270 Leu Gly His Leu Leu Thr Tyr Pro Phe Val Arg 275 280 285 Lys Thr Leu Gly Leu Lys Gly Gly Tyr Tyr Asp 290 295 300 Phe Glu Leu Trp Gly Leu Glu Tyr Ser Leu Ser 305 310 315 320 <2 10> 142 < 2 11 > 777 <2 12> DNA <2 13> Arabidopsis tha liana
Thr Ser Val Phe Asn Gln Gly Glu Lys Leu Val Glu Lys Ala Lys Lys Lys Gly Val Cys Val Arg Ala Gly Glu Tyr Leu Met Asp Trp His Ala Ala Val Asp Gly Phe Val Pro Ser
Val Ser Pro Ala Ser Leu Pro Val Phe Glu Met Gly Leu Ser Asp Gln Ile Thr Phe Asp Pro Glu Lys Tyr Gln Ser Pro Pro Ser His Asn Val Ala Val Gly Ala Ile Val Val Ser Phe Pro Val Lys Val Asn Ser Pro Asn Val Ser Leu Val Asn Lys Gly Ser Leu Ser Val <4 00> 142
atgtcgacag agtcgtacga agacgccatt aaaagactcg tcggatctcg ggaacgtggc agccgcaaag atcaagaagt cttgattcca acaagttaga tgccgtagaa cgaatcaaat actaataatt atgagaagaa tcctactttg tacaattcac aagtttttgg tgtttgcttg tgcggattca cgagttagtc caacttgggg aagccttcat cgttagaaac attgcaaaca acaaagcact ctaatgttgg tgcggccctt gaatatceaa aacattcttg ttattggaca cagctgttgt ggtggaataa gataatacag ctcccactaa gaccgagttc atagaaaact gccaagaaca ggatcaagca ggattgtaaa gacctaagct tgtgagaagg aagccgtgaa cgtgtccttg gggaatcttt gaaagagtgg tgaagaacaa gcttgccata agaggagctc acgtttgatc tttgggaact tgacttcaag actacccctg <210> 143 <211> 258 <212> PRT
<213> Arabidopsis thaliana <4 00> 143
Met Ser Thr Glu Ser Tyr Glu Asp Ala Ile Lys
10 15
Leu Ser Lys Lys Ser Asp Leu Gly Asn Val Ala
25 30
Lys Leu Thr Asp Glu Leu Glu Glu Leu Asp Ser
40 45
Val Glu Arg Ile Lys Ser Gly Phe Leu His Phe
50 55 60
Glu Lys Asn Pro Thr Leu Tyr Asn Ser Leu Ala 65 70 75 80
Lys Phe Leu Val Phe Ala Cys Ala Asp Ser Arg
85 90 95
Ile Leu Asn Phe Gln Leu Gly Glu Ala Phe Ile
100 105 110
Asn Met Val Pro Pro Tyr Asp Lys Thr Lys His
115 120 125
Ala Leu Glu Tyr Pro Ile Thr Val Leu Asn Val
130 135 140
Ile Gly His Ser Cys Cys Gly Gly Ile Lys Gly 145 150 155 160
Asp Asn Thr Ala Pro Thr Lys Thr Glu Phe Ile
165 170 175
Ile Cys Ala Pro Ala Lys Asn Arg Ile Lys Gln
180 185 190
Ser Phe Glu Asp Gln Cys Thr Asn Cys Glu Lys
195 200 205
Ser Leu Gly Asn Leu Leu Ser Tyr Pro Phe Val
210 215 220
Lys Asn Lys Leu Ala Ile Arg Gly Ala His Tyr 225 230 235 240
Thr Phe Asp Leu Trp Glu Leu Asp Phe Lys Thr 245 250 255
Leu Ser
gagagcttct taacggatga ccggatttct ttgccaagag catctcacat tggtgccacc ttacagtcct agggactcat ggatccagat ttgaagatca tgtcttaccc actatgattt cctttgcctt
cagtaagaaa gttagaggaa ccatttcaag ccagaccccc cttgaatttc ttatgacaag caacgtggag ggccattgaa ctgtgcaccg gtgcaccaac attcgtgaga cgtaaaagga gtcttaa
Arg Leu Ala Ala Asn Lys Lys Thr Lys Ser Val Ser Val Arg Ser Asn Glu Asn Leu Met Glu Asn Asp Cys Glu Ala Arg Glu Asp Phe Thr Pro
Gly Glu Leu Lys Ile Lys Leu Asp Ala Asn Asn Tyr Gln Thr Pro Pro Ser His Asn Ile Ala Val Gly Ala Ile Leu Val Ala Ile Glu Trp Ile Gln Lys Asp Leu Val Asn Val Arg Val Val Val Lys Gly Ala Phe Ala
60 120 180 240 300 360 420 480 540 600 660 720 777
<210> 144 <211> 960 <212> DNA
<213> Spinacia oleracea <4 00> 144
atgtctacta ttaacggctg cctcacctct atctctcctt cccgtactca attgaaaaat acctccactt taaggccaac tttcattgct aacagcaggg ttaacccttc ttcttctgtt cctccttccc ttattagaaa ccagcccgtt ttcgccgccc ccgcccctat catcacccct actttgaaag aagatatggc atacgaagaa gccatcgctg cccttaagaa gcttctaagc gagaagggag aacttgaaaa tgaagccgca tcaaaggtgg cacagataac atctgagtta
60 120 180 240 300 gccgacggtg gcacaccatc cgccagttac ccggttcaga aaattcaaga aggagaaata cgagaaaaat ccagcattgt caagctccca agtttatggt gtttgcgtgc tcagactccc ctagatttcc agcccggtga ggctttcatg gttcgcaaca tttgacaagg acaaatacgc tggagtcgga gcagccattg aaggtggaga acattgtcgt gattggacac agtgcttgtg tctttcccag atgcaggacc aaccacaact gattttattg ttgcctgcca agcacaaggt gttagccgag catggtaatg acccattgtg aaaaggaagc tgtgaatgta tctctcggaa gtaagagatg gtttggtgaa gaagactcta gctttgcagg aatggatcat tcgagctatg gggactcgaa tacggcctct <210> 145 <211> 319 <212> PRT
<213> Spinacia oleracea <4 00> 145
Met Ser Thr Ile Asn Gly Cys Leu Thr Ser Ile
10 15
Gln Leu Lys Asn Thr Ser Thr Leu Arg Pro Thr
25 30
Arg Val Asn Pro Ser Ser Ser Val Pro Pro Ser
40 45
Pro Val Phe Ala Ala Pro Ala Pro Ile Ile Thr
50 55 60
Asp Met Ala Tyr Glu Glu Ala Ile Ala Ala Leu 65 70 75 80
Glu Lys Gly Glu Leu Glu Asn Glu Ala Ala Ser
85 90 95
Thr Ser Glu Leu Ala Asp Gly Gly Thr Pro Ser
100 105 110
Gln Arg Ile Lys Glu Gly Phe Ile Lys Phe Lys
115 120 125
Lys Asn Pro Ala Leu Tyr Gly Glu Leu Ser Lys
130 135 140
Phe Met Val Phe Ala Cys Ser Asp Ser Arg Val 145 150 155 160
Leu Asp Phe Gln Pro Gly Glu Ala Phe Met Val
165 170 175
Met Val Pro Val Phe Asp Lys Asp Lys Tyr Ala
180 185 190
Ile Glu Tyr Ala Val Leu His Leu Lys Val Glu
195 200 205
Gly His Ser Ala Cys Gly Gly Ile Lys Gly Leu
210 215 220
Ala Gly Pro Thr Thr Thr Asp Phe Ile Glu Asp 225 230 235 240
Leu Pro Ala Lys His Lys Val Leu Ala Glu His
245 250 255
Ala Glu Gln Cys Thr His Cys Glu Lys Glu Ala
260 265 270
Gly Asn Leu Leu Thr Tyr Pro Phe Val Arg Asp
275 280 285
Thr Leu Ala Leu Gln Gly Gly Tyr Tyr Asp Phe
290 295 300
Glu Leu Trp Gly Leu Glu Tyr Gly Leu Ser Pro
gaattaagga atggtgagct gtgtgtgtcc tcgccaacat aatacgcagt gtggaatcaa aggattgggt caactttcgc acttgttgac gtggttacta ctccttccca
agggtttatc ttctaagggc ctcgcacgta ggtgcc.agtg gttgcacctt ggggcttatg caaaatctgc tgaacaatgc ttacccattt cgattttgtc atctgtatga
Ser Pro Phe Ile Leu Ile Pro Thr Lys Lys Lys Val Ala Ser Lys Glu Gly Gln Cys Pro Arg Asn Gly Val Asn Ile Met Ser Trp Val Gly Asn Val Asn Gly Leu Val Asn Ser Gln
Ser Arg Thr Ala Asn Ser Arg Asn Gln Leu Lys Glu Leu Leu Ser Ala Gln Ile Tyr Pro Val Lys Tyr Glu Ala Pro Lys Ser His Val Ile Ala Asn Gly Ala Ala Val Val Ile Phe Pro Asp Lys Ile Cys Ala Thr Phe Val Ser Leu Val Lys Lys Gly Ser Phe Ser Val
315
305 310
<210> 146 <211> 987 <212 > DNA <213> Pisum satívuin <400> 146
atgtctacct cttcaataaa cggctttagt ctttcttctt accaaaagaa ctacattgag accctttgtt tctgoatctc
360 420 480 540 600 660 720 780 840 900 960
tgtcccctgc caaaacttct ttaacacttc ttcttcatct
60 120 tcttcctcga ctttcccttc tcttattcaa gacaagccgg atcatcaccc cagttttgag agaagaaatg ggaaagggct ctccaaaagt tgttgaggga gaagactgaa ctgaaagcca caaatcacag ctcagctagg aacaacatca tcatctgatg tctgaaagga tcaaaactgg tttccttcac ttcaagaaag gctttgtatg gtgaacttgc caaaggccaa agccctccgt gactcaagag tctgcccatc tcatgtgcta gatttccagc agaaatgttg ctaacttggt tccaccatat gaccaggcaa gcaattgagt acgcagttct gcatctcaag gtttccaaca gcttgtggtg gtattaaggg acttttgtcc tttccatttg ttcattgagg agtgggtcaa aattggttta cctgcaaagg ggagatgcac cttttgcaga gctatgcaca cactgtgaga cttggaaacc ttctcaccta cccatttgtg agagagggat ctcaaaggag gatactatga ctttgtgaaa ggatcctttg ggcctttcgt ccactttctc cgtatga 147 328 PRT
Pisum sativum
ttttcgcttc atgatgaagc cagctgctga gcattccaaa agaaatatga ttatggtgtt caggtgaagc aatatgccgg ttgttgtcat atggaaccta cgaaggtgaa aggaagctgt tggtgaacaa agctttgggg 987
ttcttctcct tattgaagaa gaaggttgag atctgaagcc caagaatcca tgcatgttca ctttgtggtc aactggtgct tggacacagt ctccactgat agcacaacat gaatgcttcc gacattggca acttgaattt
<210> <211> <212> <213> <4 00>
147
Met Ser Thr Ser Ser Ile Asn Gly Phe Ser Leu
10
15
Ala Lys Thr Ser Thr Lys Arg Thr Thr Leu Arg
20
25
30
Ser Leu Asn Thr Ser Ser Ser Ser Ser Ser Ser
35
40
45
Ile Gln Asp Lys Pro Val Phe Ala Ser Ser Ser
50
55
60
Val Leu Arg Glu Glu Met Gly Lys Gly Tyr Asp
65 70 75 80
Leu Gln Lys Leu Leu Arg Glu Lys Thr Glu Leu
85 90 95
Glu Lys Val Glu Gln Ile Thr Ala Gln Leu Gly
100 105 110
Asp Gly Ile Pro Lys Ser Glu Ala Ser Glu Arg
115 120 125
Leu His Phe Lys Lys Glu Lys Tyr Asp Lys Asn
130 135 140
Glu Leu Ala Lys Gly Gln Ser Pro Pro Phe Met 145 150 155 160
Asp Ser Arg Val Cys Pro Ser His Val Leu Asp
165 170 175
Ala Phe Val Val Arg Asn Val Ala Asn Leu Val
180 185 190
Ala Lys Tyr Ala Gly Thr Gly Ala Ala Ile Glu
195 200 205
Leu Lys Val Ser Asn Ile Val Val Ile Gly His
210 215 220
Ile Lys Gly Leu Leu Ser Phe Pro Phe Asp Gly 225 230 235 240
Phe Ile Glu Glu Trp Val Lys Ile Gly Leu Pro
245 250 255
Lys Ala Gln His Gly Asp Ala Pro Phe Ala Glu
260 265 270
Glu Lys Glu Ala Val Asn Ala Ser Leu Gly Asn
275 280 285
Phe Val Arg Glu Gly Leu Val Asn Lys Thr Leu
290 295 300
Tyr Tyr Asp Phe Val Lys Gly Ser Phe Glu Leu 305 310 315 320
Gly Leu Ser Ser Thr Phe Ser Val 325
<210> 148
Ser Ser Pro Phe Thr Phe Pro Ile Glu Ala Lys Ala Thr Thr Ile Lys Pro Ala Val Phe Phe Gln Pro Pro Tyr Ala Ser Ala Thr Tyr Ala Lys Leu Cys Leu Leu Ala Leu Trp Gly
Leu Ser Pro Val Ser Ala Pro Ser Leu Ile Thr Pro Ile Glu Glu Thr Ala Ala Ser Ser Ser Thr Gly Phe Leu Tyr Gly Ala Cys Ser Pro Gly Glu Tyr Asp Gln Val Leu His Cys Gly Gly Ser Thr Asp Ala Lys Val Thr His Cys Thr Tyr Pro Lys Gly Gly Leu Glu Phe
180 240 300 360 420 480 540 600 660 720 780 840 900 960 <211> 996 <212> DNA
<213> Medicago truncatula <4 00> 148
atgtctacct cttccataaa cggctttagt ctctcttctt attaaaaaag ttacattgag acctattgtt tctgcatctc tcttccactt ctaacttccc ttctcttatt caagacaagc tctcctatca tcaccccagt tttgagagaa gaaatgggaa gaagaactcc aaaaattgtt gagggagaag actgaattga gttgagcaaa ttacagctca gctaggaaca acagcatcag gatcaagcct cagagaggat caaaactggt ttccttcact acaaaaccag ctttgtatgg tgaacttgcc aaaggccaag gcatgctcag actcaagagt ctgcccatct catgtgctag tttgtggtca gaaatgttgc taacatggtt ccaccatatg actggatctg caattgagta tgctgttctg catctcaagg ggacacagtg cttgtggtgg tattaagggg cttttgtctt tccactgatt tcattgagga gtgggtcaaa attggtttac gcaaagcatg gagatgcacc ttttggagag ctatgcacac aatgtttctc ttggaaacct tctaacctac ccatttgtga acattggcac taaaaggagg atactatgac tttgtgaaag cttgaatttg gcctttcttc aactttctcc gtatga <210> 149 <211> 331 <212> PRT
<213> Medicago truncatula <400> 149
tgtcccctac ttaactcttc ctgtttttgc agggctatga aagccacagc ctgatggtgt tcaagaaaga cccccccgtt acttccagcc accaggcaaa tttccaacat ttccatttga ctgcaaaggc actgtgagaa gagagggatt gatcttttga
aaaaacttct ttcttcttcc ttcatcttct tgaagctatt agctgaaaag tccaacatct gaaatatgac tatggtgttt aggagaagct atatgctgga tgtggtcatt tggagcctac aaaggtgaag ggaagctgtg ggtgaacaaa gctttgggga )96
Met 1
Ser Thr Ser Ser Ile Asn Gly Phe Ser Leu
5
10
15
Thr Lys Thr Ser Ile Lys Lys Val Thr Leu Arg
25 30
Ser Leu Asn Ser Ser Ser Ser Ser Ser Ser Thr
40 45
Leu Ile Gln Asp Lys Pro Val Phe Ala Ser Ser
50 55 60
Thr Pro Val Leu Arg Glu Glu Met Gly Lys Gly 65 70 75 80
Glu Glu Leu Gln Lys Leu Leu Arg Glu Lys Thr
85 90 95
Ala Ala Glu Lys Val Glu Gln Ile Thr Ala Gln
100 105 110
Ser Ala Asp Gly Val Pro Thr Ser Asp Gln Ala
115 120 125
Thr Gly Phe Leu His Phe Lys Lys Glu Lys Tyr
130 135 140
Leu Tyr Gly Glu Leu Ala Lys Gly Gln Ala Pro 145 150 155 160
Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His
165 170 175
Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala
180 185 190
Tyr Asp Gln Ala Lys Tyr Ala Gly Thr Gly Ser
195 200 205
Val Leu His Leu Lys Val Ser Asn Ile Val Val
210 215 220
Cys Gly Gly Ile Lys Gly Leu Leu Ser 225 230 235
Ser Thr Asp Phe Ile Glu Glu Trp Val 245 250 255
Ala Lys Val Lys Ala Lys His Gly Asp Ala Pro
260 265 270
Thr His Cys Glu Lys Glu Ala Val Asn Val Ser
275 280 285
Thr Tyr Pro Phe Val Arg Glu Gly Leu Val Asn
Phe Pro 240
Lys Ile
Ser Ser Pro Ile Ser Asn Ser Ser Tyr Asp Glu Leu Leu Gly Ser Glu Asp Thr Pro Phe Val Leu Asn Met Ala Ile Ile Gly Phe Asp Gly Leu Phe Gly Leu Gly Lys Thr
Leu Ser Pro Val Ser Ala Phe Pro Ser Pro Ile Ile Glu Ala Ile Lys Ala Thr Thr Thr Ala Arg Ile Lys Lys Pro Ala Met Val Phe Asp Phe Gln Val Pro Pro Glu Tyr Ala His Ser Ala Gly Ala Tyr Pro Ala Lys Glu Leu Cys Asn Leu Leu Leu Ala Leu
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 290 295 300
Lys Gly Gly Tyr Tyr Asp Phe Val Lys Gly Ser 305 310 315 320
Leu Glu Phe Gly Leu Ser Ser Thr Phe Ser Val
325 330
<210> 150 <211> 471 <212> DNA
<213> Medicago truncatula <4 00> 150
atggtatttg cttgctctga ctctagagtg agtccctcta ggagaagctt tcatggtccg aaacattgct aacatggtcc aacatcttgg ttattggaca tagtcgctgc ggtggaatct ggatggctgc tccataatga ttgggtgaaa attggtttat aaagaacatg aatgctgtga tttcaaagaa caatgcaaat aataattcat tagtgaacct gaagacatat ctatatgttg aacttagcac tattgggagg ttactatgat tttgtgaatg tataagaccc atgtcactaa acccattaca atcccctcta <210> 151 <211> 156 <212> PRT
<213> Medicago truncatula <400> 151
Met Val Phe Ala Cys Ser Asp Ser Arg Val Ser
10 15
Asn Phe Gln His Gly Glu Ala Phe Met Val Arg
25 30
Val Pro Thr Phe Asn Gln Val Glu Asn Ile Leu
40 45
Arg Cys Gly Gly Ile Ser Arg Leu Met Pro Ser
50 55 60
His Asn Asp Trp Val Lys Ile Gly Leu Ser Phe 65 70 75 80
Lys Glu His Glu Cys Cys Asp Phe Lys Glu Gln
85 90 95
Met Glu Ser Val Asn Asn Ser Leu Val Asn Leu
100 105 110
Val Asp Arg Glu Val Arg Asn Lys Asn Leu Ala
115 120 125
Tyr Asp Phe Val Asn Gly Glu Phe Lys Leu Trp
130 135 140
Val Thr Lys Pro Ile Thr Ile Pro Ser Lys Arg 145 150 155
<210> 152 <211> 828 <212> DNA
<213> Arabidopsis thaliana <4 00> 152
atggtgaact actcatcaat cagttgcatc ttctttgtgg attgtttcga tttcgagtgc tgcttcaagt cacggagaag aactacaaga agaacgatga gaaggggcca gagagatggg gaaatgtgtg gaaaaggaga gatgcaatct cccatagatc attgtttctc atcttggaag gcttaataga gactataatc aacagaggcc atgacatcat gttaaaattt gaagatggag ggttttgaat atgaacttca acagcttcac tggcactctc ggaagaaggt ttgcacttga gctgcatatg gttcacgaag gttgtgactg tgttgtacaa gatcggaaga gcagatactt gaattagagg gcattgctga aatggaggag gctgagaaaa accaaaatta agatcggaag cagaaaatat tacagataca ccttgcactc aaaacgttac ttggagcgtc gttagaaagg caagtgaagc tcctccgcgt ggcagtgcac gatgatgcta caaccaacca acaagcgcat agtgcactta tacagaccaa <210> 153
Phe Glu Leu Trp Gly
ttatcctgaa ctacatttaa caaggcttat ctttcaaagt tttgtgaaat atagagaagt gagaattcaa aaagaccttg
ctttcaacat tcaggtggag gccttccaga caaggttctg ggaatcag tg aaggaacaag gctctggaag a 471
Pro Ser Asn Ile Val Ile Arg Gly Lys Val Cys Lys Lys Thr Leu Leu Lys Tyr Pro
Ile Ile Leu Ala Asn Met Gly His Ser Trp Leu Leu Lys Val Leu Phe Cys Glu Tyr Leu Tyr Gly Gly Tyr Lys Thr His
ctctgtttag ttgaggacga gagaacttaa ttatgaacga cttcaaatgc caggaactat cgtctgaaca gcaggaatag ttatcagatc atgtaggaat ctggttcact ttaggaccgt attcgaatgc tagtttaa
tattttcaca acgcgagttt accggaatgg gagagttaac aactcttaag taagatcaat tactattaat aagaatggct gttggagaaa gattgatccc taccactcct gacaagaaaa gaggccggtt 828
60 120 180 240 300 360 420
60 120 180 240 300 360 420 480 540 600 660 720 780 <211> 275 <212> PRT
<213> Arabidopsis thaliana <4 00> 153
Met Val Asn Tyr Ser Ser Ile Ser Cys Ile Phe
1
5
10
15
Ser Ile Phe Thr Ile Val Ser Ile Ser Ser Ala
25 30
Glu Val Glu Asp Glu Arg Glu Phe Asn Tyr Lys
40 45
Gly Pro Glu Arg Trp Gly Glu Leu Lys Pro Glu
50 55 60
Lys Gly Glu Met Gln Ser Pro Ile Asp Leu Met
65 70 75 80
Ile Val Ser His Leu Gly Arg Leu Asn Arg Asp
85 90 95
Ala Thr Leu Lys Asn Arg Gly His Asp Ile Met
100 105 110
Gly Ala Gly Thr Ile Lys Ile Asn Gly Phe Glu
115
120
125
Leu His Trp His Ser Pro Ser Glu His Thr Ile
130
135
140
Ala Leu Glu Leu His Met Val His Glu Gly Arg
145
150
155
160
Val Val Thr Val Leu Tyr Lys Ile Gly Arg Ala
165 170 175
Ser Leu Glu Lys Glu Leu Glu Gly Ile Ala Glu
180 185 190
Lys Asn Val Gly Met Ile Asp Pro Thr Lys Ile
195 200 205
Lys Tyr Tyr Arg Tyr Thr Gly Ser Leu Thr Thr
210 215 220
Asn Val Thr Trp Ser Val Val Arg Lys Val Arg 225 230 235 240
Gln Val Lys Leu Leu Arg Val Ala Val His Asp
245 250 255
Ala Arg Pro Val Gln Pro Thr Asn Lys Arg Ile
260 265 270
Pro Ile Val
275 <210> 154 <211> 987 <212> DNA
<213> Flaveria pringlei <4 00> 154
atgtatgcta cagctgccgc atttgcaccc tccttcacca tcgtcgtctt ccaccgtatc cacttgcttt gcaaggctta tcgtcgtctg ccactccacc acccagcctc atccgtaatc actcccatca tcacccccac tgtgagagga gacatgggaa attgctgcac tcaagaagct tttaagtgaa aaggaggagt aaaatcgacg aaatcacggc ccaacttcaa actctcgaca gtcgagagga tcaaaaccgg gtttgccaag ttcaagaccg gctttgtacg atgaactttc caaaggccag agcccaaaat gactctcgag tttgcccgtc acacgtgctg gatttccaac cgtaacgtag ccaacattgt cccccccttt gataagctta gcagtcgagt atgcagttct gcatctcaag gtggagcaga aaatgtggtg ggatcaaggg tctgatgact ttccccgatg ttcattgagg actgggtcag agttggtctc cctgcaaagt ggaagtgcat cacttgatga tcaatgtgta tcctgcgaga cttgcaaacc tgttgactta cccgtttgtg agaaacggat ctcaagggtg cacactatga ctttgttaac ggggcctttg agcctttcgc ctcctacctc ggcataa <2 10> 155
Phe Val Ala Ser Lys Asn Trp Glu Asn Glu Tyr Asn Leu Lys Tyr Glu Asn Gly Asn Arg Asp Thr Met Glu Lys Ile Pro Pro Thr Val Asp Ala Val His
Ala Leu Phe Ser His Gly Asp Glu Lys Met Cys Gly Arg Val Asn Pro Ser Asn Phe Glu Asp Leu Gln Gln Arg Arg Phe Arg Met Ala Phe Ile Arg Glu Ala Glu Gly Ser Arg Cys Thr Gln Thr Arg Lys Asn Ser Asn Leu Tyr Arg
cctcccgccg gcaacagcgc agcccgtttt gtgaatcata tggcacctgt ccaaacctgc agaaatacct ttatggtttt ccggtgaggc aatacgctgg tagtcgtaat agggaccgac caaaggtgaa aggaggcggt tgatgaacaa agttgtgggg 987
caaaccgtca tcagtcgtcg tgccgccccg tgatgaggca ggctgctgcc atttgacgcg gacaaatcca tgcatgctct gtttgtggtc agtaggatcc tgggcatagt cagcaccgac agcggagcat gaatgtgtct aacattggcg gcttgatttc
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 <211> 328 <212> PRT
<213> Flaveria pringleí <400> 155
Met Tyr Ala Thr Ala Ala Ala Phe Ala Pro Ser
10 15
Arg Lys Pro Ser Ser Ser Ser Ser Thr Val Ser
25 30
Leu Ser Asn Ser Ala Gln Ser Ser Ser Ser Ser
40 45
Ser Leu Ile Arg Asn Gln Pro Val Phe Ala Ala
0 5 5 60
Thr Pro Thr Val Arg Gly Asp Met Gly Ser Glu 65 70 75 80
Ile Ala Ala Leu Lys Lys Leu Leu Ser Glu Lys
85 90 95
Val Ala Ala Ala Lys Ile Asp Glu Ile Thr Ala
100 105 110
Asp Thr Lys Pro Ala Phe Asp Ala Val Glu Arg
115 120 125
Ala Lys Phe Lys Thr Glu Lys Tyr Leu Thr Asn
130 135 140
Glu Leu Ser Lys Gly Gln Ser Pro Lys Phe Met 145 150 155 160
Asp Ser Arg Val Cys Pro Ser His Val Leu Asp
165 170 175
Ala Phe Val Val Arg Asn Val Ala Asn Ile Val
180 185 190
Leu Lys Tyr Ala Gly Val Gly Ser Ala Val Glu
195 200 205
Leu Lys Val Glu Gln Ile Val Val Ile Gly His
210 215 220
Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly 225 230 235 240
Phe Ile Glu Asp Trp Val Arg Val Gly Leu Pro
245 250 255
Lys Ala Glu His Gly Ser Ala Ser Leu Asp Asp
260 265 270
Glu Lys Glu Ala Val Asn Val Ser Leu Ala Asn
275 280 285
Phe Val Arg Asn Gly Leu Met Asn Lys Thr Leu
290 295 300
His Tyr Asp Phe Val Asn Gly Ala Phe Glu Leu 305 310 315 320
Ser Leu Ser Pro Pro Thr Ser Ala 325
<210> 156 <211> 996 <212> DNA
<213> Flaveria Iinearis <4 00> 156
atgtatgcca cagctgccgc attaattgca ccctccttca tcatcgtcgt cttccaccgt atccgctccc ttcgcaaggc gcgtcgtcgt cgttgtctgc cactccacca ccgagcctca gccgccccga ctcccatcat cacccccact gtgagaggag gacgaggcaa ttgctgcact gaagaagctt ttaagtgaaa gctgctgcaa aaatcgacga aatcacct.cc caacttcaaa tttgacgcgg tcgagaggat caaaaccggc tttgccaagt acaaatccag ctttgtacga tgaactttcc aaaggccaga gcatgctctg actctcgagt ttgcccgtca cacgtgctcg tttgt.ggtcc gtaacgtagc caacattgtc cccccctttg gtaggatccg ctgtcgagta tgcagttttg catctcaagg gggcatagta aatgtggtgg gatcaagggt ctgatgactt
Phe Thr Thr Cys Ala Thr Pro Thr Ser Tyr Glu Glu Gln Leu Ile Lys Pro Ala Val Phe Phe Gln Pro Pro Tyr Ala Ser Lys Pro Thr Ala Lys Gln Cys Leu Leu Ala Leu Trp Gly
Thr Ser Arg Phe Ala Arg Pro Pro Pro Pro Ile Ile Asp Glu Ala Leu Ala Pro Gln Thr Leu Thr Gly Phe Leu Tyr Asp Ala Cys Ser Pro Gly Glu Phe Asp Lys Val Leu His Cys Gly Gly Ser Thr Asp Ser Lys Val Val Ser Cys Thr Tyr Pro Lys Gly Ala Leu Asp Phe
ccacctctct taattaccaa tccgtaacca acatgggaag gggaggattt cgctcgacac tcaagaccga gcccaaaatt atttccaacc ataagcttaa tggagcagat tcccggacga
ccgcaaaccg caactcgctg gcccgttttt tgaatcatat ggcacctgtg caaacccgca gaaatacttg tatggttttt tggtgaggcg atatgctgga agttgtaatt aggaccgaca
60 120 180 240 300 360 420 480 54 0 600 660 720 agcaccgact tcattgagga ctgggtcaga gttggtctcc ctgcaaagtc aaaggtgaaa 780 gcggagcatg gaagtgcatc aattgatgat caatgtgtat cctgcgagaa ggaggcggtg 840 aatgtgtctc ttgcaaacct gttgacttac ccgtttgtga gaaacggatt gataaacaaa 900 acattggcgc tcaagggtgc acactatgac tttgttaacg ggacctttga gttgtggggg 960 cttgatttct gcctttcgcc tcctacctcg gcataa 996
<210> 157 <211> 331 <212> PRT
<213> Flaveria línearís <4 00> 157
Met Tyr Ala Thr Ala Ala Ala Leu Ile Ala Pro Ser Phe Thr Thr Ser 10 15
Leu Arg Lys Pro Ser Ser Ser Ser Ser Thr Val Ser Ala Pro Phe Ala
25 30
Arg Leu Ile Thr Asn Asn Ser Leu Ala Ser Ser Ser Lcu Ser Ala Thr
40 45
Pro Pro Pro Ser Leu Ile Arg Asn Gln Pro Val Phe Ala Ala Pro Thr
50 55 60
Pro Ile Ile Thr Pro Thr Val Arg Gly Asp Met Gly Ser Glu Ser Tyr 65 70 75 80
Asp Glu Ala Ile Ala Ala Leu Lys Lys Leu Leu Ser Glu Arg Glu Asp
85 90 95
Leu Ala Pro Val Ala Ala Ala Lys Ile Asp Glu Ile Thr Ser Gln Leu
100 105 110
Gln Thr Leu Asp Thr Lys Pro Ala Phe Asp Ala Val Glu Arg Ile Lys
115 120 125
Thr Gly Phe Ala Lys Phe Lys Thr Glu Lys Tyr Leu Thr Asn Pro Ala
130 135 140
Leu Tyr Asp Glu Leu Ser Lys Gly Gln Ser Pro Lys Phe Met Val Phe 145 150 155 160
Ala Cys Ser Asp Ser Arg Val Cys Pro Ser His Val Leu Asp Phe Gln
165 170 175
Pro Gly Glu Ala Phe Val Val Arg Asn Val Ala Asn Ile Val Pro Pro
180 185 190
Phe Asp Lys Leu Lys Tyr Ala Gly Val Gly Ser Ala Val Glu Tyr Ala
195 200 205
Val Leu His Leu Lys Val Glu Gln Ile Val Val Ile Gly His Ser Lys
210 215 220
Cys Gly Gly Ile Lys Gly Leu Met Thr Phe Pro Asp Glu Gly Pro Thr 225 230 235 240
Ser Thr Asp Phe Ile Glu Asp Trp Val Arg Val Gly Leu Pro Ala Lys
245 250 255
Ser Lys Val Lys Ala Glu His Gly Ser Ala Ser Ile Asp Asp Gln Cys
260 265 270
Val Ser Cys Glu Lys Glu Ala Val Asn Val Ser Leu Ala Asn Leu Leu
275 280 285
Thr Tyr Pro Phe Val Arg Asn Gly Leu Ile Asn Lys Thr Leu Ala Leu
290 295 300
Lys Gly Ala His Tyr Asp Phe Val Asn Gly Thr Phe Glu Leu Trp Gly 305 310 315 320
Leu Asp Phe Cys Leu Ser Pro Pro Thr Ser Ala
325 330
<210> 158 <211> 828 <212> DNA
<213> Arabidopsís thalíana <4 00> 158
atgggaaccc taggcagagc attttactcg gtcggttttt ggatccgtga gctcttgatc gcctcggttg tcgccttcaa ggcaaaaatt acttccgaga aggcatcgga cactgatgaa tgtatttgat aaggctccga ttgtggacaa gtggcaccaa gcgcctcagt tattggggac gttcacattg gaagaggatc gtccatttgg tatggatgcg tattacgagg cgatgtgaac accgtaagtg ttgggtcai caggacaact cacttgtgca tgtggcaaaa tcaaacttaa gcgggaaggt gcacccaacc
gactggtcaa 60 acaactgtca 120 ggaagctttt 180 gtccatttgg 240 aactaatatt 300 gcacccaacc 360 ataattggag acaatgtaac cattggtcat agtgctgttt tacatggatg tactgttgag 420 gatgagacct ttattgggat gggtgcgaca cttcttgatg gggtcgttgt tgaaaagcat 480 gggatggttg ctgctggtgc acttgtacga caaaacacca gaattccttc tggagaggta 540 tggggaggaa acccagcaag gttcctcagg aagctcactg atgaggaaat tgcttttatc 600 tctcagtcag caacaaacta ctcaaacctc gcacaggctc acgctgcaga gaatgcaaag 660 ccattaaatg tgattgagtt cgagaaggtt ctacgcaaga agcatgctct aaaggacgag 720 gagtatgact caatgctcgg aatagtgaga gaaactccac cagagcttaa cctccctaac 780 aacatactgc ctgataaaga aaccaagcgt ccttctaatg tgaactga 828
<210> 159 <211> 275 <212> PRT
<213> Arabidopsis thaliana <400> 159
Met Gly Thr Leu Gly Arg Ala Phe Tyr Ser Val Gly Phe 10 15
Glu Thr Gly Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu
25 30
Asn Tyr Phe Arg Glu Gln Leu Ser Arg His Arg Thr Leu
40 45
Phe Asp Lys Ala Pro Ile Val Asp Lys Asp Ala Phe Val
50 55 60
Ala Ser Val Ile Gly Asp Val His Ile Gly Arg Gly Ser 65 70 75 80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Thr Val Ser
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala
100 105 110
Leu Ser Gly Lys Val His Pro Thr Ile Ile Gly Asp Asn
115 120 125
Gly His Ser Ala Val Leu His Gly Cys Thr Val Glu Asp
130 135 140
Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val 145 150 155 160
Gly Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr
165 170 175
Ser Gly Glu Val Trp Gly Gly Asn Pro Ala Arg Phe Leu
180 185 190
Thr Asp Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr
195 200 205
Asn Leu Ala Gln Ala His Ala Ala Glu Asn Ala Lys Pro
210 215 220
Ile Glu Phe Glu Lys Val Leu Arg Lys Lys His Ala Leu 225 230 235 240
Glu Tyr Asp Ser Met Leu Gly Ile Val Arg Glu Thr Pro
245 250 255
Asn Leu Pro Asn Asn Ile Leu Pro Asp Lys Glu Thr Lys
260 265 270
Asn Leu Asn
275 <210> 160 <211> 874 <212> DNA
<213> Gossypium hirsutum <4 00> 160
catttcgagc tttgtttcct aatcactcgc ccgctgcgca atcaccgatc aaagctgaag 60 atgggaagcc ttggaaaagc aatatacacc gtcggattct ggattcggga gaccggtcag 120 gctctcgatc gcctaggctg ccgcctacaa ggcaactatt ttttccagga gcaactttct 180 aggcatcgga ctctgatgaa cgtatttgat aaatctcctc tggtggacaa ggatgcattt 240 gtagccccta gcgcatctgt cattggcgat gttcaggtgg gaagaggatc atctatttgg 300 tatggatgtg ttttaagggg ggatgtcaac agcattagtg ttggatctgg aactaatata 360 caagacaact cccttgtgca tgttgcaaag tctaatctaa gtgggaaagt gctaccaact 420 aacattggaa acaatgttac tgtaggtcat agtgctgttt tacatggctg taccgttgag 480 gatgaagcat ttgttggcat gggagccaca cttcttgatg gtgtagttgt ggaaaaacat 540
Trp Ile Arg Gln Gly Lys Met Asn Val Ala Pro Ser Ser Ile Trp Val Gly Ser Lys Ser Asn Val Thr Ile Glu Thr Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Ser Leu Asn Val Lys Asp Glu Pro Glu Leu Arg Pro Ser gctatggttg ctgctggagc ccttgtaaga cagaatacaa tggggaggca atcctgctaa attcctgagg aagctaactg tcccagtcag ccaccaatta taccaacctt gcacaggtac ccctttgatg aaattgaatt tgagaaaatt cttcgcaaga gagtatgact caatgctggg tgttgtccgt gaaactccac aatgtcctac cagataaaga gcaaaagtcc tctc <210> 161 <211> 273 <212> PRT
<213> Gossypium hírsutum <4 00> 161
Met Gly Ser Leu Gly Lys Ala Ile Tyr Thr Val
10 15
Glu Thr Gly Gln Ala Leu Asp Arg Leu Gly Cys
25 30
Tyr Phe Phe Gln Glu Gln Leu Ser Arg His Arg
40 45
Phe Asp Lys Ser Pro Leu Val Asp Lys Asp Ala
50 55 60
Ala Ser Val Ile Gly Asp Val Gln Val Gly Arg 65 70 75 80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His
100 105 110
Leu Ser Gly Lys Val Leu Pro Thr Asn Ile Gly
115 120 125
Gly His Ser Ala Val Leu His Gly Cys Thr Val
130 135 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val 145 150 155 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln
165 170 175
Ala Gly Glu Val Trp Gly Gly Asn Pro Ala Lys
180 185 190
Thr Glu Glu Glu Ile Ala Phe Ile Ser Gln Ser
195 200 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala
210 215 220
Ile Glu Phe Glu Lys Val Leu Arg Lys Lys Phe 225 230 235 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu
245 250 255
Ile Leu Pro Asp Asn Val Leu Pro Asp Lys Glu 260 265 270
Lys
<210> 162 <211> 1217 <212> DNA
<213> Lycopersicon esculentum <4 00> 162
aggcatgtgg tattcactat tctgccctac caattactct actcaatcgt cccttttgct acacaaacac cttgactgca agggctaaac cgaaagaaga agaaggagga ggtcaaacat tttactccct gggatccatc gttcgagcga ccggcaaagc gcctacaagg cagctcccac atagaggaac acctgtccag tattcgataa agctccggtg gtggataagg atgtatttgt ttggagatgt ccatgtggga cgcaattcat ctatttggta atgttaacag catcagtgtc ggatctggta ccaatataca tggccaaatc aaatataagt caaaaggtgc tgcccaccat ttggtcatag tgctgttgta catggctgca ccattgagga gggccacact gcttgatggt gttcatgtag agaaacatigc
ggatccctgc tggagaggtg 600
aagaagagat agcgtttatt 660
atgctgctga gaatgcaaaa 720
agtttgcgaa gagggatgaa 780
cagaactaat tcttccagac 840 874
Gly Phe Arg Leu Thr Leu Phe Val Gly Ser Ile Ser Val Ala Asn Asn Glu Asp Val Val Asn Thr Phe Leu Ala Thr Lys Pro Ala Lys Thr Pro Gln Lys
Trp Ile Arg Gln Gly Asn Met Asn Val Ala Pro Ser Ser Ile Trp Val Gly Ser Lys Ser Asn Val Thr Val Glu Ala Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Thr Phe Asp Glu Arg Asp Glu Pro Glu Leu Ser Ser Gln
gtggaaagcc cagctctact gggaaccctc tcttgatcgc gcatcggact agctccaggt tggatgtgta ggacaactcc catagggaac tgaggccttc catggttgct
ttcatttctc gatcagaaag gggaaagcaa gtcggaaatc cttatgaacg gcctcagtca ctaagaggtg cttgttcatg aatgttactg attggtatgg gcaggagccc
60 120 180 240 300 360 420 480 540 600 660 ttgtgaaaca gaacacaagg attccctccg gagaggtatg ggcaggcaat cccgctaagt 720 ttctgaggaa gctaactgat gaagagatag ccttcattgc tcagtcagca accaactact 780 gtaaccttgc tcgtgtccat gcagctgaga actccaagtc ctttgacgaa attgaatttg 840 aaaagatgct tcgtaagaag tatgccaaac gtgatgagga atatgattct atgattggtg 900 ttgtccgtga aacacctccc gagcttgtac ttcctgataa tatcctcccc gaaaaagctg 960 ctaagagcat cgcccaatga gatcagtgcc caagcaactc tctctttttt tgctttccag 1020 agatttattt tacaccgtga gcatctgtat ggagaacagt catggatatt ggctgttacc 1080 cttccaaata atatcaaact tattggatag catcggtacg tcactgcttt gtagttaaga 1140 cttttgcccc ttatttccca gaaattcttc agcttggaaa aggaagttac gcccgaaaaa 1200 aaaaaaaaaa aaaaaaa 1217
<210> 163 <211> 273 <212> PRT
<213> Lycopersicon esculentum <4 00> 163
Met Gly Thr Leu Gly Lys Ala Ile Tyr Ser Leu Gly Ser 10 15
Ala Thr Gly Lys Ala Leu Asp Arg Val Gly Asn Arg Leu
25 30
Ser His Ile Glu Glu His Leu Ser Arg His Arg Thr Leu
40 45
Phe Asp Lys Ala Pro Val Val Asp Lys Asp Val Phe Val
50 55 60
Ala Ser Val Ile Gly Asp Val His Val Gly Arg Asn Ser 65 70 75 80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala
100 105 110
Ile Ser Gln Lys Val Leu Pro Thr Ile Ile Gly Asn Asn
115 120 125
Gly His Ser Ala Val Val His Gly Cys Thr Ile Glu Asp
130 135 140
Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val His Val 145 150 155 160
Ala Met Val Ala Ala Gly Ala Leu Val Lys Gln Asn Thr
165 170 175
Ser Gly Glu Val Trp Ala Gly Asn Pro Ala Lys Phe Leu
180 185 190
Thr Asp Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr
195 200 205
Asn Leu Ala Arg Val His Ala Ala Glu Asn Ser Lys Ser
210 215 220
Ile Glu Phe Glu Lys Met Leu Arg Lys Lys Tyr Ala Lys 225 230 235 240
Glu Tyr Asp Ser Met Ile Gly Val Val Arg Glu Thr Pro
245 250 255
Val Leu Pro Asp Asn Ile Leu Pro Glu Lys Ala Ala Lys 260 265 270
Gln
<210> 164 <211> 1962 <212> DNA <213> Zea mays <4 00> 164
atgtacacat tgcccgtccg tgccaccaca tccagcatcg tgccagcctg ccacccccgc 60 gccgtcctcc tcctccggct ccggccccca ggctcaggct catccggaac gccccgtctt 120 cgccgccccg ccaccgtcgt gggcatggac cccaccgtcg agcgcttgaa gagcgggttc 180 cagaagttca agaccgaggt ctatgacaag aagccggagc tgttcgagcc tctcaagtcc 240 ggccagagcc ccaggtacat ggtgttcgcc tgctccgact cccgcgtgtg cccgtcggtg 300 acactgggac tgcagcccgg cgaggcattc accgtccgca acatcgcttc catggtccca 360 ccctacgaca agatcaagta cgccggcaca gggtccgcca tcgagtacgc cgtgtgcgcg 420 ctcaaggtgc aggtcatcgt ggtcattggc cacagctgct gcggtggcat cagggcgctc 480
Ile Val Arg Gln Gly Ser Met Asn Val Ala Pro Gly Ser Ile Trp Val Gly Ser Lys Ser Asn Val Thr Val Glu Ala Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Cys Phe Asp Glu Arg Asp Glu Pro Glu Leu Ser Ile Ala ctctccctca aggacggcgc gcccgacaac ttcaccttcg ggcagccctg ccaagaacaa ggtgaagaaa gagcacgcgt tgctccatcc tggagaagga ggccgtgaac gtgtcgctcc ttcgtcaagg aagggctggc cggcgggacg ctcaagctgg gtcaaagggc agttcgtcac atgggagcct ccccaggacg ggcttccagc agttcaaggt caatgtctat gacaagaagc aagtccggcc aggcccccaa gtacatggtg ttcgcctgct tcggtgaccc tgggcctgca gcccgcgaag gccttcaccg gtcccaggct acgacaagac caagtacacc ggcatcgggt tgcgccctca aggtggaggt cctcgtggtc attggccata gcgctcctct ccctcaagga cggcgcgccc gacaacttcc aggatcggca gccctgccaa gaacaaggtg aagaaagagc gaccagtgct ccatcctgga gaaggaggcc gtgaacgtgt taccccttgg tcaaggaagg gctggccggc gggacgtcaa ttcgttaaag ggcagttcgt cacatgggag cctccccagg agcggcttcc agcagttcaa ggtcaatgtc tatgacaaga ctcaagtccg gccaggcccc caagtacatg gtgttcgcct ccgtcggtga ccctgggcct gcagcccggc gaggccttca atggtccccg gctacgacaa gaccaagtac accggcatcg gtgtgcgccc tcaaggtgga ggtcctcgtg gtcattggcc agggcgctcc tctcactcca ggacggcgca cctgacacct gttaagatcg ccttcattgc caagatgaag gtaaagaaag gatgaccagt ggtccattct cgagaaggag gccgtgaacg acctacccct tcgtcaagga agggcttgca aatgggaccc tacgactttg tctcaggaga gttcctcaca tggaaaaagt <210> 165 <211> 653 <212> PRT <213> Zea mays <4 00> 165
Met Tyr Thr Leu Pro Val Arg Ala Thr Thr Ser
10 15
Cys His Pro Arg Ala Val Leu Leu Leu Arg Leu
25 30
Gly Ser Ser Gly Thr Pro Arg Leu Arg Arg Pro
40 45
Met Asp Pro Thr Val Glu Arg Leu Lys Ser Gly
50 55 60
Thr Glu Val Tyr Asp Lys Lys Pro Glu Leu Phe 65 70 75 80
Gly Gln Ser Pro Arg Tyr Met Val Phe Ala Cys
85 90 95
Cys Pro Ser Val Thr Leu Gly Leu Gln Pro Gly
100 105 110
Arg Asn Ile Ala Ser Met Val Pro Pro Tyr Asp
115 120 125
Gly Thr Gly Ser Ala Ile Glu Tyr Ala Val Cys
130 135 140
Val Ile Val Val Ile Gly His Ser Cys Cys Gly 145 150 155 160
Leu Ser Leu Lys Asp Gly Ala Pro Asp Asn Phe
165 170 175
Trp Val Arg Ile Gly Ser Pro Ala Lys Asn Lys
180 185 190
Ala Ser Val Pro Phe Asp Asp Gln Cys Ser Ile
195 200 205
Val Asn Val Ser Leu Gln Asn Leu Lys Ser Tyr
210 215 22 0
Gly Leu Ala Gly Gly Thr Leu Lys Leu Val Gly 225 230 235 240
Val Lys Gly Gln Phe Val Thr Trp Glu Pro Pro
245 250 255
Arg Leu Thr Ser Gly Phe Gln Gln Phe Lys Val
tggaggactg ccgtgccgtt agaacctcaa ttggcgccca ccatcgagcg cggagctttt ccgactcccg ttcgcaacat ccgccatcga gctgctgcgg acttcgtgga acgcgtccgt cgctccagaa gtggttggcc acgccatcga agccggagct gctccgactc ccgttcgcaa ggtccgccat atagctgctg tccacttcgt agcacgcctc tgtccctgga tcaagctgat ga
ggtcaggatc cgatgaccag gagctacccc ctacagcttc cttgacgagc cgggcctctc tgtgtgcccg cgccgccatg gtacgctgtg tggcatcagg ggactgggtc gccgttcgat cctcaagagc ccactacgac gcgcttgacg tttcgggcct ccgtgtgtcc catcgccgcc cgagtacgct cggtggcatc cgaggactgg ggtgccgttc gaacctcaag cggcgcccac 1962
Ser Ile Val Arg Pro Pro Ala Thr Val Phe Gln Lys Glu Pro Leu Ser Asp Ser Glu Ala Phe Lys Ile Lys Ala Leu Lys Gly Ile Arg Thr Phe Val Val Lys Lys Leu Glu Lys Pro Phe Val Ala His Tyr Gln Asp Ala Asn Val Tyr
Pro Ala Gly Ser Val Gly Phe Lys Lys Ser Arg Val Thr Val Tyr Ala Val Gln Ala Leu Glu Asp Glu His Glu Ala Lys Glu Ser Phe Ile Glu Asp Lys
540 600 660 720 7 80 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 192 0 260
265
270
Lys Pro Glu Leu Phe Gly Pro Leu Lys Ser Gly
275
280
285
Met Val Phe Ala Cys Ser Asp Ser Arg Val Cys
290
295
300
Gly Leu Gln Pro Ala Lys Ala Phe Thr Val Arg
305
310
315 320
Val Pro Gly Tyr Asp Lys Thr Lys Tyr Thr Gly
325 330 335
Glu Tyr Ala Val Cys Ala Leu Lys Val Glu Val
340 345 350
His Ser Cys Cys Gly Gly Ile Arg Ala Leu Leu
355 360 365
Ala Pro Asp Asn Phe His Phe Val Glu Asp Trp
370 375 380
Pro Ala Lys Asn Lys Val Lys Lys Glu His Ala 385 390 395 400
Asp Gln Cys Ser Ile Leu Glu Lys Glu Ala Val
405 410 415
Asn Leu Lys Ser Tyr Pro Leu Val Lys Glu Gly
420 425 430
Ser Ser Gly Trp Pro His Tyr Asp Phe Val Lys
435 440 445
Trp Glu Pro Pro Gln Asp Ala Ile Glu Arg Leu
450 455 460
Gln Phe Lys Val Asn Val Tyr Asp Lys Lys Pro 465 470 475 480
Leu Lys Ser Gly Gln Ala Pro Lys Tyr Met Val
485 490 495
Ser Arg Val Ser Pro Ser Val Thr Leu Gly Leu
500 505 510
Phe Thr Val Arg Asn Ile Ala Ala Met Val Pro
515 520 525
Lys Tyr Thr Gly Ile Gly Ser Ala Ile Glu Tyr
530 535 540
Lys Val Glu Val Leu Val Val Ile Gly His Ser 545 550 555 560
Arg Ala Leu Leu Ser Leu Gln Asp Gly Ala Pro
565 570 575
Val Glu Asp Trp Val Lys Ile Ala Phe Ile Ala
580 585 590
Lys Glu His Ala Ser Val Pro Phe Asp Asp Gln
595 600 605
Lys Glu Ala Val Asn Val Ser Leu Glu Asn Leu
610 615 620
Val Lys Glu Gly Leu Ala Asn Gly Thr Leu Lys 625 630 635 640
Tyr Asp Phe Val Ser Gly Glu Phe Leu Thr Trp 645 650
166 1920 DNA
Zea mays 166
atgtacacat tgcccgtccg tgccaccaca tccagcatcg gcgccgtcct cctcctccgg ctccggccgc cccaggctca gtcttcgccg cccccgccac cgtctgtaaa cgggacggcg agagagatcg agagagaaag aaagggaggg catccaccag ggagagagag gccagagaag aggaggagaa gaagaagaag tccgaaaaaa aaggaggggc cagcgaagga gaagccgtcc actccttcag aaccagaagc cctccaacct ccacctcctc ggcatggacc ccaccgtcga gcgcttgaag agcgggttcc tatgacaaga agccggagct gttcgagcct ctcaagtccg
Gln Ala Pro Ser Asn Ile Ile Gly Leu Val Ser Leu Val Arg Ser Val Asn Val Leu Ala Gly Gln Thr Ser Glu Leu Phe Ala Gln Pro Gly Tyr Ala Val Cys Cys Asp Thr Lys Met Trp Ser Lys Thr Leu Ile Lys Lys
<2 10> <211> <212> <213> <4 00>
Pro Lys Tyr Val Thr Leu Ala Ala Met Ser Ala Ile Val Ile Gly Lys Asp Gly Ile Gly Ser Pro Phe Asp Ser Leu Gln Gly Gly Thr Phe Val Thr Gly Phe Gln Phe Gly Pro Cys Ser Asp Gly Glu Ala Asp Lys Thr Cys Ala Leu Gly Gly Ile Phe His Phe Lys Val Lys Ile Leu Glu Tyr Pro Phe Gly Ala His
tcgccagcct ggctcatccg ggcagctgag ccggcgggca atgagcagct acagataccc cctccaaggc agaagttcaa gccagagccc
cgccaccccc 60
gaacgccccc 120
gagtcaaacg 180
taagagggga 240
gcctctgcct 300
ccacctcgtc 360
ttcctccaag gaccgaggtc caggtacatg
420 480 540 gtgttcgcct gaggcattca gccggcacag gtcattggcc cccgacaact gtgaagaaag gccgtgaacg ggcgggacgc tgggagcctc. aatgtctatg tacatggtgt ccgggcgagg aagtacaccg ctcgtggtca ggcgcagcct atgaaggtaa aaggaggccg cttgcaaatg ctcacatgga atcatcataa aatgtgaatg atcgcccaat gaggcttttt
gctccgactc ccgtccgcaa ggtccgccat acagctgctg tcaccttcgt agcacgcgtc tgtcgctcca tcaagctggt cccaggacgc acaagaagcc tcgcctgctc ccttcaccgt gcatcgggtc ttggccatag acaccttcca agaaagagca tgaacgtgtc ggaccctcaa aaaagtgaaa tatatatact cgtcgagtac gtgaatgtaa atgtactata
ccgcgtgtgc catcgcttcc cgagtacgcc cggtggcatc ggaggactgg cgtgccgttc gaacctcaag tggcgcccac catcgagcgc ggagcttttc cgactcccgt tcgcaacatc cgccatcgag ctgctgcggt cttcgtcgag cgcctcggtg cctggagaac gctgatcggc aactagggct ataactatac tatctgtttt taagcaatat tcttatatga
ccgtcggtga atggtcccac gtgtgcgcgc agggcgctcc gtcaggatcg gatgaccagt agctacccct tcacacttcg ttgacgagcg gggcctctca gtgtgcccgt gccgccatgg tacgctgtgt ggcatcaggg gactgggtta ccgttcgatg ctcaagacct gcccactacg aaggcaattc tactagctac ctgcatctac cattttctac tgaataataa
cactgggact cctacgacaa tcaaggtgca tctccctcaa gcagccctgc gctccatcct tcgtcaagga tcaaagggca gcttccagca agtccggcca cggtgaccct tcccaggcta gcgccctcaa cgctcctctc agatcggctt accagtgctc accccttcgt actttgtctc taccggcccg ctaccgatag atatatatac cacttttcat tatgaccgcc
gcagcccggc gatcaagtac ggtcatcgtg ggacggcgcg caagaacaag ggagaaggag agggctggcc gttcgtcaca gttcaaggtc ggcccccaag gggcctgcag cgacaagacc ggtggaggtc actccaggac cattgccaag cattctcgag caaggaaggg aggagagttc ccgactctgc tcacccgagc cggatcaaca tcctaacgct ttgtgatcta
<210> <211> <212> <213> <4 00> Met Tyr 1
Leu Leu
Cys 50
Arg Glu 65
167 545 PRT Zea 167 Thr 5
Ala Thr 20 Arg Leu 35
Lys Arg
Arg
mays
Leu Pro
Pro Ala 25
Ile Arg 40
Asp Gly
55 Lys 70
Val 10 Pro
Asn
Gly
Arg Al
Ser
Gly Gly His 75
Ala 45
Gln Leu 60
Pro
Thr
15 Ser Ser 30 Pro
Thr Ser
Ser Gly
Val Phe Ala
Arg Ser Gln
Pro 80
Ala Gly
Gly Glu Arg Gly Gln Arg Arg Gly Gly Glu Glu
95
Lys Gly Gly Ala 110
Leu
Val
Gln
85
Pro Leu 100 His Arg 115 Pro
Pro
130 Thr Val 145
Tyr Asp Pro Arg
Pro
Glu
Lys 165 Tyr
Tyr
120 Pro Pro
135 Arg Leu 150 Lys
Met
90
Ser Glu
105 Pro His
jYs
Leu
Pro Ser
Val
125 Lys
Thr Pro Ser
Ala Ser Ser
Pro
Val
195 Ala Ser 210 Ser Ala 22 5 Val
180 Thr Leu
Gly
Met
Ile
Ile
Gly 245
Lys Asp Gly 260 y Ser
Val Ii Leu 200 Val Pro
215 Glu Tyr 230 His
Lys
Glu 170 Phe S 5
Gln
140 Ser Gly 155 Leu
Phe
Ala Cys
Phe
Glu 17 5 Ser
Gln 160 Pro
Lys
Leu
Pro
Pro Tyr
190 Gly Glu
205
Asp Lys
Asp Ser
Ala Phe
Ser
Ala Pro
Ala
Cys 250 Asp
220 Val Cys 235 Cys
Ala
Ile G
Pro
265 Ala Lys
Gly Gly 255
Asn Phe Thr 270 Lys Val
Ile
Leu 240 Ile
Lys Lys Arg
Asn
Phe Val
Lys Lys
Ser Ile Val Ser Gly Arg Ala Pro Ala Thr Arg Glu Gly His Lys Glu Glu Asp Ser Glu Gly Glu Pro Glu Lys Gly Met Phe Lys Thr Lys Ser Gly Arg Val Cys Thr Val Arg Tyr Ala Gly Val Gln Val Ala Leu Leu Glu Asp Trp Glu His Ala
Ala Ser Pro Arg Thr Val Ile Glu Arg Gly Glu Gln Glu Ala Ala Leu Asp Pro Glu Val Gln Ser Pro Ser Asn Ile Thr Gly Ile Val Ser Leu Val Arg Ser Val
600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 275 Pro Phe
290 Ser Leu 305 Gly
Gly
280
Asp Asp Gln Cys 295
Gln Asn Leu Lys 310
Leu Lys
Thr Leu Lys Leu 325 330
Gln Phe Val Thr Trp Glu
340 345
Ser Gly Phe Gln Gln Phe
285 Ser Ile
300 Ser Tyr 315
Val Gly
Leu Glu Lys
Pro
Phe 320 His
Val
Ser
Leu
355 Phe
Gly Pro
360 Leu
370 Ala Cys 385
Pro Gly
Ser
375 Asp Ser 390
Ala Phe
Lys Arg
Ala 335
Pro Pro Gln Asp Ala 350
Lys Val Asn Val Tyr 365
Ser Gly Gln Ala Pro 380
Val Cys Pro Ser Val 395 400
Val Arg Asn Ile Ala
Glu Ala Phe Thr Val Arg Asn 405 410 415
Tyr Asp Lys Thr Lys Tyr Thr Gly Ile Gly Ser 420 425 430
Cys Ala Leu Lys Val Glu Val Leu Val Val 440
Gly Ile Arg Ala 455 Phe Val
Val
435 Cys Gly
450 Thr Phe
His
Glu
Glu
445 Leu Leu
460 Asp Trp
Ser Leu Gln
Val
465 Met
Lys
Val 485
Ser Ile Leu
500 Thr Tyr Pro 515 Gly
470 Lys
Lys
Ile
530 Lys 545 <2 10> <211> <212> <213> <4 00> gggcagcccg ccagcgtccg ccgccgccaa agactagaga gagaagatga gagcgcttgc ctgttcgagc tcccgttgct aacatcgccg atcgagtacg tgcggtggca gtcgaggact atggctccct tacaacctcc gtcggcggcc cgatttacaa accccatccg atcgtcgtcc taaggccgag acatcaccaa tttttatt <210> 169 <211> 157
Glu 490
Glu Lys Glu
505 Phe Val Lys 520
Ala His Tyr Asp 535
475 His
Ala
Ser 495
Ala Val Asn 510
Glu Gly Leu
525 Phe Val Ser 540
Lys 480 Val
Ile
Pro
Val Ser
Ala Asn
Gly Glu
Glu Ala Lys Glu His Phe Ile Glu Asp Lys Lys Tyr Thr Leu Ala Met Ala Ile Ile Gly Asp Gly Gly Phe Phe Asp Leu Glu Gly Thr Phe Leu
Val Asn Val Gly Leu Ala Val Lys Gly Arg Leu Thr Lys Pro Glu Met Val Phe Gly Leu Gln Val Pro Gly Glu Tyr Ala His Ser Cys Ala Ala Tyr Ile Ala Lys Asp Gln Cys Asn Leu Lys Leu Lys Leu Thr Trp Lys
168
1208
DNA
Urochloa panicoídes 168
cactttaatg cacccccgcg cgccgtcgtg gaggggggcg gcgggtgcct agagcgggtt cactcaagga gcccgtcggt ccatggtccc ccgtctgcgc tcaaggcgct gggtcaggat tcgacgacca tgacctaccc actacgactt ctcctacacc acgtgaatgg ttctatgtga ctttttattt ta tatgtata
tcggcattgg ctctccgccc taaaccggcc agaagtacta ctgcctcccc caagcagttc aggccaggcc gaccctcggc accctacgac cctcaaggtc cctctcaatg cggcttcctc gtgctccatc ctgggtgaag cgtcaagggc atcatacata gtggagtgct atgtaataag taccatatga agccttcttc
ccatccgtgc gccgccgccc ggcgcacggg gtaggtcgaa ggctacaaaa aagagcgagg cccacgtaca ctgaagcccg aagaatcggt aaggtcctca caggacggcg gccaagaaga ttggagaagg gaaggtgtgt gcgttcgtca tatacatacg cactacctat caatagcatc tgcataattt ataataatat 1208
agccccgtcc caggctcgtc gagctcgaaa gccggctgtg agaagaccat tctacgacaa tggtgttcgc gcgaggcctt acaccggcat ccgtcatcgg cagccgacaa aggttctcac aggccgtcaa ccaacggctc catgggagaa tacatcgtct tttcggccgc ctctaccgct gaccgccttg ataatcatca
agcatcatcg 60 ggcaacgccg 120 gtcaaacgag 180 ataaaaagag 240 ggaccccgtc 300 gaagccggag 360 ctgctccgac 420 caccgtccgc 480 cgggtccgcc 540 ccacagccgc 600 cttccacttc 660 cgaccacccc 720 cgtctccctg 780 cctcaagctg 840 ataagccacc 900 cccgatatgc 960 tacatacggg 1020 ttaatttcta 1080 tggtcaaaag 1140 agtgtttacc 1200 Gly 5
Glu
<212> <2 13> <4 00> Met Ser 1
Pro Val 20
Tyr Asp Lys 35
Pro Thr
50 Val Thr
PRT
Urochloa pânico ides 169
Cys Leu Cys Leu
Tyr
Arg Leu 25
Lys Pro 40
Met Val
Cys 10 Gln
Glu
Phe
Ser
Leu
65 Ala
Ala
Ser Ala
55 Gly 70 Met Val 85 Ile
Leu 45
Ala Cys 60
Pro Gly
Pro Gly
15 Gly Phe 30 Phe
Tyr Lys
Lys
Gln
Lys Lys Phe Lys
Glu Pro Leu Lys Glu Ser Asp Ser Arg Cys
Val
100 Ile Gly
Glu
His
Leu Lys Pro Gly Glu 75 80
Pro Pro Tyr Asp Lys
90 95
Tyr Ala Val Cys Ala
105 110
Ser Arg Cys Gly Gly Ile
Ala Phe Thr Val Tyr Thr
Asn Arg Leu Lys Lys
Val Lys Ala Leu
Gln
115 Asp 130 Ile Gly 145 <210> <211> <212> <213> <4 00> ccgcactgga ccgcaccccc gttgaccatg ctatgacaag ggtgttcgcc cgaggccttc caccggcatc cgtcatcggc agccgacaac ggttctgacc ggcagtcaac caacgggtcc atgggagaaa cccgatatgt cgctacgtac ttaatttcta gtggtcaaaa tttacctttt <210> <211> <212> <213> <4 00> Met Ser
120 125
Gly Ala Ala Asp Asn Phe
135 140
Phe Leu Ala Lys Lys Lys 150 155
170
1034
DNA
Urochloa panicoídes
170
atgtcggcat tggccatccg gcgcaccgcc gccccgggct gaccccgtcg agcgcttgca aagccggagc tgttcgagcc tgctccgact ctcgttgctg accgtccgca acatcgccgc gggtccgcca tcgagtacgc cacagccgct gcggtggcat ttccacttcg tcgaggattg gaccacccca tggctccgtt gtctccctct acaacctcct ctcaagctgg tcggcggcca taagccaccc gatttacagc accccatccg acgtgaacgg cgggtcgtcg ttctatgtga aggccgagct ttttatttat gacatcagct atatatgtat tact
171 240 PRT
Urochloa panicoídes 171
Leu Ala
His Phe Val Glu Asp Val Leu Thr Asp His
Thr Met Asp Ser Glu Val Gly Gln Ala Cys Pro Ser Arg Asn Ile Gly Ile Gly Val Leu Thr Leu Ser Met Trp Val Arg
ctcagccccg cgtcaggaac gagcggcttc actcaaggaa cccgtcggtg catggtccca cgtctgcgcc caaggcgctc ggtcaggatc cgatgaccag gacctacccc ctacgacttc tcctacacca gtggagtact atgtaataag gtaccgtatg aagtcttctt 1
tccagcatca gccgccgcca aagcagttca ggccaggccc accctcggcc ccctacgaca ctcaaggtca ctctccatgc ggcttcctcg tgctccatct tgggtgaagg gtcaaggggg ccgtacatac tactactacc caatagcatt atgcataatt cataatataa 034
tcgccagcgt 60 ccaccgccga 120 agagcgaggt 180 ccacgtacat 240 tgaagcccgg 300 agaaccggta 360 aggtcctcac 420 aggatggcgc 480 cgaagaagaa 540 tggagaagga 600 aaggcgtgtc 660 cgttcgtcac 720 atacgtacat 780 tattttcggc 840 ctctaccgct 900 tgacctcctt 960 tcataaagtg 1020
1
Val Ala
Ala
5 Thr
Arg 20 Thr Thr 35 Phe
Pro
Gly 50
Phe Glu 65
Cys Ser
Ala 25
Ala Glu 40
Gln Phe
55 Leu Lys 70
Asp Ser Arg 8 5
Lys
Pro
Ile
10
His
Leu
Lys
Glu
75 Cys Cys 90
Arg Ser Ala 15
Arg Arg Pro 30
Thr Met 45
Ser Glu 60
Gly Gl.n
Pro 95
Pro Ser Ser Ile Ile Ala Ser Gly Leu Val Arg Asn Ala Ala Asp Pro Val Glu Arg Leu Gln Ser Val Tyr Asp Lys Lys Pro Glu Leu
Ala Pro Thr Tyr Met Val Phe Ala
80
Ser Val Thr Leu Gly Leu Lys Pro Gly Glu Ala Phe Thr Val Arg Asn Ile Ala Ala
100 105 110
Asp Lys Asn Arg Tyr Thr Gly Ile Gly Ser Ala
115 120 125
Cys Ala Leu Lys Val Lys Val Leu Thr Val Ile
130 135 140
Gly Gly Ile Lys Ala Leu Leu Ser Met Gln Asp 145 150 155 160
Phe His Phe Val Glu Asp Trp Val Arg Ile Gly
165 170 175
Lys Val Leu Thr Asp His Pro Met Ala Pro Phe
180 185 190
Ile Leu Glu Lys Glu Ala Val Asn Val Ser Leu
195 200 205
Tyr Pro Trp Val Lys Glu Gly Val Ser Asn Gly
210 215 220
Gly Gly His Tyr Asp Phe Val Lys Gly Ala Phe
Met Val Ile Glu Gly His Gly Ala Phe Leu Asp Asp Tyr Asn Ser Leu Val Thr
Pro Pro Tyr Tyr Ala Val Ser Arg Cys Ala Asp Asn Ala Lys Lys Gln Cys Ser Leu Leu Thr Lys Leu Val Trp Glu Lys
225 <210> <211> <212> <21 3> <4 00>
230
235
240
172 795 DNA
Chlamydomonas reínhardtii 172
atgggatgcg gtgccagcgt gcctcagaat ggtggaggag cccgcgccag cacaaccagt gtctgaggcg caatcggcaa agcaaccgca gcagccttga aaagatcaat tcgctcacgg gtgctgcaga acctgctgga cggcaacatg cgcttcctgg caccaggact tcagccgcgt gcaggccatt aaggccaagc ctgggctgcg ccgactctcg cgtgcctgcg gaaattgtgt gtgttcgtgt: gccgtgtcgc cggcaacatt gctacgccag tatgccgtgc ttgacctcgg agttaaggtg gtgatggtcc gccgtgaagg ctgcactttc aggcaaggcg ttccccggct cacctggacg tcgccatcag ccgcgtcaac agcatgagcg aaggacggcg acgtggacat gctggaccgc gtggtgaagg cagcggtgcc agcgctccgt catcatccag gaggggttgc gcgggcgccg tgtacgacct ggacacgggc aaggtgcacg agcagcgccg agtag <210> 173 <211> 264 <212> PRT
<213> Chlamydomonas reínhardtii <400> 173
Met Gly Cys Gly Ala Ser Val Pro Gln Asn Gly
10 15
Thr Arg Val Met Pro Ala Pro Ala Gln Pro Val
25 30
Ala Ile Ser Phe Gln Pro Ser Arg Ser Asn Arg
40 45
Ile Asn Ser Leu Thr Asp Arg Ala Ser Pro Glu
50 55 60
Leu Leu Asp Gly Asn Met Arg Phe Leu Asp Gly 65 70 75 80
His Gln Asp Phe Ser Arg Val Gln Ala Ile Lys
8 5 90 95
Leu Ala Ala Ile Leu Gly Cys Ala Asp Ser Arg
100 105 110
Val Phe Asp Gln Gly Phe Gly Asp Val Phe Val
115 120 125
Asn Ile Ala Thr Pro Glu Glu Ile Ala Ser Leu
130 135 140
Asp Leu Gly Val Lys Val Val Met Val Leu Gly 145 150 155 160
Ala Val Lys Ala Ala Leu Ser Gly Lys Ala Phe
ctcccgttac tcagcttcca atagggcatc atggcgccgt aaaagcccct tcgaccaagg aggagatcgc tcggacacac tcatcgacac ccaaggcgca agaacgtcaa agaaggggaa tcagcgtcac 7 95
gcgggttatg accatcgcgc gcctgagcag cgcgcatccc cgcggccatc ctttggcgac cagtctggag acgctgcgga gctggtggac ccaggccatc gtaccaggtg cctgctgctg caagggcggc
Gly Gly Ala Ser Glu Ala Ser Ser Leu Gln Val Leu Ala Val Ala Ala Lys Gln Val Pro Ala Cys Arg Val Glu Tyr Ala His Thr Arg Pro Gly Phe
Pro Val Gln Ser Glu Lys Gln Asn His Pro Lys Pro Glu Ile Ala Gly Val Leu Cys Gly Ile Asp
60 120 180 240 300 360 420 480 540 600 660 720 780 Thr
Ser
165 Leu Val 180 Ala Lys
Asp
Ala
17 0 His Leu
185 His Gln
Asp
175 Val Ala
190 Ile Lys
Ile Ser
195 Asp Arg 210 Arg Ser 225
Ala Gly Ala 24 5
Thr Lys Gly Gly 260 174 939 DNA
Chlamydomonas 174
tcaagtctag
Ala
200 205
Lys Glu Asn Val Lys 215 220
Ile Ile Gln Glu Gly Leu 230 235
Val Tyr Asp Leu Asp Thr 250 255
Ser Ser Ala Glu
Val Val
Val
Asp
Tyr
Gln 240 Gly
Gly Gln Lys Lys
Arg Val Asn Ser Met Asp Val Asp Met Leu Val Gln Arg Cys Gln Gly Asn Leu Leu Leu Val His Val Ser Val
<210> <211> <212> <213> <4 00> atgtcgctat gccaaggggc gccgcgctgg gtccagccta ggccaggtgg gtgcccaaca aagctggggg attgaggtgg agcatggacg gccacggtgc ctcgacggag aacaccacca ctggagccgg gccatccaca atcaaggacc gacagccaga <210> 175 <211> 312 <212> PRT <213> <4 00> Met Ser
reinhardtii
cctgcctgcg
ttgttgaggg cacgctttat atgagctggg ctctatggtt acctggcgtt tgcaccagtg tgcccgctcc acccgctgct agcacagcac cgcgttcgtg
cgggctcatc gcgccaacag gcacggcacg acgcctgcac
ggtgtggtat caacatccag gcccaccgtc cattgaggac
cgacggtcaa gagcggctcc tcccctcggg ccaggtgtgg
aggaggccag agttcgagca gcgccgctct cggcgttggt
cttcatcggc gagcaagacg ggccgacccg ggcccgcgcc
ggcttcctat ggactgggct cagggccctc caccgcaagc gctcgcacgc gctgccaacg ggcgccgtgc gacaacgcca atcggcaaca aactgcctgg atcgtggctg gccggctcgc aagtctgcca tttgaggagc tcaaactcag aagaggtag
tcccctatcg ccctgtttcg agggtagtgt cggatgtgcc tgaaaatcaa ccaatgtgct tgcgcggtga tcgtgcacgt atgtgaccat tgggcatggg ccggcgccgt ccgccaagtt gctgctacgc agtacacgga tgcaccagat
gcaccccaag cggcgtgggc caaggaccac cgttaacgcg ggaggtggtt cgggaacgtt cgtgaacggc gtccaagtac tggccacgcc cgccaccgtg ggtgccgccc cctgcgccac cgagctgtcc gagctgcatc gtgggagtac 939
Chlamydomonas reinhardtii 175
1
Arg Gly
Leu 5
His Pro 20 Ser Leu 35 Val
Met 50
Leu Ala 65
Gln
Phe Lys
Lys Ala 25
Phe Arg 40
Gly Pro
Ser 10 Lys
Gly
Gln
Ser
Gly
Ala
Leu Pro
15 Leu Val 30
Gly Ala Ala
Glu
Gly Gly Leu
Phe
Gly Lys
Gln
55 Ala 70 Val Val
Pro
Pro
tí'3
Glu Val 100
Asn Ala Asn
Val
Val
Val 75
Ala Pro 90
Val Pro Asn
105 Leu
Val 45
Gly Ser Val Lys Asp 60
His Arg Lys Pro Asp 80
Pro Ala Ala Ala 95
Lys His Ser Thr 110
Trp
115 Tyr
130 Ala Asn 145 Ser
Ile
Met
Gly 1
Gly
Ser
Asp 165 His 30
Gly Asn Val Lys Leu Gly 120 125
Val Leu Arg Gly Asp Val Asn 140
Gln Asp Asn Ala Ile Val
155 160
Ala Arg Pro Thr Val Ile 170 175
Ala Thr Val His Ala Cys Thr 185 190
Ala
135 Asn Ile 150
Gly Thr Ala
Phe Leu Thr Leu Asp Glu His Val Val Pro Arg Thr Ala Phe Ala Gly Gly Ile His Val Gly Asn Ile Glu
Phe Pro Tyr Tyr Gly Leu Leu Gly Ser Gln Pro Asn Val Asn Ala Leu Lys Ile Val Ala Ala Ser Ser Val Glu Val Gly Ser Lys Tyr Asn Val Thr Asp Asn Cys
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 Leu Val Gly Met Gly Ala Thr Val Leu Asp Gly
195 200 205
Gly Ser Ile Val Ala Ala Gly Ala Val Val Pro
210 215 220
Pro Ser Gly Gln Val Trp Ala Gly Ser Pro Ala
225
230
235
240
Leu Glu Pro Glu Glu Ala Ser Phe Ile Gly Lys
245
250
255
Ala Glu Leu Ser Ala Ile His Lys Phe Glu Gln
260
265
Glu Gln Tyr Thr Glu Ser Cys
275
280
270
Ile Ile Lys Asp 285
Asp Pro Ser Asn Ser Val His Gln Met Trp Glu
Ala Thr Val Lys Ser Pro Asn Thr Thr Ile Lys Phe Leu Arg His Ser Ala Ser Cys Tyr Ser Lys Thr Phe Glu Arg Ala Ala Leu Ala Tyr Asp Ser Gln Thr
290
295
300
Ala Leu Val Ala Arg Ala Lys Arg
305 310
<210> 176
<211> 1238
<212> DNA
<213> Oryza sativa
<4 00> 176
ggggctcatc tctctctctc tcactcttct ccctcttctc ccctacctcc cgcggcggcg gcggcggcgg cggccggcgg gagggcgcga gcggagaggg cgaggaggga aggagggagg cctcgggcgc gcgatctaca cggtggggaa gtggatccgc ccgcctcgga tccaccatcc agggcggcct ccgcgtcgag cacgatcatg aacatatttg agaaagagcc cagagtccac cagtgcagct gtgattggcg atgttgagat cggacatgga cattttaaga ggtgatgtca acagcattca tattggatct ttcccttgta catgttgcaa aagctaacat cagcgggaag aaacaatgtt acaataggtc atagtgctgt tctgcacgca ttttgttggt atgggtgcca ctctgcttga tggagtggtc tggtgcagga tcgcttgtta agcagaacac aaggattcct taatcctgcc aagttcctaa gaaagcttac tgaagaggag agcaacgaac tacatcaatc tggcccaagt ccatgctgcc cgagatcgag ctcgagaaga tgctgaggaa aaagtatgcc ttcgatgctc ggcgtggtcc gtgagatccc gccggagctc cccaaacaag gctcagaagg ctgttgctca ctgaatgttt aaagcttggt ttttttgtta cgtgttttga cctggaacaa atctcattgt ctgtttttca agcccaataa gaatttgggt accatataca gtacctctct ttgcattaca atgaagagca acatctttac tgaagtagaa acgcgtcctc tgtctgtg <210> 177 <211> 273 <212> PRT <213> Oryza sativa <4 00> 177
Met Gly Thr Leu Gly Arg Ala Ile Tyr Thr Val
10 15
Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser
25 30
Leu Arg Val Asp Glu Gln Leu Ser Arg His Arg
40 45
Phe Glu Lys Glu Pro Arg Val His Lys Asp Val
50 55 60
Ala Ala Val Ile Gly Asp Ile Glu Ile Gly His 65 7 0 7 5 8 0
Tyr Gly Ser Ile Leu Arg Gly Asp Val Asn Ser
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His
100 105 110
Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly 115 120 125
accaccagac cgagctccgg gaggcgacag ggcacggggc gagcagcttt aaggatgttt tcctcaatct ggatcaaata gttctcccaa tgcaccgtcg gttgaaaagc tctggagagg atagcgttca gagaattcca cacaaagacg atcctcccgg tgtcaagctc catttgacac cgagcattgt gttaatttgg
gccatcaaac 60 acagacagag 120 gcatggggac 180 aggccatgga 240 caaggcatcg 300 ttgttgctcc 360 ggtacggctc 420 tacaagacaa 480 ccataattgg 540 aggatgaagc 600 acagcatggt 660 tctgggtcgg 720 ttgctcagtc 780 agaccttcga 840 aggagtatga 900 acaacatcct 960 ccgcttggga 1020 atgtcttttg 1080 tttaggatcg 1140 gtcacttttt 1200 1238
Gly Lys Trp Ile Arg Thr Ile Gln Gly Gly Thr Ile Met Asn Ile Phe Val Ala Pro Ser Gly Ser Ser Ile Trp Ile His Ile Gly Val Val Ser Lys Ala Asn Asn Asn Val Thr Ile Gly His Ser Ala Val Leu His Ala Cys Ile Val
130 135 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val 145 150 155 160
Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln
165 170 175
Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys
180 185 190
Thr Glu Glu Glu Ile Ala Phe Ile Ala Gln Ser
195 200 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ser
210 215 220
Ile Glu Leu Glu Lys Met Leu Arg Lys Lys Tyr 225 230 235 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu
245 250 255
Ile Leu Pro Asp Asn Ile Leu Pro Asn Lys Ala
Glu Asp Val Val Asn Thr Phe Leu Ala Thr Lys Thr Ala His Ile Pro Gln Lys
Glu Ala Phe Glu Lys His Arg Ile Pro Arg Lys Leu Asn Tyr Ile Phe Asp Glu Lys Asp Glu Pro Glu Leu Ala Val Ala
260
265
270
His <210> <2 11> <212> <2 13> <4 00>
178 657 DNA
Oryza satíva 178
atgggttcga ctcgcctcct cgtactgctc gccgccgctt gtcccggcag ccagagcaca ggaagaaact gatcacgagg ggggacgaga aggggccgga gcactggggc aagctgaagc gccggcgaga tgcagtcgcc gatcgacctc tcccacgagc ctcggctacc tcgacgactc ctaccgcgcc gccgaggcct gacatcatgg tcaggttcga cggcgacgcc ggcagcgtcg tacctccgcc agctccactg gcactccccc accgagcaca gacatggagc tgcacatggt ccacgagagc gccgagaaga ctctacgagg tcggccgccc cgaccgcttc ctccaaaaga attgcggaca aggaggacag ggccgccttg cacgcagggg gagggttcgc accgtgtcga ggtatcagct cgaccttctc <210> 179 <211> 275 <212 > PRT <213> Oryza sativa <4 00> 179
Met Gly Ser Thr Arg Leu Leu Val Leu Leu Ala
10 15
Leu Ala Thr Ala Val Pro Ala Ala Arg Ala Gln
25 30
Glu Lys Glu Phe Thr Tyr Ile Ser Gly Asp Glu
40 45
Trp Gly Lys Leu Lys Pro Glu Trp Ala Gln Cys
50 55 60
Gln Ser Pro Ile Asp Leu Ser His Glu Arg Val 65 70 75 80
Leu Gly Tyr Leu Asp Asp Ser Tyr Arg Ala Ala
85 90 95
Asn Arg Gly His Asp Ile Met Val Arg Phe Asp
100 105 110
Val Val Ile Asn Gly Thr Ala Tyr Tyr Leu Arg
115 120 125
Ser Pro Thr Glu His Ser Val Asp Gly Arg Arg
130 135 140
His Met Val His Glu Ser Ala Glu Lys Lys Ala 145 150 155 160
Leu Tyr Glu Val Gly Arg Pro Asp Arg Phe Leu
165 170 175
Tyr Leu Lys Met Ile Ala Asp Lys Glu Asp Arg
ccctcctcct aggagttcac cggagtgggc gggtcaagct ccatcgtcaa tcatcaacgg gcgtcgacgg aggccgccgt tggagccata gtggtctgga agggaagctg
cgccaccgcc gtacatcagc gcagtgcggc ggtgcgcgac ccgcggccac caccgcctac ccgcaggtac gatcggcctc tctcaagatg cgattgtcaa tgcatga
Ala Ala Glu Glu Lys Gly Gly Ala Lys Leu Glu Ala Gly Asp Gln Leu Tyr Asp Ala Val Gln Lys Glu Glu
Ser Leu Leu Thr Asp His Pro Glu His Gly Glu Met Val Arg Asp Ser Ile Val Ala Gly Ser His Trp His Met Glu Leu Ile Gly Leu Met Glu Pro Lys Val Gly
60 120 180 240 300 360 420 480 540 600 657 180 185 190
Met Ile Asp Pro Arg Gly Ala Arg Gly Arg Ala
195 200 205
Tyr Met Gly Ser Leu Thr Thr Pro Pro Cys Thr
210 215 220
Thr Ile Val Lys Arg Val Arg Thr Val Ser Arg 225 230 235 240
Leu Arg Glu Ala Val His Asp Glu Met Glu Asn
245 250 255
Gln Ala Val Asn Asn Arg Asp Ile Ser Ile Phe
260 265 270
Lys Arg Tyr
275 <210> 180 <211> 822 <212> DNA
<213> Dioscorea cayenensis <4 00> 180
atgagttcat ccacccttct ccatctcctc ctcctctcct ccaaatgcaa aacctcagca agctgaggat gagtttagct ggtcctgaaa actggggaaa tcttaaaaag gagtgggaga cagtcaccca ttcaattgcg tgataacaga gtgatattcg agaagaaatt atagagccgc tgaagcaaca ttaaggaaca gaatttgagg gtaatgctgg ttcactatcc atcaatcgag attcattttc actccccttc agagcatgaa atgaatggcg cagctggtcc atgagagcca agaccaaaag agagcagtgg ggacgtgctg atacattcct ctcagatctt gaagacttta cagaagaatg aaataaatgc aggagttgtg gatccaaatc gcatatttta gatacatggg ctcattcaca gctccacctt accgtcatga ggaaggttgc aactgtttca ccaaggcaag gtgaatgaaa atgctataaa caatgcgaga ccacttcaac ttttactttg aacagctgaa atcgaagctt ggtgtcatat <210> 181 <211> 273 <212> PRT
<213> Dioscorea cayenensis <4 00> 181
Met Ser Ser Ser Thr Leu Leu His Leu Leu Leu Leu Ser 10 15
Phe Ser Cys Leu Pro Asn Ala Lys Pro Gln Gln Ala Glu
25 30
Ser Tyr Ile Glu Gly Ser Pro Asn Gly Pro Glu Asn Trp
40 45
Lys Lys Glu Trp Glu Thr Cys Gly Lys Gly Met Glu Gln
50 55 60
Gln Leu Arg Asp Asn Arg Val Ile Phe Asp Gln Thr Leu 65 70 75 80
Arg Arg Asn Tyr Arg Ala Ala Glu Ala Thr Leu Arg Asn
85 90 95
Asp Val Leu Val Glu Phe Glu Gly Asn Ala Gly Ser Leu
100 105 110
Arg Val Ala Tyr Gln Leu Lys Arg Ile His Phe His Ser
115 120 125
His Glu Met Asn Gly Glu Arg Phe Asp Leu Glu Ala Gln
130 135 140
Glu Ser Gln Asp Gln Lys Arg Ala Val Val Ser Ile Leu 145 150 155 160
Gly Arg Ala Asp Thr Phe Leu Ser Asp Leu Glu Asp Phe
165 170 175
Phe Ser Ser Ser Gln Lys Asn Glu Ile Asn Ala Gly Val
180 185 190
Asn Gln Leu Gln Phe Asp Asp Cys Ala Tyr Phe Arg Tyr 195 200 205
Ser Val Tyr Tyr Arg Gln Gly Val Val Trp Tyr Gln Leu Asp Leu Asn Ala Arg Pro Leu Arg Pro Tyr Pro His
ccctcctctt acattgaagg cttgtggcaa atcaaacttt gtggacatga ttgcatacca aaaggtttga tttctattct tcaagcagtt aattacagtt gcactgaagg tacttctgtt caaccaatta aa
ctcttgcctt aagtcctaat aggcatggag gggggagctg tgtattggtg actcaagcga ccttgaggca tttcagattt tagcagtagc tgatgactgt tatttcatgg gaagcaggca ccgctccgtt 822
Ser Leu Leu Asp Glu Phe Gly Asn Leu Ser Pro Ile Gly Glu Leu Ser Gly His Ser Ile Asn Pro Ser Glu Leu Val His Phe Arg Phe Ile Lys Gln Val Asp Pro Met Gly Ser
60 120 180 240 300 360 420 480 540 600 660 720 780 Phe Thr Ala Pro Pro Cys Thr Glu Gly Ile Ser Trp Thr Val Met Arg
210 215 220
Lys Val Ala Thr Val Ser Pro Arg Gln Val Leu Leu Leu Lys Gln Ala 225 230 235 240
Val Asn Glu Asn Ala Ile Asn Asn Ala Arg Pro Leu Gln Pro Thr Asn
245 250 255
Tyr Arg Ser Val Phe Tyr Phe Glu Gln Leu Lys Ser Lys Leu Gly Val 260 265 270
Ile
<210> 182 <211> 807 <212 > DNA
<213> Dioscorea batatas <4 00> 182
atgagttcat ccacccttct ccatctcctc ctcctctcct ccctcctctt ctcttgcctt 60 gcaaatgtag aggatgagtt tagctacatt gaaggaaatc ctaatggtcc tgaaaactgg 120 ggaaatctta aaccggagtg ggagacttgt ggcaaaggca tggagcagtc acccattcag 180 ttgcgtgata acagagtgat attcgatcaa actttgggga ggttgagaag aaattacaga 240 gccgttgatg caagattaag gaacagtgga catgatgtat tggtggaatt taagggtaat 300 gctggttcac tatcaatcaa tcgagttgca taccaactca agcgaattca ttttcactcc 360 ccttcagagc atgaaatgaa tggcgaaagg tttgaccttg aggcacagct ggttcatgag 420 agccaagatc aaaagagagc agtggtttct attcttttca tatttggacg tgctgaccca 480 ttcctctcag atcttgaaga ctttatcaag cagtttagca gtagccagaa gaatgaaata 540 aatgcaggag ttgtggatcc aaatcaatta cagattgatg actctgcata ttatagatac 600 atgggctcat tcacagctcc accttgcact gaaggtattt catggaccgt catgaggaag 660 gttgcaactg tttcaccaag acaagtactg ctgttgaagc aggcagtgaa tgaaaatgct 720 ataaacaatg caagaccact tcaaccaacc aatttccgct ccgtttttta ctttgaacag 780 ctgaaatcga aggtttgtgc catataa 807
<210> 183 <211> 268 <212> PRT
<213> Dioscorea batatas <4 00> 183
Met Ser Ser Ser Thr Leu Leu His Leu Leu Leu Leu Ser Ser Leu Leu 10 15
Phe Ser Cys Leu Ala Asn Val Glu Asp Glu Phe Ser Tyr Ile Glu Gly
25 30
Asn Pro Asn Gly Pro Glu Asn Trp Gly Asn Leu Lys Pro Glu Trp Glu
40 45
Thr Cys Gly Lys Gly Met Glu Gln Ser Pro Ile Gln Leu Arg Asp Asn
50 55 60
Arg Val Ile Phe Asp Gln Thr Leu Gly Arg Leu Arg Arg Asn Tyr Arg 65 70 75 80
Ala Val Asp Ala Arg Leu Arg Asn Ser Gly His Asp Val Leu Val Glu
85 90 95
Phe Lys Gly Asn Ala Gly Ser Leu Ser Ile Asn Arg Val Ala Tyr Gln
100 105 110
Leu Lys Arg Ile His Phe His Ser Pro Ser Glu His Glu Met Asn Gly
115 120 125
Glu Arg Phe Asp Leu Glu Ala Gln Leu Val His Glu Ser Gln Asp Gln
130 135 140
Lys Arg Ala Val Val Ser Ile Leu Phe Ile Phe Gly Arg Ala Asp Pro 145 150 155 160
Phe Leu Ser Asp Leu Glu Asp Phe Ile Lys Gln Phe Ser Ser Ser Gln
165 170 175
Lys Asn Glu Ile Asn Ala Gly Val Val Asp Pro Asn Gln Leu Gln Ile
180 185 190
Asp Asp Ser Ala Tyr Tyr Arg Tyr Met Gly Ser Phe Thr Ala Pro Pro
195 200 205
Cys Thr Glu Gly Ile Ser Trp Thr Val Met Arg Lys Val Ala Thr Val
210 215 220
Ser Pro Arg Gln Val Leu Leu Leu Lys Gln Ala Val Asn Glu Asn Ala 225 230 235 240
Ile Asn Asn Ala Arg Pro Leu Gln Pro Thr Asn
245 250 255
Tyr Phe Glu Gln Leu Lys Ser Lys Val Cys Ala
260 265
<210> 184 <211> 822 <212> DNA
<213> Dioscorea alata <4 00> 184
atgagttcat ccaccctttt ccatctcttc ctcctctcct tcaaatgcaa ggcttgatgg cgatgatgac tttagctaca cctgaaaact ggggaaatct tagaccggag tggaagactt tcacccatta atttgtgtga tgatagagtg atacggactc acaagttatc aggctgctcg tgcaacagtg aagaacaatg tttaaaagtg atgctggtac acaattcatc aatcaagtag cattttcact ccccatcaga acatgcactc agtggtgaaa atggtccatg agagccaaga tcaaaggaga gcagtaattg cgttctgacc cattcctccc agaccttgaa gactttatca accaatgaag tagatgcagg agttgtggat ccaaggcaat gcatattata gatacatggg ctcatacaca gctccacctt accgttatta agaagcttgg aactgtttca ccaaagcaag gtgaatgaaa attctatgaa caatgcaagg ccacttcaac tttttctatc cgcgtcagaa atctgatcat gttgccatat <210> 185 <211> 273 <212> PRT
<213> Dioscorea alata <400> 185
Phe Arg Ser Val Phe Ile
ttgaaggaag gtggctatgg caactttggg gacatgatat agtaccaact ggtatgacct ctattatgtt gccagataag tattacagtt gcactgaaga tactgatgtt cactgaaatt aa
ctcttgcttt tcctaatggt catggagcag gaagctgaga aatggtgtac caaacgaatt tgaggttcag cagatttgga cagacgtgag tgatgaccct tattacatgg gaagcaagca tcgcaccgtt 822
Met Ser Ser Ser Thr Leu Phe His Leu Phe Leu
1
15
10
Phe Ser Cys Phe Ser Asn Ala Arg Leu Asp Gly
25 30
Tyr Ile Glu Gly Ser Pro Asn Gly Pro Glu Asn
40 45
Pro Glu Trp Lys Thr Cys Gly Tyr Gly Met Glu
50 55 60
Leu Cys Asp Asp Arg Val Ile Arg Thr Pro Thr
65 70 75 80
Thr Ser Tyr Gln Ala Ala Arg Ala Thr Val Lys
85 90 95
Ile Met Val Tyr Phe Lys Ser Asp Ala Gly Thr
100 105 110
Val Glu Tyr Gln Leu Lys Arg Ile His Phe His
115 120 125
Ala Leu Ser Gly Glu Arg Tyr Asp Leu Glu Val
130 135 140
Ser Gln Asp Gln Arg Arg Ala Val Ile Ala Ile
145 150 155 160
Arg Ser Asp Pro Phe Leu Pro Asp Leu Glu Asp
165 170 175
Ser Arg Arg Glu Thr Asn Glu Val Asp Ala Gly
180 185 190
Gln Leu Leu Gln Phe Asp Asp Pro Ala Tyr Tyr
195 200 205
Tyr Thr Ala Pro Pro Cys Thr Glu Asp Ile Thr
210 215 220
Lys Leu Gly Thr Val Ser Pro Lys Gln Val Leu
225 230 235 240
Val Asn Glu Asn Ser Met Asn Asn Ala Arg Pro
245 250 255
Phe Arg Thr Val Phe Phe Tyr Pro Arg Gln Lys
260 265 270
Leu Ser Asp Asp Trp Gly Gln Ser Leu Gly Asn Asn Gln Phe Ser Pro Gln Met Met Phe Phe Ile Val Val Arg Tyr Trp Thr Met Leu Leu Gln Ser Asp
Ser Leu Leu Asp Phe Ser Asn Leu Arg Pro Ile Asn Lys Leu Arg Gly His Asp Ile Asn Gln Ser Glu His Val His Glu Arg Phe Gly Ser Gln Ile Asp Pro Arg Met Gly Ser Val Ile Lys Lys Gln Ala Pro Leu Lys His Val Ala
60 120 180 240 300 360 420 480 540 600 660 720 780 Ile <210> <211> <212> <213> <4 00>
186 831 DNA
Oryza sativa 186
atgagtactt cagctcgccg cctcctcctc ctcgccggcg ctgctctcgg ccactgcccc ggtggccgga gccgaggacg ggctcaccca gggggccgca gaactggggc agcctgaagc agcggcaaga tgcagtcgcc gatcaacctc ggcctcctcg ctcggcaacc tcaactacac ctaccagaac gccaacgcct gacatcatgg tcaggtttga cggcgacgcc ggtagcctaa cagctccggc agatgcactg gcacacgccg tcggagcaca gacatggagc tgcacatggt gcacctcaac gcccagaacc ctctacacca tcggcacccg ggacgagttt ctgcaaaagc atatcaaagc aagaaggcaa agagagagtg atcattggtg aagggacagg ataccgtgta ctaccgctac atgggctcct gagggagtca tctggaccgt tgtcaggaag gtgcgcaccg cttctcaagg cagctgtgct cacgggtaac gagaacaacg aacaacaggg agattgacct gttccttcct ctccctctca <210> 187 <211> 276 <212> PRT <213> Oryza sativa <400> 187
Met Ser Thr Ser Ala Arg Arg Leu Leu Leu Leu
10 15
Ala Ile Ala Leu Leu Leu Ser Ala Thr Ala Pro
25 30
Asp Asp Gly Tyr Ser Tyr Ile Pro Gly Ser Pro
40 45
Trp Gly Ser Leu Lys Pro Glu Trp Ala Thr Cys
50 55 60
Gln Ser Pro Ile Asn Leu Gly Leu Leu Asp Leu 65 70 75 80
Leu Gly Asn Leu Asn Tyr Thr Tyr Gln Asn Ala
85 90 95
Asn Arg Gly His Asp Ile Met Val Arg Phe Asp
100 105 110
Leu Lys Ile Asn Gly Thr Ala Tyr Gln Leu Arg
115 120 125
Thr Pro Ser Glu His Thr Ile Asp Gly Arg Arg
130 135 140
His Met Val His Leu Asn Ala Gln Asn Gln Ala 145 150 155 160
Leu Tyr Thr Ile Gly Thr Arg Asp Glu Phe Leu
165 170 175
Tyr Ile Ile Glu Ile Ser Lys Gln Glu Gly Lys
180 185 190
Gly Gly Ala Asp Pro Asn Val Ala Lys Gly Gln
195 200 205
Arg Tyr Met Gly Ser Phe Thr Thr Pro Pro Cys
210 215 220
Trp Thr Val Val Arg Lys Val Arg Thr Val Ser 225 230 235 240
Leu Leu Lys Ala Ala Val Leu Thr Gly Asn Glu
245 250 255
Leu Gln Gly Val Asn Asn Arg Glu Ile Asp Leu
2 60 2 65 27 0
Leu Ile Asn Asn
275 <210> 188 < 211> 84 6
ccgctgccgc acggctacag cggaatgggc acctcacctt ccgtcgtcaa agataaatgg ccatcgatgg aggccgccgt tagagcctta gggcggatcc ttaccacacc tgtcactgtc cgagacccct tcaacaactg
catcgcactc ctacatc.cct cacctgcagc ggctcccggc ccgtggccac cacggcgtac ccggaggtac cattggcatc tataattgag aaatgtagcc accttgcact ccaaatcaca tcagggcgtg a 831
Ala Gly Val Ala Arg Gly Ser Ser Thr Leu Asn Ala Gly Asp Gln Met Tyr Asp Ala Val Gln Lys Glu Arg Asp Thr Thr Glu Leu Ser Asn Asn Phe Leu
Ala Ala Ala Gly Ala Glu Pro Gln Asn Gly Lys Met Ala Pro Gly Ser Val Val Ala Gly Ser His Trp His Met Glu Leu Ile Gly Ile Leu Glu Pro Val Ile Ile Val Tyr Tyr Gly Val Ile Gln Ile Thr Ala Arg Pro Pro Leu Pro
60 120 180 240 300 360 420 480 540 600 660 720 780 <212> DNA <213> Oryza sativa <4 00> 188 atggtgtctc tccgcgcggc
ttctctcatg gggccgtcga cagtcgccga gaccgcaact aagttccacg atccactggc cacctcgtcc ctcggcgccc gacgagtgcg tcgctgcaga tgcggcgaga ctgcacctgc ggcagggccg aagtga <210> <21i> <212> <213> <4 00> Met Val 1
Val Ala
cggaagggaa actgggggaa tcgacatcaa acaacgccgt gcgaggtcgg acgcgccgtc acaagtccga cggactcctt acttcagcaa agcgcacggg acgtggtgtg tcatgtcgcc tcttctacta
catcgtcctc cgaggggccg gctgagcccg caccaagacc gaacgccacc ccaggtgatc ggagcacacc cgccgacggc ctacctccag ggaggaggcc gagctacttc gagcgtgctc attgccgacc caacccgccg
gtcgtcgccg gacttcacct gagtacagga gtcgtcccgc atcgtcaaca atcgccggga atcaacggca ggcctcgccg ttcaaggacc cacgtcgccg cggtacggcg gggaaggtga aaggacgcca ggcagcgccg 846
cctcgtcggt acatcgaagg tgtgcggcga gctcggacct acggcaagga agccgtacag ggcgcttccc tcatctccgt acctcgccga ccgggctggt gctcgctgac gggagatcag ggccggcgca tctccttcca
cgccgtcgcc cgccatggac ggggaggtcg cgacacgctg catcaccatg gttccaggcg gctcgagctc cctctacaag gctcggcgcc gcagatgagg gacgccgccg ccaggagcag gccgctcaat ggaattcgcc
Ile Val Leu Val 15
Ala Glu Gly Asn 30
189 281 PRT
Oryza sativa 189
Ser Leu Arg Ala Ala
10
Val Ala Phe Ser His 25
Thr Tyr Ile Glu Gly Ala Met Asp Gly Pro Ser
40 45
Ser Pro Glu Tyr Arg Met Cys Gly Glu Gly Arg
50 55 60
Asp Ile Asn Thr Lys Thr Val Val Pro Arg Ser 65 70 75 80
Asp Arg Asn Tyr Asn Ala Val Asn Ala Thr Ile
85 90 95
Asp Ile Thr Met Lys Phe His Gly Glu Val Gly
100 105 110
Gly Lys Pro Tyr Arg Phe Gln Ala Ile His Trp
115 120 125
His Thr Ile Asn Gly Arg Arg Phe Pro Leu Glu
130 135 140
Lys Ser Asp Ala Asp Gly Gly Leu Ala Val Ile 145 150 155 160
Leu Gly Ala Pro Asp Ser Phe Tyr Leu Gln Phe
165 170 175
Glu Leu Gly Ala Asp Glu Cys Asp Phe Ser Lys
180 185 190
Ala Ala Gly Leu Val Gln Met Arg Ser Leu Gln
195 200 205
Tyr Phe Arg Tyr Gly Gly Ser Leu Thr Thr Pro
210 215 220
Val Val Trp Ser Val Leu Gly Lys Val Arg Glu 225 230 235 240
Leu His Leu Leu Met Ser Pro Leu Pro Thr Lys
245 250 255
Gln Pro Leu Asn Gly Arg Ala Val Phe Tyr Tyr
260 265 270
Ala Val Ser Phe Gln Glu Phe Ala Lys
275 280
< 210 > 190 <211> 804 <212> DNA
<213> Arabidopsis thalíana
Val Ala Glu Gly Asn Trp Ser Gln Asp Leu Val Asn Gln Val His Ala Leu His Ser Val Lys Asp Glu Glu Lys Arg Pro Cys Ile Ser Asp Ala Asn Pro
Ala Ser Ser Pro Asp Phe Gly Lys Leu Ser Pro Ile Asp Thr Leu Asn Gly Lys Ile Ile Ala Pro Ser Glu Leu Val His Leu Tyr Lys His Leu Ala Ala His Val Thr Gly Ser Gly Glu Asn Gln Glu Gln Arg Pro Ala Pro Gly Ser
60 120 180 240 300 360 420 480 540 600 660 720 780 840 <400> 190
atggatacca acgcaaaaac aattttcttc atggctatgt
cctaatattt cacacgctca ttctgaagtc gacgacgaaa
aaaacggaaa agggaccaga gggatggggc aaaataaatc
accggaagat atcaatcccc gatcgatctt actaacgaaa
caagcatgga caagacaata taaaccagct ccggctgtaa
attatggtat catggaaagg agatgctggg aagatgacaa
ttggtgcaat gccattggca ttcaccttct gagcataccg
ctagagcttc acatggttca cacgagtgca cgaggcagaa
tacaaattag gcgaacctaa tgaattcctc accaagctac
ggaaataaag agataaatct agggatgatt gatccacgag
aaattctata gatacattgg ctctctcact gttcctcctt
actgtcgtca aaagggtgaa cacaatatca atggagcaaa
gttgacgatg gatttgagac aaattcaaga ccggttcaag
tggttctatg atccaaatgt ttga <210> 191 <211> 267 <212> PRT
<213> Arabídopsís thalíana <4 00> 191
Met Asp Thr Asn Ala Lys Thr Ile Phe Phe Met
gtttcatcta ctccatttac cgcactggaa gagtcagtct ttacaaacag tacggaaaac ttaacggaac ctgcggttat taaatggaat agattaggtt gcactgaagg ttacagctct actcaaaggg 804
tctatctttc ttacgaacaa agtttgtaac tattcatgat aggccatgac ggattttaat taggtacgac cggagttctt aaaagcagtg tcaaacaaga cgtcatttgg taggcaagcc aagatcagtt
1
5
10
15
Tyr Leu Ser Phe Pro Asn Ile Ser His Ala His
20
25
30
Glu Thr Pro Phe Thr Tyr Glu Gln Lys Thr Glu
40
Trp Gly Lys
50 55
45
Ile Asn Pro His Trp Lys Val Cys 60
Gln Ser Pro Ile Asp Leu Thr Asn Glu Arg Val
65 70 75 80
Gln Ala Trp Thr Arg Gln Tyr Lys Pro Ala Pro
85 90 95
Arg Gly His Asp Ile Met Val Ser Trp Lys Gly
100 105 110
Thr Ile Arg Lys Thr Asp Phe Asn Leu Val Gln
115
120
125
Pro Ser Glu His Thr Val Asn Gly Thr Arg Tyr
130 135 140
Met Val His Thr Ser Ala Arg Gly Arg Thr Ala 145 150 155 160
Tyr Lys Leu Gly Glu Pro Asn Glu Phe Leu Thr
165 170 175
Ile Lys Ala Val Gly Asn Lys Glu Ile Asn Leu
180 185 190
Arg Glu Ile Arg Phe Gln Thr Arg Lys Phe Tyr
195 200 205
Leu Thr Val Pro Pro Cys Thr Glu Gly Val Ile
210 215 220
Arg Val Asn Thr Ile Ser Met Glu Gln Ile Thr 225 230 235 240
Val Asp Asp Gly Phe Glu Thr Asn Ser Arg Pro
245 250 255
Gly Arg Ser Val Trp Phe Tyr Asp Pro Asn Val
260 265
<210> 192 <211> 792 <212> DNA
<213> Arabidopsis thalíana <4 00> 192
atgaaacaca ttttttttaa ctcgtgtata accaaaaaaa tttaactacg agaagaaagg agagaagggg ccagagaact tgggcaatgt gtggaaaagg caacatgcag tctccgattg ttgattgatc ataatcttgg ataccttcgt agccagtatt
Ala Met Cys Ser Glu Val Lys Gly Pro Asn Thr Gly Ser Leu Ile Ala Val Ile Asp Ala Gly Cys His Trp Asp Leu Glu Val Ile Gly Lys Leu Leu Gly Met Ile Arg Tyr Ile Trp Thr Val Ala Leu Arg Val Gln Asp
Phe Ile Asp Asp Glu Gly Arg Tyr His Asp Thr Asn Lys Met His Ser Leu His Val Leu Asn Gly Asp Pro Gly Ser Val Lys Gln Ala Ser Lys
atatagagga cgaaacgcag
ggggaagact aaagccagag
atcttacgga caaaagagtc
taccttcaaa tgccaccatt
60 120 180 240 300 360 420 480 540 600 660 720 780
60 120 180 240 aagaacagag gccatgatat catgatgaaa tttgaaggag gaaatgcagg tttaggtatc 300 actattaatg gtactgaata taaacttcaa cagattcatt ggcactctcc ttccgaacac 360 acactcaatg gcaaaaggtt tgttcttgag gaacacatgg ttcatcagag caaagatgga 420 cgcaacgctg ttgtcgcttt cttttacaaa ttgggaaaac ctgactattt tctcctcacg 480 ttggaaagat acttgaagag gataactgat acacacgaat cccaggaatt tgtcgagatg 540 gttcatccta gaacattcgg ttttgaatca aaacactatt atagatttat cggatcactt 600 acaactccac cgtgttctga aaatgtgatt tggacgattt ccaaagagat gaggactgtg 660 acattaaaac aattgatcat gcttcgagtg actgtacacg atcaatctaa ctcaaatgct 720 agaccgcttc agcgtaaaaa tgagcgtccg gtiggcacttt acataccaac atggcatagt 780 aaactatatt aa 792
<210> 193 <211> 263 <212> PRT
<213> Arabidopsis thaiiana <4 00> 193
Met Lys His Ile Phe Phe Asn Ser Cys Ile Thr Lys Lys Asn Ile Glu 10 15
Asp Glu Thr Gln Phe Asn Tyr Glu Lys Lys Gly Glu Lys Gly Pro Glu
25 30
Asn Trp Gly Arg Leu Lys Pro Glu Trp Ala Met Cys Gly Lys Gly Asn
40 45
Met Gln Ser Pro Ile Asp Leu Thr Asp Lys Arg Val Leu Ile Asp His
50 55 60
Asn Leu Gly Tyr Leu Arg Ser Gln Tyr Leu Pro Ser Asn Ala Thr Ile 65 7 0 7 5 8 0
Lys Asn Arg Gly His Asp Ile Met Met. Lys Phe Glu Gly Gly Asn Ala
85 90 95
Gly Leu Giy Iie Thr Ile Asn Gly Thr Giu Tyr Lys Leu Gin Gln Ile
100 105 110
His Trp His Ser Pro Ser Glu His Thr Leu Asn Gly Lys Arg Phe Val
115 120 125
Leu Glu Glu His Met Val His Gln Ser Lys Asp Gly Arg Asn Ala Val
130 135 140
Val Ala Phe Phe Tyr Lys Leu Gly Lys Pro Asp Tyr Phe Leu Leu Thr 145 150 155 160
Leu Glu Arg Tyr Leu Lys Arg Ile Thr Asp Thr His Glu Ser Gln Glu
165 170 175
Phe Val Glu Met Val His Pro Arg Thr Phe Giy Phe Glu Ser Lys His
180 185 190
Tyr Tyr Arg Phe Ile Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn
195 200 205
Val Ile Trp Thr Ile Ser Lys Glu Met Arg Thr Val Thr Leu Lys Gln
210 215 220
Leu Ile Met Leu Arg Val Thr Val His Asp Gln Ser Asn Ser Asn Ala 225 230 235 240
Arg Pro Leu Gln Arg Lys Asn Glu Arg Pro Val Ala Leu Tyr Ile Pro
245 250 255
Thr Trp His Ser Lys Leu Tyr 260 <210> 194 <211> 275 <212> PRT
<213> Adonis aestivalis <4 00> 194
Met Gly Thr Leu Gly Lys Ala Ile Tyr Thr Val Gly Phe Trp Ile Arg 10 15
Glu Thr Gly Gln Ala Iie Asp Arg Leu Gly Ser Arg Leu Gin Gly Asn
25 30
Tyr Tyr Phe His Glu Gln Leu Ser Arg His Arg Thr Leu Met Asn Ile
40 45
Phe Asp Lys Ala Pro Val Val Asp Lys Asp Ala Phe Ile Ala Pro Ser
50 55 60
Ala Ser Val Ile Gly Asp Val Gln Val Gly Arg Ser Ser Ser Ile Trp 65 70 75 80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Ser Val Gly Ser
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
100 105 110
Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asn Asn Val Thr Val
115 120 125
Gly His Ser Ala Val Leu His Gly Cys Thr Val Gln Asp Ser Ala Phe
130 135 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Asn His 145 150 155 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
165 170 175
Lys Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
180 185 190
Thr Glu Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr
195 200 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Thr Phe Glu Glu
210 215 220
Ile Glu Phe Glu Lys Leu Leu Arg Lys Lys Phe Ala Arg Lys Asp Glu 225 230 235 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Thr Pro Gln Glu Leu
245 250 255
Ile Leu Pro Asp Asn Ile Leu Ala Asp Lys Gln Ser Pro Lys Ala Val
260 265 270
Ser Ser Ser
275 <210> 195 <211> 276 <212> PRT <213> Glycine max <4 00> 195
Met Gly Thr Leu Gly Arg Ala Ile Tyr Ser Val Gly Asn Trp Ile Arg 10 15
Gly Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Leu Leu Gln Gly Gly
25 30
Tyr Tyr Val Gln Glu Gln Leu Ser Arg His Arg Thr Leu Met Asp Ile
40 45
Phe Asp Lys Ala Pro Val Val Asp Glu Asp Val Phe Val Ala Pro Ser
50 55 60
Ala Ser Val Ile Gly Asp Val Gln Leu Gly Arg Gly Ser Ser Ile Trp 65 70 75 80
Tyr Gly Val Val Leu Arg Gly Asp Val Asn Ser Ile Arg Val Gly Asn
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn
100 105 110
Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asp Asn Val Thr Val
115 120 125
Gly His Ser Ala Val Ile His Gly Cys Thr Val Glu Asp Glu Ala Phe
130 135 140
Val Gly Met Gly Ala Ile Leu Leu Asp Gly Val Val Val Glu Lys Asn 145 150 155 160
Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro
165 170 175
Ser Gly Glu Val Trp Ala Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu
180 185 190
Thr Asp Glu Glu Ile Ala Phe Ile Ser Gln Ser Ala Thr Asn Tyr Thr
195 200 205
Asn Leu Ala Gln Val His Ala Ala Glu Asn Ser Lys Ser Phe Asp Glu
210 215 220
Ile Glu Phe Glu Lys Val Leu Arg Lys Lys Phe Ala Arg Lys Asp Glu 225 230 235 240
Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Glu Leu 245 250 255
Ile Leu Pro Asp Asn Val Leu Pro Asp Lys Ala Glu Lys Ala Leu Lys
260 265 270
Lys Ser Gly Ile 275
< 210 > 196
< 211> 276
< 212 > PRT
<213> Brassica napus <4 00> 196
Met Gly Thr Leu Gly Arg Val Ile Tyr Thr Val Gly Lys Trp Ile Arg 1 5 10 15
Gly Ser Gly Gln Ala Leu Asp Arg Val Gly Ser Ile Leu Gln Gly Ser
25 30
His Arg Leu Glu Glu His Leu Ser Arg His Arg Thr Leu Met Asn Val
40 45
Phe Asp Lys Ser Pro Leu Val Asp Lys Asp Val Phe Val Ala Pro Ser
50 55 60
Ala Ser Val Ile Gly Asp Val Gln Ile Gly Lys Gly Ser Ser Ile Trp 65 70 75 80
Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Asn Ile Ser Val Gly Ser
85 90 95
Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Thr Asn
100 105 110
Leu Gly Gly Lys Val Leu Pro Thr Thr Ile Gly Asp Asn Val Thr Val
115 120 125
Gly His Ser Ala Val Ile His Gly Cys Thr VaI Glu Asp Glu Ala Phe
130 135 140
Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His 145 150 155 160
Ala Met Val Ala Ala Gly Ser Leu Val Arg Glu Asn Thr Arg Ile Pro
165 170 175
Ser Gly Glu Val Trp Gly Gly Asn Pro Ala Lys Phe Met Arg Lys Leu
180 185 190
Thr Asp Glu Glu Ile Ala Tyr Ile Ser Lys Ser Ala Glu Asn Tyr Ile
195 200 205
Asn Leu Ala His Ile His Ala Ala Glu Asn Ser Lys Ser Phe Glu Glu
210 215 220
Ile Glu Val Glu Arg Ala Leu Arg Lys Lys Tyr Ala Arg Lys Asp Glu 225 230 235 . 240
Asp Tyr Asp Ser Met Leu Gly Ile Val Arg Glu Thr Pro Ala Glu Leu
245 250 255
Ile Leu Pro Asp Asn Val Leu Pro Glu Lys Thr Thr Thr Arg Val Pro
260 265 270
Thr Thr His Tyr
275 <210> 197 <211> 273 <212> PRT <213> Zea mays <4 00> 197
Met Gly Thr Leu Gly Arg Ala Ile Phe Thr Val Gly Lys Trp Ile Arg 10 15
Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly
25 30
Leu Arg Val Glu Glu Gln Val Ser Arg His Arg Thr Ile Met Asn Ile
40 45
Phe Glu Lys Glu Pro Arg Ile His Arg Asp Val Phe Val Ala Pro Ser
50 55 60
Ala Ala Val Ile Gly Asp Val Glu Ile Gly His Gly Ser Ser Ile Trp 65 7 0 7 5 8 0
Tyr Gly Ser Ile Leu Arg Gly Asp Val Asn Ser Ile His Ile Gly Ser 8 5 90 95 Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ser Lys Ala Asn 100 105 110 Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Ser Asn Val Thr Val 115 120 125 Gly His Ser Ala Val Leu His Ala Cys Thr Ile Glu Asp Glu Ala Phe 130 135 140 Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His 145 150 155 160 Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro 165 170 175 Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu lí 30 lí 35 190 Thr Glu Glu Glu Ile Ala Phe Ile Ala Gln Ser Ala Thr Asn Tyr Ile 195 200 205 Asn Leu Ala Gln Val His Ala Ala Glu Asn Ala Lys Ser Phe Asp Glu 210 215 220 Ile Glu Leu Glu Lys Met Leu Arg Lys Lys Tyr Ala His Lys Asp Glu 225 230 235 240 Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Gln Leu 245 250 255 Ile Leu Pro Asp Asn Ile Leu Pro His Asn Ala Gln Lys Ala Val Ala 260 265 270 Arg <210> 198 <211> 274 <212> PRT <213> Triticum aestivum <4 00> 198 Met Gly Thr Leu Gly Arg Ala Ile Tyr Thr Val Gly Lys Trp Ile Arg 1 5 10 15 Gly Thr Gly Gln Ala Met Asp Arg Leu Gly Ser Thr Ile Gln Gly Gly 25 30 Leu Arg Thr Glu Glu Gln Val Ser Arg His Arg Thr Val Met Ser Ile 40 45 Phe Asp Lys Glu Pro Arg Ile Asn Lys Asp Val Phe Val Ala Pro Ser 50 55 60 Ala Ser Val Ile Gly Asp Val Glu Ile Gly His Gly Ser Ser Ile Trp 65 70 75 80 Tyr Gly Ser Val Leu Arg Gly Asp Val Asn Ser Ile Arg Ile Gly Ser 85 90 95 Gly Ser Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Thr Asn 100 105 110 Ile Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Ser Asn Val Thr Val 115 120 125 Gly His Ser Ala Val Leu His Ala Cys Thr Ile Glu Asp Glu Ala Phe 130 135 140 Val Gly Met Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His 145 150 155 160 Ser Met Val Gly Ala Gly Ser Leu Val Lys Gln Asn Thr Arg Ile Pro 165 170 175 Ser Gly Glu Val Trp Val Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu lí 30 185 190 Thr Glu Glu Glu Ile Thr Phe Ile Ala Gln Ser Ala Ala Asn Tyr Ile 195 200 205 Asn Leu Ala His Val His Ala Thr Glu Asn Ser Lys Ser Phe Asp Glu 210 215 220 Ile Glu Leu Glu Lys Lys Leu Arg Lys Lys Phe Ala His Lys Asp Glu 225 230 235 240 Glu Tyr Asp Ser Met Leu Gly Val Val Arg Glu Ile Pro Pro Gln Leu 24 5 250 255 Ile Leu Pro Asp Asn Ile Leu Pro Asp Lys Ala Pro Lys Ala Ala Val 2 60 2 65 27 0 Ala His <210> 199
<211> 270
<212> PRT
<213> Glycíne max
< 4 0 0 > 199
Met Gly Thr Leu Gly Arg Val Phe Tyr Ala Val Gly Phe Trp Ile Arg 1 5 10 15 Glu Thr Gly Gln Ala Ile Asp Arg Leu Gly Ser Arg Leu Gln Gly Asn 25 30 Tyr Leu Phe Gln Glu Gln Leu Ser Arg His Arg Pro Leu Met Asn Leu 40 45 Phe Asp Lys Ala Pro Ser Val His Arg Asp Ala Phe Val Ala Pro Ser 50 55 60 Ala Ser Leu Leu Gly Asp Val His Val Gly Pro Ala Ser Ser Ile Trp 65 70 75 80 Tyr Gly Cys Val Leu Arg Gly Asp Val Asn Ser Ile Thr Ile Gly Ser 85 90 95 Gly Thr Asn Ile Gln Asp Asn Ser Leu Val His Val Ala Lys Ser Asn 100 105 110 Leu Ser Gly Lys Val Leu Pro Thr Ile Ile Gly Asp Asn Val Thr Val 115 120 125 Gly His Ser Ala Val Leu Gln Gly Cys Thr Val Glu Asp Glu Ala Phe 130 135 14 0 Ile Gly Met Gly Ala Thr Leu Leu Asp Gly Val Tyr Val Glu Lys His 145 150 155 160 Ala Met Val Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro 165 17 0 175 Tyr Gly Glu Val Trp Gly Gly Asn Pro Ala Arg Phe Leu Arg Lys Leu 18 0 185 190 Thr Glu Asp Glu Met Thr Phe Phe Ser Gln Ser Ala Leu Asn Tyr Ser 195 200 205 Asn Leu Ala Gln Ala His Ser Ala Glu Asn Ala Lys Gly Leu Asp Glu 210 215 220 Thr Glu Phe Val Lys Val Leu His Lys Lys Phe Ala Arg His Gly Asp 225 230 235 240 Glu Tyr His Ser Val Leu Gly Gly Val Gln Glu Thr Pro Thr Glu Leu 245 250 255 Lys Ser Ser Asp Asn Val Leu Leu Asp Lys Val Pro Lys Ala 260 265 270 <2 10> 200 <211> 307 <212> PRT <213> Hordeum vuIgare <400> 200 Met Ala Lys Ala Ser Tyr Ala Val Gly Phe Trp Ile Arg Glu Thr Gly 1 5 10 15 Gln Ala Leu Asp Arg Leu Gly Cys Arg Leu Gln Gly Asn Tyr Phe Phe 25 30 His Glu Gln Ile Ser Arg His Arg Thr Leu Met Asn Ile Phe Asp Lys 40 45 Ala Pro His Val His Lys Glu Ala Phe Val Ala Pro Ser Ala Ser Leu 50 55 60 Ile Gly Asp Val Glu Val Gly Lys Gly Ser Ser Ile Trp Tyr Gly Cys 65 70 75 80 Val Leu Arg Gly Asp Ala Asn Asn Val Gln Val Gly Ser Gly Thr Asn 85 90 95 Ile Gln Asp Asn Ser Val Val His Val Ala Lys Ser Asn Leu Ser Gly 100 105 110 Lys Val Phe Pro Thr Ile Ile Gly Asp Asn Val Thr Val Gly His Ser 115 120 125 Ala Val Leu Gln Gly Cys Thr Val Glu Asp Glu Ala Phe Val Gly Met 130 135 14 0 Gly Ala Thr Leu Leu Asp Gly Val Val Val Glu Lys His Gly Met Val 145 150 155 160
Ala Ala Gly Ala Leu Val Arg Gln Asn Thr Arg Ile Pro Cys Gly Glu
165 170 175
Val Trp Gly Gly Asn Pro Ala Lys Phe Leu Arg Lys Leu Thr Asp Glu
180 185 190
Glu Ile Ala Phe Ile Ala Glu Ser Ala Ala Asn Tyr Ser Asn Leu Ala
195 200 205
Lys Ala His Ala Val Glu Asn Ala Lys Pro Val Glu Lys Ile Asp Phe
210 215 220
Glu Lys Val Leu Arg Lys Lys Val Ala His Gln Asp Glu Glu His Gly 225 230 235 240
Ser Met Leu Gly Ala Thr Arg Lys Ser Leu Gln Ser Trp Arg Arg Pro
245 250 255
Val Leu Leu Leu Arg Pro Asn Lys Leu Cys Leu Ser Val Phe Leu Ser
260 265 270
Phe Phe Gly Ala Phe Thr Ile Phe Ser Leu Asn Ser Tyr Ile Leu Ser
275 280 285
Val His Leu Val Trp Gln Phe Lys Ile Ile Ser Ile Ile Leu Gly Arg
290 295 300
Ala Met Phe 305 <210> 201 <211> 279 <212> PRT <213> Zea mays <4 00> 201
Met Val Ser Ser Ser Arg Ala Val Val Val Val Val Gly Leu Leu Val 10 15
Ala Ala Ser Ser Leu Ala Val Ala Ala Ser Asp Gly Gly Gly Pro Thr
25 30
Tyr Gly Tyr Thr Ala Gly Ser Pro Asp Gly Pro Glu Asn Trp Gly Lys
40 45
Leu Ser Pro Ala Tyr Lys Leu Cys Gly Gln Gly Lys Gln Gln Ser Pro
50 55 60
Ile Asp Ile Val Thr Lys Gln Ala Val Pro Thr Ala Thr Leu Asp Thr 65 70 75 80
Leu Asn Arg Thr Tyr Gly Ala Thr Asn Ala Thr Leu Ile Asn Asp Gly
85 90 95
His Asp Ile Thr Met Ala Leu Glu Gly Lys Val Gly Thr Val Thr Val
100 105 110
Asn Gly Lys Ala Tyr Ser Phe Glu Lys Leu His Trp His Ser Pro Ser
115 120 125
Asp His Thr Ile Asn Gly Gln Arg Phe Pro Leu Glu Leu His Leu Val
130 135 140
His Arg Ser Ala Asp Gly Ala Leu Ala Val Ile Gly Ile Leu Tyr Gln 145 150 155 160
Leu Gly Ala Pro Asp Ser Phe Tyr Tyr Gln Leu Lys Arg Gln Leu Gly
165 170 175
Glu Met Ala Gln Asp Arg Cys Asp Phe Ala Glu Glu Glu Glu Ser Arg
180 185 190
Val Glu Ala Gly Leu Ile His Leu Arg Ser Leu Gln Lys Arg Thr Gly
195 200 205
Ser Tyr Phe Arg Tyr Thr Gly Ser Leu Thr Val Pro Pro Cys Thr Glu
210 215 220
Asn Val Val Trp Ser Val Leu Gly Lys Val Arg Gln Ile Ser Gln Asp 225 230 235 240
Gln Leu Gln Leu Leu Lys Ala Pro Leu Pro Gly Ser Asp Ala Arg Pro
245 250 255
Thr Gln Pro Leu Asn Gly Arg Thr Val Gln Phe Tyr Asn Pro Pro Asn
260 265 270
Ser Thr Ile Ser Phe Gln Ile
275 <210> 202 <2 11 > 274 <212> PRT
<213> Brassíca napus <4 00> 202
Met Lys Arg Pro Ser Ile Val Arg Val Ile Phe Leu Ile Val Ile Ser 1 5 10 15
Ile Thr Thr Ala Ser Gly Ser Pro Asp His Gly Glu Val Glu Asp Glu
25 30
Thr Glu Phe Asn Tyr Glu Lys Gly Gly Glu Lys Gly Pro Glu Lys Trp
40 45
Gly Thr Leu Lys Pro Glu Trp Lys Met Cys Gly Asn Gly Thr Met Gln
50 55 60
Ser Pro Ile Asp Leu Thr Asp Lys Arg Val Phe Ile Asp His Asn Leu 65 70 75 80
Gly Pro Leu Arg Ser His Tyr Leu Pro Ser Asn Ala Thr Ile Lys Asn
85 90 95
Arg Gly His Asp Iie Met Leu Glu Phe Glu Gly Giy Asn Aia Giy Met
100 105 110
Gly Ile Ile Ile Asn Gly Thr Val Tyr Gln Leu Gln Gln Leu His Trp
115 120 125
His Ser Pro Ser Glu His Thr Ile Asn Gly Lys Arg Phe Val Leu Glu
130 135 140
Gln His Met Leu His Gln Ser Lys Asp Gly Arg Leu Ala Val Val Ala 145 150 155 160
Phe Leu Tyr Ser Leu Gly Arg Pro Asp Ser Phe Leu Leu Ser Leu Glu
165 170 175
Arg Gln Leu Lys Arg Ile Thr Asp Ala His Gly Ser Glu Asp Phe Val
180 185 190
Ser Trp Ile Asp Pro Arg Ala Val Asn Phe Lys Thr Arg Leu Tyr Tyr
195 200 205
Arg Tyr Leu Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn Val Thr
210 215 2.20
Trp Ser Ile Ser Arg Glu Met Arg Thr Val Thr Leu Lys Gln Leu Asp 225 230 235 240
Leu Leu Arg Val Ser Val His Asp Gln Ser Asn Thr Asn Ala Arg Pro
245 250 255
Leu Gln Arg Gln Asn Gly Arg Pro Val Lys Phe Tyr Leu Pro Ala Trp
260 265 270
His Ile <210> 203 <211> 17 <212> PRT
<213> Seqüência artificial <220>
<223> motivo 1 <220>
<221> VARIANTE <222> (1)..(1) <223> / substituir = "Thr" <220>
<2 21> VARIANTE
<222> (3)..(3)
<223> / substituir == "Asn"
<220>
<221> INCERTO <222> (4)..(4)
<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220>
<221> VARIANTE <222> (5)..(5)
<223> / substituir = "lie" / substituir = "Vai" / substituir = <220>
<221> INCERTO (6) . . (9)
Xaa pode ser qualquer aminoácido ocorrendo naturalmente
VARIANTE (10) . . (10) / substituir
"Tyr" / substituir = "Leu" / substituir = "His'
INCERTO
(H) - - (12)
Xaa pode ser qualquer aminoácido ocorrendo naturalmente
<222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <2 2 3> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223>
substituir <220>
<221> VARIANTE <222> (17) . . (17) <223> / substituir substituir = "Phe" <4 00> 203
Ser Glu His Xaa Leu Xaa Xaa Xaa Xaa Phe Xaa Xaa Glu Xaa His Leu
VARIANTE
(13) . . (13)
/ substituir
INCERTO
(14) . . (14) Xaa pode ser
VARIANTE
(15)..(15)
/ substituir
VARIANTE
(16) . . (16)
/ substituir "Phe"
''Asp"
qualquer aminoácido ocorrendo naturalmente
"Gln1
= "Ile" / substituir = "Val' / substituir = "Ala"
/ substituir = "Met" /
= "lie" / substituir / substituir = "Ala"
"Vai" / substituir = "Met" /
1
Leu
10
15
<210> 204 <211> 7 <212> PRT <213> Seqüência artificial <220> <223> motivo 2 <220> <221> VARIANTE <222> (D · · (1) <223> / substituir = "Asn" / substituir = substituir = "Thr" / substituir = "Phe" / substituir = "Arg" <220> <221> VARIANTE <222> (2) . . (2) <223> / substituir = "Vai" / substituir = <220> <221> VARIANTE <222> (4) . . (4) <223> / substituir = "lie" / substituir = <22 0> <2 21 > VARIANTE <222> (5) . . (5) <223> / substituir = "Thr" / substituir = <220> <221> VARIANTE <222> (6)..(6) <223> / substituir substituir = "Thr" <220>
<221> VARIANTE <222> (7)..(7) <223> / substituir <4 00> 204 Leu Ala Val Val Ala 1 5
<210> 205 16 PRT
Seqüência
= "Vai" / substituir
"lie" / substituir = "Ser" /
= "Phe" / substituir = "Vai" / substituir = "Met"
Phe Leu
<211> <212> <213> <220> <223> <220> <221> <222> <223> <220> <221> <222> <223>
motivo 3 VARIANTE
(D · · (1)
/ substituir
VARIANTE (2) . . (2) / substituir "Ala"
"Phe"
= "Phe" / substituir = "Vai" / substituir = "Gly" /
substituir = <220>
<221> VARIANTE <222> (3)..(3) <22 3> / substituir substituir = "His" <220>
VARIANTE (4)..(4) / substituir
"Glu" / substituir = "Gly" / substituir = "Thr" /
<221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223> <220> <221> <222> <223>
substituir <220>
INCERTO (5) . . (5) Xaa pode ser
VARIANTE (8)..(8) / substituir
VARIANTE (10) . . (10) / substituir
VARIANTE (14) . . (14) / substituir
"Ala"
<22 1> <222> <223> <220> <221> <222> <2 2 3> <4 00>
VARIANTE (15) . . (15) / substituir
"Phe"
qualquer aminoácido ocorrendo naturalmente
= "Phe" / substituir = "Tyr"
"Vai" / substituir = "Ala"
= "Thr" / substituir = "Gly" / substituir = "Asp" /
"Gln"
VARIANTE (16) . . (16) / substituir 205
Tyr Tyr Arg Tyr Xaa 1 5
<210> 206
= "Gly" / substituir --= "Asp" / substituir = "Arg"
Gly Ser Leu Thr Thr Pro Pro Cys Ser Glu Asn 15 120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
60
120
180
240
300
360
420
480
540
600
6 60
720
780
840
106
<211> 1416
<212> DNA
<213> Oryza sativa
<4 00> 206
cccacgcgtc aactcaaaca ctctgtcccc gagcagaagg ggcgagcccc ggtggtgatc agacggggaa gcgaaggcgg ctcgacagcg ctggtgtgca cgggtacgag gctcgacgac caccggcaac ccgggggctc gagcttcgac ggagttccac gtgcatcgcg gccgttccag ggcgcaggtg ggactcggcg gaagctctgg tcgtttcaac tgtcaagtga aggcttacat <210> 207 <2 11>
<212>
<213>
<220>
<223>
<4 00> ggggacaagt <210>
<2 11>
<2 12>
<213>
<220>
<223>
<4 00> ggggaccact <210> 209 <211>
<212>
<213>
<4 00> atggcgatga ccatgtttcg cctaaaggac ttctccggcg cctt tgtttg ttagctgcca aaggttttga aaagctatgg ccaccggaga agcggagaga ggagctggac atgtatattg acaaagcttg ttaagtaacc
cgcccacgcg
ctcacaccaa
aagaagggta
ccaagaagcc
ggcgcgggca
accggcgcgt
gtggcacgtg
cggggatggc
tccgccagtt
acgccgcaca
atgagcgtcg
ctcaagaaat
accaacacct
gccggcgggc
ggcgccaagg
cggagattcc
acgacgggct
cggttcgtga
gtgggcgacc
tcgttcgaga
gacctcagcg
tgttaatttc
tgtacaatta
tatcgatttg
gacttttgaa
cttacactga
acggtctcca
tctcatgtga
gtacaatctc
acaacttcac
atatctccaa
ttgatcttga
tgtcagagct
ttccagagag
tctccggtaa
gctactacaa
agatcctcga
tgaaacatct
tccgggacac tggctctcca acttgagcgc gtcgctggtg cgtcgaaggc cgtcggggct gtgatggcgt ggcggggagc cgtggacaac tctaccggcc gggtgaacca ccgactaccc tcgccggcaa t ccgcgggca cgtacaagga acgaggagac tgttccgcga cgaaggggtt cgagcctgac accagctctc agaagctcgt ttcggggttt gtaatttttt tccacctaaa
gactcatctt
catggaagtt
cgactggatt
cgacgatgct
accagagatt
cggtgaatta
caatggtaac
agttcttgac
taagaagctt
ttatggagat
atctccggcg
cagctacacc
catggcgagc
acatactctg
cagaaacata
agttcaggcc
ggtggtgaag
gtgagggcgg
ggacgggaag
cgggctcgcg
tccgcgactt
tacaccgtca
ttccggcgct
gacggcgcgg
cctgggccac
gtcgcggcgg
cgtccctccc
gaacgggtcg
cagcaagatc
cgggatcacg
gcacatcccg
cgtgtcggag
caagtccggc
gcaggaggcc
cggcctcgtc
agggggtttc
tttacccgac
ttaagt
aaacaatgcg
tcactgaccc
ctgtttctgc
cttctcaatc
cactcatctt
cgtgttatct
gggatgttga
ccattggaga
cttactggaa
acttataaca
aaatacctct
attcaaagct
tttctttccc
ggtggtgttc
tgtacactca
tttcttcaca
gtacacttga
gcactcctgc
gagccggggt
tggcgacgcg
aagacgctgc
gcggcgaagg
tcctgaaggc
tgcacctgga
ccggcatgcc
caaccgacgt
ttcctcctcg
ctcatcatcc
aaggccgggc
gcgatgatcg
tgtaacatgc
ttcgcgtcgc
ctgttccggc
gcggagtccg
gtgtactgga
agcgacccgg
tgagtttatt
agctttcagt
aaatcatgca
ctcagccgtt
tagcacactc
atctgtatct
tcaaatcctc
ctccggatgc
ctctcaacgt
ctcatttggt
tgaagagtct
cattccctgg
acaatttcaa
ctttcggtgg
tagagtatct
gcctcaagaa
caccggagtt
ccggagagat
tcaacaactt
gctcactcca
cctctgctct
tccttagcgt
gcgggccggt
ggcagggggt
cgcttggcgg
ggcgacggcg
cctcgcctcc
gctcgacgcg
tcaacgccga
cccgcctcaL
tcggctccat
taggcgacct
acggcgcgga
tgacgatgca
tgtacccggg
tgctgttccc
ggaagcggct
gctggaacaa
agaaggccag
atttacccat
gagagaggcc
ataaaaccac
1416
c 51
50
atttttctca
catgattggt
tcactgttct
ctccttcact
gaatctaact
aacttctctc
agagatttta
cggtaagtta
aaatttcttc
tggtctcaac
cttaagagaa
cggtggttta
tccgacgagt
aaccggtcat
51
DNA
Seqüência
iniciador: 207
208
50
DNA
Seqüência
iniciador: 208
2253
DNA
Arabidops is 209
artificial
prm8571
aagcaggctt
artificial
prm8572
aagctgggtc
thaliana
ttgtacaaaa
ttgtacaaga 960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
107
ataccaccgg
ttaaccggag
ttcagaaaca
gtcttcgaag
gggaatctaa
ttatgcagag
attccagaag
ctcaacggca
actgataatt
atttacctct
aatctacaga
ttcgaattga
ccagattcaa
aacggagaaa
ggtaatcaat
ctcgatctct
ttcaacgaaa
ccaacacggc
atcgtaatca
cagatgaata
ctagatttca
ggcggagctg
cgactcgttg
ttggggagaa
<210> 21C
<211> 7 5C
<212> PRl
<213> Ara
<4 00> 210 Met Ala Met Arg Leu Leu Lys Thr His Leu Leu Phe Leu His Leu Tyr 1 5 10 15 Leu Phe Phe Ser Pro Cys Phe Ala Tyr Thr Asp Met Glu Val Leu Leu 20 25 30 Asn Leu Lys Ser Ser Met Ile Gly Pro Lys Gly His Gly Leu His Asp 35 40 45 Trp Ile His Ser Ser Ser Pro Asp Ala His Cys Ser Phe Ser Gly Val 50 55 60 Ser Cys Asp Asp Asp Ala Arg Val Ile Ser Leu Asn Val Ser Phe Thr 65 70 75 80 Pro Leu Phe Gly Thr Ile Ser Pro Glu Ile Gly Met Leu Thr His Leu 85 90 95 Val Asn Leu Thr Leu Ala Ala Asn Asn Phe Thr Gly Glu Leu Pro Leu 100 105 110 Glu Met Lys Ser Leu Thr Ser Leu Lys Val Leu Asn Ile Ser Asn Asn 115 120 125 Gly Asn Leu Thr Gly Thr Phe Pro Gly Glu Ile Leu Lys Ala Met Val 130 135 140 Asp Leu Glu Val Leu Asp Thr Tyr Asn Asn Asn Phe Asn Gly Lys Leu 145 150 155 160 Pro Pro Glu Met Ser Glu Leu Lys Lys Leu Lys Tyr Leu Ser Phe Gly 165 170 175 Gly Asn Phe Phe Ser Gly Glu Ile Pro Glu Ser Tyr Gly Asp Ile Gln 180 18 5 190 Ser Leu Glu Tyr Leu Gly Leu Asn Gly Ala Gly Leu Ser Gly Lys Ser 195 200 205 Pro Ala Phe Leu Ser Arg Leu Lys Asn Leu Arg Glu Met Tyr Ile Gly 210 215 9 ' 20 Tyr Tyr Asn Ser Tyr Thr Gly Gly Val Pro Pro Glu Phe Gly Gly Leu 225 230 235 240 Thr Lys Leu Glu Ile Leu Asp Met Ala Ser Cys Thr Leu Thr Gly Glu 245 250 255 Ile Pro Thr Ser Leu Ser Asn Leu Lys His Leu His Thr Leu Phe Leu 260 265 270
agctttccgg
aaatccctca
atctctacgg
tatgggagaa
taaagcttga
gtgagaaatt
agcttggtaa
ctgttccggc
tcttctccgg
ctaacaactg
ctctattctt
agcatttatc
tctctcgctg
tccctaaagg
taaccggttc
ctttcaacga
cttccttcgc
caggacaaac
cggttatcgc
agaagaagaa
aatctgaaga
gaattgtcta
gccgtgggac
tccgccaccg
tttagtcagc
aagcttcatc
acaaatacca
caatttcacg
tgtctctgat
agagatgtta
atgcaaatcc
ggggcttttc
tgaacttccg
gttttccggc
agatcggaac
gaggatcaac
ctcaacttta
gatcaacaac
aatccctacc
tctctccggt
cggaaacact
ctccgatcac
agcgatcacc
ccagaaatct
cgttctcgag
ccgtggatca
cgggaggagc
tcacatagtg
ttgaaatctc
aatctcggaa
gaggccatcg
ttacaattac
aatcatctca
attctctcta
ttaaccaaaa
aatctaccgt
gtaacgatgt
gagattccac
cgatttcgcg
acaagtgcga
atctccgtcg
gtgaaaaact
ggaatcggaa
agagtaccac
tacctctgtc
aatcacacgg
ggtttgatcc
ctcgcctgga
tgtcttaaag
atgccaaaca
gatcatggat
tga
tcgatttatc acattactct gagaattacc cggcgaatct ccggacttat acaacttctt tcagaatcgt tagttacgat ccggcgatgt ctgcgattgg gcaacattcc acaacatcac atctcagccg taggaactct acatgacgag tcggtggtca tccctcaccg cgttgttctc taatcagtgt aact aatcgc aagagaacat acgtagacgt tcacggcgga 22
aatcaatcag
aatcaatctc
aaaactcgaa
tggccggaac
ccccaaggac
ctttggtcca
taagaatctt
tatcgaactc
tctcgatcag
taatttcccc
gagagaaatc
cggcggtatt
taaccgaatc
aaatatctcc
tttaacaact
attcttggtg
tgtctcttgc
accgtcaagg
agcgattcgt
cttccagaaa
aatcggtaaa
cgcgattaaa
gattcaaact
53
P
íbidops is thaliana His Ile Asn Asn Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu 275 280 285 Val Ser Leu Lys Ser Leu Asp Leu Ser Ile Asn Gln Leu Thr Gly Glu 290 295 300 Ile Pro Gln Ser Phe Ile Asn Leu Gly Asn Ile Thr Leu Ile Asn Leu 305 310 315 320 Phe Arg Asn Asn Leu Tyr Gly Gln Ile Pro Glu Ala Ile Gly Glu Leu 325 330 335 Pro Lys Leu Glu Val Phe Glu Val Trp Glu Asn Asn Phe Thr Leu Gln 340 345 350 Leu Pro Ala Asn Leu Gly Arg Asn Gly Asn Leu Ile Lys Leu Asp Val 355 360 365 Ser Asp Asn His Leu Thr Gly Leu Ile Pro Lys Asp Leu Cys Arg Gly 370 375 380 Glu Lys Leu Glu Met Leu Ile Leu Ser Asn Asn Phe Phe Phe Gly Pro 385 390 395 400 Ile Pro Glu Glu Leu Gly Lys Cys Lys Ser Leu Thr Lys Ile Arg Ile 405 410 415 Val Lys Asn Leu Leu Asn Gly Thr Val Pro Ala Gly Leu Phe Asn Leu 420 425 430 Pro Leu Val Thr Ile Ile Glu Leu Thr Asp Asn Phe Phe Ser Gly Glu 435 440 445 Leu Pro Val Thr Met Ser Gly Asp Val Leu Asp Gln Ile Tyr Leu Ser 450 455 460 Asn Asn Trp Phe Ser Gly Glu Ile Pro Pro Ala Ile Gly Asn Phe Pro 4 65 470 475 480 Asn Leu Gln Thr Leu Phe Leu Asp Arg Asn Arg Phe Arg Gly Asn Ile 485 490 495 Pro Arg Glu Ile Phe Glu Leu Lys His Leu Ser Arg Ile Asn Thr Ser 500 505 510 Ala Asn Asn Ile Thr Gly Gly Ile Pro Asp Ser Ile Ser Arg Cys Ser 515 520 525 Thr Leu Ile Ser Val Asp Leu Ser Arg Asn Arg Ile Asn Gly Glu Ile 530 535 540 Pro Lys Gly Ile Asn Asn Val Lys Asn Leu Gly Thr Leu Asn Ile Ser 545 550 555 560 Gly Asn Gln Leu Thr Gly Ser Ile Pro Thr Gly Ile Gly Asn Met Thr 565 570 575 Ser Leu Thr Thr Leu Asp Leu Ser Phe Asn Asp Leu Ser Gly Arg Val 580 585 590 Pro Leu Gly Gly Gln Phe Leu Val Phe Asn Glu Thr Ser Phe Ala Gly 595 600 605 Asn Thr Tyr Leu Cys Leu Pro His Arg Val Ser Cys Pro Thr Arg Pro 610 615 620 Gly Gln Thr Ser Asp His Asn His Thr Ala Leu Phe Ser Pro Ser Arg 625 630 635 640 Ile Val Ile Thr Val Ile Ala Ala Ile Thr Gly Leu Ile Leu Ile Ser 645 650 655 Val Ala Ile Arg Gln Met Asn Lys Lys Lys Asn Gln Lys Ser Leu Ala 660 665 670 Trp Lys Leu Ile Ala Phe Gln Lys Leu Asp Phe Lys Ser Glu Asp Val 675 680 685 Leu Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly 690 695 700 Ile Val Tyr Arg Gly Ser Met Pro Asn Asn Val Asp Val Ala Ile Lys 705 710 715 720 Arg Leu Val Gly Arg Gly Thr Gly Arg Ser Asp His Gly Phe Thr Ala 725 730 7 5 5 Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg His Ile Val 740 745 750
<210> 211 <211> 2943 <212> DNA <213> Arabídopsis thaliana <4 00> 211
atggcgatga gacttttgaa gactcatctt ccatgtttcg cttacactga catggaagtt cctaaaggac acggtctcca cgactggatt ttctccggcg tctcatgtga cgacgatgct cctttgtttg gtacaatctc accagagatt ttagctgcca acaacttcac cggtgaatta atatctccaa caatggtaac ttgatcttga agttcttgac tgtcagagct taagaagctt ttccagagag ttatggagat tctccggtaa atctccggcg gctactacaa cagctacacc agatcctcga catggcgagc tgaaacatct acatactctg
aaggttttga
aaagctatgg
ccaccggaga
agcggagaga
ggagctggac
atgtatattg
acaaagcttg
ttaagtaacc
ataccaccgg
ttaaccggag
ttcagaaaca
gtcttcgaag
gggaatctaa
agctttccgg tttagtcagc aaatccctca aagcttcatc
atctctacgg
tatgggagaa
taaagcttga
ttatgcagag gtgagaaatt attccagaag agcttggtaa
ctcaacggca ctgttccggc actgataatt tcttctccgg atttacctct ctaacaactg aatctacaga ctctattctt ttcgaattga agcatttatc ccagattcaa tctctcgctg aacggagaaa tccctaaagg ggtaatcaat taaccggttc ctcgatctct ctttcaacga ttcaacgaaa cttccttcgc ccaacacggc caggacaaac atcgtaatca cggttatcgc cagatgaata agaagaagaa ctagatttca aatctgaaga ggcggagctg gaattgtcta cgactcgttg gccgtgggac ttggggagaa tccgccaccg acgaatctcc ttctttatga tctaaaggtg gtcatcttca ggcttgtgtt atcttcacca aataacattc ttttggactc ttcttagttg atggtgctgc ttctgagtgt atcgccccag agtatgcata taccttgaaa tgttggagtt aatagctggg ttaggtgggt gaggaacacg ttgcgattgt tgacccgagg agatcgcaat gatgtgtgtg tgcacatgct cactaaccct
acaaatacca
caatttcacg
tgtctctgat
agagatgtta
atgcaaatcc
ggggcttttc
tgaacttccg
gttttccggc
agatcggaac
gaggatcaac
ctcaacttta
gatcaacaac
aatccctacc
tctctccggt
cggaaacact
ctccgatcac
agcgatcacc
ccagaaatct
cgttctcgag
ccgtggatca
cgggaggagc
tcacatagtg
gtacatgcct
atgggagacg
tgattgttca
tgattttgaa
ggagtggttt
gtggatatag
gctattgttg
catgtgttca
agggaagttg
tga
<2 10>
<2 11>
<212 >
<213>
<4 00> Met Ala 1
Leu Phe
212
980
PRT
Arabidopsis 212
Arg Leu
thaliana
ctgtttctgc cttctcaatc cactcatctt cgtgttatct gggatgttga ccattggaga cttactggaa acttataaca aaatacctct attcaaagct tttctttccc ggtggtgttc tgtacactca tttcttcaca ttgaaatctc aatctcggaa gaggccatcg ttacaattac aatcatctca attctctcta ttaaccaaaa aatctaccgt gtaacgatgt gagattccac cgatttcgcg acaagtgcga atctccgtcg gtgaaaaact ggaatcggaa agagtaccac tacctctgtc aatcacacgg ggtttgatcc ctcgcctgga tgtcttaaag atgccaaaca gatcatggat agact tcttg aatggaagcc agacatagag ccattgatct gcccatgttg atgtcttcaa gtggacgaga aagaaacctg gaagaggaga ttgactggtt gaggaagaag cctaaatccg 2943
atctgtatct tcaaatcctc ctccggatgc ctctcaacgt ctcatttggt tgaagagtct cattccctgg acaatttcaa ctttcggtgg tagagtatct gcctcaagaa cacgcgagtt ccggagagat tcaacaactt tcgatttatc acattactct gagaattacc cggcgaatct ccggacttat acaacttctt tcagaatcgt tagttacgat ccggcgatgt ctgcgattgg gcaacattcc acaacatcac atctcagccg taggaactct acatgacgag tcggtggtca tccctcaccg cgttgttctc taatcagtgt aactaaccgc aagagaacat acgtagacgt tcacggcgga gttacgtagc ttggagagct tagccgtgga tgcatagaga ctgattttgg ttgctggctc agagtgatgt ttggtgaatt taactcagcc acccgttgac ccgcggcaag tggcgaactt
atttttctca
catgattggt
tcactgttct
ctccttcact
gaatctaact
aacttctctc
agagatttta
cggtaagtta
aaatttcttc
tggtctcaac
cttaagagaa
cggtggttta
tccgacgagt
aaccggtcat
aatcaatcag
aatcaatctc
aaaactcgaa
tggccggaac
ccccaaggac
ctttggtcca
taagaatctt
tatcgaactc
tctcgatcag
taatttcccc
gagagaaatc
cggcggtatt
taaccgaatc
aaatatctcc
tttaacaact
attcttggtg
tgtctcttgt
accgtcaagg
agcgattcgt
cttccagaaa
aatcggtaaa
cgcgattaaa
gattcaaact
gaacaaggat
tttgcatgga
agctgcaaag
tgttaagtcc
gcttgctaag
ttatggatac
gtatagtttc
tggagaagga
atcggatgct
aagtgtgatt
gcctacgatg
gatcgcgttc
Met
5
Phe
Asn
20 Ijeu Lys 35
Ser Pro 25
Ser Ser 40
Leu
10
Cys
Met
Lys Thr His
15
Phe Ala Tyr 30
He Gly Pro 45
Leu Leu Phe Leu His Leu Tyr Thr Asp Met Glu Val Leu Leu Lys Gly His Gly Leu His Asp
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 24 60 2520 2580 2640 2700 2760 2820 2880 2940 Trp I Ie His Ser Ser Ser Pro Asp Ala His Cys Ser Phe Ser Gly Val 50 55 60 Ser Cys Asp Asp Asp Ala Arg Val Ile Ser Leu Asn Val Ser Phe Thr 65 70 75 80 Pro Leu Phe Gly Thr Ile Ser Pro Glu Ile Gly Met Leu Thr His Leu 85 90 95 Val Asn Leu Thr Leu Ala Ala Asn Asn Phe Thr Gly Glu Leu Pro Leu 100 105 110 Glu Met Lys Ser Leu Thr Ser Leu Lys Val Leu Asn Ile Ser Asn Asn 115 120 125 Gly Asn Leu Thr Gly Thr Phe Pro Gly Glu Ile Leu Lys Ala Met Val 130 135 140 Asp Leu Glu Val Leu Asp Thr Tyr Asn Asn Asn Phe Asn Gly Lys Leu 145 150 155 160 Pro Pro Glu Met Ser Glu Leu Lys Lys Leu Lys Tyr Leu Ser Phe Gly 165 170 175 Gly Asn Phe Phe Ser Gly Glu Ile Pro Glu Ser Tyr Gly Asp Ile Gln 180 185 190 Ser Leu Glu Tyr Leu Gly Leu Asn Gly Ala Gly Leu Ser Gly Lys Ser 195 200 205 Pro Ala Phe Leu Ser Arg Leu Lys Asn Leu Arg Glu Met Tyr Ile Gly 210 215 220 Tyr Tyr Asn Ser Tyr Thr Gly Gly Val Pro Arg Glu Phe Gly Gly Leu 225 230 235 240 Thr Lys Leu Glu Ile Leu Asp Met Ala Ser Cys Thr Leu Thr Gly Glu 245 250 255 Ile Pro Thr Ser Leu Ser Asn Leu Lys His Leu His Thr Leu Phe Leu 260 265 270 His Ile Asn Asn Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu 275 280 285 Val Ser Leu Lys Ser Leu Asp Leu Ser Ile Asn Gln Leu Thr Gly Glu 290 295 300 Ile Pro Gln Ser Phe Ile Asn Leu Gly Asn Ile Thr Leu Ile Asn Leu 305 310 315 320 Phe Arg Asn Asn Leu Tyr Gly Gln Ile Pro Glu Ala Ile Gly Glu Leu 325 330 335 Pro Lys Leu Glu Val Phe Glu Val Trp Glu Asn Asn Phe Thr Leu Gln 340 345 350 Leu Pro Ala Asn Leu Gly Arg Asn Gly Asn Leu Ile Lys Leu Asp Val 355 360 365 Ser Asp Asn His Leu Thr Gly Leu Ile Pro Lys Asp Leu Cys Arg Gly 370 375 380 Glu Lys Leu Glu Met Leu Ile Leu Ser Asn Asn Phe Phe Phe Gly Pro 385 390 395 400 Ile Pro Glu Glu Leu Gly Lys Cys Lys Ser Leu Thr Lys Ile Arg Ile 405 410 415 Val Lys Asn Leu Leu Asn Gly Thr Val Pro Ala Gly Leu Phe Asn Leu 420 425 430 Pro Leu Val Thr Ile Ile Glu Leu Thr Asp Asn Phe Phe Ser Gly Glu 435 440 445 Leu Pro Val Thr Met Ser Gly Asp Val Leu Asp Gln Ile Tyr Leu Ser 450 4 55 460 Asn Asn Trp Phe Ser Gly Glu Ile Pro Pro Ala Ile Gly Asn Phe Pro 465 470 475 480 Asn Leu Gln Thr Leu Phe Leu Asp Arg Asn Arg Phe Arg Gly Asn Ile 485 490 4 95 Pro Arg Glu Ile Phe Glu Leu Lys His Leu Ser Arg Ile Asn Thr Ser 500 505 510 Ala Asn Asn I Ie Thr Gly Gly Ile Pro Asp Ser Ile Ser Arg Cys Ser 515 520 525 Thr Leu Ile Ser Val Asp Leu Ser Arg Asn Arg Ile Asn Gly Glu Ile 530 535 54 0 Pro Lys Gly He Asn Asn Val Lys Asn Leu Gly Thr Leu Asn He Ser 545 550 555 560 Gly Asn Gln Leu Thr Gly Ser Ile Pro Thr Gly Ile Gly Asn Met Thr 565 570 575 Ser Leu Thr Thr Leu Asp Leu Ser Phe Asn Asp Leu Ser Gly Arg Val 580 585 590 Pro Leu Gly Gly Gln Phe Leu Val Phe Asn Glu Thr Ser Phe Ala Gly 595 600 605 Asn Thr Tyr Leu Cys Leu Pro His Arg Val Ser Cys Pro Thr Arg Pro 610 615 62 ) η Gly Gln Thr Ser Asp His Asn His Thr Ala Leu Phe Ser Pro Ser Arg 625 630 635 640 Ile Val Ile Thr Val Ile Ala Ala Ile Thr Gly Leu Ile Leu Ile Ser 645 650 655 Val Ala Ile Arg Gln Met Asn Lys Lys Lys Asn Gln Lys Ser Leu Ala 660 665 670 Trp Lys Leu Thr Ala Phe Gln Lys Leu Asp Phe Lys Ser Glu Asp Val 675 680 685 Leu Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly 690 695 700 Ile Val Tyr Arg Gly Ser Met Pro Asn Asn Val Asp Val Ala Ile Lys 705 710 715 720 Arg Leu Val Gly Arg Gly Thr Gly Arg Ser Asp His Gly Phe Thr Ala 725 730 735 Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg His Ile Val Arg Leu 740 745 750 Leu Gly Tyr Val Ala Asn Lys Asp Thr Asn Leu Leu Leu Tyr Glu Tyr 755 760 765 Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys Gly Gly 770 775 780 His Leu Gln Trp Glu Thr Arg His Arg Val Ala Val Glu Ala Ala Lys 785 790 795 800 Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Leu His Arg 805 810 815 Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu Ala His 820 825 830 Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Val Asp Gly Ala Ala Ser 835 840 845 Glu Cys Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu 850 855 860 Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser Phe 865 870 875 880 Gly Val Val Leu Leu Glu Leu Ile Ala Gly Lys Lys Pro Val Gly Glu 885 890 895 Phe Gly Glu Gly Val Asp Ile Val Arg Trp Val Arg Asn Thr Glu Glu 900 905 910 Glu Ile Thr Gln Pro Ser Asp Ala Ala Ile Val Val Ala Ile Val Asp 915 920 925 Pro Arg Leu Thr Gly Tyr Pr ο Leu Thr Ser Val Ile His Val Phe Lys 930 93 5 940 Ile Ala Met Met Cys Val Glu Glu Glu Ala Ala Ala Arg Pro Thr Met 945 950 955 960 Arg Glu Val Val His Met Leu Thr Asn Pro Pro Lys Ser Val Ala Asn 965 970 975
Leu Ile Ala Phe 980 <210> 213 <2 11> 2964 <212> DNA
<213> Brassica napus <4 00> 213
atggcgatga gacttttgaa gactcacctt ctgtttctcc atcttcacta cgttatctcg attttgcttc tatctttctc accatgcttc gcttccactg acatggacca tctcctcacc ctcaaatcgt ccatggtcgg ccccaacggc cacggcctcc acgactgggt tcgctcccct
60
120
180 tctccctcag ctcactgttc tttctccggc tccctcaacg tctctttcac tcctctcttc gaccgtctcg tgaatctgac gttagctgct atgaagagtc tcacttctct aaaggttctc accttccccg gagagattct aacaacttca caggcccact tctctcggag gaaacttctt aaccggagaa ttggagtatc ttggcctcaa cggagccgga
gtttcctgcg ggaaccatct aataatttct aacatctcca cactcccatg gtcgacctcg accgccggag atccccgggc atcccagaga ctctccggcg
cgcctcaaga atcttaaaga aatgtacgtc ggctacttca ccgccggagt tcggtgaatt acgggagaga ttccgacgac atcaacaact taaccggaaa
gacaaaccta gaggttctcg tctgagtaat ctaaaacatt
catccctccg gaactctccg ctagacctct caataaacca gctaaccgga gagattcctc aacatcactc tcgtcaacct cttcagaaac aatctccacg ggagacatgc cgaacctcca agtcctccag gtgtgggaga ccggcgaatc tcggccggaa cgggaatctg aaaaagctcg accggactca tccccatgga gacaacttct tcttcggctc atcagaatcg tcaagaatct
tttgtgcaga ggcgggaagc gatccctgag aagctaggtc
ctcgttacca tcatcgagct tcaggcgacc ttctcgatca
cctcaacggt
caccgataac
tatctactta
acggttccgg
ttcttctccg
tctaacaatt
ccggctatcg gtaattttaa aaatctacag gatttattct
tttcgagtta
ccctgactcg
cggcggagat
cgggaatcaa
cctcacgcgt
gatcgccatc
tcagatgaac
gctcgatttc
aagcatctca atctcgcgat atcccgaaag ctcaccggct tccttcaacg acttccttcg cccggccaaa acgataatcg aagaagaagc aaggcggaag aggcggagcg gggatcgtct acgcctcgtg ggacgcggaa
gggaatattc cgagagaagt aacaacctca ccggcgacat gatctcagcc gtaaccgaat ttaggaactc tcaatctctc aagatgacga gcttaaccac tctcgatctc ctcggcggcc agttcctagt cttcaacgac ctccctcgcc acgtctcgtg gcgctgttct cgccgtcgag ctcatcagcg tcgcgattcg aagctaaccg ccttccagcg gaggagaaca taatcggcaa aacgtagacg tcgcgatcaa ttcacggcgg agattcagac gctagggagg atccgccacc ggatacgtgg cgaacaggga cacgaacctg cttctctacg ctcggcgagc ttttgcacgg gtctaaagga ggtcatcttc gtagccgttg aagcggcgaa aggactgtgt tatcttcacc ttgcatagag acgttaagtc caataacatt ttactggact gctgattttg ggcttgctaa gttcttactg gacggtgctg atagctggat cctatggata catcgctcca gagtatgctt aagagtgatg tttatagttt tggagtggtg ttattggagc gttggtgagt ttggggaagg agtggatata gtgaggtggg atacctcagc cgtcggatgc agctactgtt gttgcgatcg tacccgttga ctagtgtgat tcacgtgttc aagatagcga gcaacgacaa ggccgacgat gagggaagtt gtgcacatgc gtgactaact tgatcgcctt ctga <2 10>
<211>
<2 12>
<213>
<4 00>
acggcgacgc
ccccggagat
ccggtatgct
acaacgtgaa
aagtcctcga
tcaagaagct
gttacggaga
aatctccggc
acagctacac
acatggcgag
tgcacacttt
gtttaatcag
agagcttcat
ggcccatacc
acaacttcac
acgtctctga
tggagacgct
gatgcaaatc
cgggactatt
gggagcttcc
ggtttaccgg
tagaccggaa
ctaagatcaa
gcacttcctt
acatccacga
cgatcccgat
acctctcggg
ccggaaaccc
cctccgatcg
cagcggtcac
acgagagatc
acgtcctcga
accgcggatc
cagggaggag
gtcacatcgt
agtacatgcc
agtgggagac
atgactgttc
ctgattttga
cttccgagtg
acactctcaa
tgatagctgg
tgaggaacac
tcgaccagag
tgatgtgtgt
tcactaaccc
2964
tcgtgtcatc
tgggatgctg
cccgttggag
cctcaacgga
cgcgtacaac
gagacacctc
tatccagagc
gttcttgtct
cggcggcgta
ctgtacactc
gtttctccac
cttaaaatct
ctccctctgg
tgagttcatc
gctagagcta
taaccatctc
ggtgctctcc
gctaaacaag
cactctaccg
gggggagatg
tttaatcccc
ccggtttagc
cacgagtgct
aatctccgtc
cgtgattaac
cggaatcggg
gcgagtccca
ttacctctgc
catccacacg
ggcgctgatc
cctctcctgg
gtgcctccaa
catgccgaac
cgatcacgga
gagactcctc
taacgggagc
gaggcacaga
gccgttgatc
ggcccatgtt
tatgtcttcg
agtggatgag
gaagaaaccg
ggagggtgag
gttgactggt
ggaggatgag
tcccaagtcc
214
987
PRT
Brassíca napus 214
Met Ala I
10
15
Tyr Val Ile Ser Ile Leu Leu Leu Ser
20
25
30
40
4 5
50 55
His Cys Ser Phe 65 7 0
Ser Leu Asn Val
60
7 5 8 0
Ser Phe Thr Pro Leu
Leu Leu Phe Leu His Leu His Phe Ser Pro Cys Phe Ala Ser Lys Ser Ser Met VaL Gly Pro Arg Ser Pro Ser Pro Ser Ala > Gly Asp Ala Arg Val Ile CO Ή Phe Gly Thr Ile Ser Pro Glu 240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340
2400
2460
2520
2580
2640
2700
2760
2820
2880
2940 85 90 95
Ile Gly Met Leu Asp Arg Leu Val Asn Leu Thr Leu Ala Ala Asn Asn 100 105 HO Phe Ser Gly Met Leu Pro Leu Glu Met Lys Ser Leu Thr Ser Leu Lys 115 120 125 Val Leu Asn Ile Ser Asn Asn Val Asn Leu Asn Gly Thr Phe Pro Gly 130 135 140 Glu Ile Leu Thr Pro Met Val Asp Leu Glu Val Leu Asp Ala Tyr Asn 145 150 155 160 Asn Asn Phe Thr Gly Pro Leu Pro Pro Glu Ile Pro Gly Leu Lys Lys 165 170 175 Leu Arg His Leu Ser Leu Gly Gly Asn Phe Leu Thr Gly Glu Ile Pro 180 185 190 Glu Ser Tyr Gly Asp Ile Gln Ser Leu Glu Tyr Leu Gly Leu Asn Gly 195 200 205 Ala Gly Leu Ser Gly Glu Ser Pro Ala Phe Leu Ser Arg Leu Lys Asn 210 215 220 Leu Lys Glu Met Tyr Val Gly Tyr Phe Asn Ser Tyr Thr Gly Gly Val 225 230 235 240 Pro Pro Glu Phe Gly Glu Leu Thr Asn Leu Glu Val Leu Asp Met Ala 245 250 255 Ser Cys Thr Leu Thr Gly Glu Ile Pro Thr Thr Leu Ser Asn Leu Lys 260 265 270 His Leu His Thr Leu Phe Leu His Ile Asn Asn Leu Thr Gly Asn Ile 275 280 285 Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys Ser Leu Asp Leu Ser 290 295 300 Ile Asn Gln Leu Thr Gly Glu He Pro Gln Ser Phe Ile Ser Leu Trp 305 310 315 320 Asn Ile Thr Leu Val Asn Leu Phe Arg Asn Asn Leu His Gly Pro Ile 325 330 335 Pro Glu Phe Ile Gly Asp Met Pro Asn Leu Gln Val Leu Gln Val Trp 340 345 350 Glu Asn Asn Phe Thr Leu Glu Leu Pro Ala Asn Leu Gly Arg Asn Gly 355 360 365 Asn Leu Lys Lys Leu Asp Val Ser Asp Asn His Leu Thr Gly Leu Ile 370 37 5 380 Pro Met Asp Leu Cys Arg Gly Gly Lys Leu Glu Thr Leu Val Leu Ser 385 390 395 400 Asp Asn Phe Phe Phe Gly Ser Ile Pro Glu Lys Leu Gly Arg Cys Lys 405 410 415 Ser Leu Asn Lys Ile Arg He Val Lys Asn Leu Leu Asn Gly Thr Val 420 425 430 Pro Ala Gly Leu Phe Thr Leu Pro Leu Val Thr Ile Ile Glu Leu Thr 435 440 445 Asp Asn Phe Phe Ser Gly Glu Leu Pro Gly Glu Met Ser Gly Asp Leu 450 455 460 Leu Asp His Ile Tyr Leu Ser Asn Asn Trp Phe Thr Gly Leu Ile Pro 465 470 475 480 Pro Ala Ile Gly Asn Phe Lys Asn Leu Gln Asp Leu Phe Leu Asp Arg 485 490 495 Asn Arg Phe Ser Gly Asn Ile Pro Arg Glu Val Phe Glu Leu Lys His 500 505 510 Leu Thr Lys Ile Asn Thr Ser Ala Asn Asn Leu Thr Gly Asp Ile Pro 515 520 525 Asp Ser Ile Ser Arg Cys Thr Ser Leu Ile Ser Val Asp Leu Ser Arg 530 53 5 540 Asn Arg Ile Gly Gly Asp Ile Pro Lys Asp He His Asp Va .1 Ile Asn 54 5 550 5 5 5 560 Leu Gly Thr Leu Asn Leu Ser Gly Asn Gln Leu Thr Gly Ser Ile Pro 565 570 575 Ile Gly Ile Gly Lys Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Phe 580 58 5 590 Asn Asp Leu 595
Asn Asp Thr 610
Val Ser Cys 625
Ala Leu Phe 645
Thr Ala Leu 660
Lys Hls Glu 675
Asp Phe Lys 690 He Gly Lys 705
Asn Val Asp 725
Ser Asp His 740 His Arg His 755
Asn Leu Leu 770 Leu His Gly 785
Val Ala Val 805
Ser Pro Leu 820
Asp Ser Asp 835 Leu Leu Asp 850 Tyr Gly Tyr 865
Lys Ser Asp 885
Gly Lys Lys 900
Trp Val Arg 915
Thr Val Val 930
Ser Val Ile 945
Ala Thr Thr
9 65
Pro Pro Lys 980
< 210 > 215
< 211> 2925
< 212 > DNA
<213> Eucalyptus grandis <4 00> 215
atggcggcga cggcggcgaa accgccctgc tccttctgcc tcctcctctt cgtctcggct ctgcagctca gggccgccct ggccgcgccc ccctcctcct cctcctcatc ctcctcgtcg ggggtcacgt gcgacgccgg ctcccgggtc ttcggccgcg tcccccgcga aatcggcctc agctgcaacc tctcggggac cctcccgccg ctcgacgtgt acgacaacaa cttcacggcc
Gly Gly Gln Phe Leu Val Phe Tyr Leu Cys Leu Pro Arg His Thr Ser Asp Arg Ile His Thr 640 Ile Thr Ile I Ie Ala Ala Val Ile Arg Gln Met Asn Lys Lys Leu Thr Ala Phe Gln Arg Leu Cys Leu Gln Glu Glu Asn Ile Tyr Arg Gly Ser Met Pro Asn 720 Val Gly Arg Gly Thr Gly Arg Gln Thr Leu Gly Arg He Arg Tyr Val Ala Asn Arg Asp Thr Asn Gly Ser Leu Gly Glu Leu Gln Trp Glu Thr Arg His Arg 800 Cys Tyr Leu His His Asp Cys Lys Ser Asn Asn Ile Leu Leu Asp Phe Gly Leu Ala Lys Phe Met Ser Ser Ile Ala Gly Ser Tyr Thr Leu Lys Val Asp Glu 880 Val Leu Leu Glu Leu Ile Ala Glu Gly Val Asp I Ie Val Arg Pro Gln Pro Ser Asp Ala Ala Leu Thr Gly Tyr Pro Leu Thr Met Met Cys Val Glu Asp Glu 960 Val Val His Met Leu Thr Asn Ala Phe
aagcccgcLt tccctcgcgc aactcgaccg ccgccgccct gtgtctctca ct ccgcgacc gagctc.ggca cagctgccgc
cctacttctg
agagcgacct
ccctccacga
ttccgcattg
acctcactga
tcgtcaacct
acctgaccga
cggaggtggt
cttctcctcc 60
cgacgtgctc 120
ctgggtcggc 180
ctccttcacc 240
cgtccgcctc 300
cacgctcacc 3 60
gctcgaagtc 420
ggggctgaag 48 0
Ser Gly Arg Val Pro Leu 600 605 Ser Phe Ala Gly Asn Pro 615 620 Leu Thr Arg Pro Gly Gln 630 635 Ser Pro Ser Arg Ile Ala 650 655 Ile Leu Ile Ser Val Ala 665 670 Arg Ser Leu Ser Trp Lys 680 685 Ala Glu Asp Val Leu Glu 695 700 Gly Gly Ala Gly Ile Val 710 715 Val Ala Ile Lys Arg Leu 730 735 Gly Phe Thr Ala Glu Ile 745 750 Ile Val Arg Leu Leu Gly 760 765 Leu Tyr Glu Tyr Met Pro 775 780 Ser Lys Gly Gly Hi s Leu 790 795 Glu Ala Ala Lys Gly Leu 810 815 Ile Leu His Arg Asp Val 825 830 Phe Glu Ala His Val Ala 840 845 Gly Ala Ala Ser Glu Cys 855 860 Ile Ala Pro Glu Tyr Ala 870 875 Val Tyr Ser Phe Gly Val 890 895 Pro Val Gly Glu Phe Gly 905 910 Asn Thr Glu Gly Glu Ile 920 925 Ala Ile Val Asp Gln Arg 935 940 His Val Phe Lys Ile Ala 950 955 Arg Pro Thr Met Arg Glu 970 975 Ser Val Thr Asn Leu Ile 98 5 aagctgaagt ggctcaacct cgccggcaat tacttcttcg gcgagatacc ggaggtttac
tcggagatgg agagcctgga gtacctgggc ctgcaggcga accagctgag cggcagagtc
ccggcgagcc tcgcgaagct gaagaacctc cagtggctct acctgggcta cttcaacacg
tacgatggcg agattccggc ggagttcggg tctatgaaag agctcagacg cctcgacttg
gcgagctgcg gcctctccgg cgagattccg gtgagcctga gcgagctaaa gaagttagac
tctctgttcc tccagtggaa caacctcatg ggcgttatcc cccccgagct ctcgaagatg
ttgagcctca tgtccctcga cctctccaac aattacctca ctggagtgat tccggcgacc
ttcgccgaac tcaagaacct gactctgctc aacctgttcg cgaaccacct ggaaggccag
atccccgagt tcgtgggcga gcttccgaac ctggagaccc tccaggtttg gggcaacaac
ttcacgatga tgttgccagc gggcctaggg aggaacggga ggctgctata cgtcgacgtc
acgcagaacc acttcaccgg cacgatccct cgggaattgt gccggggagg gaggctcaag
actctgatcc tgaccaacaa ctcgttcttt gggcccatcc ctgatgaatt cggggagtgc
aagtcgctga ccaaagtccg agtcggcaag aactttctcg acgggacgat tcctcggggg
atcttcaacc tgccgcaagc aactataatc gagcttaacg acaatctctt ctccggcgag
ctcccggcgc agatgtccgg cgagaacttg gtcatcctgt cgctctcgaa caaccggatt
tccggtgaga tccctccggc gattggcaac ttcagcggcc tgcgtactct gttactggac
gcgaacaggt tctccggcaa gattcccagc gagcttttct cgccgaggtt cctactgagg
gtgaacatca gcgggaacag catcagcggc aggattcctg gttcggtcac tgggtgcact
tctctggcag cccttgattt gagcaggaac aatctcgctg gcgagattcc gaacggcttg
tctagcctga aagtgttggc cgtcctcaat ctgtcgagca acagattgac cggtccagtt
ccaaaggaaa ttggcatcat gaccagcctc aatacgctcg atttgtcctt caacgatctc
tccggcgaag tcccccacga aggccagttc ctcgtcttca agaactcctc cttcgccgga
aaccagaaac tctgctcgcc aggccgcttc tcttgccctt cgcggtcaag tgcctcgcgc
acttcctcga gggttgtgat cacggcaatc tcactcgtga ccgcggcgct gctcatcacc
gtcacggtct accaggtcct gaagaggagg cggcagggct cgagagcctg gaagctcact
gccttccaga agctcggctt caaggccgag gacgtgctca agtgcctgga ggaggagaat
atcatcggca aaggtggcgc ggggatcgtc taccgcgggt cgatgcccaa cgggacggac
gtcgccatca agcagctggc gggacggggc ggcaacgggc tcagcgacca cggcttctcc
gcggagattc agaccctcgg tcggatccgg caccggaaca tcgtgaggct cctcggatac
ctctccaaca aggacaccaa cctgttgctg tacgagtaca tgcccaatgg gagcttaggg
gagctgttgc atggttcgaa aggcggccac ttgcagtggg agacgcggta tcggatcgcc
gtggaggccg cgaaggggct gtgctacctc caccacgatt gcttgccgct gataattcat
cgagacgtga agtcgaacaa cattctgctg gattcggact tcgaggcgca cgtcgctgat
ttcgggctgg ccaagttctt gcaggacgcc ggcgcatcgg agtgcatgtc gtccgtggcc
ggttcctacg gctacatagc cccagaatac gcctacacgc tgaaagtgga cgagaagagc
gacgtgtaca gcttcggggt cgtgctgctg gagctgatag ccgggaggaa gccggtgggg
gagtttggcg acggcgtgga catcgtgagg tgggtgaaga ccgcgtcgga ccccctcccg
cagccgccgt cggacgcggc cttggtgctg gccgtgatcg accgcaggct gggcgggtac
cccatcgcga gcgtgatcca cctcttcaag atcgcgtgcc ggtgcgtcga ggaggagagt
tccgagaggc ccaccatgag agaagtcgtc cacatgctga caaacccgcc tctgtccgcc
accaccttcg ccgtcggcgc caccccggac ctcatcaaac tgtag 2925
<210> 216
<211> <212> <213> <4 00> Met AJ 1
97 4 PRT
Eucalyptus grandis 216
5
10
15
20
25
30
35
40
45
50
5 5
60
65
70
75
100
105
95
IiO
115
120
125
Cys Lys Pro Ala Ser Tyr Phe Leu Phe Val Ser Ala Ser Leu Gln Leu Arg Ala Ala Leu Ala Trp Val Gly Pro Ser Ser Ser Phe Pro His Cys Ser Phe Thr Val Val Ser Leu Asn Leu Thr Arg Glu Ile Gly Leu Leu Arg Cys Asn Leu Ser Gly Thr Leu Leu Glu Val Leu Asp Val Tyr 540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340
2400
2460
2520
2580
2640
2700
2760
2820
2880 130 135 140
Asp Asn Asn Phe Thr Ala Gln Leu Pro Pro Glu Val Val Gly Leu Lys 14 5 150 155 160 Lys Leu Lys Trp Leu Asn Leu Ala Gly Asn Tyr Phe Phe Gly Glu He 165 170 17 5 Pro Glu Val Tyr Ser Glu Met Glu Ser Leu Glu Tyr Leu Gly Leu Gln 180 185 190 Ala Asn Gln Leu Ser Gly Arg Val Pro Ala Ser Leu Ala Lys Leu Lys 195 200 205 Asn Leu Gln Trp Leu Tyr Leu Gly Tyr Phe Asn Thr Tyr Asp Gly Glu 210 215 220 I Ie Pro Ala Glu Phe Gly Ser Met Lys Glu Leu Arg Arg Leu Asp Leu 225 230 235 240 Ala Ser Cys Gly Leu Ser Gly Glu Ile Pro Val Ser Leu Ser Glu Leu 245 250 255 Lys Lys Leu Asp Ser Leu Phe Leu Gln Trp Asn Asn Leu Met Gly Val 260 265 270 Ile Pro Pro Glu Leu Ser Lys Met Leu Ser Leu Met Ser Leu Asp Leu 275 280 285 Ser Asn Asn Tyr Leu Thr Gly Val Ile Pro Ala Thr Phe Ala Glu Leu 290 295 300 Lys Asn Leu Thr Leu Leu Asn Leu Phe Ala Asn His Leu Glu Gly Gln 305 310 315 320 He Pro Glu Phe Val Gly Glu Leu Pro Asn Leu Glu Thr Leu Gln Val 325 330 335 Trp Gly Asn Asn Phe Thr Met Met Leu Pro Ala Gly Leu Gly Arg Asn 340 345 350 Gly Arg Leu Leu Tyr Val Asp Val Thr Gln Asn His Phe Thr Gly Thr 355 360 365 Ile Pro Arg Glu Leu Cys Arg Gly Gly Arg Leu Lys Thr Leu Ile Leu 370 375 380 Thr Asn Asn Ser Phe Phe Gly Pro Ile Pro Asp Glu Phe Gly Glu Cys 385 390 395 400 Lys Ser Leu Thr Lys Val Arg Val Gly Lys Asn Phe Leu Asp Gly Thr 405 410 415 Ile Pro Arg Gly Ile Phe Asn Leu Pro Gln Ala Thr Ile Ile Glu Leu 420 425 430 Asn Asp Asn Leu Phe Ser Gly Glu Leu Pro Ala Gln Met Ser Gly Glu 435 440 445 Asn Leu Val Ile Leu Ser Leu Ser Asn Asn Arg Ile Ser Gly Glu He 4 50 455 460 Pro Pro Ala Ile Gly Asn Phe Ser Gly Leu Arg Thr Leu Leu Leu Asp 465 470 475 480 Ala Asn Arg Phe Ser Gly Lys Ile Pro Ser Glu Leu Phe Ser Pro Arg 485 490 495 Phe Leu Leu Arg Val Asn He Ser Gly Asn Ser Ile Ser Gly Arg Ile 500 505 510 Pro Gly Ser Val Thr Gly Cys Thr Ser Leu Ala Ala Leu Asp Leu Ser 515 520 52 5 Arg Asn Asn Leu Ala Gly Glu Ile Pro Asn Gly Leu Ser Ser Leu Lys 530 535 540 Val Leu Ala Val Leu Asn Leu Ser Ser Asn Arg Leu Thr Gly Pro Val 545 550 5 55 560 Pro Lys Glu Ile Gly Ile Met Thr Ser Leu Asn Thr Leu Asp Leu Ser 565 570 575 Phe Asn Asp Leu Ser Gly Glu Val Pro His Glu Gly Gln Phe Leu Val 580 585 590 Phe Lys Asn Ser Ser Phe Ala Gly Asn Gln Lys Leu Gys Ser Pro Gly 595 600 605 Arg Phe Ser Cys Pro Ser Arg Ser Ser Ala Ser Arg Thr Ser Ser Arg 610 615 620 Val Val Ile Thr Ala Ile Ser Leu Val Thr Ala Ala Leu Leu Ile Thr 625 630 635 640 Val Thr Val Tyr Gln Val Leu Lys Arg Arg Arg Gln Gly Ser Arg Ala 645 650 655 Trp Lys Leu Thr Ala Phe Gln Lys Leu Gly Phe Lys Ala Glu Asp Val 6 60 665 670 Leu Lys Cys Leu Glu Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly 675 680 685 Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp Val Ala Ile Lys 690 695 700 Gln Leu Ala Gly Arg Gly Gly Asn Gly Leu Ser Asp His Gly Phe Ser 705 710 715 720 Ala Glu Ile Gln Thr Leu Gly Arg Ile Arg His Arg Asn Ile Val Arg 725 730 735 Leu Leu Gly Tyr Leu Ser Asn Lys Asp Thr Asn Leu Leu Leu Tyr Glu 74 0 745 750 Tyr Met Pro Asn Gly Sor Leu Cly Glu Leu Leu IIio C' 1 , . Ser Lys Gly 755 760 765 OJ- _y Gly His Leu Gln Trp Glu Thr Arg Tyr Arg Ile Ala Val Glu Ala Ala 770 775 780 Lys Gly Leu Cys Tyr Leu His His Asp Cys Leu Pro Leu Ile Ile His 785 790 795 800 Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu Ala 805 810 815 His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Gln Asp Ala Gly Ala 820 825 830 Ser Glu Cys Met Ser Ser Val Ala Gly Ser Tyr Gly Tyr Ile Ala Pro 835 840 845 Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr Ser 850 855 860 Phe Gly Val Val Leu Leu Glu Leu Ile Ala Gly Arg Lys Pro Val Gly 865 870 875 880 Glu Phe Gly Asp Gly Val Asp Ile Val Arg Trp Val Lys Thr Ala Ser 885 890 895 Asp Pro Leu Pro Gln Pro Pro Ser Asp Ala Ala Leu Val Leu Ala Val 900 905 910 Ile Asp Arg Arg Leu Gly Gly Tyr Pro Ile Ala Ser Val Ile His Leu 915 920 925 Phe Lys Ile Ala Cys Arg Cys Val Glu Glu Glu Ser Ser Glu Arg Pro 930 935 940 Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Leu Ser Ala 945 950 955 960 Thr Thr Phe Ala Val Gly Ala Thr Pro Asp Leu Ile Lys Leu 965 970 <210>
<211>
<212>
<213>
<4 00>
atgagaagct gcaacgtgtt ggagacagag cactgtttct tcctttgttc aacctcacca acttccctca ataattcttc tcgcttccgg aagagttcgt
217
2946
DNA
Glycine max 217
gtgtgtgtta cacgctttta cttcgttcag tgacatggat
ccaaagacga
tttcaggtgt
ctctcttcgg ccacgttccg tctcgcagaa caacctcacc
tatttctccg
ttaagcacca
aggattctca
accatggaat
ccgagtctag
ggaaccattc
aacggcctca
agcacctcaa cgatgaccga actcgaggtc gaaactggag ggagagttac ggggaatatt caacaacgct ccttgacctc
ttgtttgttt gcgctgctga gactggaagt caagaacttc ccggagatcg ggcgaacttc catctctcac aacgtcttct
cgcgctccat
atcttgcgac
gaagcatacc atagcttatc agctcggata ctctgaaata caaatatgag aaacctcgac cgtctgagct ctccgacatg ccggggagat accgacgcgc
ctcgacgtct
aaattgaaat
tcggagttta
ccgaagagtt
tacgaaggcg
tcaagctgca
acgttgttct
gtgagcctca
ttctctcagc
tcttcatatg
agctgaagga
tttccacgtc
gagttgttgc
gagaattgga
ccaaggagct
ccggctattt
acgacaacaa
acctgaagct
agagcttgga
tgtctaagtt
gaattccacc
acctcagcgg
tgcaaatgaa
tgtcactgga
tgaaaaacct
gctacacgtg
gtccatgaag
gctttctgca
tatcaacgtc
caaacttgaa
cgccgccctc
tcccggcaaa
cttcaccgga
cgacggaaac
gtttttaagc
gaagacgctg
ggagttcggc
cgagattcca
taacctcacc
tctctccttc
cactctgatg
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960 aacttcttcc ctggaaacgc caaaacggga cgggatttgt ggtccaatcc aactacctta gagttggcca gggattctca ttaagggcac gaggtttttg ccaatcccaa atgcttgacg gtgtcgataa accacgctgg ttggtcttca cctaattcct gtcatggtga aggaggagga ttgaaagccg gcagggatcg gttggagcgg aagataaggc ttgcttctgt ggaggtcatt tgctatttgc atattgctcg tacgaccttg ccagagtatg gtgctgttgg atcgttggat gtgttggcag ttcaacatag gtagttcata ctctag <210>
acaacaatct
tgcagctctg
agttcaagtt
gcaagagtgg
ctaacgagat
acggcgcagt
ataaccgttt
ctctttccaa
tgcagactct
acctaccaat
cgacgtttac
gggagattcc
accaaatctc
atctctccta
gcgacaaatc
cgttgaagaa
ttgcactggc
agctgaagct
aggaggtggt
tgtaccgcgg
ggagtggaag
acaggaacat
atgagtacat
taaagtggga
accatgattg
atgctcactt
gctcctctca
cttacacttt
aactgataat
gggtcaacaa
tggtggaccc
ctatgatgtg
tgctctcaaa
ccgaggctca
ggagaacaat
cttcgacgtc
gaggttacaa
tgctaactgc
tccgtcaggg
taacggagaa
caacttattc
gtcacttgac
gctgactgtg
tcgctgcgtt
caaggggatg
agggtcagtc
caacaatttc
ctttgcaggg
gagacgcggc
cactgcggcg
tgcgatgacg
ggagtgtcta
gtccatgaga
gaacgattac
aatgaggctt
gccgaatggg
aatgaggtac
ttcccctctt
tgaggctcat
gtccatgtcc
gaaagtggac
agggaggaag
aacgagattg
aaggcttagt
tgttaaagaa
tcctcctcac
gttccctcct ttctcctctg acgaagaatc acgttcttga aagtctctaa attttcaagc ctgcctcccg ac.tgggaaaa acgaacgaat gtcaacataa tcactcgccg aaaaacctaa ccagacgaga atcggcaagg aacccgaatc ccttggagtt attctcgtgg tggaagctga aaagaagaga aacggaagcg gggttcaaag ttgggttacg agcttagggg aagattgcgg atcattcaca gttgctgatt tccattgctg gagaaaagtg ccagttggtg gagctctctc gggtatccat gtggggccca tttaccactc 2 94 6
tcgtcggcga
agctcccgca
acttcagcgg
tcacagataa
ccaagatccg
taccttccgt
aaatttccgg
ttcccccagc
tccttggaga
gcggcaacaa
ccgttgatct
cggatttaag
ttcgcttcat
tccctaccgg
tctgtagttc
tgaaatcgac
cggggacgga
cggggttcca
acataatagg
acgtggcaat
cggagataga
tgtcgaacaa
agtggctgca
tggaagctgc
gggatgtcaa
ttggccttgc
gctcctacgg
atgtgtacag
agtttggaga
agccgtcgga
tgataagtgt
ctaggcctac
acactcacaa
gcttcctaat gaacctgggg gt tgatccct cttcttccat agcctccaat cacgataatc cgattcactc gt tgaagaac aatcccgggg tctcaccgga tagccggaac cattttcaat gt tgagtctc tggtcagttt ccactcttgc gagggtgatc gtacatgagg gcggctgaac aaaaggagga aaagcggttg gacggtgggg ggagacgaac tggtgccaag aaagggacta gtctaataat caagttcttg ctacattgct ctttggcgtg cggggtggac tgcagcagta catttacatg catgagggaa cctaattaat
<211> <212> <2 13> <400>
218
981
PRT
Glycine max 218
Met Arg Ser Cys Val Cys Tyr Thr Leu Leu Leu Phe Val Phe Phe Ile 1 5 10 15 Trp Leu His Val Ala Thr Cys Ser Ser Phe Ser Asp Met Asp Ala Leu 20 25 30 Leu Lys Leu Lys Glu Ser Met Lys Gly Asp Arg Ala Lys Asp Asp Ala 35 40 45 Leu His Asp Trp Lys Phe Ser Thr Ser Leu Ser Ala His Cys Phe Phe 50 55 60 Ser Gly Val Ser Cys Asp Gln Glu Leu Arg Val Val Ala Ile Asn Val 65 70 75 80 Ser Phe Val Pro Leu Phe Gly His Val Pro Pro Glu Ile Gly Glu Leu 8 5 90 95 Asp Lys Ijeu Glu Asn Leu Thr Ile Ser Gln Asn Asn Leu Thr Gly Glu 100 105 110 Leu Pro Lys Glu Leu Ala Ala Leu Thr Ser Leu Lys His Leu Asn Ile 115 120 125 Ser His Asn Val Phe Ser Gly Tyr Phe Pro Gly Lys Ile Ile Leu Pro 130 135 140 Met Thr Glu Leu Glu Val Leu Asp Val Tyr Asp Asn Asn Phe Thr Gly 145 150 155 160 Ser Leu Pro Glu Glu Phe Val Lys Leu Glu Lys Leu Lys Tyr Leu Lys 165 170 175 Leu Asp Gly Asn Tyr Phe Ser Gly Ser Ile Pro Glu Ser Tyr Ser Glu 180
190
1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 17 4 0 1800 1860 1920 1980 2040 2100 2160 2220 2280 234 0 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 Phe Lys Ser Leu Glu Phe Leu Ser Leu Ser Thr Asn Ser Leu Ser Gly 195 200 205
Asn Ile Pro Lys Ser Leu Ser Lys Leu Lys Thr Leu Arg Ile Leu Lys 210 215 220
Leu Gly Tyr Asn Asn Ala Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly 225 230 235 240
Thr Met Glu Ser Leu Lys Tyr Leu Asp Leu Ser Ser Cys Asn Leu Ser 245 250 255
Gly Glu Ile Pro Pro Ser Leu Ala Asn Met Arg Asn Leu Asp Thr Leu 260 265 270
Phe Leu Gln Met Asn Asn Leu Thr Gly Thr Ile Pro Ser Glu Leu Ser 275 280 285
Asp Met Val Ser Leu Met Ser Leu Asp Leu Ser Phe Asn Gly Leu Thr 290 295 300
Gly Glu Ile Pro Thr Arg Phe Ser Gln Leu Lys Asn Leu Thr Leu Met 305 310 315 320
Asn Phe Phe His Asn Asn Leu Arg Gly Ser Val Pro Ser Phe Val Gly 325 330 335
Glu Leu Pro Asn Leu Glu Thr Leu Gln Leu Trp Glu Asn Asn Phe Ser 340 345 350
Ser Glu Leu Pro Gln Asn Leu Gly Gln Asn Gly Lys Phe Lys Phe Phe 355 360 365
Asp Val Thr Lys Asn His Phe Ser Gly Leu Ile Pro Arg Asp Leu Cys 370 375 380
Lys Ser Gly Arg Leu Gln Thr Phe Leu Ile Thr Asp Asn Phe Phe His 385 390 395 400
Gly Pro Ile Pro Asn Glu Ile Ala Asn Cys Lys Ser Leu Thr Lys Ile 405 410 415
Arg Ala Ser Asn Asn Tyr Leu Asn Gly Ala Val Pro Ser Gly Ile Phe 420 425 430
Lys Leu Pro Ser Val Thr Ile Ile Glu Leu Ala Asn Asn Arg Phe Asn 435 440 445
Gly Glu Leu Pro Pro Glu Ile Ser Gly Asp Ser Leu Gly Ile Leu Thr 450 455 460
Leu Ser Asn Asn Leu Phe Thr Gly Lys Ile Pro Pro Ala Leu Lys Asn 465 470 475 480
Leu Arg Ala Leu Gln Thr Leu Ser Leu Asp Thr Asn Glu Phe Leu Gly 485 490 495
Glu Ile Pro Gly Glu Val Phe Asp Leu Pro Met Leu Thr Val Val Asn 500 505 510
Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Phe Thr Arg 515 520 525
Cys Val Ser Leu Ala Ala Val Asp Leu Ser Arg Asn Met Leu Asp Gly 530 535 540
Glu Ile Pro Lys Gly Met Lys Asn Leu Thr Asp Leu Ser Ile Phe Asn 545 550 555 560
Val Ser Ile Asn Gln Ile Ser Gly Ser Val Pro Asp Glu Ile Arg Phe 565 570 575
Met Leu Ser Leu Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Ile Gly 580 585 590
Lys Val Pro Thr Gly Gly Gln Phe Leu Val Phe Ser Asp Lys Ser Phe 595 600 605
Ala Gly Asn Pro Asn Leu Cys Ser Ser His Ser Cys Pro Asn Ser Ser 610 615 620
Leu Lys Lys Arg Arg Gly Pro Trp Ser Leu Lys Ser Thr Arg Val Ile 625 630 635 64 0
Val Met Val Ile Ala Leu Ala Thr Ala Ala Ile Leu Val Ala Gly Thr 645 650 655
Glu Tyr Met Arg Arg Arg Arg Lys Leu Lys Leu Ala Met Thr Trp Lys 660 665 67 0
Leu Thr Gly Phe Gln Arg Leu Asn Leu Lys Ala Glu Glu Val Val Glu 675 680 685
Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val 690
Tyr Arg Gly '7 05
Val Gly Ala
725
Glu Thr Val 740
Tyr Val Ser 755 Asn Gly Ser 770 Lys Trp Glu 785
Cys Tyr Leu 805
Lys Ser Asn 820
Asp Phe Gly 835
Met Ser Ser 850 Tyr Thr Leu 865
Val Leu Leu 885
Asp Gly Val 900
Ser Gln Pro 915
Leu Ser Gly 930
Met Met Cys 945
Val Val His 965
Asn Leu Ile 980
<210> 219 <211> 2964 <212> DNA <213> Glyc <4 00> 219 atgagaagct gtgtgtgcta gcaacgtgct cttcgttcac ggagataaag ccaaagacga cactgtttct tcgtttgttc aacctcaccg acttccctca attatccttc ccgcttcccg tatttctccg ttaagcacca aggtacctaa agcatgaaat ccgagccttg ggaaccattc aacgacctca aacttcttcc ctggaaacgc caaaacggca cgagatt tgt ggtccaatcc
700
Asn Gly Ser Asp Val Ala 715 720
Arg Asn Asp Tyr Gly Phe 7 35
Arg His Arg 750
Thr Asn Leu 765
Trp Leu His 780 Lys Ile Ala 795
Cys Ser Pro 815
Leu Asp Ala 830
Phe Leu Tyr 845
Ser Tyr Gly 860
Glu Lys Sei:
875
Ile Gly Arg 895
Gly Trp Val 910 Aia Val 925 Ile Ser 940 Val Gly 955
Asn Pro
Ile Lys Arg Leu
Lys Ala Glu Ile Arg Leu Leu Gly Glu Tyr Met Pro Gly Gly His Leu Ala Lys Gly Leu His Arg Asp Val Ala His Val Ala Ser Ser Gln Ser Pro Glu Tyr Ala Gly Val Phe Gly Glu Leu Pro Arg Ile Ala Arg Glu His
60 120 18 0 240 300 360 420 4 80 540 600 660 720 780 840 900 960 102 0 1080 1140 1200 1260
tttcaggcgt
ctctcttcgg
tctcgcagaa
agcacctcaa
cgatgacgaa
tagagttggt
gcagcatacc
atagcttatc
aactcggata
ctctgagata
caaatctgac
cgtcggagct
ccggtgagat
aaaacaatct
tgcagctctg
agttaaagtt
gtaagagtgg
ctaacgagat
cacgctatta
tgacatggaa
cgctctccat
aaaatgcgac
tcaccttccg
caacctcacc
catctctcac
actggaggtc
gaaactggag
ggagagttac
ggggaagatt
caacaacgct
ccttgacctc
aaaccttgac
ctccgctatg
accgatgagc
tcgcggctca
ggataacaac
cttcgacgtc
gaggttacaa
tggtaactgc
ttgtttattt
tcgcttctga
gactggaagt
cgagaacttc
ccggagatcg
ggcgtacttc
aacgtcttct
ctcgacgtct
aaattaaaat
tcggagttta
cccaagagtt
tacgaaggtg
tctagctgca
acgttgttcc
gtgagcctca
ttctcacagc
gttccgtcct
ttctccttcg
atcaagaatc
acgatcatga
aagtctctca
695
Ser Met Arg 710
Gly Ser Gly 730
Gly Lys Ile 745
Asn Lys Glu 760
Leu Gly Glu 775
Met Arg Tyr 790
His His Asp 810
Asn Ile Leu 825 Leu Ala Lys 840
Ile Ala Gly 855
Lys Val Asp 870
Glu Leu Ile 890
Asp Ile Val 905
Ser Asp Ala 920
Tyr Pro Leu 935
Val Lys Glu 950
Met Leu Ser 970
Asn Leu
ine max
Asn Ile
Leu Leu
Gly Ala
Val Glu 800
Leu Ile
His Phe
Asp Leu
Tyr Ile
Asp Val 880
Lys Pro
Asn Lys
Val Leu Ala
Val Ile Tyr
Pro Thr Arg 960
Pro His Phe 975
Met Tyr Lys Ala Ile Glu Gly Ala Tyr Ser Phe Val Gly Glu Thr Arg Leu Val Val Asp Met Phe Asn Pro Thr Met Thr Thr His
tcttcatatg
agctgaagga
ttttcccctc
gagtcgttgc
gacaattgga
ccaaggagct
ccggccattt
acgacaacaa
acctgaagct
agagcttgga
tgtcgaagtt
gaattccacc
acctcagcgg
tgcaaattaa
tgtcacttga
ttagaaacct
tcgtcggcga
tgctacctcc
acttcaccgg
tcacagataa
ccaagatccg
Thr
gctgcgcgtg
ctccatgaaa
gctttctgca
tatcaacgtc
caaactcgag
cgccgccctc
ccccggccaa
cttcaccgga
cgacggaaac
gtttttaagc
gaagacgctg
ggagtttggc
cgagattcca
caacctcacc
tctctccatc
cactctcatg
gcttccgaat
gaaccttggg
gttgatccct
cttcttccgc
agcctccaat aactacctta acggcgtggt tccgtcaggg attttcaaac gagctggcca ataaccgttt: taacggcgaa ctgcctcctg gggattctca ctctttccaa caacttattc agtgggaaaa ttgagggcac tgcagactct ctcacttgac gcaaacgagt gaggtttttg acctaccgat gctgactgtg gtcaacataa ccaatcccaa cgacgttgac tcgctgcgtt tcactcaccg atgcttgaag ggaagattcc gaagggaatc aaaaacctca gtgtcgataa accaaatttc agggccagtc cctgaggaga accacattgg atctatccaa caacaatttc atcggcaagg gcggtcttca gcgagaaatc, ctttgcaggg aaccccaacc ccgaattcct cgttgtaccc tgacgacgcc ttgaagaaga aaatccacga gggtgatagt catcgtgatt gcactgggca gtgacggtgt acatgatgag gaggaggaag atgaaccttg gcgttccagc ggctgaactt caaagccgag gacgtggtgg ataataggaa aaggaggggc agggatcgtg taccgcgggt gtggcgataa agcggttggt tggggcgggg agtggaagga gagatagaaa cgctggggaa gataaggcac aggaacataa tcgaacaagg agacgaactt gctgctgtat gagtacatgc tggctgcatg gtgccaaagg agggcacttg aagtgggaaa gaagctgcta agggactgtg ctatttgcac catgattgtt gatgtcaagt ctaataatat attgctggat ggggacttgg ggccttgcca agttcttgta cgaccctggc gcctctcagt tcctacggct acattgctcc agagtatgca tacactttga gtgtacagct ttggcgttgt gctgctggag ctgataatag tttggagacg gggtggacat cgttggatgg gtcaacaaaa ccgtcggatg cagcgttggt gttggcagtg gtggacccaa acaagtgtca tttacatgtt caacatagct atgatgtgtg aggcctacca tgagggaagt cgttcatatg ctctcagagc actcacaacc taattaatct ctag <210> 220
taccttctgt
agatttccgg
ttcccccagc
tcgttggaga
gcggcaacaa
ccgtggacct
cggacttgag
ttcgcttcat
tcccaaccgg
tctgtacctc
ggcgcggccc
cagccgcgct
cgaagacgtg
agtgtctgaa
ccatgccaaa
acgattacgg
tgaggctttt
caaatgggag
tgaggtacaa
cccctcttat
aggcccatgt
ccatgtcctc
aagtggacga
ggaggaagcc
cgagattgga
ggttgagtgg
ttaaagaaat
ctcctcactc
2964
cacgataatc
cgaatccctg
gttgaagaac
aataccggga
tctaaccgga
cagccggaac
cattttcaat
gttgagtctc
gggtcagttc
ccactcttgc
ttggagtttg
gctggtggcg
gaagctgacg
ggaggagaac
cggaacagac
attcaaagcg
aggttacgtg
cttaggggaa
gattgcggtg
cattcacagg
tgctgatttt
cattgctggc
gaaaagtgat
agtgggagag
gctcgctcag
gtatccattg
ggggcccgct
tgctactcac
<211> <212> <213> <400>
987
PRT
Glycine max 220
Met Arg Ser Cys Val Cys Tyr Thr Leu Leu Leu Phe Ile Phe Phe Ile 1 5 10 15 Trp Leu Arg Val Ala Thr Cys Ser Ser Phe Thr Asp Met Glu Ser Leu 20 25 30 Leu Lys Leu Lys Asp Ser Met Lys Gly Asp Lys Ala Lys Asp Asp Ala 35 40 45 Leu His Asp Trp Lys Phe Phe Pro Ser Leu Ser Ala His Cys Phe Phe 50 55 60 Ser Gly Val Lys Cys Asp Arg Glu Leu Arg Val Val Ala Ile Asn Val 65 70 75 80 Ser Phe Val Pro Leu Phe Gly His Leu Pro Pro Glu Ile Gly Gln Leu 85 90 95 Asp Lys Leu Glu Asn Leu Thr Val Ser Gln Asn Asn Leu Thr Gly Val 100 105 HO Leu Pro Lys Glu Leu Ala Ala Leu Thr Ser Leu Lys His Leu Asn Ile 115 120 125 Ser His Asn Val Phe Ser Gly His Phe Pro Gly Gln Ile Ile Leu Pro 130 135 14 0 Met Thr Lys Leu Glu Val Leu Asp Val Tyr Asp Asn Asn Phe Thr Gly 145 150 155 160 Pro Leu Pro Val Glu Leu Val Lys Leu Glu Lys Leu Lys Tyr Leu Lys 165 170 175 Leu Asp Gly Asn Tyr Phe Ser Gly Ser Ile Pro Glu Ser Tyr Ser Glu 180 185 190 Phe Lys Ser Leu Glu Phe Leu Ser Leu Ser Thr Asn Ser Leu Ser Gly 195 200 205 Ijys Ile Pro Lys Ser Leu Ser Lys Leu Lys Thr Leu Arg Tyr Leu Lys 210 215 220 Leu Gly Tyr Asn Asn Ala Tyr Glu Giy Gly Ile Pro Pro Glu Phe Gly 1320 1380 1440 1500 1560 1620 1680 17 4 0 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 225 230 235 240 Ser Met Lys Ser Leu Arg Tyr Leu Asp Leu Ser Ser Cys Asn Leu Ser 245 250 255 Gly Glu Ile Pro Pro Ser Leu Ala Asn Leu Thr Asn Leu Asp Thr Leu 260 265 270 Phe Leu Gln Ile Asn Asn Leu Thr Gly Thr Ile Pro Ser Glu Leu Ser 275 280 285 Ala Met Val Ser Leu Met Ser Leu Asp Leu Ser Ile Asn Asp Leu Thr 290 295 300 Gly Glu Ile Pro Met Ser Phe Ser Gln Leu Arg Asn Leu Thr Leu Met 305 310 315 320 Asn Phe Phe Gln Asn Asn Leu Arg Gly Ser Val Pro Ser Phe Val Gly 325 330 335 Glu Leu Pro Asn Leu Glu Thr Leu Gln Leu Trp Asp Asn Asn Phe Ser 340 345 350 Phe Val Leu Pro Pro Asn Leu Gly Gln Asn Gly Lys Leu Lys Phe Phe 355 360 365 Asp Val Ile Lys Asn His Phe Thr Gly Leu Ile Pro Arg Asp Leu Cys 370 375 380 Lys Ser Gly Arg Leu Gln Thr Ile Met Ile Thr Asp Asn Phe Phe Arg 385 390 395 400 Gly Pro Ile Pro Asn Glu Ile Gly Asn Cys Lys Ser Leu Thr Lys Ile 405 410 415 Arg Ala Ser Asn Asn Tyr Leu Asn Gly Val Val Pro Ser Gly Ile Phe 420 425 430 Lys Leu Pro Ser Val Thr Ile Ile Glu Leu Ala Asn Asn Arg Phe Asn 435 440 445 Gly Glu Leu Pro Pro Glu I Ie Ser Gly GIu Ser Leu Gly Ile Leu Thr 450 455 460 Leu Ser Asn Asn Leu Phe Ser Gly Lys Ile Pro Pro Ala Leu Lys Asn 465 470 475 480 Leu Arg Ala Leu Gln Thr Leu Ser Leu Asp Ala Asn Glu Phe Val Gly 485 490 495 Glu I Ie Pro Gly Glu Val Phe Asp Leu Pro Met Leu Thr Val Val Asn 500 505 510 He Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr Leu Thr Arg 515 520 525 Cys Val Ser Leu Thr Ala Val Asp Leu Ser Arg Asn Met Leu Glu Gly 530 535 540 Lys Ile Pro Lys Gly Ile Lys Asn Leu Thr Asp Leu Ser Ile Phe Asn 545 550 555 560 Val Ser Ile Asn Gln Ile Ser Gly Pro Val Pro Glu Glu Ile Arg Phe 565 570 575 Met Leu Ser Leu Thr Thr Leu Asp Leu Ser Asn Asn Asn Phe Ile Gly 580 585 590 Lys Val Pro Thr Gly Gly Gln Phe Ala Val Phe Ser Glu Lys Ser Phe 595 600 605 Ala Gly Asn Pro Asn Leu Cys Thr Ser His Ser Cys Pro Asn Ser Ser 610 615 620 Leu Tyr Pro Asp Asp Ala Leu Lys Lys Arg Arg Gly Pro Trp Ser Leu 625 630 635 64 0 Lys Ser Thr Arg Val He Val Ile Val Ile Ala Leu Gly Thr Ala Ala 6 4 5 650 655 Leu Leu Val Ala Val Thr Val Tyr Met Met Arg Arg Arg Lys Met Asn 660 66 i5 670 Leu Ala Lys Thr Trp Lys Leu Thr Ala Phe Gln Arg Leu Asn Phe Lys 675 680 685 Ala Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile GI y Lys 690 695 700 Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp 7 05 710 715 720 Val Ala Ile I. ys Arg Leu Val Gly Ala Gly Ser Gly Arg Asn Asp Tyr 725 7 30 7 35 120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
123
Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly Lys Ile Arg His Arg Asn 740 7 4 5 750 Ile Met Arg Leu Leu Gly Tyr Val Ser Asn Lys Glu Thr Asn Leu Leu 755 760 765 Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Trp Leu His Gly 770 775 780 Ala Lys Gly Gly His Leu Lys Trp Glu Met Arg Tyr Lys Ile Ala Val 785 790 7 95 800 Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu 805 810 815 Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Gly Asp 820 825 830 Leu Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp 835 840 845 Pro Gly Ala Ser Gln Ser Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr 850 855 860 Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp 865 870 875 880 Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ile Gly Arg Lys 885 890 895 Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile Val Gly Trp Val Asn 900 905 910 Lys Thr Arg Leu Glu Leu Ala Gln Pro Ser Asp Ala Ala Leu Val Leu 915 920 925 Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro Leu Thr Ser Val He 930 935 940 Tyr Met Phe Asn Ile Ala Met Met Gys Val Lys Glu Met Gly Pro Ala 945 950 955 960 Arg Pro Thr Met Arg Glu Val Val His Met Leu Ser Glu Pro Pro His 965 970 975 Ser Ala Thr His Thr His Asn Leu Ile Asn Leu 980 985 <210> 221 <211> 2961 <212> DNA <213> Lotus japonica <400> 221 atgagaatca
acagtggtgt
aagggagcca
gcacactgtt
gtcacgctgg
gagaatctca
ctcacctccc
aacatcaccg
ggtcctctcc
aactatttct
ggcttgaacg
ttgaaggaac
ggttccatgg
ccaccgagcc
accggaacca
atcaacgacc
atgaacttct
aatctcgaaa
ggcggaaacg
ccgccggatc
cgtggcccaa
aacaacttcc
acggaattga
ctcgggacgc
aacctcagag
gggggagttt
gagtgtctta
actcttcatt
aagccaaaca
cgttttccgg
ttccgctttt
ccatctccat
tcaaggtcct
ttggcatgac
cggaggaaat
ccggtacaat
caaacagctt
tgcacctcgg
agaatictccg
tggggaatct
ttccgccgga
tcaccggcga
tccaaaacaa
cgcttcaggt
gaagattctt
tatgcaaaag
ttcccaaggg
ttgacggtcc
gcaataaccg
tcacgctttc
cgttgcagag
ttgaaatccc
cttgttagtg
cagtgatctc
ccacgcactc
cgtaacgtgc
cggccacctt
gaacaacctc
caacatctcc
ggagctcgag
cgtcaagctc
accggagagc
aaccgggaga
ttactcgaac
cctgctagaa
aaccaaactc
ctatgtttta
gatgcactgc
gaagattgga
gaccagaact
ccgccggaga
actgaccagc
cacaacctct
gcccttgatg
gagaaactca
tactcggagt
gtcccggaga
gcttacgaag
atggctaact
cactccttat
gctatcttcc atgatgagcc gatcccggag agcttctcaa
gttccgcggc
ttgggagaac
atacttcgac
cgggaggttg
aatcggcgag
agttccacca
tctctcccct
aatttctcct
gtcaccaaaa
aaaacgttca
tgtaggtcac
ggggttttcc
cctcaacggc gaactgcctt
caacaacctc ttcaccggaa
cttatccctc gacgccaatg
aatgctcacc aaagtcaaca
ccttaatttg
taaagctcaa
agttttccac
tgcgagtggt
tagggttgtt
ttccctccga
tctccggcca
cctacgacaa
agtacctcca
ttcagagcct
gcttggcgaa
gtggaatccc
gcaacctcac
tcgtgcagat
tcatgtcact
aactgaagaa
ccttcatcgg
tcgtgctgcc
accacctcac
tcatcactga
tcacgaagat
aactgccttc
ccgtgatttc
aaatccccgc
agttcatcgg
tcagcggcaa
gttcagatgg
agaatccatg
ctcactctca
tgctctcaac
ggagaagtta
ccttgcaagc
attccctggt
cagcttctcc
cctcgccggg
tgagtttctc
gttgaagacg
gccggcgttc
cggcgagatt
gaacaacctc
ggacctctcc
tctcactcta
cgaccttcca
gcacaatctc
cgggttgatt
taacttcttc
tcgcgtggct
cgttacgata
aggcgaatct
cgcgatgaaa
agaaattccg
caacctcaca ggtccgatcc aacaacctcg aatctctcac ctcacgacgc tttctggtat agagcatcct cgggtgaggg acggtgcacg ttccagaggc attgggaaag gcgatcaagc attgagacgt aacaaggata ctgcacggtg gcggcgaggg gttaagtcca cttgctaagt tacggttaca tacagctttg ggagatggcg tcggatactg agtgtcatcc cccaccatga caagacctaa <210>
< 2 11 >
<212>
<213>
<4 00>
caacgacgat
ccggcgaggt
gcaacgagat
tggatctctc
tcaactacga
gtccttctgt
cgattgtgat
tggtcagaaa
tggagatcaa
gaggagcagg
ggttggtagg
tggggaaaat
cgaacttgtt
cgaagggtgg
gactctgcta
acaacatttt
ttttgtatga
ttgctccaga
gcgttgtgct
tggacatcgt
cattagtgtt
acatgttcaa
gggaagttgt
ttaatctcta
cactcaccgt
tccgaagggg
ttctggaccg
gagtaacaat
caagacgttc
cctctacgac
tggaattgca
gcggaggctg
ggcggaggat
catcgtgtac
gcagggaagt
ccggcaccgg
gctgtatgag
gcacttgcgg
tatgcaccat
gcttgatgct
ccctggtgct
gtatgcttac
gttggaactg
tggatgggtc
agcagtggtg
catagctatg
tcatatgctc
g
gcttctctga
atgaagaatt
gttcctgatg
ttcaccggaa
gccggaaacc
tcgttaagga
ctcgccacgg
caccgagcgc
gtagtcgagt
agaggttcca
gggaggaacg
aatataatga
tacatgccga
tgggagatga
gattgctctc
gattttgagg
tctcagtcca
acgctgaaag
atcataggga
aacaaaacca
gaccctcgcc
atgtgtgtga
actaatcctc
cggcggtaga
tgatggactt
agattcgatt
cagtccccac
cgaacctctg
aaacccgcgc
cggtgttgct
aggcctggaa
gtttaaagga
tgccgaacgg
attacggttt
ggcttctggg
atgggagctt
ggtataagat
ctcttattat
ctcatgttgc
tgtcctccat
tggacgagaa
gaaagccagt
tgtcagagct
tcagtggata
aggaaatggg
ctcagtctaa
2961
cctcagccgg
aagcattctg
catgactagc
cggcggccag
tttccctcac
caaaacggcg
ggtggcggtg
gctcaccgcg
agagaatata
aaccgacgtg
cagggcggag
gtacgtttcg
aggggagtgg
tgcggtggag
tcacagggat
tgattttgga
tgctggctcc
gagtgacgtg
gggtgagttt
ctctcagccg
ccccttgaca
ccctgctagg
tacctccact
222
986
PRT
Lotus
222
j aponica
Met Arg Ile Arg Val Ser Tyr Leu Leu Val Leu Cys Phe Thr Leu Ile 1 5 10 15 Trp Phe Arg Trp Thr Val Val Tyr Ser Ser Phe Ser Asp Leu Asp Ala 20 25 30 Leu Leu Lys Leu Lys Glu Ser Met Lys Gly Ala Lys Ala Lys His His 35 40 45 Ala Leu Glu Asp Trp Lys Phe Ser Thr Ser Leu Ser Ala His Cys Ser 50 55 60 Phe Ser Gly Val Thr Cys Asp Gln Asn Leu Arg Val Val Ala Leu Asn 65 70 75 80 Val Th.!? Leu Val Pro Leu Phe Gly His Leu Pro Pro Glu Ile Gly Leu 85 90 95 Leu Glu Lys Leu Glu Asn Leu Thr Ile Ser Met Asn Asn Leu Thr Asp 100 105 110 Gln Leu Pro Ser Asp Leu Ala Ser Leu Thr Ser Leu Lys Val Leu Asn 115 120 125 Ile Ser His Asn Leu Phe Ser Gly Gln Phe Pro Gly Asn Ile Thr Val 130 135 140 Gly Met Thr Glu Leu Glu Ala Leu Asp Ala Tyr Asp Asn Ser Phe Ser 145 150 155 160 Gly Pro Leu Pro Glu Glu Ile Val Lys Leu Glu Lys Leu Lys Tyr Leu 165 170 175 Hls Leu Ala Gly Asn Tyr Phe Ser Gly Thr Ile Pro Glu Ser Tyr Ser 180 185 190 Glu Phe Gln Ser Leu Glu Phe Leu Gly Leu Asn Ala Asn Ser Leu Thr 195 200 205 Gly Arg Val Pro Glu Ser Leu Ala Lys Leu Lys Thr Leu Lys Glu Leu 210 215 220 His Leu Gly Tyr Ser Asn Ala Tyr GI u Gly Gly Ile Pro Pro Ala Phe 225 230 235 240 Gly Ser Met Glu Asn Leu Arg Leu Leu Glu Met Ala Asn Cys Asn Leu 245 250 2 55 Thr Gly Glu Ile Pro Pro Ser Leu Gly Asn Leu Thr Lys Leu His Ser 260
265
270
1620 1680 17 4 0 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 Leu Phe Val Gln Met Asn Asn Leu Thr Gly Thr Ile Pro Pro Glu Leu 275 280 285 Ser Ser Met Met Ser Leu Met Ser Leu Asp Leu Ser Ile Asn Asp Leu 290 295 300 Thr Gly Glu Ile Pro Glu Ser Phe Ser Lys Leu Lys Asn Leu Thr Leu 305 310 315 320 Met Asn Phe Phe Gln Asn Lys Phe Arg Gly Ser Leu Pro Ser Phe Ile 325 330 335 Gly Asp Leu Pro Asn Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe 340 345 350 Ser Phe Val Leu Pro His Asn Leu Gly Gly Asn Gly Arg Phe Leu Tyr 355 360 365 Phe Asp Val Thr Lys Asn His Leu Thr Gly Leu Ile Pro Pro Asp Leu 370 37 5 380 Cys Lys Ser Gly Arg Leu Lys Thr Phe Ile Ile Thr Asp Asn Phe Phe 385 390 3 95 400 Arg Gly Pro Ile Pro Lys Gly Ile Gly Glu Cys Arg Ser Leu Thr Lys 405 410 415 Ile Arg Val Ala Asn Asn Phe Leu Asp Gly Pro Val Pro Pro Gly Val 420 425 430 Phe Gln Leu Pro Ser Val Thr He Thr Glu Leu Ser Asn Asn Arg Leu 435 440 445 Asn Gly Glu Leu Pro Ser Val Ile Ser Gly Glu Ser Leu Gly Thr Leu 450 455 460 Thr Leu Ser Asn Asn Leu Phe Thr Gly Lys Ile Pro Ala Ala Met Lys 465 470 475 480 Asn Leu Arg Ala Leu Gln Ser Leu Ser Leu Asp Ala Asn Glu Phe Ile 485 490 495 Gly Glu Ile Pro Gly Gly Val Phe Glu Ile Pro Met Leu Thr Lys Val 500 505 510 Asn Ile Ser Gly Asn Asn Leu Thr Gly Pro Ile Pro Thr Thr He Thr 515 520 52 5 His Arg Ala Ser Leu Thr Ala Val Asp Leu Ser Arg Asn Asn Leu Ala 530 535 540 Gly Glu Val Pro Lys Gly Met Lys Asn Leu Met Asp Leu Ser Ile Leu 545 550 555 560 Asn Leu Ser Arg Asn Glu Ile Ser Gly Pro Val Pro Asp Glu Ile Arg 565 570 575 Phe Met Thr Ser Leu Thr Thr Leu Asp Leu Ser Ser Asn Asn Phe Thr 580 585 590 Gly Thr Val Pro Thr Gly Gly Gln Phe Leu Val Phe Asn Tyr Asp Lys 5 95 600 605 Thr Phe Ala Gly Asn Pro Asn Leu Cys Phe Pro His Arg Ala Ser Cys 610 615 620 Pro Ser Val Leu Tyr Asp Ser Leu Arg Lys Thr Arg Ala Lys Thr Ala 625 630 635 640 Arg Val Arg Ala Ile Val Ile Gly Ile Ala Leu Ala Thr Ala Val Leu 645 650 655 Leu Val Ala Val Thr Val His Val Val Arg Lys Arg Arg Leu His Arg 660 6 65 670 Ala Gln Ala Trp Lys Leu Thr Ala Phe Gln Arg Leu Glu Ile Lys Ala 675 680 685 Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Lys Gly 690 695 700 Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro Asn Gly Thr Asp Val 705 710 715 720 Ala Ile Lys Arg Leu Val Gly Gln Gly Ser Gly Arg Asn Asp Tyr Gly 725 7 30 735 Phe Arg Ala Glu Ile Glu Thr Leu Gly Lys He Arg His Arg Asn Ile 740 745 750 Met Arg Leu Leu Gly Tyr Val Ser Asn Lys Asp Thr Asn Leu Leu Leu 755 760 765 Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Trp Leu His Gly Ala 120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
126
770
775
780
Lys Gly Gly His Leu Arg Trp Glu Met Arg Tyr Lys Ile Ala Val Glu 785 790 795 800 Ala Ala Arg Gly Leu Cys Tyr Met His His Asp Cys Ser Pro Leu Ile 805 810 815 Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ala Asp Phe 820 825 830 Glu Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Tyr Asp Pro 835 840 845 Gly Ala Ser Gln Ser Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile 850 855 860 Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val 865 870 875 880 Tyr Ser Phe Gly Val Val Leu Leu Glu Leu Ile Ile Gly Arg Lys Pro 885 890 895 Val Gly Glu Phe Gly Asp Gly Val Asp Ile Val Gly Trp Val Asn Lys 900 905 910 Thr Met Ser Glu Leu Ser Gln Pro Ser Asp Thr Ala Leu Val Leu Ala 915 920 925 Val Val Asp Pro Arg Leu Ser Gly Tyr Pro Leu Thr Ser Val Ile His 930 935 940 Met Phe Asn Ile Ala Met Met Cys Val Lys Glu Met Gly Pro Ala Arg 945 950 955 9 60 Pro Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Gln Ser 965 970 975 Asn Thr Ser Thr Gln Asp Leu Ile Asn Leu 980 985 <210> 223 <211 > 2925 <212> DNA <213> Medicago truncatula <400> 223 atgaaaaaca ttaaataatg aaagatgatg tccggtgtaa ctcttcggac actatggaca atcctcaaca atgaagaaac gaaatcgtta acaataccgg agtttaacag ttaggttatg ctccgatatc aatttagaaa cccgaactct ggggagattc aacaagcttc caggtttggg ttcatatact aaatcaaaga aacggaattg ggcccggtcc aaccgtttta ctttctaaca cagacgctgt ttaccggtgt acggttactc gaggttccta agcatatctg ttatcttaca gaccggtcat
tcacatgtta
atcttgatgc
cactcaaaga
aatgcgacga
acctttccaa
atctcaccgg
tctctcacaa
ttgaggctct
gcctgatgaa
agagttactc
ggaagattcc
agaatgctta
ttgaaatttc
acctcgactc
cttcaatgcg
cagaaacctt
gcggttcaat
aaaacaattt
ttgacgttac
agttgaaaac
gcccgtgtaa
caccggggat
acggccaact
atttatttac
tactcgatgc
tgactagaat
aatgtagttc
aagggatgaa
ggaaaatccc
acaattttac
ttgccggaaa
tttgctacta
gttgctaaag
ctggaaattt
agatcaacgt
ggagatcgga
cgagcttcca
cctcttctcc
agatgcttat
actcaagtac
ggagtttcag
taagagtttg
ctccggtgga
taacgctaac
cttgtttttg
gagtctcatg
ctcaaagctg
tccagcgttc
ctcttttgta
gaagaatcac
gtttatcgtt
gtcacttgaa
ttttcagttg
accaacggag
cgggaggatt
caatcagttt
caacataagt
actgactgca
gaatctgaag
tgatgagatt
cggaattgtc
tcctagccta
ttgtgcatgt
ctaaaaaaat
tcaacttctg
gtgattgctt
gagttgaaca
actgagctat
ggtaacttcc
gacaataatt
ttaagttttg
aagttggaga
tcgaagttaa
attccaccgg
ctcaccggag
caaatgaaca
tcgttggatc
aaaaatctca
atcggcgatc
ttgccgcaga
ctcaccggat
actgacaact
aaaatcagag
ccttctgtac
atttctggca
ccggcgtcca
ctcggagaaa
ggcaataatc
gttgacttca
gttctaagca
agattcatga
cccacaggtg
tgtttccccc
tatttacaac caatgaaagg cttcagctca tgaacgtgac tgctcgagag ccaaacttac ccggcaacat tcgaaggtcc ctggaaactt ttttaaggct agatgctaaa agttaggttc aaattccacc acctcaccgg tctccatcaa ctctcatcaa ttcctaacct atctcggttc tgatcccacc tcttccgcgg tggctaataa agataataga attctctcgg tgaagaatct ttccggcaga tcactggtgg gccgaaacat tttttaatgt cgagtctaac gtcagttttt accaaacaac
gtgttattca
agagaaagcc
ctgttcattt
gcaagttcca
ccttacaatc
ttctcttaga
cacttttgga
tcttccagag
tttctccggt
gaactataac
ggaactccaa
aatcaaatct
gagtcttgga
aacaattcca
cggactctca
tttcttccag
cgaaacgctt
aaacggaaag
ggagttatgc
tccaatacct
ctacttggac
gcttggaaat
gaatctcgct
ccgatcactg
ggtctttgct
aattccaaag
gcttaccggt
ttcgcataat
gacgctggat
ggtcttcaac
atgttcttca 1980
2040
2100
2160
2220
2280
2340
2400
2460
2520
2580
2640
2700
2 7 60
2820
2880
127
ttgctctatc gttcgagaaa aagccatgca aaggagaaag ctgtcgtcat agcaatcgtc
ttcgccacag cggtgttaat ggtaattgta acactgcaca tgatgaggaa gaggaagcgt
cacatggcaa aagcatggaa gctaacagcg tttcagaagt tggaattcag agcagaggaa
gtagtggagt gtctgaaaga agagaacata ataggaaaag gaggagctgg gattgtctac
agagggtcca tggcaaacgg aacagacgtt gcgataaagc gtttagttgg acaaggaagt
ggtagaaatg attatggatt caaagctgag atagagacat tgggaaggat tagacacaga
aacataatga ggcttttggg atatgtttca aacaaggata caaatttgtt gttgtatgag
tacatgccta atggtagttt aggtgagtgg cttcatggtg caaaaggttg tcatttgagt
tgggaaatga ggtacaaaat tgctgtggaa gctgctaagg gactttgcta tttgcaccat
gattgttcac ctcttatcat tcatagggat gttaagtcta ataatatatt gcttgatgct
gattttgagg ctcatgttgc tgattttgga cttgctaagt tcttgtatga tccaggtgct
tctcaatcca tgtcctcaat tgctggctcc tacggctaca ttgctccaga atatgcatac
actctcaaag tggatgaaaa aagtgatgtg tatagtttcg gagtggtgct attggagctg
ataataggaa ggaagccagt tggtgaattt ggagatggag tagacatcgt tggatggatc
aataaaactg aattagaact ttatcagcca tcagataaag cattagtgtc agcagtggtg
gacccacgac tcaatggata ccctttgact agtgttatct acatgttcaa catagctatg
atgtgtgtta aagaaatggg acctgcaagg cctaccatga gggaagttgt tcatatgctc
actaatccac ctcactctac aagtcacaac ttgattaatc tctag 2925
<210> <211> <2 12> <213> <4 00> Met 1
224
974
PRT
Medicago truncatula 224
5
10
15
20
25
30
35
40
45
50
5 5
60
65
70
75
85
90
95
100
105
110
115
120
125
130
135
14 (
145
150
155
165
170
175
180
185
190
195
200
205
210
215
220
225
230
235
245
250
2 55
260
2 65
270
2.75
280
28 5
290
295
300
305
31 (
315
Leu Leu Cys Met Leu Phe Thr Asp Ala Leu Leu Lys Leu Lys Asp Asp Ala Leu Lys Asp Trp Cys Ser Phe Ser Gly Val Lys Leu Asn Val Thr Gln Val Pro Gly Glu Leu Asn Met Leu Glu Thr Gly Glu Leu Pro Thr Glu Leu Asn Ile Ser Hls Asn Leu Thr Phe Gly Met Lys Lys Leu Phe Glu Gly Pro Leu Pro Glu 160 Tyr Leu Ser Phe Ala Gly Asn Tyr Ser Glu Phe Gln Lys Leu Leu Thr Gly Lys Ile Pro Lys Glu Leu Gln Leu Gly Tyr Glu Glu Leu Gly Ser Ile Lys Ser 240 Asn Leu Thr Gly Glu Ile Pro Asp Ser Leu Phe Leu Gln Met Glu Leu Ser Ser Met Arg Ser Gly Leu Ser Gly Glu Ile Pro Thr Leu Ile Asn Phe Phe Gln 320 Asn Lys Leu Arg Gly Ser Ile Pro Ala Phe Ile Gly Asp Leu Pro Asn 325 330 335 Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe Ser Phe Val Leu Pro 340 345 350 Gln Asn Leu Gly Ser Asn Gly Lys Phe Ile Tyr Phe Asp Val Thr Lys 355 360 365 Asn His Leu Thr Gly Leu Ile Pro Pro Glu Leu Cys Lys Ser Lys Lys 37 0 375 380 Leu Lys Thr Phe Ile Val Thr Asp Asn Phe Phe Arg Gly Pro Ile Pro 385 390 395 400 Asn Gly Ile Gly Pro Cys Lys Ser Leu Glu Lys Ile Arg Val Ala Asn 405 410 415 Asn Tyr Leu Asp Gly Pro Val Pro Pro Gly Ile Phe Gln Leu Pro Ser 420 425 430 Val Gln Ile Ile Glu Leu Gly Asn Asn Arg Phe Asn Gly Gln L e U Pjio 435 440 445 Thr Glu Ile Ser Gly Asn Ser Leu Gly Asn Leu Ala Leu Ser Asn Asn 450 455 460 Leu Phe Thr Gly Arg Ile Pro Ala Ser Met Lys Asn Leu Arg Ser Leu 465 470 475 480 Gln Thr Leu Leu Leu Asp Ala Asn Gln Phe Leu Gly Glu Ile Pro Ala 485 4 90 495 Glu Val Phe Ala Leu Pro Val Leu Thr Arg Ile Asn Ile Ser Gly Asn 500 505 510 Asn Leu Thr Gly Gly Ile Pro Lys Thr Val Thr Gln Cys Ser Ser Leu 515 520 52 5 Thr Ala Val Asp Phe Ser Arg Asn Met Leu Thr Gly Glu Val Pro Lys 530 535 540 Gly Met Lys Asn Leu Lys Val Leu Ser Ile Phe Asn Val Ser His Asn 545 550 555 560 Ser Ile Ser Gly Lys Ile Pro Asp Glu Ile Arg Phe Met Thr Ser Leu 565 570 575 Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Thr Gly Ile Val Pro Thr 580 5 8 5 Si 90 Gly Gly Gln Phe Leu Val Phe Asn Asp Arg Ser Phe Ala Gly Asn Pro 595 600 605 Ser Leu Cys Phe Pro His Gln Thr Thr Cys Ser Ser Leu Leu Tyr Arg 610 615 620 Ser Arg Lys Ser His Ala Lys Glu Lys Ala Val Val Ile Ala Ile Val 625 630 635 640 Phe Ala Thr Ala Val Leu Met Val Ile Val Thr Leu His Met Met Arg 645 650 655 Lys Arg Lys Arg His Met Ala Lys Ala Trp Lys Leu Thr Ala Phe Gln 660 665 670 Lys Leu Glu Phe Arg Ala Glu Glu Val Val Glu Cys Leu Lys Glu Glu 675 680 685 Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met 690 695 700 Ala Asn Gly Thr Asp Val Ala Ile Lys Arg Leu Val Gly Gln Gly Ser 705 710 715 720 Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly Arg 725 730 735 Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly Tyr Val Ser Asn Lys 740 745 750 Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly 755 760 765 Glu Trp Leu His Gly Ala Lys Gly Cys His Leu Ser Trp Glu Met Arg 770 775 780 Tyr Lys Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His 785 7 90 7 95 800 Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile 805 810 815 Leu Leu Asp Ala Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala 820 825 830
Lys Phe Leu Tyr Asp Pro Gly Ala Ser Gln Ser 835 840 845
Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala 850 855 860
Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val 865 870 875 880
Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly 885 890 895
Val Gly Trp Ile Asn Lys Thr Glu Leu Glu Leu 900 905 910
Lys Ala Leu Val Ser Ala Val Val Asp Pro Arg 915 920 925
Leu Thr Ser Val Ile Tyr Met Phe Asn Ile Ala 930 935 940
Glu Met Gly Pro Ala Arg Pro Thr Met Arg Glu 945 950 955 960
Thr Asn Pro Pro His Ser Thr Ser His Asn Leu 965 970
225 2985 DNA
Oryza satíva
Met Ser Tyr Thr Val Leu Asp Gly Tyr Gln Leu Asn Met Met Val Val Ile Asn
Ser Ile Ala Leu Lys Val Leu Glu Leu Val Asp Ile Pro Ser Asp Gly Tyr Pro Cys Val Lys His Met Leu Leu
<2 10> <211> <212> <213> <4 00>
225
atgcctccta ctctcctcct cctcctcctc ctcctcccac
cgcgacatct acgcgctcgc caagctcaag gcggcgctcg
gccccaccgc cgctcgccga ctgggacccg gccgcgacct tccggcgtca cctgcgacgg ccgctcccgc gtcgtcgcca
ctccactccg gctacctccc gcccgagatc gccctccttg
atcgccgcct gctgcctccc cggccacgtc cccctcgagc
cgccacctca acctctccaa caacaacctt tccggccact
ggtggcgcct ccccctactt cccctcgctc gagctcatcg
tcagggttgc ttcctccctt ctccgcttca cacgctcgcc
ggcaactact tcaccggcgc aatcccggac agctatggcg
cttggactca acggcaacac gctctccggc catgtccccg
cgcctccgcg agatgtacat cggatactac aaccagtacg
ttcggcgacc tcggcgcgct cctccgcctc gacatgagca
gtcccgccgg agctcggccg actccagcgc ctcgacacgc
ctctccggcg agataccgcc gcagctcggc gatctcagca
tccgtcaacg acctcgccgg cgagatccct cccagcctcg
ctcctcaacc tcttccggaa ccacctccgc ggcagcatac
gcgcagctcg aggtgctgca gctgtgggac aacaacctca
ctcgggaaga acggccgcct caagacgctc gacctggcca
atcccggcgg acctctgcgc cggccggcgg ctggagatgc
ctgttcggcc ccatcccgga ctcgctcggc gactgcaaga
gccaagaact tcttgaccgg cccggttccc gccgggctct
atggtggagc tcaccgacaa cctgctcacc ggcgagctcc
aagatcggca tgctgctgct ggggaacaat gggatcggtg
ggcaacctcc cggcgctgca gacgctgtcg ctggagtcca
ccaccggaga tcggcaatct caagaacctg tccaggctca
accggcgcca ttccagacga gctcatccgc tgcgcctccc
cgtaacggct tctccggcga gataccggag agcatcacgt
ctgaacgtgt ccaggaacag gctcaccggc gagctcccgc
agcctcacga cgctcgacgt gtcgtacaac agcctctcgg
cagttcttgg tgttcaacga gagctcgttc gtcggcaacc
gtggccgacg cgtgccctcc gtccatggcc ggcggcggcg
cggctgcggt gggactcgaa gaagatgctg gtggcgctgg
gcggtggcgt tcctgggcgc gaggaagggg tgctcggcgt
cggtcggggg cgtggaagat gacggcgttc cagaagctgg
gtggagtgcg tgaaggagga caacatcatc gggaagggcg
ggcgtgacgc gcggggcgga gctggcgatc aagcggttgg
cacgaccggg ggttctcggc ggaggtgacg acgctgggga
gtgaggctgc tggggttcgt gtcgaacagg gagacgaacc
cctccctcgc
tcccatcccc
cccccgcgca
tcaacctcac
actccctcgc
tccccaccct
tccccgtccc
acgcttacaa
tccgctacct
acctcgccgc
tctccctctc
acggcggcgt
gctgcaacct
tcttcctgca
gcctcgcgtc
ccaacctctc
cggacttcgt
ccggcaacat
ccaaccacct
tcgtgctcat
cgctcacgcg
tcaacctccc
cggacgtgat
gccgcatccc
acaacttctc
acgtcagcgg
tcgccgccgt
cgctcaagat
cggagatgtc
gccccgtgcc
cggggctgtg
gcggcgcggg
tggcggcgtt
ggcggtcggc
agttctcggc
gcgcggggat
tggggcgcgg
ggatcaggca
tgctgctgta
ctcccccgac
ctccgccacc
ctgcaccttc
cgccctcccg
caacctcacc
cccctctctc
cgactccggc
caacaacctc
ccacctcggc
gctcgagtac
ccgcctcacc
cccgccggag
caccggcccc
gtggaaccgc
gctcgacctc
caacctcaag
cgccggcttc
ccccgccggg
caccggcccc
ggagaacggc
cgtccgcctc
gcaggccaac
cggcggcgac
tccggccatc
cggagcgctg
caacgcgctc
cgacctcagc
actgtgcacg
caacatgacg
gatgcagggg
cggcggcccc
gtcccagctg
cgcggcggtg
ggcgcggcgg
ggaggacgtg
cgtgtaccac
cggcggcgag
ccggaacatc
cgagtacatg
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340 ccgaatgggt cgctggggga gatgctccat ggcgggaagg gggggcacct cgggtgggag gcgagggcgc gggtggcggc ggaggcggcg tgcggcctct gctacctcca ccatgactgc gccccgagga tcatccaccg cgacgtcaag tccaacaaca tcctcctcga ctccgccttc gaggcgcacg tcgccgactt cggcctcgcc aagttcctcg gcggcgccac ctccgagtgc atgtccgcca ttgctggctc ctacggctac atcgcgccag agtacgcata cacgctgcga gtggacgaga agagcgacgt gtatagcttc ggtgtggtgc tattggagct catcaccgga cgccgccccg tgggcgggtt cggtgacggc gtggacatcg tgcactgggt ccgcaaggtg accgccgagc tgccggacaa ctccgacacg gcggccgtcc tcgccgtggc cgaccgccgc ctgacgccgg agccggtggc gctgatggtg aacctgtaca aggtggccat ggcgtgcgtg gaggaggcga gcacggcccg gcccaccatg cgcgaggtcg tccacatgct ctccaaccca aactcggc.cc agcccaatag tggtgacctc ctcgtcacct tctga 2985
<210> 226 <211> 994 <212> PRT <213> Oryza satíva <4 00> 226
Met Pro Pro Thr Leu Leu Leu Leu Leu Leu Leu Leu Pro Pro Ser Leu 10 15
Ala Ser Pro Asp Arg Asp Ile Tyr Ala Leu Ala Lys Leu Lys Ala Ala 20 25 30
Leu Val Pro Ser Pro Ser Ala Thr Ala Pro Pro Pro Leu Ala Asp Trp 35 40 45
Asp Pro Ala Ala Thr Ser Pro Ala His Cys Thr Phe Ser Gly Val Thr
50 55 60
Cys Asp Gly Arg Ser Arg Val Val Ala Ile Asn Leu Thr Ala Leu Pro 65 70 75 80
Leu His Ser Gly Tyr Leu Pro Pro Glu Ile Ala Leu Leu Asp Ser Leu 85 90 95
Ala Asn Leu Thr Ile Ala Ala Cys Cys Leu Pro Gly His Val Pro Leu 100 105 110
Glu Leu Pro Thr Leu Pro Ser Leu Arg His Leu Asn Leu Ser Asn Asn 115 120 125
Asn Leu Ser Gly His Phe Pro Val Pro Asp Ser Gly Gly Gly Ala Ser 130 135 140
Pro Tyr Phe Pro Ser Leu Glu Leu Ile Asp Ala Tyr Asn Asn Asn Leu 145 150 155 160
Ser Gly Leu Leu Pro Pro Phe Ser Ala Ser His Ala Arg Leu Arg Tyr 165 170 175
Leu His Leu Gly Gly Asn Tyr Phe Thr Gly Ala Ile Pro Asp Ser Tyr 180 185 190
Gly Asp Leu Ala Ala Leu Glu Tyr Leu Gly Leu Asn Gly Asn Thr Leu 195 200 205
Ser Gly His Val Pro Val Ser Leu Ser Arg Leu Thr Arg Leu Arg Glu 210 215 220
Met Tyr Ile Gly Tyr Tyr Asn Gln Tyr Asp Gly Gly Val Pro Pro Glu 225 230 235 240
Phe Gly Asp Leu Gly Ala Leu Leu Arg Leu Asp Met Ser Ser Cys Asn 245 250 255
Leu Thr Gly Pro Val Pro Pro Glu Leu Gly Arg Leu Gln Arg Leu Asp 260 265 270
Thr Leu Phe Leu Gln Trp Asn Arg Leu Ser Gly Glu Ile Pro Pro Gln 275 280 285
Leu Gly Asp Leu Ser Ser Leu Ala Ser Leu Asp Leu Ser Val Asn Asp 290 295 300
Leu Ala Gly Glu He Pro Pro Ser Leu Ala Asn Leu Ser Asn Leu Lys 305 310 315 320
Leu Leu Asn Leu Phe Arg Asn His Leu Arg Gly Ser Ile Pro Asp Phe 325 330 335
Val Ala Gly Phe Ala Gln Leu Glu Val Leu Gln Leu Trp Asp Asn Asn 34 0 34 5 35 0
Leu Thr Gly Asn Ile Pro Ala Gly Leu Gly Lys Asn Gly Arg Leu Lys 355 360 365
Thr Leu Asp Leu Ala Thr Asn His Leu Thr Gly Pro Ile Pro Ala Asp
2400 2460 2520 258 0 2 64 0 2700 2760 2820 2880 2940 370 375 380
Leu Cys Ala Gly Arg Arg Leu Glu Met Leu Val Leu Met Glu Asn Gly 385 390 395 4 00 Leu Phe Gly Pro Ile Pro Asp Ser Leu Gly Asp Cys Lys Thr Leu Thr 405 410 415 Arg Val Arg Leu Ala Lys Asn Phe Leu Thr Gly Pro Val Pro Ala Gly 420 425 430 Leu Phe Asn Leu Pro Gln Ala Asn Met Val Glu Leu Thr Asp Asn Leu 435 440 445 Leu Thr Gly Glu Leu Pro Asp Val Ile Gly Gly Asp Lys Ile Gly Met 4 50 4 55 460 Leu Leu Leu Gly Asn Asn Gly Ile Gly Gly Arg Ile Pro Pro Ala Ile 465 470 475 480 Gly Asn Leu Pro Ala Leu Gln Thr Leu Ser Leu Glu Ser Asn Asn Phe 485 4 90 495 Ser Gly Ala Leu Pro Pro Glu Ile Gly Asn Leu Lys Asn Leu Ser Arg 500 5 05 510 Leu Asn Val Ser Gly Asn Ala Leu Thr Gly Ala Ile Pro Asp Glu Leu 515 520 525 Ile Arg Cys Ala Ser Leu Ala Ala Val Asp Leu Ser Arg Asn Gly Phe 530 535 540 Ser Gly Glu Ile Pro Glu Ser Ile Thr Ser Leu Lys Ile Leu Cys Thr 545 550 555 5 60 Leu Asn Val Ser Arg Asn Arg Leu Thr Gly Glu Leu Pro Pro Glu Met 565 570 575 Ser Asn Met Thr Ser Leu Thr Thr Leu Asp Val Ser Tyr Asn Ser Leu 580 585 590 Ser Gly Pro Val Pro Met Gln Gly Gln Phe Leu Val Phe Asn Glu Ser 595 600 605 Ser Phe Val Gly Asn Pro Gly Leu Cys Gly Gly Pro Val Ala Asp Ala 610 615 620 Cys Pro Pro Ser Met Ala Gly Gly Gly Gly Gly Ala Gly Ser Gln Leu 625 630 635 64 0 Arg Leu Arg Trp Asp Ser Lys Lys Met Leu Val Ala Leu Val Ala Ala 645 650 655 Phe Ala Ala Val Ala Val Ala Phe Leu Gly Ala Arg Lys Gly Cys Ser 660 6 65 670 Ala Trp Arg Ser Ala Ala Arg Arg Arg Ser Gly Ala Trp Lys Met Thr 675 680 685 Ala Phe Gln Lys Leu Glu Phe Ser Ala Glu Asp Val Val Glu Cys Val 690 695 700 Lys Glu Asp Asn Ile He Gly Lys Gly Gly Ala Gly Ile Val Tyr His 705 710 715 720 Gly Val Thr Arg Gly Ala Glu Leu Ala Ile Lys Arg Leu Val Gly Arg 725 730 735 Gly Gly Gly Glu His Asp Arg Gly Phe Ser Ala Glu Val Thr Thr Leu 740 745 750 Gly Arg Ile Arg His Arg Asn He Val Arg Leu Leu Gly Phe Val Ser 7 55 760 765 Asn Arg Glu Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser 770 775 780 Leu Gly Glu Met Leu His Gly Gly Lys Gly Gly His Leu Gly Trp Glu 785 790 795 800 Ala Arg Ala Arg Val Ala Ala Glu Ala Ala Cys Gly Leu Cys Tyr Leu 805 810 815 His His Asp Cys Ala Pro Arg Ile Ile His Arg Asp Val Lys Ser Asn 820 825 830 Asn He Leu Leu Asp Ser Ala Phe Glu Ala His Val Ala Asp Phe Gly 835 840 845 Leu Ala Lys Phe Leu Gly Gly Ala Thr Ser Glu Cys Met Ser Ala Ile 8 5 ι0 855 860 Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Arg 865 870 875 880 Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu 885 890 895 Leu Ile Thr Gly Arg Arg Pro Val Gly Gly Phe Gly Asp Gly Val Asp 900 905 910 Ile Val His Trp Val Arg Lys Val Thr Ala Glu Leu Pro Asp Asn Ser 915 920 925 Asp Thr Ala Ala Val Leu Ala Val Ala Asp Arg Arg Leu Thr Pro Glu 930 935 94 0 Pro Val Ala Leu Met Val Asn Leu Tyr Lys Val Ala Met Ala Cys Val 945 950 955 960 Glu Glu Ala Ser Thr Ala Arg Pro Thr Met Arg Glu Val Val His Met 965 970 975 Leu Ser Asn Pro Asn Ser Ala Gln Pro Asn Ser Gly Asp Leu Leu Val 980 985 990 227
2931
DNA
Písum satíva 227
Thr Phe <210>
<211>
<212>
<213>
<400>
atgaaaagta tcacgtgtta tttgctggta ttcttctgcg tgttatttac accatgtttt tcaataaccg atctcgatgc gttgctaaag cttaaagaat caatgaaagg agagaaatca aaacatcccg attcactcgg agactggaag ttttccgctt ctggttcagc tcactgctca ttttccggtg taacgtgcga tcaagataac cgagtgataa ctctgaacgt gacgcaagtt ccactcttcg gaagaatttc taaggagatt ggagtgttgg ataagcttga gagactcatc atcaccatgg ataatctcac tggcgagctt ccgtttgaga tatccaatct tacctctctt aaaatcctta acatctctca caacaccttc tctggtaact tccccggcaa catcactctc cgtatgacga aacttgaggt tctagatgct tatgacaata gcttcactgg tcatcttcct gaggaaatcg tcagcctcaa ggaactcacg atcttatgtc tggccggaaa ctatttcacc ggtacaatac ccgagagtta ctcggaattt cagaagttgg agattttaag cataaacgca aacagtttat cggggaagat tccgaagagc ttatccaaat taaagacgct gaaggaactc cgtttaggtt acaacaacgc ttacgatggc ggagttccac cggagtttgg ttcattgaaa tctctccgat atcttgaggt gtctaactgt aacctcaccg gagaaattcc accgagtttt ggaaatttag aaaacctaga cagcttgttc ttgcaaatga acaacctcac cggaataatt ccaccggaac tctcttccat gaagagtctc atgtcgttgg atctctccaa caacgctctc tcaggagaga ttccagagag cttctcaaat ctcaaaagcc tcactctctt gaatttcttc cagaacaagt ttcgcggttc tattccggca ttcataggcg atcttcctaa cctggaaacg cttcaggttt gggaaaacaa tttctctttt gtattgccac aaaatctcgg ttcaaacgga aagttcattt tcttcgacgt tacgaagaat cacctcaccg gattgattcc accggatttg tgcaaatcga agaaattgca aacgtttata gttacggata acttcttcca cggtccaatc cctaaaggaa tcggcgcgtg taagtcactt ctcaaaatca gagttgctaa taactactta gacgggccgg tcccacaagg gatttttcaa atgccttctg taacgataat agagcttgga aataaccgtt ttaacggcca actaccttct gaagtttccg gcgttaatct cgggattctc actatctcta acaatttatt caccgggagg attcccgctt caatgaagaa tctcatatca cttcagactc tgtggcttga cgcaaatcag ttcgtcggag aaattccaaa ggaagtcttt gacttaccag tgttaacgaa gttcaacata agtggtaaca acctcaccgg tgtaatccca acgacggttt ctcagtgtag atcgttgaca gccgttgact tcagccggaa catgattacc ggcgaggttc ccaggggaat gaagaatctg aaggttctca gcatttttaa cctttcacat aacaacatat cgggtctaat ccccgacgag attcgattca tgacgagtct caccacgctg gatctatcct acaacaattt caccggaata gtccccaccg gcggtcagtt tttggttttc aacgacaggt cgtttttcgg aaaccctaac ctctgtttcc cacaccaatc ctcatgctct tcctatacct ttccctcgag taaaagccac gcgaaggtga aggccattat taccgcaatt gctctcgcca cagcagtgtt actggtaata gcgacgatgc acatgatgag gaagagaaag cttcatatgg cgaaagcatg gaagttaaca gcatttcaga gactagactt caaagcagag gaagttgtgg agtgtttgaa agaagagaac ataataggaa aaggaggagc cgggatcgtg tacagagggt ccatgcccaa cggaacagac gtagcgataa agcgtttagt tggacaagga agtgggagaa acgattacgg tttcaaagca gagatagaaa cattgggtag aatcagacac agaaacataa tgaggctatt gggttacgtt tctaataagg acacaaattt gttgctgtat gagtacatgc cgaatggtag tttaggggaa tggcttcatg gtgcaaaagg ctgtcatttg agttgggaaa tgaggtataa aattgcagtg gaagctggta aaggactttg ctatttgcac catgattgtt cacctcttat tattcatagg gatgttaagt ccaacaatat attgctagat gctgattttg aagcccatgt: tgctgatttt ggacttgcaa agtttttata tgacccaggt gcttctcagt ccatgtcctc tattgctggc tcctacggct acattgctcc agagtatgct
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340
2400
2460
2520
2580 tatacgttga aagtggatga gaaaagcgat gtgtatagct ttggagtggt gctattggag ctgatcatag gaaggaaacc agtgggtgag tttggagatg gagtggacat cgttggatgg atcaataaaa ctgaattaga gctttatcag ccgtcagata aagcattggt gtcggcggtg gtggacccgc ggctcactgg atacccaatg gcaagtgtta tctacatgtt caacatagct atgatgtgtg ttaaagaaat gggacccgca aggcctacca tgagggaagt agttcatatg ctcactaatc cacctcagtc taccactcat aacaacctta ttaatctcta g 2931
<210> 228 <211> 976 <212> PRT <213> Písum satíva <400> 228
Met Lys Ser Ile Thr Cys Tyr Leu Leu Val Phe Phe Cys Val Leu Phe 1 5 10 15 Thr Pro Cys Phe Ser Ile Thr Asp Leu Asp Ala Leu Leu Lys Leu Lys 20 25 30 Glu Ser Met Lys Gly Glu Lys Ser Lys His Pro Asp Ser Leu Gly Asp 35 40 4 5 Trp Lys Phe Ser Ala Ser Gly Ser Ala His Cys Ser Phe Ser Gly Val 50 55 60 Thr Gys Asp Gln Asp Asn Arg Val Ile Thr Leu Asn Val Thr Gln Val 65 70 75 80 Pro Leu Phe Gly Arg Ile Ser Lys Glu Ile Gly Val Leu Asp Lys Leu 85 90 95 Glu Arg Leu Ile Ile Thr Met Asp Asn Leu Thr Gly Glu Leu Pro Phe 100 105 110 Glu Ile Ser Asn Leu Thr Ser Leu Lys Ile Leu Asn Ile Ser His Asn 115 120 125 Thr Phe Ser Gly Asn Phe Pro Gly Asn Ile Thr Leu Arg Met Thr Lys 130 135 140 Leu Glu Val Leu Asp Ala Tyr Asp Asn Ser Phe Thr Gly His Leu Pro 145 150 155 160 Glu Glu Ile Val Ser Leu Lys Glu Leu Thr Ile Leu Cys Leu Ala Gly 165 170 175 Asn Tyr Phe Thr Gly Thr Ile Pro Glu Ser Tyr Ser Glu Phe Gln Lys 180 185 190 Leu Glu Ile Leu Ser Ile Asn Ala Asn Ser Leu Ser Gly Lys Ile Pro 195 200 205 Lys Ser Leu Ser Lys Leu Lys Thr Leu Lys Glu Leu Arg Leu Gly Tyr 210 215 220 Asn Asn Ala Tyr Asp Gly Gly Val Pro Pro Glu Phe Gly Ser Leu Lys 225 230 235 240 Ser Leu Arg Tyr Leu Glu Val Ser Asn Cys Asn Leu Thr Gly Glu Ile 245 250 255 Pro Pro Ser Phe Gly Asn Leu Glu Asn Leu Asp Ser Leu Phe Leu Gln 260 265 270 Met Asn Asn Leu Thr Gly Ile Ile Pro Pro Glu Leu Ser Ser Met Lys 275 280 285 Ser Leu Met Ser Leu Asp Leu Ser Asn Asn Ala Leu Ser Gly Glu Ile 290 295 300 Pro Glu Ser Phe Ser Asn Leu Lys Ser Leu Thr Leu Leu Asn Phe Phe 305 310 315 320 Gln Asn Lys Phe Arg Gly Ser Ile Pro Ala Phe Ile Gly Asp Leu Pro 325 330 335 Asn Leu Glu Thr Leu Gln Val Trp Glu Asn Asn Phe Ser Phe Val Leu 340 345 350 Pro Gln Asn Leu Gly Ser Asn Gly Lys Phe Ile Phe Phe Asp Val Thr 355 360 365 Lys Asn His Leu Thr Gly Leu Ile Pro Pro Asp Leu Cys Lys Ser Lys 370 37 5 380 Lys Leu Gln Thr Phe Ile Val Thr Asp Asn Phe Phe His Gly Pro Ile 385 390 395 400 Pro Lys Gly Ile Gly Ala Cys Lys Ser Leu Leu Lys Ile Arg Val Ala 405 410 4 15 2640
2700
2760
2820
2880 Asn Asn Tyr Leu Asp Gly Pro Val Pro Gln Gly Ile Phe Gln Met Pro 420 425 430
Ser Val Thr Ile Ile Glu Leu Gly Asn Asn Arg Phe Asn Gly Gln Leu 435 440 445
Pro Ser Glu Val Ser Gly Val Asn Leu Gly Ile Leu Thr Ile Ser Asn 450 455 460
Asn Leu Phe Thr Gly Arg Ile Pro Ala Ser Met Lys Asn Leu Ile Ser 465 470 475 480
Leu Gln Thr Leu Trp Leu Asp Ala Asn Gln Phe Val Gly Glu Ile Pro 485 490 495
Lys Glu Val Phe Asp Leu Pro Val Leu Thr Lys Phe Asn Ile Ser Gly 500 505 510
Asn Asn Leu Thr Gly Val Ile Pro Thr Thr Val Ser Gln Cys Arg Ser 515 520 525
Leu Thr Ala Val Asp Phe Ser Arg Asn Met Ilc Thr Gly Glu Val Pro 530 535 540
Arg Gly Met Lys Asn Leu Lys Val Leu Ser Ile Phe Asn Leu Ser His 545 550 555 560
Asn Asn Ile Ser Gly Leu Ile Pro Asp Glu Ile Arg Phe Met Thr Ser 565 570 575
Leu Thr Thr Leu Asp Leu Ser Tyr Asn Asn Phe Thr Gly Ile Val Pro 580 585 590
Thr Gly Gly Gln Phe Leu Val Phe Asn Asp Arg Ser Phe Phe Gly Asn 595 600 605
Pro Asn Leu Cys Phe Pro His Gln Ser Ser Cys Ser Ser Tyr Thr Phe 610 615 620
Pro Ser Ser Lys Ser His Ala Lys Val Lys Ala Ile Ile Thr Ala Ile 625 630 635 640
Ala Leu Ala Thr Ala Val Leu Leu Val Ile Ala Thr Met His Met Met 645 650 655
Arg Lys Arg Lys Leu His Met Ala Lys Ala Trp Lys Leu Thr Ala Phe 660 665 670
Gln Arg Leu Asp Phe Lys Ala Glu Glu Val Val Glu Cys Leu Lys Glu 675 680 685
Glu Asn Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser 690 695 700
Met Pro Asn Gly Thr Asp Val Ala Ile Lys Arg Leu Val Gly Gln Gly 705 710 715 720
Ser Gly Arg Asn Asp Tyr Gly Phe Lys Ala Glu Ile Glu Thr Leu Gly 725 730 735
Arg Ile Arg His Arg Asn Ile Met Arg Leu Leu Gly Tyr Val Ser Asn 740 745 750
Lys Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu 755 760 765
Gly Glu Trp Leu His Gly Ala Lys Gly Cys His Leu Ser Trp Glu Met 770 775 780
Arg Tyr Lys Ile Ala Val Glu Ala Gly Lys Gly Leu Cys Tyr Leu His 785 790 795 800
His Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn 805 810 815
Ile Leu Leu Asp Ala Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu 820 825 830
Ala Lys Phe Leu Tyr Asp Pro Gly Ala Ser Gln Ser Met Ser Ser Ile 835 840 845
Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys 850 855 860
Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu 8 65 870 875 880
Leu Ile Ile Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp 885 890 895
Ile Val Gly Trp Ile Asn Lys Thr Glu Leu Glu Leu Tyr Gln Pro Ser 900 905 910
Asp Lys Ala Leu Val Ser Ala Val Val Asp Pro Arg Leu Thr Gly Tyr 915 920 925 Pro Met Ala Ser Val Ile Tyr Met Phe Asn Ile Ala Met Met Cys Val 930 935 940 Lys Glu Met Gly Pro Ala Arg Pro Thr Met Arg Glu Val Val His Met 945 950 955 960 Leu Thr Asn Pro Pro Gln Ser Thr Thr His Asn Asn Leu Ile Asn Leu 965 970 975 <210>
<2 11>
<212>
<213>
<4 00> atgagaacat tacagtgatc ggccttcaag gtcacgtgtg ggttcaattc aataatctca aatatttcca ctgcttgagg gtaaagctga ccggaggagt tcaggcaaag tactttaacc cttcttgaca acccatctgc ttatctggtc ataccagaga ctgcacggtc tggggcaaca atgctggatg gggaaattga attggccagt atccctgctg ttctctggcg aacaatcgga ctgtcactgg tccctcacca tcccactgca cctaagaaga actggtcaac tacaacaatt tcatttctcg catggccata gtcactgttt aaatcacggg cttgagtgct gggtcaatgc ggaagaagtg aatattgtaa tacatgccta tgggagac.ta gattgctcgc gattttgagg tcagagtgca acactgaaag atagcaggga aggaagacca gaccccaggc. ctgtgtgtta accaatcctc <210> 230 <211> 973
229 2922 DNA
Popu Iu s 229
ttctgtgctt ttgaagtcct attgggtggc atgaggactc ctccagagat cggggggatt acaatgttat ttcttgatgt aaaatctcaa actcggagat taccttcaag gttatgaggg tggcttcctg attcgttgtt taattagctt gtttttcaga caatcccaga acttcacttt tgtctattaa cgacgttgat gcaagtcctt ggatatttaa agcttccacc tcacaggtaa acacgaacag agatcaacat catcacttac ttgccaaact taccaggtga tatttggcag gaaatccaaa ggggggggtc tgctgttaat cctggaagct tgaaagagga cagagggtgt atcatggctt ggctgttggg atggaagctt gatacagaat ctttgattat ctcatgttgc tgtcctccgt tggacgaaaa gaaagccagt catcagaact ttagtgggta aagatgagag cacaatctgc
tremuloides
ttttctttta cttgaagctg ttctccagca gcgtgtggtg tgggctgttg tccagtggag tgctgggaat ttacaacaat gcatgttcat tttgagcttg cttgtccagg gagtattcca taaccttgac tcttcaagtc gaaatcactg tttgaaaaac attttttggt tgagcttcct tcacttaact tctcatgaac gctcaaaatc tttgcctttg agagatttca aatcccgcct actttctggt ccgtgctaac atccgttgat gaacgatttg aattggatac gatcccttct tctctgtgca ttttagtact agttgtgacg cactgcattc aaacattata tgatcatgta ctcggctgag gtacgtatcg aggggagctt tgctgtggag acatagggat tgattt tggt tgctggctcc gagtgatgtt cggggagttt ctctcagcca cccacttgca ctcagccagg ccccagccta
ctagtattat
aaaacctcca
tctcccacag
tctctaaacg
aacaagcttg
atagccatgc
ttccccggaa
aattttacgg
cttggaggga
gagtacttgg
ttgaagaatc
cctgaatttg
ggtgagattc
aataatctca
gatctttcga
atagaactga
gattttccga
caaaatcttg
ggattggtcc
aatttcttcc
cgaataatga
gcgacacttg
ggagatgcac
gctattggga
gaaattcctg
aacatcagag
ttcagtcaaa
agctttcttg
atgagaagcc
gccggccaat
gcgagaaata
tcaaagctaa
gtttacagat
caaaggctcg
ggcaaaggtg
gctatcaaac
attcaaactc
aataaggata
ttgcatggtt
gctgctaagg
gttaagtcca
ctcgctaagt
tatggttaca
tacagttttg
ggagatgggg
tctgatgcag
ggtgtcattc
cccaccatga
ctcgcccttt
tgttcgctcc
tgtatggaca
ctcactgtta
tgtcgtttag
tgaatcttac
tgacatctct
aaatcactct
gtgcattgcc
atttcttttc
gcttgaatgg
ttaagagctt
ggtcattaag
cttccgcttt
ctggccatat
taaacaacct
tcaatctctt
accttgaggt
gccggaatgg
cgcgggattt
ttggatcgct
ataatatgtt
ttgagttgag
taggcctttt
atctgaagaa
aagaaatctg
gtgaaatccc
acagcctcag
atctctctcg
ttacatccct
tcctggcgtt
atacttgctc
taatcactgt
tgagaaagaa
acttcaaggc
gtgctggtat
gacttgttgg
ttggaagaat
ccaacttgct
caaagggagg
gactctgtta
ataacatatt
tcttacaaga
ttgctccaga
gtgttgtgct
tggacatcgt
ctacagtctt
acttgtttaa
gggaagttgt
ag
ttgcagtgga
taatggcact
cttctctgga
acatcttcct
tctgtcaggt
caggattttg
tggcatggca
aactgaaatt
tggtacaata
taatgcgctt
gtgcgttggg
taatcttgaa
aagtcaatta
ccctcctgaa
cactggggag
tcaaaacaag
gcttcaggtt
gaagctgatg
atgcaaagga
tcctgatgaa
ttcaggaact
caataacctt
atcagtttct
cttgcagact
gggactgaag
agcttcgatt
tggggagatt
aaatcaactc
taatctctca
caatgacagt
cttcggtgat
cattgcactc
gaggctgcag
agaggacgtg
tgtctaccgt
tcgaggcagc
caggcaccga
attgtatgaa
ccatttgcag
tcttcaccac
acttgattcc
tgcaggctca
gtacgcatac
gctggagctg
gaggtgggtc
ggcagttgtg
gatagctatg
tcacatgctc
2922
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340
2400
2460
2520
2580
2640
2700
2760
2820
2880 <212> PRT
<213> Populus tremuloides <4 O0> 230
Met Arg Thr Phe Leu Cys Phe Phe Leu Leu Leu Val Leu Leu Phe Ala 1 5 10 15 Pro Cys Ser Gly Tyr Ser Asp Leu Glu Val Leu Leu Lys Leu Lys Thr 20 25 30 Ser Met Tyr Gly His Asn Gly Thr Gly Leu Gln Asp Trp Val Ala Ser 35 40 45 Pro Ala Ser Pro Thr Ala His Cys Tyr Phe Ser Gly Val Thr Cys Asp 50 55 60 Glu Asp Ser Arg Val Val Ser Leu Asn Val Ser Phe Arg His Leu Pro 65 7 0 75 80 Gly Ser Ile Pro Pro Glu Ile Gly Leu Leu Asn Lys Leu Val Asn Leu 8 5 90 95 Thr Leu Ser Gly Asn Asn Leu Thr Gly Gly Phe Pro Val Glu Ile Ala 100 105 110 Met Leu Thr Ser Leu Arg Ile Leu Asn Ile Ser Asn Asn Val Ile Ala 115 120 125 Gly Asn Phe Pro Gly Lys Ile Thr Leu Gly Met Ala Leu Leu Glu Val 130 135 140 Leu Asp Val Tyr Asn Asn Asn Phe Thr Gly Ala Leu Pro Thr Glu Ile 145 150 155 160 Val Lys Leu Lys Asn Leu Lys His Val His Leu Gly Gly Asn Phe Phe 165 170 175 Ser Gly Thr Ile Pro Glu Glu Tyr Ser Glu Ile Leu Ser Leu Glu Tyr 180 185 190 Leu Gly Leu Asn Gly Asn Ala Leu Ser Gly Lys Val Pro Ser Ser Leu 195 200 205 Ser Arg Leu Lys Asn Leu Lys Ser Leu Cys Val Gly Tyr Phe Asn Arg 210 215 220 Tyr Glu Gly Ser Ile Pro Pro Glu Phe Gly Ser Leu Ser Asn Leu Glu 225 230 235 240 Leu Leu Asp Met Ala Ser Cys Asn Leu Asp Gly Glu Ile Pro Ser Ala 245 250 2 55 Leu Ser Gln Leu Thr His Leu His Ser Leu Phe Leu Gln Val Asn Asn 260 265 270 Leu Thr Gly His Ile Pro Pro Glu Leu Ser Gly Leu Ile Ser Leu Lys 275 280 285 Ser Leu Asp Leu Ser Ile Asn Asn Leu Thr Gly Glu Ile Pro Glu Ser 290 295 300 Phe Ser Asp Leu Lys Asn Ile Glu Leu Ile Asn Leu Phe Gln Asn Lys 305 310 315 320 Leu His Gly Pro Ile Pro Glu Phe Phe Gly Asp Phe Pro Asn Leu Glu 325 330 335 Val Leu Gln Val Trp Gly Asn Asn Phe Thr Phe Glu Leu Pro Gin Asn 340 345 350 Leu Gly Arg Asn Gly Lys Leu Met Met Leu Asp Val Ser Ile Asn His 355 360 365 Leu Thr Gly Leu Val Pro Arg Asp Leu Cys Lys Gly Gly Lys Leu Thr 370 37 '5 380 Thr Leu Ile Leu Met Asn Asn Phe Phe Leu Gly Ser Leu Pro Asp Glu 385 390 395 400 Ile Gly Gln Cys Lys Ser Leu Leu Lys Ile Arg Ile Met Asn Asn Met 405 410 415 Phe Ser Gly Thr Ile Pro Ala Gly Ile Phe Asn Leu Pro Leu Ala Thr 420 425 430 Leu Val Glu Leu Ser Asn Asn Leu Phe Ser Gly Glu Leu Pro Pro Glu 435 440 445 Ile Ser Gly Asp Ala Leu Gly Leu Leu Ser Val Ser Asn Asn Arg Ile 4 50 455 460 Thr Gly Lys Ile Pro Pro Ala Ile Gly Asn Leu Lys Asn Leu Gln Thr 4 65 4 70 475 480 Leu Ser Leu Asp Thr Asn Arg Leu Ser Gly Glu Ile Pro Glu Glu Ile 485 490 495 Trp Gly Leu Lys Ser Leu Thr Lys Ile Asn Ile Arg Ala Asn Asn Ile 500 505 510 Arg Gly Glu Ile Pro Ala Ser Ile Ser His Cys Thr Ser Leu Thr Ser 515 520 525 Val Asp Phe Ser Gln Asn Ser Leu Ser Gly Glu Ile Pro Lys Lys Ile 530 535 540 Ala Lys Leu Asn Asp Leu Ser Phe Leu Asp Leu Ser Arg Asn Gln Leu 4 5 550 555 560 Thr Gly Gln Leu Pro Gly Glu Ile Gly Tyr Met Arg Ser Leu Thr Ser 565 570 575 Leu Asn Leu Ser Tyr Asn Asn Leu Phe Gly Arg Ile Pro Ser Ala Gly 580 585 590 Gln Phe Leu Ala Phe Asn Asp Ser Ser Phe Leu Gly Asn Pro Asn Leu 595 600 605 Cys Ala Ala Arg Asn Asn Thr Cys Ser Phe Gly Asp His Gly His Arg 610 615 620 Gly Gly Ser Phe Ser Thr Ser Lys Leu Ile Ile Thr Val Ile Ala Leu 625 630 635 640 Val Thr Val Leu Leu Leu Ile Val Val Thr Val Tyr Arg Leu Arg Lys 645 650 655 Lys Arg Leu Gln Lys Ser Arg Ala Trp Lys Leu Thr Ala Phe Gln Arg 660 665 670 Leu Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Lys Glu Glu Asn 675 680 685 Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Pro 690 695 700 Glu Gly Val Asp His Val Ala Ile Lys Arg Leu Val Gly Arg Gly Ser 705 710 715 720 Gly Arg Ser Asp His Gly Phe Ser Ala Glu Ile Gln Thr Leu Gly Arg 725 730 735 Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Tyr Val Ser Asn Lys 740 745 750 Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly 755 760 765 Glu Leu Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg 770 775 780 Tyr Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His 785 790 795 800 Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile 805 810 815 Leu Leu Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Ala 820 825 830 Lys Phe Leu Gln Asp Ala Gly Ser Ser Clu Cys Met Ser Ser Val Ala 835 840 845 Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val 850 855 860 Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu Leu Glu Leu 865 870 875 880 Ile Ala Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile 885 890 895 Val Arg Trp Val Arg Lys Thr Thr Ser Glu Leu Ser Gln Pro Ser Asp 900 905 910 Ala Ala Thr Val Leu Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro 915 920 925 Leu Ala Gly Val Ile His Leu Phe Lys Ile Ala Met Leu Cys Val Lys 930 935 940 Asp Glu Ser Ser Ala Arg Pro Thr Met Arg Glu Val Val His Met Leu 945 950 955 960 Thr Asn Pro Pro Gln Ser Ala Pro Ser Leu Leu Ala Leu 965 970
<210> 231 <211> 2922 <212> DNA
<213> Populus tremuloides <4 00> 231
atgggaactc ttctgtgttt tcttcttcct tttcttgtac ggatacagtg aacttgaagt cctcttgaag ctgaaatctt actggccttg aagattgggt ggcttctcct acatctcctt ggagtcacgt gtgatgagag ctcacgtgtg gtgtcactta cctggttcaa ttcctccaga gattgggttg ttgaacaagc aatgataatc tcacggggga acttcctgcg gagatagcca ttgaacattt ctggcaatgc tattggtggg aatttctctg acacagcttg aggttcttga tatttacaac aataattgct attgcaaacc tgaaaaaact caagcatctt cacctgggag ataccagagg agtactcgga gattatgatc ttggagttct ctttcaggca aagttccttc tagcttgtct aagctgaaga gggtactata accattacga aggaggtatt ccacctgaat gaacttcttg acatgggttc ttgcaacctt aatggtgaga ttaacccatc tgcattcgct gtttcttcaa ttcaataatc gaattatctg gtctaattag cttgaaatca cttgatcttt gagatacccg agagtttttc agctttgaaa aacttaacac aagctgcacg gtccaatccc agactttgtt ggtgattttc gtttggggaa acaacttcac atttgagctt cccaaacagc atgtatctgg acgtgtcata taatcacttg acaggattgg ggagggaaat tgaagacgtt gattctcatg aataatttct gaaattggcc agtgcaagtc cttgctcaaa atcagaatca actatccctg ctgggatctt taatttacct ttggtgaccc tatttctccg gcgagcttcc accggagatt tcaggagatg tctgacaatc ggattactgg tagaatcccc cgggctattg tttctatctc tggaaatgaa cagactttct ggtgaaattc gagatcctct ccaagatcag catccgtgcc aacaacatta atgttccatt gcacttcact tacatccgtt gatttcagtc attccaaagg agattactaa actgaaggat ttgagtattc cttactggtc aactaccaag tgaaattcga tacatgacaa tcctacaaca atttatttgg ccggatccct tctgtcggcc agctcatttc ttggaaatcc aaatctctgt gtagcaagaa ggtcatggcc atagaaggtc ctttaatact tcaaagctaa gtcactgcgt tgctgttaat agcagtgaca gtttacagat aaatcacggg cctggaagct cactgcattc caaaggctcg ctcgagtgct tgaaagagga aaacattata ggcaaaggtg gggtcaatga cagagggtat tgatcatgta gctatcaaac ggacgaaacg atcatggctt ctcagccgag atccaaacac aatattgtta ggctgctggg gtacgtatca aataaggata tacatgccaa atgggagctt aggagagctt ttgcatggtt tgggaaacca ggtacagaat tgctgtggag gctgccaagg gattgctctc ctttgattat acatagggat gtgaagtcca gattttgagg ctcatgttgc tgattttggg ctggccaagt tcagaatgca tgtcctctat tgctggctcc tatggttaca acattgaaag tggacgaaaa aagtgatgtt tacagctgcg atagcaggga ggaagccagt aggggagttt ggagatgggg aggaagacca cgtcagaact atctcagcca tccgatgcag gaccccaggc ttagtgggta ccctctaaca ggtgccattc ttgtgtgtaa aagatgagag ctcgaaccgg cctaccatga accaatcctc cacagtcagc ctcaagcctc ctcaccctct <210>
<211>
<212>
<213>
<400>
tactgttcac tgcttgcagt 60 ccatgtacgg acataatggc 120 cagctcattg tttcttctct 180 atttgtcgtt cagacatctt 240 ttgtgaatct tactttggcc 300 tgcttaaatc tctcaggatt 360 gaaagatcac tcctggcatg 420 cgggtccact gccaattgaa 480 ggaatttctt ttctggtaaa 540 taggcttgaa tggtaatgac 600 atctcaagag cttgtgcatt 660 ttggatcatt gagtaatctt 720 ttccttctac tctaggccaa 780 tcactggata tatcccttcg 840 caatcaacaa cctcactggg 900 tcctcaatct ctttcaaaac 960 caaaccttga ggtgcttcag 1020 tcggccggaa tgggaagctg 1080 ttcctcggga cttatgcaag 1140 tcattggatc acttcctgaa 1200 tttgtaatct ctttacaggc 1260 aaattgagtt gagccataac 1320 cactaggctc tctttcggtc 1380 ggaatttgaa gagtttgcag 1440 ctgatgaaat cttcagtctg 1500 gcggtgaaat cccagcttcc 1560 aaaacagcat cagtggggag 1620 ttgatctctc tcgaaatcag 1680 gtcttacaac tctaaacctc 1740 aattcctggc gttcaatgac 1800 atgactcttg ctcatttggt 1860 tgatcactgt cattgctctt 1920 tgagaaagaa gaatctgcag 1980 atttcaaagc agaggatgtg 2040 gcgctgggat tgtctaccgt 2100 gacttgttgg tagaggcacc 2160 ttggaaggat caggcaccga 2220 ccaacttgct gttgtatgag 2280 caaagggagg ccatttgcag 2340 gactctgtta tcttcaccat 2400 ataacatatt acttgattcg 2460 tcttgcaaga tgcaggtgca 2520 ttgctccaga atacgcttac 2580 gtgttgtgct gctggagctg 2640 tggacatagt gagatgggtc 2700 cttcagtctt ggcagttgtg 2760 acctgtttaa gatagctatg 2820 gggaagtggt tcacatgctc 2880 ag 2922 232 97 3 PRT
Populus tremuloides 232
Met Gly Thr Leu Leu Cys Phe Leu Leu Pro Phe 1 5 10 15
Thr Ala Cys Ser Gly Tyr Ser Glu Leu Glu Val 2 0 2 5 30
Ser Ser Met Tyr Gly His Asn Gly Thr Gly Leu
Leu Val Leu Leu Phe Leu Leu Lys Leu Lys Glu Asp Trp Val Ala 40 45
Ser Pro Thr Ser Pro Ser Ala His Cys Phe Phe Ser Gly Val Thr O 1C CO 50 55 60 Asp Glu Ser Ser Arg Val Val Ser Leu Asn Leu Ser Phe Arg His Leu 65 70 75 80 Pro Gly Ser Ile Pro Pro Glu Ile Gly Leu Leu Asn Lys Leu Val Asn 85 90 95 Leu Thr Leu Ala Asn Asp Asn Leu Thr Gly Glu Leu Pro Ala Glu Ile 100 105 110 Ala Met Leu Lys Ser Leu Arg Ile Leu Asn Ile Ser Gly Asn Ala Ile 115 120 125 Gly Gly Asn Phe Ser Gly Lys Ile Thr Pro Gly Met Thr Gln Leu Glu 130 135 140 Val Leu Asp Ile Tyr Asn Asn Asn Cys Ser Gly Pro Leu Pro Ile Glu 145 150 155 160 Ile Ala Asn Leu Lys Lys Leu Lys His Leu His Leu Gly Gly Asn Phe 165 170 175 Phe Ser Gly Lys Ile Pro Glu Glu Tyr Ser Glu Ile Met Ile Leu Glu 180 185 190 Phe Leu Gly Leu Asn Gly Asn Asp Leu Ser Gly Lys Val Pro Ser Ser 195 200 205 Leu Ser Lys Leu Lys Asn Leu Lys Ser Leu Cys Ile Gly Tyr Tyr Asn 210 215 220 His Tyr Glu Gly Gly Ile Pro Pro Glu Phe Gly Ser Leu Ser Asn Leu 225 230 235 240 Glu Leu Leu Asp Met Gly Ser Cys Asn Leu Asn Gly Glu Ile Pro Ser 245 250 2 5 5 Thr Leu Gly Gln Leu Thr His Leu His Ser Leu Phe Leu Gin Phe Asn 260 265 270 Asn Leu Thr Gly Tyr Ile Pro Ser Glu Leu Ser Gly Leu Ile Ser Leu 275 280 285 Lys Ser Leu Asp Leu Ser Ile Asn Asn Leu Thr Gly Glu Ile Pro Glu 290 295 300 Ser Phe Ser Ala Leu Lys Asn Leu Thr Leu Leu Asn Leu Phe Gln Asn 305 310 315 320 Lys Leu His Gly Pro Ile Pro Asp Phe Val Gly Asp Phe Pro Asn Leu 325 330 335 Glu Val Leu Gln Val Trp Gly Asn Asn Phe Thr Phe Glu Leu Pro Lys 340 345 350 C-In Leu Gly Arg Asn Gly Lys Leu Met Tyr Leu Asp Val Ser Tyr Asn 3 5 5 360 365 His Leu Thr Gly Leu Val Pro Arg Asp Leu Cys Lys Gly Gly Lys Leu 370 375 380 Lys Thr Leu He Leu Met Asn Asn Phe Phe Ile Gly Ser Leu Pro Glu 385 390 395 400 Glu Ile Gly Gln Cys Lys Ser Leu Leu Lys Ile Arg Ile Ile Cys Asn 405 410 415 Leu Phe Thr Gly Thr Ile Pro Ala Gly Ile Phe Asn Leu Pro Leu Val 420 425 430 Thr Gln Ile Glu Leu Ser His Asn Tyr Phe Ser Gly Glu Leu Pro Pro 435 440 445 Glu Ile Ser Gly Asp Ala Leu Gly Ser Leu Ser Val Ser Asp Asn Arg 450 455 460 Ile Thr Gly Arg Ile Pro Arg Ala Ile Gly Asn Leu Lys Ser Leu Gln 465 470 475 480 Phe Leu Ser Leu Glu Met Asn Arg Leu Ser Gly Glu Ile Pro Asp Glu 485 490 495 Ile Phe Ser Leu Glu Ile Leu Ser Lys Ile Ser Ile Arg Ala Asn Asn 500 505 510 Ile Ser Gly Glu Ile Pro Ala Ser Met Phe His Cys Thr Ser Leu Thr 515 520 525 Ser Val Asp Phe Ser Gln Asn Ser He Ser Gly Glu Ile Pro Lys Glu 530 535 540 Ile Thr Lys Leu Lys Asp Leu Ser I Ie Leu Asp Leu Ser Arg Asn Gln 545 550 555 560 Leu Thr Gly Gln Leu Pro Ser Glu Ile Arg Tyr Met Thr Ser Leu Thr 565 570 57 5 Thr Leu Asn Leu Ser Tyr Asn Asn Leu Phe Gly Arg Ile Pro Ser Val 580 585 590 Gly Gln Phe Leu Ala Phe Asn Asp Ser Ser Phe Leu Gly Asn Pro Asn 595 600 605 Leu Cys Val Ala Arg Asn Asp Ser Cys Ser Phe Gly Gly His Gly His 610 615 620 Arg Arg Ser Phe Asn Thr Ser Lys Leu Met Ile Thr Val Ile Ala Leu 625 630 635 640 Val Thr Ala Leu Leu Leu Ile Ala Val Thr Val Tyr Arg Leu Arg Lys 645 650 655 Lys Asn Leu Gln Lys Ser Arg Ala Trp Lys Leu Thr Ala Phe Gln Arg 660 665 670 Leu Asp Phe Lys Ala Glu Asp Val Leu Glu Cys Leu Lys Glu Glu Asn 675 680 685 Ile Ile Gly Lys Gly Gly Ala Gly Ile Val Tyr Arg Gly Ser Met Thr 690 695 700 Glu Gly Ile Asp His Val Ala Ile Lys Arg Leu Val GIy Arg Gly Thr 705 710 715 720 Gly Arg Asn Asp His η 1 \Ι Phe Ser Ala Glu Ile Gln Thr Leu Gly Arg 725 ^xy 735 730 Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Tyr Val Ser Asn Lys 740 745 750 Asp Thr Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Gly 755 760 765 Glu Leu Leu His Gly Ser Lys Gly Gly His Leu Gln Trp Glu Thr Arg 770 775 780 Tyr Arg Ile Ala Val Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His 785 790 795 800 Asp Cys Ser Pro Leu Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile 805 810 815 Leu Leu Asp Ser Asp Phe Glu Ala His Val Ala Asp Phe Gly Leu Aia 820 825 830 Lys Phe Leu Gln Asp Ala Gly Ala Ser Glu Cys Met Ser Ser Ile Ala 835 840 845 Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr Leu Lys Val 850 855 860 Asp Glu Lys Ser Asp Val Tyr Ser Cys Gly Val Val Leu Leu Glu Leu 865 870 875 880 Ile Ala Gly Arg Lys Pro Val Gly Glu Phe Gly Asp Gly Val Asp Ile 885 890 895 Val Arg Trp Val Arg Lys Thr Thr Ser Glu Leu Ser Gln Pro Ser Asp 900 905 910 Ala Ala Ser Val Leu Ala Val Val Asp Pro Arg Leu Ser Gly Tyr Pro 915 920 925 Leu Thr Gly Ala Ile His Leu Phe Lys Ile Ala Met Leu Cys Val Lys 930 935 940 Asp Glu Ser Ser Asn Arg Pro Thr Met Arg Glu Val Val His Met Leu 945 950 955 960 Thr Asn Pro Pro Gln Ser Ala Ser Ser Leu Leu Thr Leu 965 970 <2 10> 233 <211> 996 <2 12> PRT <2 13> Zea mays <400 > 233 Met Pro Pro Pro Thr Phe Leu Leu Gly Leu Leu Leu Leu Leu Leu Leu 1 5 10 15 Ala Ala Ala Ala Pro Ala Pro Ala Ser Ala Thr Pro Glu Arg Asp Ala 25 30 Tyr Ala Leu Ser Arg Leu Lys Ala Ser Leu Val Pro Ser Ala Thr Asn 35 40 45 Ser Thr Ser Ala Pro Leu Ser Asp Trp Asp Pro Ala Ala Thr Pro Pro 50 55 60 Ala His Cys Ala Phe Thr Gly VaI Thr Cys Asp Ala Ala Thr Ser Arg 65 70 75 80 Val Val Ala Ile Asn Leu Thr Ala Val Pro Leu His Gly Gly Ala Leu 85 90 95 Pro Pro Glu Val Ala Leu Leu Asp Ala Leu Ala Ser Leu Thr Val Ala 100 105 110 Asn Cys Tyr Leu Arg Gly Arg Leu Pro Pro Ala Leu Ala Ser Met Pro 115 120 125 Ala Leu Arg His Leu Asn Leu Ser Asn Asn Asn Leu Ser Gly Pro Phe 130 135 40 Pro Pro Pro Pro Pro Ala Ala Tyr Phe Pro Ala Leu Glu Ilc Val Asp 145 150 155 160 Val Tyr Asn Asn Asn Leu Ser Gly Pro Leu Pro Pro Leu Gly Ala Pro 165 170 175 His Ala Arg Ser Leu Arg Tyr Leu His Leu Gly Gly Asn Tyr Phe Asn 180 18 5 190 Gly Ser Ile Pro Asp Thr Phe Gly Asp Leu Ala Ala Leu Glu Tyr Leu 195 200 205 Gly Leu Asn Gly Asn Ala Leu Ser Gly Arg Val Pro Pro Ser Leu Ser 210 215 220 Arg Leu Ser Arg Leu Arg Glu Met Tyr Val Gly Tyr Tyr Asn Gln Tyr 225 230 235 240 Ser Gly Gly Val Pro Arg Glu Phe Gly Ala Leu Gln Ser Leu Val Arg 245 250 255 Leu Asp Met Ser Ser Cys Thr Leu Thr Gly Pro Ile Pro Pro Glu Leu 260 265 270 Ala Arg Leu Ser Arg Leu Asp Thr Leu Phe Leu Ala Leu Asn Gln Leu 275 280 28 5 Thr Gly Glu Ile Pro Pro Glu Leu Gly Ala Leu Thr Ser Leu Arg Ser 290 295 300 Leu Asp Leu Ser Ile Asn Asp Leu Ala Gly Glu Ile Pro Ala Ser Phe 305 310 315 320 Ala Ala Leu Thr Asn Leu Lys Leu Leu Asn Leu Phe Arg Asn Lys Leu 325 330 335 Arg Gly Glu Ile Pro Ala Phe Leu Gly Asp Phe Pro Phe Leu Glu Val 34 0 345 350 Leu Gln Val Trp Asp Asn Asn Leu Thr Gly Pro Leu Pro Pro Ala Leu 355 360 365 Gly Arg Asn Gly Arg Leu Lys Thr Leu Asp Val Thr Ser Asn His Leu 370 375 380 Thr Gly Thr Ile Pro Pro Asp Leu Cys Ala Gly Arg Asn Leu Gln Leu 385 390 395 400 Leu Val Leu Met Asp Asn Gly Phe Phe Gly Ser Ile Pro Glu Ser Leu 405 410 415 Gly Asp Cys Lys Thr Leu Thr Arg Val Arg Leu Gly Lys Asn Phe Leu 420 425 430 Thr Gly Pro Val Pro Ala Gly Leu Phe Asp Leu Pro Gln Ala Asn Met 435 440 445 Leu Glu Leu Thr Asp Asn Met Leu Thr Gly Glu Leu Pro Asp Val Ile 450 455 460 Ala Gly Asp Lys Ile Gly Met Leu Met Leu Gly Asn Asn Arg Ile Gly 465 470 475 480 Gly Arg Ile Pro Ala Ala Ile Gly Asn Leu Pro Ala Leu Gln Thr Leu 485 490 495 Ser Leu Glu Ser Asn Asn Phe Ser Gly Ser Leu Pro Pro Glu Ile Gly 500 505 510 Arg Leu Arg Asn Leu Thr Arg Leu Asn Ala Ser Gly Asn Ala Leu Thr 515 520 525 Gly Giy Ile Pro Arg Glu Leu Met Gly Cys Ala Ser Leu Gly Ala Val 530 535 540
Asp Leu Ser Arg Asn Gly Leu Thr Gly Glu Ile Pro Asp Thr Val Thr 54 5 550 555 560 Ser Leu Lys Ile Leu Cys Thr Leu Asn Val Ser Arg Asn Arg Leu Ser 565 570 575 Gly Glu Leu Pro Ala Ala Met Ala Asn Asn Thr Ser Leu Thr Thr Leu 580 585 590 Asp Val Ser Tyr Asn Gln Leu Ser Gly Pro Vai Pro Met Gln Gly Gln 595 600 605 Phe Leu Val Phe Asn Glu Ser Ser Phe Val Gly Asn Pro Gly Leu Cys 610 615 620 Ser Ala Cys Pro Pro Ser Ser Gly Gly Ala Arg Ser Pro Phe Ser Leu 625 630 635 640 Arg Arg Trp Asp Ser Lys Lys Leu Leu Val Trp Leu Val Val Leu Leu 645 650 655 Thr Leu Leu Val Leu Ala Val Leu Gly Ala Arg Lys Ala His Glu Ala 660 665 670 Trp Arg Glu Ala Ala Arg Arg Arg Ser Gly Ala Trp Lys Met Thr Ala 675 680 685 Phe Gln Lys Leu Asp Phe Ser Ala Asp Asp Val Val Glu Cys Leu Lys 690 695 700 Glu Asp Asn Ile He Gly Lys Gly Gly Ala Gly Ile Val Tyr His Gly 705 710 715 720 Val Thr Arg Gly Gly Ala Glu Leu Ala Ile Lys Arg Leu Val Gly Arg 725 730 735 Gly Cys Gly Asp His Asp Arg Gly Phe Thr Ala Glu Val Thr Thr Leu 740 745 750 Gly Arg Ile Arg His Arg Asn Ile Val Arg Leu Leu Gly Phe Val Ser 755 7 60 765 Asn Arg Glu Ala Asn Leu Leu Leu Tyr Glu Tyr Met Pro Asn Gly Ser 770 775 780 Leu Gly Glu Met Leu His Gly Gly Lys Gly Gly His Leu Gly Trp Glu 785 790 795 800 Ala Arg Ala Arg Val Ala Ala Glu Ala Ala Arg Gly Leu Cys Tyr Leu 805 810 815 Hls His Asp Cys Ala Pro Arg He Ile His Arg Asp Val Lys Ser Asn 820 825 830 Asn Ile Leu Leu Asp Ser Ala Phe Glu Ala His Val Ala Asp Phe Gl y 835 840 845 Leu Ala Lys Phe Leu Gly Gly Gly Gly Ala Thr Ser Glu Cys Met Ser 850 855 860 Ala Ile Ala Gly Ser Tyr Gly Tyr Ile Ala Pro Glu Tyr Ala Tyr Thr 865 870 875 880 Leu Arg Val Asp Glu Lys Ser Asp Val Tyr Ser Phe Gly Val Val Leu 885 890 895 Leu Glu Leu Ile Thr Gly Arg Arg Pro Val Gly Ser Phe Gly Asp Gl y 900 905 910 Val Asp Ile Val His Trp Val Arg Lys Val Thr Ala Asp Ala Ala Al a 915 920 925 Al a Glu Glu Pro Val Leu Leu Val Ala Asp Arg Arg Leu Ala Pro Glu 930 935 940 Pro Val Pro Leu Leu Ala Asp Leu Tyr Arg Val Ala Me t: Ala Cys Val 945 950 955 960 Glu Glu Aia Ser Thr Ala Arg Pro Thr Met Arg Glu Val Val His Met 965 97 0 975 Leu Ser Thr Ser Ala Ala Ala Gln Pro Asp VaI Pro His Aia Leu Cys 980 985 990
Lys Val Val Asp 995 <210> 234 <211> 2343 <212> DNAi
<213> Ipomoea batatas <4 00> 234
ttctccggcg ttgcatgcga tcaggattca cgagtcattt ccgctcttcg gttccctccc gccggagatt ggactgctgg ctcacctccg ttaatctctc tggtgcgctt ccatcggaga aaagccatta atatgtcaaa caatttgttg agcggccatt ggtatgactg agcttcaagt gttggatgtt tacaataaca catgaagtgg tgaagttgaa gaagctgaaa attctcaatc ggagagatac cggaaatata ctctaacatt tccagtttac aatagcctca cgggaaatat accggcaagc ttggcgcagc cgccttggct acttgaatac atttgaaaga ggcattccac acacttcaaa tgcttgatct tagggaatgc aacctttctg gggaatctaa aacagctata ctttctgtat ttgtacggga ccggcggagc tctccggttt ggagagtttg gtgcatctgg atgggagaaa ttcctcaaag tttagccgag ttgaagagcc agaaacacgt tccaaggcac aattcccgcg ttcatcggtg ttacagcttt ggaacaacaa tttcacatcc gagttaccgg cgattgaggt ttctggacgt ttcgtcaaac caaatcagcg tgtatgggag ggaagctgga agcactaatt ctcatggaaa cctcaagtcc tgggcgagtg caagtccttg aatggggttc aatggagcca tcccgcctgg ctttcttcaa tttgccgttg caaaacaatt acttctccag cgagcttccg accaagatgc cttgatcttc acaacaacag gataaatggc cagattcctc aacctctgga agttatccct ccactccaac agattctccg tcacatttga aaaagatggt gaccatggat ttaagcagca ccagcctcaa ttgctcagtg tacacagctg aattcctttg accggaaaaa ttccaaagga aatctcttct ctggagcgcc agaaatctac ttactggttc agttcccagt gaactagggc ctggatcatt ctttcaatga tttttcgggt ccaataccca ttcgataacc ggtctttcta cgggaatcca aaactcttct ccagtcaatc acaacaacca ttcttggacc acaaaacgaa attttgggta ctgcagcagc atttttatct gctgttatat gcgcgaagag aaaagattat gaaatccaat aatgcttgga ctggaatata aagtagagga tgtggttgag tgtttgaaag gggggagcag ggacagtata caaaggctcc atgcccgatg aggctagaca ggcgaggaac tgggcgtcgt gatcttggtt ctgggaagaa tcaggcaccg acacattatt agattacttg actaatttgt tattgtatga atacatgcct aatgggagct acgaatgggg ccaatttgct ttgggagatg cggtttcgaa gggctatgtt acttgcacca tgattgctcc cctcccatta aataatattt tactcacttc tgattatata gcttgcattg
ctttagccat
ataggctttt
tggcgaaact
tccctggaga
acttttccgg
tcggaggaaa
agactttaaa
ttcagaatct
cagaattagg
gtgaaattcc
acagcctgac
acctttcaga
tggtattgat
atctacccaa
taaacctcgg
gcagagtacc
acaaattttc
gtgttgagaa
gcttaatcta
ttgccaagaa
cggcattcgg
ggaaaattcc
acagtttaac
acttgagtgc
taaatgtact
taatgaatag
ccaatggaca
attcacctcc
tactcataat
gggtaaggtg
aactaacaac
aggaaaacat
gtgtcatcat
tctctgctga
gttatgcatc
tgtcggggat
ttgcggtgga
ttcataggga
ctgattttgg
tcc <210> <211> <212> <213> <4 00> Phe Se 1
2343
235
781
PRT
Ipomoea batatas 235
atccgctgtt
aaacttaact
cacatccatt
aatcttggtc
aaggcttcct
ttacttcaca
cttacaaaca
tcgtgagctc
ctccatcacc
taaaagttta
aggtcatatt
aaataatatg
aaacttgttc
actagaggtt
acgaaaccgc
ggaaaatttg
tggaccgttt
gaactatctc
cgtttgtctc
tctcacagat
aaatttagag
aaatcaaatt
aggtgaagtt
aaataattta
caacttgtcc
cttgactgtc
gttaggagtt
aagctcatcg
tactgtcttg
cattattgtt
attcaagaaa
aattgggcaa
agcaataaaa
aattaaaaca
taacagagat
cctgcatggg
agccgcaaag
cgtaaagtct
gctggctaaa
10
15
20
25
35
40
45
50
5 5
60
65
70
75
90
95
100
105
110
115
120
125
Ser Arg Val Ile Ser Leu Ala Leu Pro Pro Glu Ile Gly Leu Thr Ser Val Asn Leu Ser Gly Thr Ser Ile Lys Ala Ile Asn Phe Pro Gly Glu Ile Leu Val Val Tyr Asn Asn Asn Phe Ser Leu Lys Lys Leu Lys Ile Leu Glu Ile Pro Glu Ile Tyr Ser Leu Gln Thr Asn Ser Leu Thr 60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
960
1020
1080
1140
1200
1260
1320
1380
1440
1500
1560
1620
1680
1740
1800
1860
1920
1980
2040
2100
2160
2220
2280
2340 130 135 140
Gly Asn Ile Pro Ala Ser Leu Ala Gln Leu Gln Asn Leu Arg Glu Leu 145 150 155 160 Arg Leu Gly Tyr Leu Asn Thr Phe Glu Arg Gly Ile Pro Pro Glu Leu 165 170 175 Gly Ser Ile Thr Thr Leu Gln Met Leu Asp Leu Arg Glu Cys Asn Leu 180 185 190 Ser Gly Glu Ile Pro Lys Ser Leu Gly Asn Leu Lys Gln Leu Tyr Phe 195 200 205 Leu Tyr Leu Tyr Gly Asn Ser Leu Thr Gly His Ile Pro Ala Glu Leu 210 215 220 Ser Gly Leu Glu Ser Leu Val His Leu Asp Leu Ser Glu Asn Asn Met 225 230 235 240 Met Gly Glu Ile Pro Gln Ser Leu Ala Glu Leu Lys Ser Leu Val Leu 245 250 255 Ile Asn Leu Phe Arg Asn Thr Phe Gln Gly Thr Ile Pro Ala Phe Ile 260 265 270 Gly Asp Leu Pro Lys Leu Glu Val Leu Gln Leu Trp Asn Asn Asn Phe 275 280 285 Thr Ser Glu Leu Pro Val Asn Leu Gly Arg Asn Arg Arg Leu Arg Phe 290 295 300 Leu Asp Val Ser Ser Asn Gln Ile Ser Gly Arg Val Pro Glu Asn Leu 305 310 315 320 Cys Met Gly Gly Lys Leu Glu Ala Leu Ile Leu Met Glu Asn Lys Phe 325 330 335 Ser Gly Pro Phe Pro Gln Val Leu Gly Glu Cys Lys Ser Leu Asn Gly 340 345 350 Val Arg Val Glu Lys Asn Tyr Leu Asn Gly Ala I Ie Pro Pro Gly Phe 355 360 365 Leu Gln Phe Ala Val Gly Leu Ile Tyr Val Cys Leu Gln Asn Asn Tyr 370 375 380 Phe Ser Ser Glu Leu Pro Thr Lys Met Leu Ala Lys Asn Leu Thr Asp 385 390 395 400 Leu Asp Leu His Asn Asn Arg Ile Asn Gly Gin Ile Pro Pro Ala Phe 405 410 415 Gly Asn Leu Glu Asn Leu Trp Lys Leu Ser Leu His Ser Asn Arg Phe 420 425 430 Ser Gly Lys Ile Pro Asn Gln Ile Ser His Leu Lys Lys Met Val Thr 435 440 445 Met Asp Leu Ser Ser Asn Ser Leu Thr Gly Glu Val Pro Ala Ser Ile 450 455 460 Ala Gln Cys Thr Gln Leu Asn Ser Phe Asp Leu Ser Ala Asn Asn Leu 465 470 475 480 Thr Gly Lys Ile Pro Lys Glu He Ser Ser Leu Glu Arg Leu Asn Val 485 490 495 Leu Asn Leu Ser Arg Asn Leu Leu Thr Gly Ser Val Pro Ser Glu Leu 500 505 510 Gly Leu Met Asn Ser Leu Thr Val Leu Asp His Ser Phe Asn Asp Phe 515 520 525 Ser Gly Pro Ile Pro Thr Asn Gly Gln Leu Gly Val Phe Asp Asn Arg 530 535 540 Ser Phe Tyr Gly Asn Pro Lys Leu Phe Tyr Ser Pro Pro Ser Ser Ser 54 5 550 555 560 Pro Val Asn His Asn Asn His Ser Trp Thr Thr Lys Arg Ile Leu Ile 5 65 570 575 Ile Thr Val Leu Ile Leu Gly Thr Ala Ala Ala Phe Leu Ser Ala Val 580 585 590 Ile Trp Val Arg Cys Ile He Val Ala Arg Arg Glu Lys Ile Met Lys 595 600 605 Ser Asn Asn Ala Trp Lys Leu Thr Thr Phe Lys Lys Leu Glu Tyr Lys 610 615 620 Val Glu Asp Val Val Glu Cys Leu Lys Glu Glu Asn Ile Ile Gly Gln 625 630 635 640 Gly Gly Ala Gly Thr Val Tyr Lys Gly Ser Met Pro Asp Gly Val Iie 6 4 5 650 65 5 Ile Ala Ile Lys Arg Leu Asp Arg Arg Gly Thr Gly Arg Arg Asp Leu 660 665 670 Gly Phe Ser Ala Glu Ile Lys Thr Leu Gly Arg Ile Arg His Arg His 675 680 685 Ile Ile Arg Leu Leu Gly Tyr Ala Ser Asn Arg Asp Thr Asn Leu Leu 690 695 700 Leu Tyr Glu Tyr Met Pro Asn Gly Ser Leu Ser Gly Ile Leu His Gly 705 710 715 720 Thr Asn Gly Ala Asn Leu Leu Trp Glu Met Arg Phe Arg Ile Ala Val 725 730 735 Glu Ala Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Pro 740 745 750 Ile Ile His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Thr Scr Asp 755 760 765 Tyr Ile Ala Cys Ile Ala Asp Phe Gly Leu Ala Lys Ser 770 775 780 <210> 236 <211> 4 <212> PRT <213> Seqüência artificial <220>
<223> motivo 1 <220>
<221> INCERTO
<222> (2) . . (2)
<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente
<4 00> 236 Leu Xaa Asp Trp 1
<210> 237
<211> 11
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 2 <220>
<221> VARIANTE
<222> (1) . . (1)
<223> / substituir = "Pro"
<220>
<221> INCERTO
<222> (4)..(4)
<223> Xaa pode ser qualquer aminoácido ocorrendo naturalmente <220>
<221> VARIANTE
<222> (6)..(6)
<223> / substituir = "Thr"
<220>
<221> VARIANTE
<222> (9)..(9)
<223> / substituir = "Thr" / substituir = "Lys"
<4 00> 237
Ala His Cys Xaa Phe Ser Giy Val Ser Cys Asp
10
<210> 238
<211> 56
<212> DNA
<213> Seqüência artificial <220>
<223> iniciador: prm08591
<4 00> 238 ggggacaagt ttgtacaaaa aagcaggctt: aaacaatggc gatgagactt ttgaag <210> 239
51 DNA
Seqüência artificial
56
<211> <212> <213> <220> <223> <4 00>
iniciador: prm.08592 239
ggggaccact ttgtacaaga aagctgggtc gctacgtaac caagaagtca c
<210> 240
<211> 1243
<212> DNA
<213> Oryza satíva
<4 00> 240
51
aaaaccaccg agggacctga tctgcaccgg ttttgatagt
gttttccgat cgagggacga aaatcggatt cggtgtaaag
ttattccgga gcatgattgg gaagggagga cataaggccc
gtccagatct ccagatcact cagcaggatc ggccgcgttc
ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc
gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc
atagatagct actactctct ccgtttcaca atgtaaatca
atattgatgt taatgaatat agacatatat atctatttag
atgtaggaaa tgctagaatg acttacattg tgaattgtga
tggatggatg caggatcatg aaagaattaa tgcaagatcg
ttactaattg cgctgcatat atgcatgaca gcctgcatgc
ccattaggaa gtaaccttgt cattacttat: accagtacta
tcatgagcaa atctacaaaa ctggaaagca ataaggaata
cattaatcac caaatatttc gccttctcca gcagaatata
tgtacacact gacagtgtac gcataaacgc. agcagccagc
gcacactggc cttccatctc aggctagctt tctcagccac
gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc
gaatcgctcc cgcgcgcggc ggcggcgcgc acgtacgaat
ccacgacacg atcgcgcgcg acgccggcga caccggccat
ccgactataa atacgtaggc atctgcttga tcttgtcatc
aggaaaaaaa aacaaaacac accaagccaa ataaaagcga <210> 241 <211> 230 <212> PRT
<213> Seqüência artificial <22 0>
tgagggaccc
ttaagggacc
atgtcgcatg
gcgtagcacc
gtagcttccg
cttgcacgcg
ttctactatt
attcattaac
aatggacgaa
tatctgccgc
gggcgtgtaa
catactatat
cgggactgga
tatctctcca
ttaactgtcg
ccatcgtaca
aaatcaaaac
gcacgcacgc
ccacccgcgc
catctcacca
caa
gttgtgtctg 60 tcagatgaac 120 tgtttggacg 180 cgcggtttga 240 ccggaagcga 300 atacatcggg 360 ttccacattc 420 atcaatatga 480 gtacctacga 540 atgcaaaatc 600 gcgtgttcat 660 agtattgatt 720 aaagactcaa 780 tcttgatcac 840 tctcaccgtc 900 tgtcaactcg 960 caccggagaa 1020 acgcccaacc 1080 cctcacctcg 1140 CC3â3âd333 1200 1243 <223> Dominio C-terminai deSEQ ID NO: 212 <4 00> 241 Arg Leu Leu Gly Tyr Val Ala Asn Lys Asp Thr Asn Leu Leu Leu Tyr 1 5 10 15 Glu Tyr Met Pro Asn Gly Ser Leu Gly Glu Leu Leu His Gly Ser Lys 20 25 30 Gly Gly His Leu Gln Trp Glu Thr Arg His Arg Val Ala Val Glu Ala 35 40 45 Ala Lys Gly Leu Cys Tyr Leu His His Asp Cys Ser Pro Leu Ile Leu 50 55 60 His Arg Asp Val Lys Ser Asn Asn Ile Leu Leu Asp Ser Asp Phe Glu 65 70 7. 5 80 Ala His Val Ala Asp Phe Gly Leu Ala Lys Phe Leu Val Asp Gly Ala 85 90 95 Ala Ser Glu Gys Met Ser Ser Ile Ala Gly Ser Tyr Gly Tyr Ile Ala 100 105 110 Pro Glu Tyr Ala Tyr Thr Leu Lys Val Asp Glu Lys Ser Asp Val Tyr 115 12 0 125 CO Phe Gly Val Val Leu Leu Glu Leu Ile Ala Gly Lys Lys Pro Val CD 130 135 140 Gly Glu Phe Gly Glu Gly Val Asp Ile Val Arg Trp Val Arg Asn Thr 145 150 15 5 160 Glu Glu Glu Ile Thr Gln Pro Ser Asp Ala Ala Ile Val Val Ala Ile 165 170 175
Val Asp Pro Arg Leu Thr Gly Tyr Pro Leu Thr Ser Val Ile His 180 185 190 Phe Lys Ile Ala Met Met Cys Val Glu Glu Glu Ala Ala Ala Arg 195 200 205 Thr Met Arg Glu Val Val His Met Leu Thr Asn Pro Pro Lys Ser 210 215 220
Ala Asn Leu Ile Ala Phe 225 230
Claims (24)
1. Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, caracterizado pelo fato de que compreende aumentar expressão em uma planta de uma seqüência ácido nucleico codificando um polipeptídeo TCP de Classe I, e opcionalmente selecionar plantas tendo rendimento aumentado, em que dito polipeptídeo TCP de Classe I compreende de término N a término C: (i) em ordem crescente de preferência pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% ou mais identidade de seqüência com o domínio conservado de TCP (compreendendo um Hélice-Alça-Hélice básico (bHLH)) como representado por SEQ ID NO: 66; e (ii) um motivo 1 consenso C-terminal como representado por SEQID: 65.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que dito polipeptídeo TCP de Classe I compreende adicionalmente uma região rica em HQ (H sendo histidina, Q glutamina), entre o motivo I C- terminal conservado e a extremidade C-terminal do polipeptídeo.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que dito polipeptídeo TCP de Classe I, quando usado na construção de uma árvore filogenética de TCP, tal como aquela descrita em Fig. 1, tende a se agrupar com o ciado de polipeptídeos TCP compreendendo a seqüência de polipeptídeo como representado por SEQ ID NO: 2 ao invés de com qualquer outro ciado de TCP.
4. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita seqüência de ácidos nucleicos codifica qualquer um dos polipeptídeos TCP de Classe I como dado em Tabela A ou ortólogos ou parálogos ou homólogos de qualquer das SEQ ID NOs mencionadas acima.
5. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I é uma ou mais das seguintes variantes de ácido nucleico: (i) uma porção de uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (ii) uma seqüência de ácidos nucleicos capaz de hibridizar com uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (iii)uma variante de união de uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (iv) uma variante alélica de uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (v) uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I obtida por embaralhamento de gene; (vi) uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I obtida por mutagênese dirigida por sítio.
6. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita expressão aumentada é efetuada por um ou mais dentre identificação por ativação de T-DNA, TILLING, ou recombinação homóloga.
7. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dita expressão aumentada é efetuada introduzindo e expressando em uma planta uma seqüência de ácidos nucleicos codificando polipeptídeo TCP de Classe I.
8. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que dito rendimento aumentado de sementes é um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.
9. Método de acordo com reivindicações 7 ou 8, caracterizado pelo fato de que dita seqüência de ácidos nucleicos é operacionalmente ligada a um promotor constitutivo, preferivelmente a um promotor GOS2.
10. Método de acordo com qualquer uma das reivindicações 7 a 9, caracterizado pelo fato de que dita seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I preferivelmente é de origem de planta, ainda preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente de Arabidopsis thaliana.
11. Planta ou parte da mesma, caracterizada pelo fato de que inclui sementes viáveis por um método como definido em qualquer uma das reivindicações 1 a 10, em que dita planta ou parte da mesma compreende um transgene de ácido nucleico codificando um polipeptídeo TCP de Classe I.
12. Construção, caracterizada pelo fato de compreender: (a) seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; (b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácidos nucleicos de (a); e opcionalmente (c) uma seqüência de término de transcrição.
13. Construção de acordo com a reivindicação 12, caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelo menos um promotor constitutivo, preferivelmente um promotor GOS2.
14. Uso de uma construção como definida nas reivindicações 12 ou 13, caracterizado pelo fato de ser para fazer plantas tendo rendimento aumentado de sementes em relação às plantas de controle.
15. Planta, parte de planta, ou célula de planta, caracterizada pelo fato de ser transformada com uma construção como definida nas reivindicações 12 ou 13.
16. Método para a produção de uma planta transgênica tendo rendimento aumentado de sementes em relação às plantas de controle, caracterizado pelo fato de compreender: (i) introduzir e expressar em uma planta ou célula de planta uma seqüência de ácidos nucleicos codificando um polipeptídeo TCP de Classe I; e (ii) cultivar a célula de planta em condições promovendo crescimento e desenvolvimento de planta.
17. Planta transgênica, caracterizada pelo fato de ter rendimento aumentado de sementes em relação às plantas de controle, dito rendimento aumentado de sementes resultando de expressão aumentada de um ácido nucleico codificando um polipeptídeo TCP de Classe I, ou uma célula de planta transgênica derivada de dita planta transgênica.
18. Planta transgênica de acordo com a reivindicação 17, caracterizada pelo fato de que dito rendimento aumentado de sementes é um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.
19. Planta transgênica de acordo com a reivindicação 11, 15,17 ou 18, caracterizada pelo fato de que dita planta é uma planta de cultivo ou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia, ou uma célula de planta transgênica derivada de dita planta transgênica.
20. Partes colhíveis de uma planta como definida qualquer uma das reivindicações 11, 15, 17, 18, ou 19 caracterizadas pelo fato de que ditas partes colhíveis preferivelmente são sementes.
21. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 19 e/ou de partes colhíveis de uma planta como definida na reivindicação 20.
22. Uso de um ácido nucleico codificando um polipeptídeo TCP de Classe I caracterizado pelo fato de ser para aumentar rendimento de sementes em plantas.
23. Uso de acordo com a reivindicação 22, caracterizado pelo fato de que dito rendimento aumentado de sementes é selecionado a partir de um ou mais dos seguintes: (i) peso aumentado de semente; (ii) índice de colheita aumentado; ou (iii) Peso de Mil Sementes aumentado.
24. Uso de um ácido nucleico codificando um polipeptídeo TCP de Classe I, caracterizado pelo fato de ser como um marcador molecular.
Applications Claiming Priority (13)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP06124785.4 | 2006-11-24 | ||
| EP06124785 | 2006-11-24 | ||
| EP06125156.7 | 2006-11-30 | ||
| EP06125156 | 2006-11-30 | ||
| US68338106P | 2006-12-04 | 2006-12-04 | |
| US60/8683381 | 2006-12-04 | ||
| EP06126018.8 | 2006-12-13 | ||
| EP06126018 | 2006-12-13 | ||
| US88316607P | 2007-01-03 | 2007-01-03 | |
| US88317007P | 2007-01-03 | 2007-01-03 | |
| US60/883166 | 2007-01-03 | ||
| US60/883170 | 2007-01-03 | ||
| PCT/EP2007/062720 WO2008062049A1 (en) | 2006-11-24 | 2007-11-22 | Transgenic plants comprising as transgene a class i tcp or clavata 1 (clv1) or cah3 polypeptide having increased seed yield and a method for making the same |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0718977A2 true BRPI0718977A2 (pt) | 2014-02-04 |
Family
ID=43466222
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0718977-0A BRPI0718977A2 (pt) | 2006-11-24 | 2007-11-22 | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US8350119B2 (pt) |
| EP (2) | EP2599871A3 (pt) |
| AR (1) | AR063972A1 (pt) |
| BR (1) | BRPI0718977A2 (pt) |
| CA (1) | CA2664987A1 (pt) |
| MX (1) | MX2009005280A (pt) |
| WO (1) | WO2008062049A1 (pt) |
Families Citing this family (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EA019514B1 (ru) * | 2007-04-27 | 2014-04-30 | Те Риджентс Оф Те Юниверсити Оф Калифорния | Сенсоры coрастений, нуклеиновые кислоты, кодирующие их, способы их получения и применение |
| CN101969759A (zh) * | 2007-12-20 | 2011-02-09 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物及其制备方法 |
| AU2009284263B2 (en) * | 2008-08-20 | 2015-04-09 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and a method for making the same |
| BRPI0919120B1 (pt) | 2008-09-25 | 2018-08-07 | Toyota Jidosha Kabushiki Kaisha | Métodos para aumentar a produção de biomassa e conferir resistência ao estresse salino a uma planta e de produção de planta |
| BRPI0921761A2 (pt) * | 2008-11-11 | 2015-09-01 | Toyota Motor Co Ltd | Gene para aumentar a producao de biomassa e metodo para uso do mesmo |
| JP5454086B2 (ja) | 2009-10-30 | 2014-03-26 | トヨタ自動車株式会社 | 植物に環境ストレス耐性を付与する遺伝子及びその利用方法 |
| CN102811617A (zh) | 2010-01-22 | 2012-12-05 | 拜耳知识产权有限责任公司 | 杀螨和/或杀虫活性物质结合物 |
| CA2792745A1 (en) * | 2010-03-18 | 2011-09-22 | Basf Plant Science Company Gmbh | Plants having enhanced yield-related traits and method for making the same |
| WO2013020985A1 (en) | 2011-08-10 | 2013-02-14 | Bayer Intellectual Property Gmbh | Active compound combinations comprising specific tetramic acid derivatives |
| AU2013221486A1 (en) * | 2012-02-14 | 2014-08-21 | Sapphire Energy, Inc. | Sodium hypochlorite resistant genes |
| AU2014221493B2 (en) * | 2013-02-28 | 2017-02-16 | Wellkey Holdings Limited | Recombinant plant cell, preparation method therefor, and method for producing target protein using same |
| WO2015108777A1 (en) | 2014-01-16 | 2015-07-23 | Papoutsakis Eleftherios T | Synthetic methylotrophy to liquid fuels and chemicals |
| US9101100B1 (en) | 2014-04-30 | 2015-08-11 | Ceres, Inc. | Methods and materials for high throughput testing of transgene combinations |
| EP3172225B1 (en) | 2014-07-25 | 2021-09-08 | Benson Hill, Inc. | Compositions and methods for increasing plant growth and yield using rice promoters |
| CN110628808B (zh) * | 2018-06-05 | 2021-06-04 | 北京大学 | 拟南芥AtTCP5基因及其在调控株高上的应用 |
| CN109234300B (zh) * | 2018-10-16 | 2021-08-27 | 天津农学院 | 一种调控集胞藻生长速度的基因spkD的应用 |
| CN110669784B (zh) * | 2019-10-30 | 2023-05-16 | 深圳大学 | 一种能胞外分泌抗菌肽的衣藻的构建方法及其应用 |
| US11999946B2 (en) | 2020-03-26 | 2024-06-04 | Pairwise Plants Services, Inc. | Methods for controlling meristem size for crop improvement |
| CN116096230A (zh) | 2020-06-02 | 2023-05-09 | 成对植物服务股份有限公司 | 控制分生组织大小以改良作物的方法 |
| PY2149243A (es) * | 2020-06-17 | 2022-03-16 | Pairwise Plants Srvices Inc | Métodos para el control del tamaño del meristemo para la mejora de cultivos |
| CN111926023A (zh) * | 2020-08-04 | 2020-11-13 | 山东农业大学 | 一种桃休眠相关PpTCP20基因及其应用 |
| US12319717B2 (en) | 2021-02-22 | 2025-06-03 | Arizona Board Of Regents On Behalf Of The University Of Arizona | Brassica plants with increased locules |
| CN117946237B (zh) * | 2024-03-14 | 2024-07-09 | 扬州大学 | 柳枝稷TCP类转录因子PvTCP19及其重组载体的应用 |
Family Cites Families (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4987071A (en) | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
| US5116742A (en) | 1986-12-03 | 1992-05-26 | University Patents, Inc. | RNA ribozyme restriction endoribonucleases and methods |
| US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
| AU3756889A (en) | 1988-06-01 | 1990-01-05 | The Texas A & M University System | Method for transforming plants via the shoot apex |
| EP0672159B1 (en) | 1992-04-24 | 2005-12-28 | Sri International | Homologous sequence targeting in eukaryotic cells |
| EP0652705B1 (en) | 1992-06-29 | 2005-12-14 | Gene Shears Pty Limited | Nucleic acids and methods of use thereof for controlling viral pathogens |
| WO1995003404A1 (en) | 1993-07-22 | 1995-02-02 | Gene Shears Pty Limited | Dna virus ribozymes |
| AU8003494A (en) | 1993-10-29 | 1995-05-22 | Japan Tobacco Inc. | Dna coding for carbonic anhydrase |
| EP0733059B1 (en) | 1993-12-09 | 2000-09-13 | Thomas Jefferson University | Compounds and methods for site-directed mutations in eukaryotic cells |
| US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
| US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
| US5859338A (en) * | 1995-06-06 | 1999-01-12 | California Institute Of Technology | Plant clavata1 nucleic acids, transformed plants, and proteins |
| CN1249245C (zh) | 1995-10-06 | 2006-04-05 | 拜尔生物科学股份有限公司 | 种子散失 |
| GB9607517D0 (en) | 1996-04-11 | 1996-06-12 | Gene Shears Pty Ltd | The use of DNA Sequences |
| ID21006A (id) | 1997-02-10 | 1999-04-08 | Japan Tobacco Inc | Siklus c4 jenis pck |
| GB9703146D0 (en) | 1997-02-14 | 1997-04-02 | Innes John Centre Innov Ltd | Methods and means for gene silencing in transgenic plants |
| JP3210960B2 (ja) | 1997-03-11 | 2001-09-25 | 農林水産省農業生物資源研究所長 | C4植物の光合成酵素を発現するc3植物体 |
| GB9710475D0 (en) | 1997-05-21 | 1997-07-16 | Zeneca Ltd | Gene silencing |
| GB9720148D0 (en) | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
| EP3214177A3 (en) | 1998-04-08 | 2017-11-22 | Commonwealth Scientific and Industrial Research Organisation | Methods and means for obtaining modified phenotypes |
| MXPA01000174A (es) | 1998-06-26 | 2003-09-10 | Univ Iowa State Res Found Inc | Materiales y metodos para la alteracion de los niveles de enzimas y de acetil-coa en plantas. |
| US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
| AU776605B2 (en) | 1998-12-17 | 2004-09-16 | Cropdesign N.V. | Novel cell cycle genes and uses thereof |
| US20030233670A1 (en) * | 2001-12-04 | 2003-12-18 | Edgerton Michael D. | Gene sequences and uses thereof in plants |
| CA2366104C (en) | 1999-07-22 | 2010-07-06 | Japan As Represented By Director General Of National Institute Of Agrobiological Resources, Ministry Of Agriculture, Forestry And Fisheries | Ultra-fast transformation technique for monocotyledons |
| DK1272651T3 (da) | 2000-04-13 | 2008-06-09 | Univ California | Styring af frugtopspringning i arabidopsis via indehiscent1-gener |
| US7619146B2 (en) * | 2001-06-18 | 2009-11-17 | Frankard Valerie | Method for modifying plant morphology, biochemistry and physiology |
| MXPA04011039A (es) * | 2002-05-06 | 2005-02-14 | Pionner Hi Bred International | Secuencias de polinucleotidos semejantes a clavata 3 de maiz y metodos de uso. |
| BR0314389A (pt) | 2002-09-18 | 2005-07-12 | Mendel Biotechnology Inc | Polinucleotìdeos e polipeptìdeos em plantas |
| ES2279339T3 (es) * | 2003-01-21 | 2007-08-16 | Cropdesign N.V. | Uso de la secuencia reguladora del gen gos2 del arroz para la expresion genica en plantas o celulas de plantas dicotiledoneas. |
| US20060150283A1 (en) * | 2004-02-13 | 2006-07-06 | Nickolai Alexandrov | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
| NL1033850C2 (nl) | 2007-05-15 | 2008-11-18 | 3Force B V | Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen. |
-
2007
- 2007-11-22 BR BRPI0718977-0A patent/BRPI0718977A2/pt not_active IP Right Cessation
- 2007-11-22 EP EP12195751.8A patent/EP2599871A3/en not_active Withdrawn
- 2007-11-22 WO PCT/EP2007/062720 patent/WO2008062049A1/en not_active Ceased
- 2007-11-22 EP EP07847287A patent/EP2084284A1/en not_active Withdrawn
- 2007-11-22 CA CA002664987A patent/CA2664987A1/en not_active Abandoned
- 2007-11-22 US US12/515,852 patent/US8350119B2/en not_active Expired - Fee Related
- 2007-11-22 MX MX2009005280A patent/MX2009005280A/es active IP Right Grant
- 2007-11-26 AR ARP070105238A patent/AR063972A1/es unknown
-
2012
- 2012-11-26 US US13/684,914 patent/US20130180011A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| EP2599871A2 (en) | 2013-06-05 |
| US8350119B2 (en) | 2013-01-08 |
| US20110016586A1 (en) | 2011-01-20 |
| EP2599871A3 (en) | 2013-09-04 |
| AR063972A1 (es) | 2009-03-04 |
| MX2009005280A (es) | 2009-08-12 |
| WO2008062049A1 (en) | 2008-05-29 |
| CA2664987A1 (en) | 2008-05-29 |
| US20130180011A1 (en) | 2013-07-11 |
| EP2084284A1 (en) | 2009-08-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101842489B (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
| CN101495640B (zh) | 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 | |
| CN102224247B (zh) | 具有改良的产量相关性状的植物和用于制备该植物的方法 | |
| BRPI0718977A2 (pt) | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico | |
| CN101415829B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
| CN101801998B (zh) | 养分可利用度减小下具有改良生长特性的植物及其制备方法 | |
| KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| US20150232874A1 (en) | Plants having enhanced yield-related traits and a method for making the same | |
| BRPI0721100A2 (pt) | Método para intensificar características relacionadas a rendimentos em plantas, e para a produção de uma planta transgênica, planta ou parte de mesma, molécula de ácido nucleico isolado, polipeptídio isolado, construção, usos de uma construção, de um ácido nucleico e de uma sequência de ácido nucleico, planta, parte de planta ou célula vegetal, partes colhíveis de uma planta, e, produtos | |
| CN101868544A (zh) | 具有提高的产量相关性状的植物和用于制备该植物的方法 | |
| KR20120126061A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| KR20100034027A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| KR101429469B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
| MX2010010735A (es) | Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas. | |
| CN101849009A (zh) | 具有增强的产率相关性状的植物及其制备方法 | |
| CN101883783A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
| CN101605902A (zh) | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 | |
| CN101969759A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
| MX2013000576A (es) | Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas. | |
| MX2011005778A (es) | Plantas que tienen tolerancia al estres abiotico y/o mejores rasgos relacionados con el rendimiento y un metodo para producirlas. | |
| CN101778942A (zh) | 产率相关性状增强的植物及制备其的方法 | |
| CN103582702A (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
| MX2012010749A (es) | Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas. | |
| CN101595222B (zh) | 具有改良的种子产量相关性状的植物及其制备方法 | |
| CN101668859A (zh) | 具有增强的产量相关性状的植物及其制备方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
| B08F | Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette] |
Free format text: REFERENTE A 9A ANUIDADE. |
|
| B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |
Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2386 DE 27-09-2016 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013. |